Palai

Palai

程序员 | 开源爱好者 | 喜欢交友

報告/PDF無法加水印-實習小記

背景:爬蟲爬取的報告無法加水印#

遇到的情況是只有這種特殊的報告不能加,因為是缺少了 Trailer 的 pdf 格式報告。

pdf 格式

pdf 基本結構一共有四個部分:Header 部分Body 部分Cross-Reference Table 交叉引用表部分Trailer 部分

重點說一下 Trailer 部分:
PDF 解析是從 PDF 的尾部開始解析文件的,通過 Trailer 部分能夠快速找到交叉引用表和某些特殊對象。

另外這個格式 瀏覽器、wps 都能解析,但我們現在使用的轉化工具是免費版,所以不能解析,也就不能加水印。

解決的對策:1、調研其他後端 pdf 水印工具;2、嘗試前端 pdf 水印工具;3、樣從 html 寫 pdf。

考慮到 後端加水印現在用的 itext 開源版本,維護得很少了。換個新一點的 pdf 水印工具很有可能就能解決。
我調研之後,發現另一個開源工具Spire.PDF

Spire.PDF 是一個專業的 PDF 組件,能夠獨立地創建、編寫、編輯、操作和閱讀 PDF 文件,支持.NET、Java、WPF 和 Silverlight。

但是使用中發現一些小問題 spire pdf 高版本會有 自帶工具的水印。

解決方法是:換成低版本 只有首頁有,在這個基礎上 給每個 pdf 前面加一頁 然後刪掉就行了。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。