背景:爬虫爬取のレポートにウォーターマークを追加できない#
問題は、この特殊なレポートのみが追加できないことであり、これは Trailer のない PDF 形式のレポートです。
PDF 形式
PDF の基本的な構造は、ヘッダー部分、本文部分、クロスリファレンステーブル部分、トレーラー部分の 4 つの部分で構成されています。
トレーラー部分について重要な点を説明します:
PDF の解析は、ファイルの末尾から解析が開始され、トレーラー部分を通じてクロスリファレンステーブルや特定のオブジェクトを迅速に見つけることができます。
また、この形式は、ブラウザや wps でも解析できますが、私たちが現在使用している変換ツールは無料版なので、解析できず、したがってウォーターマークを追加することもできません。
解決策:1. 他のバックエンド PDF ウォーターマークツールの調査、2. フロントエンド PDF ウォーターマークツールの試用、3. HTML から PDF を作成する方法。
バックエンドでのウォーターマーク追加については、現在使用している itext のオープンソースバージョンはほとんどメンテナンスされていません。より新しい PDF ウォーターマークツールを試すと、問題が解決する可能性が非常に高いです。
私の調査の結果、別のオープンソースツールであるSpire.PDFを見つけました。
Spire.PDF は、独立して PDF ファイルを作成、編集、操作、読み取りすることができるプロフェッショナルな PDF コンポーネントであり、.NET、Java、WPF、Silverlight をサポートしています。
しかし、使用中にいくつかの小さな問題が見つかりました。Spire PDF の高いバージョンには、組み込みのツールによるウォーターマークがあります。
解決策は、低いバージョンに切り替えて、最初のページのみにウォーターマークを追加し、それを削除することです。