はじめに

『PDF CookBook』は、電子の紙PDFを企業向けのシステムで編集したり、加工したりする方法を紹介する本です。いわば、PDFをメイン素材とする料理本です。本書はシリーズ3巻目にあたります。巻3では、『PDF Tool API』の機能のうち第1章テキストの抽出・検索、第2章画像の抽出・最適化、第3章矩形内のデータ削除、第4章フォントの統合・埋め込み、第5章PDFの最適化、第6章レイヤーをテーマに取り上げています。

PDFは米国のアドビ社が開発したものですが、PDFの仕様書はアドビ社からISO - International Organization for Standardizationに移管され、2008年にISO 32000-1:2008という国際標準となりました。こうして、PDFを作成したり、利用したりするアプリケーションは誰でも開発・提供できるようになっています。

現在、さまざまなアプリケーションから大量にPDFが生み出されて流通しています。例えば、Microsoft Officeには2010年代末から(※)PDF形式保存機能があり、また、Windows10 以降のWindowsにはPDF出力ドライバーが標準で付いています。主要なブラウザはPDFを表示する機能を内蔵しています。このように2010年代を境に、PDFを作成・表示する環境は著しく進化・充実しています。これからはPDFを紙のように手軽に簡単に加工したいという需要がますます大きくなるでしょう。

本書では企業向けシステムの企画・営業担当者から開発者まで幅広い層にPDFの活用法をご理解いただけるよう、最初にできるだけ図版で料理のイメージを表すようにしました。包丁としては、アンテナハウスのPDF編集・加工ライブラリ『PDF Tool API』を前提としています。なお、本書ではISO 32000-1:2008 で作成できるPDF の機能のうち、『PDF Tool API V7.0』がサポートしている範囲に限って説明しています。PDF の仕様で定められていることのすべてを網羅している訳ではありません。あらかじめご了承ください。

『PDF Tool API』には無料でお使いいただける評価版を用意しています。次のページからお申込みいただけます。

www.antenna.co.jp/ptl/trial.html

本書のプログラム例はJava で作成しています。本書で紹介しているプログラム例は次のページよりダウンロードしていただけます。

www.antenna.co.jp/ptl/cookbook/source/

Javaプログラムのコンパイル方法や実行方法は『PDF Tool API』の利用ガイドを参照して下さい。なお、『PDF Tool API』は、C++、.Net インターフェイスも用意していますので、Java 以外の言語によるプログラミングも可能です。ぜひ、お試しになってみてください。

注記

※:Microsoft Officeは2019年のOffice 2017 SP2以降からPDFによる出力をサポートしています。

参考:Office Service Pack 2 A Significant Stability, Performance and Interoperability Upgrade(Microsoft) https://news.microsoft.com/2009/04/28/office-service-pack-2-a-significant-stability-performance-and-interoperability-upgrade/

改訂版にあたって

本書籍は、本文内で使用している『PDF Tool API』のバージョンアップに伴い、サンプルプログラムなどを修正したものになりますが、大筋は初版本と変わりありません。