2–1 『PDF Advanced Extractor』の概要

PDF Advanced Extractor』は、PDFファイルからテキストを抽出しプレーンテキストまたはHTMLタグ付きテキストでファイルに保存するためのユーティリティ・ソフトウェアです。

PDFはデジタル社会の情報交換になくてはならない基盤技術として、さまざまな場面で利用されるようになっています。PDFが身近になれば、それを再利用して活用したいとは誰しも思うことでしょう。しかし、PDFのテキストデータを再利用する場合には注意が必要です。
PDFに含まれるテキストデータは必ずしも見た目と同じ順序で格納されていると限らないためです。 PDFからそのままコピー&ペーストしたときに文脈の通じない文字の羅列になってしまったり、文字間に不要な空白が挿入されて取り除くのに手間がかかってしまったというようなご経験をされた方も多いのではないでしょうか。

PDF Advanced Extractor』は、こうした不便さを解消し、PDFの再利用を容易にするための便利な機能をご提供します。