PDFマルチ変換ライブラリ変換サンプル
本ライブラリを利用してPDFから各種形式への変換例を用意しましたので、出力内容のご参考にしてください。(変換元のPDFと、変換結果のxml、xlsx、docx、pptx、txtファイル)
変換サンプルのサムネイルをクリックすると変換元と変換先のスクリーンショットを拡大表示ます。
PDFからPDFXML形式に変換した例
PDFXMLは、
- カタログXML(pdf2tmp_catalog.xml)
- スタイルXML(pdf2tmp_style.xml)
- ドキュメントXML(pdf2tmp.xml)
- 画像ファイル
など複数のファイルから構成されます。
サンプルのダウンロード用ファイルは1つのZIP形式ファイルに圧縮していますので解凍してご覧ください。
以下の変換結果のPDFXMLの画像は、出力内容がわかりやすいように可視化したものです。実際のPDFXMLの内容はダウンロードしたZIPファイルを解凍して、各xmlファイルをご確認ください。
赤い枠線は文字情報の外周、緑の枠線は表位置の外周、黒い枠線はページの外周を示します。
1. 行政文書開示請求書
出典:文部科学省ホームページ
2. 都市・農山漁村の地域連携による子供農山漁村交流推進事業
出典:総務省ホームページ
3. 気候変動適応法
出典:環境省ホームページ(抜粋)
4. 参考1-1-1 地球上の水の量
出典:国土交通省ホームページ(抜粋)
PDFからExcel形式に変換した例
PDFからExcelに表書式を再現した変換例
参考1-1-1 地球上の水の量
出典:国土交通省ホームページ
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample005.pdf -p @XLSX -o sample005.xlsx
複数ページの表をExcelの1シートに変換した例
重要文化的景観一覧【都道府県毎選定年順】
出典:文化庁ホームページ
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample003.pdf -p @XLSX -o sample003.xlsx -sheetmerge -emf
PDFからWord形式に変換した例
行政文書開示請求書
出典:文部科学省ホームページ
[既定値で変換]
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample001.pdf -p @DOCX -o sample001.docx
PDFからPowerPoint形式に変換した例
都市・農山漁村の地域連携による子供農山漁村交流推進事業
出典:総務省ホームページ
[オプション"-emf -notTextInPicture -enablewhiterect -alltextbox"を付加して変換]
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample002.pdf -p @PPTX -o sample002.pptx -emf -notTextInPicture -alltextbox
PDFからText形式に変換した例
1. 行政文書開示請求書
出典:文部科学省ホームページ
[既定値(UTF-8)で変換]
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample001.pdf -p @TEXT -o sample001.txt
2. 都市・農山漁村の地域連携による子供農山漁村交流推進事業
出典:総務省ホームページ
[UTF-16で変換]
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample002.pdf -p @TEXT -o sample002.txt -encoding "utf-16"
3. 重要文化的景観一覧【都道府県毎選定年順】
出典:文化庁ホームページ
[SHIFT-JISで変換]
この変換サンプルは以下のコマンドを実行しています。
pdf2ooxml -d sample003.pdf -p @TEXT -o sample003.txt -encoding "shift_jis"