PDFtoCells 変換ライブラリ V1.1機能紹介:オプション設定ファイル
オプション設定ファイル
オプション設定ファイルはUTF-8でエンコードされたXML形式ファイルです。
以下の変換条件を指定できます。
- 変換条件
- 機能
- 変換条件 / 機能
- 変換するページ範囲
- 変換対象としたいページ範囲を指定します。ページ範囲はひとつのPDFファイルに対し、文字列で複数指定が可能です(例:"1-3, 5, 7, 10-12")。既定値ではPDFのすべてのページを変換します。
- ページの回転角度
- PDFでページの回転がされていた場合、ページ毎の回転角度を指定することで正しい変換結果が得られます。ページの回転角度は、任意のページ範囲に対して指定可能です。既定値ではすべてのページを「回転しない」設定で変換します。
- 複数ページを1シートに変換する
- PDFでひとつの表が複数ページにまたがっているような場合に、各ページのサイズと列の幅がすべて同じであればExcelの1シート内に変換できます。これにより、PDFでページ毎に分割された表をExcel上で一つの表にして編集可能になります。既定値ではPDFの1ページをExcelの1シートに変換します。
- 画像を出力する
- PDFの線画・画像をExcelに変換するかしないかを指定します。サイズの大きなデータを変換すると、データ量に応じて処理時間がかかるため、それらのデータを再利用する必要がない場合は出力しない設定にしてください(ただし、線画に含まれる水平・垂直線は、この指定の有無にかかわらず変換対象となりますのでご注意ください)。既定値は「出力する」です。
- セルを縦に結合する
- PDFで表のセル中に複数行の文字列があった場合、既定値ではセルを縦に結合して変換します。何らかの理由でセル内の文字列を結合したくないときは、この指定をOFFに設定してください。
- 縦書きのテキストボックスを作成する
- 変換元のPDFに縦書きの文字列があった場合、既定値ではテキストボックスを作成して変換します。この指定をOFFにすると、縦書きの文字列はすべて横書きでシート末尾に変換されます。
- フォントの文字幅情報を取得しない
- 既定値では、PDFのフォントから文字幅情報を取得してセル内のテキスト配置に反映します。PDFによってはこの処理に時間がかかるため、処理速度を優先して変換したい場合は、この指定をONに設定します。
- 指定した矩形範囲内の表のみ変換する(ページ番号と矩形範囲座標のペアで指定)
- PDFのページ内で任意の矩形範囲のみExcelの表に変換したい場合に指定します。ページ番号と、ページの左上を原点とした矩形の座標(単位:ミリメートル)のペアで指定してください(矩形範囲の座標を取得する機能は本ライブラリでは提供しません)。既定値はページ全体を対象に変換します。
- クリッピングパスの内側テキストのみ変換する
- PDFでクリッピングパスが指定されたテキストは、既定値ではパスを考慮せず、すべてのテキストを変換します。クリッピングパス内のテキストのみ変換したい場合は、この指定をONにしてください。
- クリッピングパスの内側テキストに外側テキストを追加して変換する
- PDFでクリッピングパスが指定されたテキストについてパス内のテキストを変換し、末尾にパス外のテキストを追加して変換します。
- 文字位置の調整にインデントを使用しない
- セルの左端とセル内テキストの先頭文字位置との間隔は、既定値でインデントを使用して調整します。この指定をONにすると、インデントを使用せず、セルの左端とテキストの先頭文字位置の間に半角空白を挿入して調整します。
- セルの横方向の文字配置に文字揃えを使用しない
- 既定値では、セル内の横方向の文字配置は文字揃えを使用して調整します。セル内のテキストを常に左詰めで変換したい場合は、この指定をONにしてください。
- 白色の文字色を変更する
- PDFで文字の色が白に指定されている場合、既定値ではそのままで変換するためセルの背景色と同じになり見えなくなる場合があります。このようなときは任意の色を指定して文字の色を変更できます。
- 変換する縦罫線、横罫線の長さを指定する
- 既定値では、PDFで使用されている垂直線、水平線を解析しセルの縦罫線、横罫線に変換します。しかし、PDFによってはごく短い垂直線や水平線を縦横の罫線に変換されることで、予期しないセルが作成されてしまう場合があります。このようなとき、罫線に変換する最小の長さを指定して、それ以下の短い垂直・水平線を罫線に変換しないようにできます。
- 右詰めの場合に右インデントを出力する
- セルの横方向の文字配置が右詰めの場合に、セルの右端とセル内テキストの右端との距離を右インデントで調整します。インデントの単位は文字数です。
- 行高を補正しない
- Excel への変換時に行の高さを補正しないで変換します。既定値では1 行に含まれるセルの文字サイズを参照して行の高さを決定しますが、行高が変わることで画像などのオブジェクト位置がずれて変換される場合があります。この指定をON にすると、行高を補正せずに変換するため、セルの開始位置とオブジェクトの開始位置がずれないように調整できます。
※コマンドラインでオプション設定ファイルを使用して、パラメータと設定ファイルの指定が重複した場合は、コマンドラインの指定を優先します。