オプション設定ファイルの説明

  • 変換するページ範囲

PDFが複数ページで構成されている場合、既定値ではPDFのすべてのページを変換します。ページ範囲を限定して変換したい場合は、ページ範囲を指定してください。
ページ範囲はひとつのPDFファイルに対し、文字列で複数指定が可能です(例:”1-3, 5, 7”)。

  • ページの回転角度

PDFでページの回転がされていた場合、既定値ではすべてのページを「回転しない」設定で変換するため、変換結果が不正になる場合があります。このようなときは、ページ毎に回転角度を指定することで正しい変換結果が得られます。
ページの回転角度は、任意のページ範囲に対して指定が可能です。

  • 複数ページを1シートに変換する

PDFでひとつの表が複数ページにまたがっていると、既定値ではPDFの1ページを1シートに変換します。このため、表は各シートに分割されます。各ページのサイズと列幅がすべて同じであれば、複数ページを1シートに変換する指定を行うことで1シート内に変換できます。
これにより、PDFでページ毎に分割された表をExcel上で一つの表にして編集可能になります。

  • 画像を出力する

PDFで画像と線画が使用されていると、既定値ではそのままExcelに変換します。このため、サイズの大きなデータはデータ量に応じて処理時間がかかります。
画像や線画データを再利用する必要がない場合は出力しない設定にすることで処理時間を短縮できます(ただし、線画に含まれる水平・垂直線は、この指定の有無にかかわらず変換対象となりますのでご注意ください)。

  • セルを縦に結合する

PDFで表のセル中に複数行の文字列があった場合、既定値ではセルを縦に結合して変換します。何らかの理由でセルを結合したくないときは、この指定をOFFに設定してください。

  • 縦書きのテキストボックスを作成する

変換元のPDFに縦書きのテキストがあった場合、既定値ではテキストボックスを作成してテキストを変換します。この指定をOFFにすると、縦書きのテキストはすべて横書きでシート末尾に変換できます。

  • フォントの文字幅情報を取得しない

既定値ではPDFのフォントから文字幅情報を取得してセル内のテキスト配置に反映しますが、PDFによってはこの処理に時間がかかります。
処理速度を優先して変換したい場合は、この指定をONに設定してください。

  • 指定した矩形範囲内のみ変換する

既定値ではPDFのページ全体を対象にして内部のデータを変換します。ページ内で任意の範囲のみ変換したい場合は、範囲を含む矩形領域を指定してください。
矩形領域はページ番号と、ページの左上を原点とした矩形の座標(単位:ミリメートル)のペアで指定します。1ページに指定できる矩形領域は1箇所のみです。
※ご注意:矩形範囲の座標を取得する機能は本製品では提供しません。

  • クリッピングパスの内側テキストのみ変換する

PDFでクリッピングパスが指定されたテキストは、既定値でパスを考慮せず、すべてのテキストを変換します。クリッピングパス内のテキストのみ変換したい場合は、この指定をONにしてください。
ただしその場合、パス外にあるテキストは無視して変換されませんのでご注意ください。また、この指定は【クリッピングパスの内側テキストに外側テキストを追加して変換する】と同時に指定できません。

  • クリッピングパスの内側テキストに外側テキストを追加して変換する

PDFでクリッピングパスが指定されたテキストについてパス内のテキストを変換し、末尾にパス外のテキストを追加して変換します。
この指定は【クリッピングパスの内側テキストのみ変換する】と同時に指定できません。

  • 文字位置の調整にインデントを使用しない

セルの左端とセル内テキストの先頭文字位置との間隔は、既定値でインデントを使用して調整します。この指定をONにすると、インデントを使用せず、セルの左端とテキストの先頭文字位置の間に半角空白を挿入して調整します。

  • セルの横方向の文字配置に文字揃えを使用しない

セル内の横方向の文字配置は、既定値で文字揃えを使用して調整します。セル内のテキストを常に左詰めで変換したい場合は、この指定をONにしてください。

  • 白色の文字色を変更する

PDFで文字の色が白に指定されている場合、既定値ではそのままで変換するためセルの背景色と同じになり見えなくなる場合があります。このようなときは任意の色を指定して文字の色を変更できます。
文字の色はRGB値で0~255の範囲を整数値で指定します。

  • 変換する縦罫線、横罫線の長さを指定する

既定値では、PDFで使用されている垂直線、水平線を解析しセルの縦罫線、横罫線に変換します。しかし、PDFによっては文字色を白に設定し、その上に文字のアウトライン(線画)を重ねて文字と見せるような方法が使われる例があります。この場合、文字のアウトラインに含まれる短い垂直線や水平線が縦横の罫線に変換されることで、予期しないセルが作成されてしまいます。
このようなとき、罫線に変換する最小の長さを指定して、それ以下の短い垂直・水平線を罫線に変換しないようにできます。最小値は文字の大きさに合わせてミリメートル単位で実数値を指定します。

  • 右詰めの場合に右インデントを出力する

セルの横方向の文字配置が右詰めの場合に、セルの右端とセル内テキストの右端との距離を右インデントで調整します。インデントの単位は文字数です。

  • 行高を補正しない

Excelへの変換時に行の高さを補正しないで変換します。既定値では1行に含まれるセルの文字サイズを参照して行の高さを決定しますが、行高が変わることで画像などのオブジェクト位置がずれて変換される場合があります。この指定をONにすると、行高を補正せずに変換するため、セルの開始位置とオブジェクトの開始位置がずれないように調整できます。

<?xml version="1.0" encoding="utf-8"?>
<tbl-interface>
 <rotations num="2">
  <rotate page="6-8” angle="90" /> 【6~8ページを右90°回転】
  <rotate page="10" angle="270" />  【10ページを左90°回転】
 </rotations>
 <xlsx-option page="1-0" shmerge="0" noimg="1" vcmerge="1" cptxt="1" noindent="1" noalign="1" chwtxt="1" minhline="1" minvline="1">
  <chwcolor r="0" g="18" b="154" />  【白色の文字色を濃い青色に変更】
  <minline vvalue="4.5" hvalue="3.0" /> 指定値以下の垂直線、水平線を変換しない】
  <tables num="1">
   <table page="3, 5-7">       【3,5,6,7ページで矩形範囲を指定】
    <range top="15.0" left="14.2" bottom="240.0" right="343.2" />
   </table>
  </tables>
 </xlsx-option>
</tbl-interface>