2–3 制限事項

  • ISO 32000に準拠した、PDF1.3~2.0形式のPDFファイル
    ※ 上記以外のPDFからの読み込みは保証できません。
  • [文書を開くパスワード]で保護されたPDFからは読み込みできません。あらかじめパスワードを使用したセキュリティ解除が必要です。
  • [編集を制限するパスワード]で保護され[コピー不許可]が設定されたPDFからは変換できません。あらかじめパスワードを使用したセキュリティ解除が必要です。
  • [編集を制限するパスワード]で保護されたPDFで内容のコピーが許可されていても、ページの回転・削除が許可されていない場合はページ範囲の指定・ページの回転の指定・ページの矩形範囲の指定が無効となり、既定値で変換されます。指定を有効にするには、事前にパスワードによるセキュリティ解除が必要です。
  • 電子署名が設定されたPDF ファイルは変換できません。
  • Acrobat 8以上で保存されるPDF1.7のパッケージ形式(ポートフォリオ機能)は先頭の表紙ページのみ読み込みます。
  • PDFで使用されているカラースペース、フォント及びグラフィックス要素の一部で未対応のものがあります。このためPDFによっては正確にデータを取得できない場合があります。
  • PDFファイルに保存されている注釈、フォームデータ、JavaScript には対応しません。
  • PDFファイル中に存在するカラーモデルによっては、色を正しく再現できない場合があります。
  • スキャナで紙媒体を読み取って作成されたPDFやフォント埋め込み処理されたPDFなどは内部に文字や線情報が保存されていない場合があります。このようなPDFからは文字や罫線を用いた表形式への変換ができません。
  • PDFファイルでUnicode にマッピングできない文字が使用されている場合は、正しく変換できません。
  • PDFに文字の回転や画像の回転属性などがつけられている場合は、正しく変換できません。
  • PDFファイルで塗りつぶしにパターンやシェーディングが使用されている場合、そのイメージは無視して変換します。
  • PDFファイルに微小なイメージが使用されている場合、そのイメージは無視して変換します。
  • PDFファイルによっては文字色を白に設定し、その上に文字のアウトラインを重ねて描画している場合があります。このようなときは、一定の長さの水平・垂直線を無視することである程度レイアウトを保ちながらExcelに変換できます。文字色、水平・垂直線の長さはライブラリの機能で任意に指定できます。
  • PDFファイルで背景色に白色で塗りつぶした矩形を重ねて描画している場合は、この矩形を無視して変換します。
  • PDFの線画は変換先で図または画像に変換します。表と線画が混在したようなPDFでは線画が正しく変換できない場合があります。
  • PDFファイルで使用されているフォントは、最も近いものをパソコン上で検索して変換します。近似のフォントに割り当てできない場合は元のイメージを再現できないことがあります。
  • 既定値ではPDFのフォント情報から文字幅を取得し、Excelへの変換時にセル内に収まるよう計算しますが、PDFによっては処理時間が長くかかる場合があります。このような場合はオプションでフォントの文字幅を参照しない指定をすることで処理時間を短くできます。ただし、データによっては文字がセルからはみ出て変換される場合があります。
  • PDFで各ページの用紙サイズと表の列幅がすべて同じ場合には、オプションですべてExcelの1シート内に変換する指定ができます。ただし、各ページのサイズと列の幅が正確に一致していない場合は、この指定がされていても無効となります。
  • Excelへの変換時は、既定値でイメージデータを変換します(オプションで変更可能)。ただし、イメージデータを変換した場合は透過属性を設定できません。
  • PDFで縦書きの箇所はテキストボックスで変換しますが、オプションでテキストボックスを使用しない指定も可能です。その場合、該当するテキストはシートの末尾に変換します。
  • セル左端とテキスト先頭の距離は、既定値でインデントを使用して変換しますが、オプションで半角空白により調整する方法に変更が可能です。半角空白はTimes New Roman / 8ptを使用します。ただしセルの内容が数値の場合は、この指定は無効です。
  • セル内のテキストの横方向配置は既定値で文字揃えを使用して変換しますが、文字揃えを使用せずすべて左揃えで変換することも可能です。ただしセルの内容が数値の場合は、この指定は無効です。
  • セル左端とテキスト先頭の距離、またはセル右端とテキスト右端の距離をインデントで調整した場合は、Excelの標準文字サイズ(11pt)を基準にしてインデント量を計算します。このため計算結果によっては切り捨てが発生し、文字とセル罫線の間隔が詰まって変換される場合があります。
  • セル内の複数行は既定値で縦結合して変換しますが、オプションで縦結合しない指定が可能です。
  • PDFで文字"m"の次に"2"がくる場合は、同じベースラインで "m2"と変換しますが、"㎡"(U+33A1)はそのまま変換します。
    同様に文字"m"の次に"3"がくる場合は、同じベースラインで "m3"と変換しますが、"㎥" (U+33A5)はそのまま変換します。
  • PDFで全角空白が使用されている場合、半角空白に置換して変換します。ただし、テキスト中に全角空白がある場合はそのまま変換します。
  • PDFで同じ箇所に複数の線を重ねて描画していると線の色をいずれかに特定できないため、PDFと異なる罫線の色が設定される場合があります。
  • Excelへの変換時は、テキストの前後の空白を削除して変換します。ただし、すべて空白のみのデータがあった場合は1個の空白にして変換します。
  • 既定値では、日本語フォントに「MS-PMincho」、英文フォントに「Century」を設定します。文字に使用するフォントは、ライブラリに配置される「pdf2ooxml.properties」ファイルに定義された代替フォント名を使用して変換します。
  • PDFにある3ポイント以下の矩形は無視して変換します。これにより、幅の細い矩形を塗りつぶして表現した線が変換されない場合があります。
  • ページの矩形範囲を指定してExcelに変換する場合は、1ページに対して1カ所のみ矩形領域の指定が可能です。