PDFtoCells 変換ライブラリ V1.1動作環境/制限事項
動作環境
『PDFtoCells 変換ライブラリ V1.1』をインストールしてご利用になるには以下の動作環境が必要です。
対応OS | Windows 10(64ビット版) Windows 11 Windows Server 2022 ※プラットフォームの動作保証については、保守サービス仕様のページを参照してください。 |
---|---|
CPU | 上記OSが正常に動作するIntel系のCPU、および100%互換性を持つプロセッサー |
メモリ | 上記OSが推奨するメモリ以上(これに加えて1GB以上の空き容量を推奨) |
ハードディスク | 本製品のインストールに必要な120MB以上の空き容量 |
ランタイム | 本ライブラリを使用するには、以下の.NET ランタイムとVisual C++ 2022ランタイムライブラリが必要です。あらかじめ実行環境にインストールを行ってください(本ライブラリのインストーラを使用することでも導入できます)。
|
ライセンス | 本ライブラリを使用するには、弊社から配布するライセンスファイル(TblAHPDFtoCells.lic)を実行環境に配置する必要があります。 ライセンスには正規版ライセンスと評価版ライセンスがあります。本ライブラリのインストーラを使用すると評価版ライセンスファイルがインストール先フォルダに配置されます。
|
制限事項
PDFの読み込みに関する制限
- 本ライブラリは、以下の条件で作成されたPDFについて読み込みが可能です。
下記以外のPDFからの読み込みは保証できません。
- ISO32000に準拠した、PDF1.3~2.0形式のPDFファイル
- [文書を開くパスワード]で保護されたPDFからは読み込みできません。事前にパスワードによるセキュリティ解除が必要です。
- [編集を制限するパスワード]で保護されたPDFで内容のコピーが許可されていない場合は変換できません。事前にパスワードによるセキュリティ解除が必要です。
- [編集を制限するパスワード]で保護されたPDFで内容のコピーが許可されていても、ページの回転・削除が許可されていない場合はページ範囲の指定、ページの回転の指定、ページの矩形範囲の指定が無効となり、既定値で変換されます。指定を有効にするには、事前にパスワードによるセキュリティ解除が必要です。
- 電子署名が設定されたPDF ファイルは変換できません。
- Acrobat 8以上で保存されるPDF1.7のパッケージ形式(ポートフォリオ機能)は先頭の表紙ページのみ読み込みます。
- PDFで使用されているカラースペース、フォント及びグラフィックス要素の一部で未対応のものがあります。このためPDFによっては正確にデータを取得できない場合があります。
- PDFファイルに保存されている注釈、フォームデータ、JavaScript には対応しません。
- PDFファイル中に存在するカラーモデルによっては、色を正しく再現できない場合があります。
- スキャナで紙媒体を読み取って作成されたPDFやフォント埋め込み処理されたPDFなどは内部に文字や線情報が保存されていない場合があります。このようなPDFからは編集可能な表形式での変換ができません。
- PDFファイルでUnicode にマッピングできない文字が使用されている場合は、正しく変換できません。
- PDFに文字の回転や画像の回転属性などがつけられている場合は、正しく変換できません。
- PDFファイルに微小なイメージが使用されている場合、そのイメージは無視して変換します。
- PDFファイルで塗りつぶしにパターンやシェーディングが使用されている場合、そのイメージは無視して変換します。
- PDFファイルによっては文字色を白に設定し、その上に文字のアウトラインを重ねて描画している場合があります。このようなときは、一定の長さの水平・垂直線を無視することである程度レイアウトを保ちながらExcelに変換できます。文字色、水平・垂直線の長さはライブラリの機能で任意に指定できます。
- PDFファイルで背景色に白色で塗りつぶした矩形を重ねて描画している場合は、この矩形を無視して変換します。
PDFからExcelへの変換に関する制限
- PDFの線画は変換先で図または画像に変換します。表と線画が混在したようなPDFでは線画が正しく変換できない場合があります。
- PDFファイルで使用されているフォントは、最も近いものをパソコン上で検索して変換します。近似のフォントに割り当てできない場合は元のイメージを再現できないことがあります。
- 既定値ではPDFのフォント情報から文字幅を取得し、Excelへの変換時にセル内に収まるよう計算しますが、PDFによっては処理時間が長くかかる場合があります。このような場合はオプションでフォントの文字幅を参照しない指定をすることで処理時間を短くできます。ただし、データによっては文字がセルからはみ出て変換される場合があります。
- PDFで各ページの用紙サイズと表の列幅がすべて同じ場合には、オプションですべてExcelの1シート内に変換する指定ができます。ただし、各ページのサイズと列の幅が正確に一致していない場合は、この指定がされていても無効となります。
- Excelへの変換時は、既定値でイメージデータを変換します(オプションで変更可能)。ただし、イメージデータを変換した場合は透過属性を設定できません。
- PDFで縦書きの箇所はテキストボックスで変換しますが、オプションでテキストボックスを使用しない指定も可能です。その場合、該当するテキストはシートの末尾に変換します。
- セル左端とテキスト先頭の距離は、既定値でインデントを使用して変換しますが、オプションで半角空白により調整する方法に変更が可能です。半角空白はTimes New Roman / 8pt を使用します。ただしセルの内容が数値の場合は、この指定は無効です。
- セル内のテキストの横方向配置は既定値で文字揃えを使用して変換しますが、文字揃えを使用せずすべて左揃えで変換することも可能です。ただしセルの内容が数値の場合は、この指定は無効です。
- セル左端とテキスト先頭の距離、またはセル右端とテキスト右端の距離をインデントで調整した場合は、Excel の標準文字サイズ(11pt)を基準にしてインデント量を計算します。このため計算結果によっては切り捨てが発生し、文字とセル罫線の間隔が詰まって変換される場合があります。
- セル内の複数行は既定値で縦結合して変換しますが、オプションで縦結合しない指定が可能です。
- PDFで文字"m"の次に"2"がくる場合は、同じベースラインで "m2"と変換しますが、"㎡"(U+33A1)はそのまま変換します。
同様に文字"m"の次に"3"がくる場合は、同じベースラインで "m3"と変換しますが、"㎥" (U+33A5)はそのまま変換します。 - PDFで全角空白が使用されている場合、半角空白に置換して変換します。ただし、テキスト中に全角空白がある場合はそのまま変換します。
- PDFで同じ箇所に複数の線を重ねて描画していると線の色をいずれかに特定できないため、PDFと異なる罫線の色が設定される場合があります。
- Excelへの変換時は、テキストの前後の空白を削除して変換します。ただし、すべて空白のみのデータがあった場合は1個の空白にして変換します。
- 既定値では、日本語フォントに「MS-PMincho」、英文フォントに「Century」を設定します。文字に使用するフォントは、ライブラリに配置される「pdf2ooxml.properties」ファイルに定義された代替フォント名を使用して変換します。
- PDFにある3ポイント以下の矩形は無視して変換します。これにより、幅の細い矩形を塗りつぶして表現した線が変換されない場合があります。
- ページの矩形範囲を指定してExcelに変換する場合は、1ページに対して1カ所のみ範囲指定が可能です。
その他の制限
- 本ライブラリは、マルチスレッドでの動作は保証しません。