ページ上でテキスト抽出する範囲、抽出しない範囲を指定します。また、回転しているページの角度を補正します。
図3・51 抽出範囲、抽出除外範囲と回転の指定
抽出範囲指定
- 抽出範囲枠を指定すると、その範囲に含まれるテキスト枠・画像枠のデータのみをテキスト抽出の対象とし、範囲に含まれない枠のデータは無視します。これにより、例えば柱やノンブルなどを除いて基本版面の情報のみを抽出したい場合などに利用できます。
既定値では、抽出範囲枠をページ全体に設定します。
図3・52 抽出範囲枠の指定
- 抽出範囲枠の指定は、[他ページに適用]機能を使用して他のページに一括で複製できます。
- 抽出範囲枠は、ページ上に一箇所だけ指定できます。
抽出除外範囲指定
- 抽出除外範囲枠を指定すると、その範囲に含まれるテキスト・画像データを抽出対象から除外します。これにより、例えばテキスト枠内で不要な画像を除き、他のテキストだけ抽出するといった使い方ができます。
図3・53 抽出除外範囲枠の指定
- 抽出除外範囲枠の指定は、[他ページに適用]機能を使用して他のページに一括で複製できます。
- 抽出除外範囲枠は、ページ上に一箇所だけ指定できます。
回転
- PDFのページが回転している場合、ページの角度を90°単位に補正して表示します。
- 回転角度は、元のPDFの表示角度を基準に指定します。
- [0°]:ページを元の角度に回転して表示します。
- [右90°]:ページを右90°に回転して表示します。
- [左90°]:ページを左90°に回転して表示します。
- [180°]:ページを180°回転して表示します。