OCR処理で参照する各種の条件を設定します。
【ヒント】
通常は[自動]を選択してください。
【ヒント】
PDF内部に文字が埋め込みされていて文字コードとの関連づけがない場合、通常の変換では文字化けしてしまいます。そのような場合、OCRを常に行う設定にすることで文字に変換することができます。
【注意!】
変換先に「OCR」を選択した場合やOCR補正機能を選択した場合は、設定に関わらず常にOCR処理が行われます。
言語 | 自動で設定されるフォント |
日本語 | MS Pゴシック(和文)、Arial(英数字) |
英語 | Times New Roman |
ドイツ語 | Times New Roman |
フランス語 | Times New Roman |
スペイン語 | Times New Roman |
イタリア語 | Times New Roman |
スウェーデン語 | Times New Roman |
デンマーク語 | Times New Roman |
ノルウェー語 | Times New Roman |
オランダ語 | Times New Roman |
ポルトガル語 | Times New Roman |
チェコ語 | Times New Roman |
ハンガリー語 | Times New Roman |
ポーランド語 | Times New Roman |
ルーマニア語 | Times New Roman |
スロバキア語 | Times New Roman |
クロアチア語 | Times New Roman |
スロベニア語 | Times New Roman |
ルクセンブルク語 | Times New Roman |
フィンランド語 | Times New Roman |
リトアニア語 | Times New Roman |
ラトビア語 | Times New Roman |
トルコ語 | Times New Roman |
カタルーニャ語 | Times New Roman |
ブルガリア語 | Times New Roman |
マケドニア語 | Times New Roman |
ロシア語 | Times New Roman |
セルビア語 | Times New Roman |
ウクライナ語 | Times New Roman |
ギリシャ語 | Times New Roman |
ベトナム語 | Times New Roman |
タイ語 | Tahoma |
韓国語 | Malgun Gothic |
簡体字中国語 | SimSun |
繁体字中国語 | Microsoft JhengHei |
【ヒント】
【ヒント】
OCR処理を使用した変換では、変換結果の文字列に対して一括で指定したフォントが適用されます。このため、元データ中に複数の言語が混在しているような場合は、指定した言語以外の文字が正しく変換されません(日本語、韓国語または中国語と英語が混在した場合を除く)。
【ヒント】
一般的に解像度が低いと文字の認識率は低下し、解像度が高いと認識率は高くなります。しかし、高解像度に設定した場合、画像作成に長時間かつ大量のメモリーを必要とするため、場合によっては処理に失敗する可能性もあります。通常は、300~400dpiの範囲を指定してください。
【注意!】
ここで設定した回転・傾き角度は、すべてのページに一括適用します。任意のページのみ設定したい場合は、別途、OCR補正機能を使用し、ページ単位に回転・傾き角度を指定してください。
【注意!】
【ヒント】
OCR処理では、画像上でテキストや表として変換したい部分を別の領域として誤認識してしまう場合があります。本製品の既定値ではそのようなときに誤認識したままOCR処理を行うため、文字化けなどが生じてしまいます。
このような場合は、[OCR補正機能]を使用すると、画面上の操作により誤認識した領域を正しい領域に補正できます。
関連...