OCR機能

以下では、OCR機能の概要を説明します。

OCR機能とは?

OCR機能の利点

基本機能

言 語サポートするフォントファミリー
日本語明朝系、ゴシック系
英語(その他欧州言語)Arial、Times New Roman、Courier New
韓国語Batang
繁体字中国語PMingLiU
簡体字中国語SimSun
機 能説 明
認識できる最大文字サイズ61ポイント(300dpi)
対応する画像解像度96~500dpi(300~400dpiを推奨)
調整可能な項目言語種類・dpi値・画像の回転(自動、左右90°・180°)・傾きの補正(自動、左右45°)・フォントの指定

変換の制限、注意事項など

OCR処理には以下の制限があります。

  1. 画質:画質とは、OCR処理エンジンに与える画像の品質です。画質には、オリジナル文書そのものの品質と、スキャンするときの設定、そしてスキャナーの特性が影響を与えます。具体的には、ノイズ・原稿の歪み・色の不均質などがあげられます。画質の悪い画像データや、画質が悪いままPDF化された文書は、OCR処理を行っても判読できない可能性が高く文字の認識率が低くなります。
  2. 解像度:解像度とは、1インチ幅(1インチは約25.4mm)の範囲内で点をいくつ表現できるかにより画像の細密さを表現する単位です。一般的には解像度の数値が大きいほどより精密な画像が作成でき、細部まで細かく表現できます。解像度が小さいと、小さな文字などがつぶれてしまいOCR処理を行った場合に認識率が低くなります。ただし、解像度を高くして画像を作成すると非常に多くのメモリーを消費するため、パソコンで利用可能なメモリー使用量をオーバーした場合にはOCR処理の前段階で失敗することがありますので注意が必要です。
  3. 画像の複雑さ:画像中に文字、図、グラフ、線などが混在していると、OCR処理に影響を与えます。ここで「複雑さ」とは、定量的に平準化が難しい状態を指します。人間の目には「単純」に見えることであってもOCR処理エンジンにとって「複雑」である場合、結果がオリジナル文書と異なったものになる可能性があります。
  4. 横書き・縦書きの混在:OCR処理では、画像中の範囲をいくつかの領域に分割し、領域毎に文字認識処理を行います。この際に横書き・縦書きが混在していずれか判別がつきがたい場合などは領域分割がうまく行われず、結果として文字認識率が低くなる可能性があります。
  5. 複数言語の混在:OCR処理では、ページ内に複数の異なる言語が混在した場合、いずれか1種類の言語のみ認識できます。例として日本語と中国語または韓国語が混在した場合、[言語]に日本語が指定されていると、それ以外の言語の文字は正しく認識できなくなります(言語を指定して変換する場合はそれらに対応したフォントも合わせて指定してください)。なお、例外として日本語と英語が混在した場合は両方の言語を同時に認識できます(中国語または韓国語と英語が混在した場合も同様に可。ただし、英語以外の欧文との組み合わせでは同時認識できません)。

OCR補正機能

OCR処理では、対象の画像を[横書き]・[縦書き]・[表]・[画像]の4種類の領域に分けて認識します。この領域認識がうまくいかないと、変換結果が期待したものになりません。本製品のOCR補正機能では、ページ内の画像を手動で任意の領域に分割し文字認識処理を行うことができます。既定のOCR処理で領域認識がうまく行われず結果が思わしくなかった場合に、本機能を使用することで改善できる可能性があります。