4–11 除外する文字と枠の重なり比率を指定

抽出除外範囲枠を指定した場合、除外対象範囲に文字が含まれるか否かは、文字と枠の重なる比率により判断します。

既定値では枠の範囲に文字が45%以上重なっていれば、その枠内に文字が含まれると判断して抽出除外対象とします。
下図の例では、「行政相談所(神奈川県横浜市)」という文字が抽出除外範囲枠(緑色の枠)の一部に重なっており、枠に45%以上重なると判断して抽出対象から除外されています(図で黄色にハイライトされたテキストが抽出対象の文字です)。

images/screenshot_81b.png

図4・34 文字の上に除外範囲枠が重なる(出典:総務省ホームページ)

文字が抽出除外範囲枠と重なるとき、文字と枠の重なる比率を変更することで重なった文字を抽出対象に変更することができます。

文字の抽出除外条件を変更する

  • 抽出除外範囲枠に重なる文字を除外範囲に含めない指定は以下の手順で行います。
  • (1)テキストを含む表枠を選択します。
  • (2)表枠の枠線上でマウスを右クリックして「プロパティ」を選択します。
  • (3)表示されたダイアログボックスで、[除外する文字と枠の重なり比率]を%値で指定します。

images/screenshot_81c.png

図4・35 除外する文字と枠の重なり比率を指定
  • 重なり比率を大きな値とすることで文字が抽出除外範囲枠に重ならない設定となり、以下のような結果を得ることができます。

images/screenshot_81d.png

図4・36 枠に重なる文字が抽出対象になる