3.3 テキスト検索:マスク処理

PDF Tool APIでは、テキストの検索とマスク処理を組み合わせることができます。この機能を利用するためには、searchTextAndDoProcess( )メソッドでパラメータにPtlParamSearchTextAndMaskを指定することでMask処理が行われます。

PtlParamSearchTextAndMaskのマスク処理ではテキスト検索した上でヒットしたテキストを削除するのが基本動作です。さらに追加でsetRemoveElement( )メソッドを用いて指定することにより削除テキストの矩形と重なった他の要素について削除するよう指定することも可能です。この指定方法については3.2 削除する対象を参照してください。また、マスクの色や透明度についても3.1.1 マスクの色3.1.2 マスクの不透明度と同様にして指定できます。 searchTextAndDoProcess( )メソッドを用いたマスク処理では検索された対象テキストは無条件に処理されることに十分注意してください。つまり、定型文書でない一般文書などでは想定外のテキストがMask処理されてしまうことがあります。(例) "元日", "本日"のようにテキストが取得された場合、"日本"で検索するとヒットして"日"と"本"は削除されてしまいます。

検索機能については、PtlParamSearchTextAndMaskクラスがPtlParamSearchTextクラスを継承したものであるため、キーワード・オプションの指定方法ともにテキストの検索と同様に動作します。キーワードの指定については1.2.1 キーワードの指定による検索を、オプションについては、1.2.2 検索オプションの指定:検索対象文字列のオプション1.2.3 検索オプションの指定:取得順序1.2.4 検索オプションの指定:同一行とみなす文字の重なりを参照してください。