アウトライナー機能紹介:しおりの自動作成・編集
しおりの自動生成機能
文書内のテキスト情報から自動生成
独自のPDF解析エンジンによる見出し判定で、複数のしおりを自動で生成・付与できます。
文書内のテキスト情報から、文字列の位置やスタイル、文字種など様々な要素を総合的に分析し、見出しかどうか判断します。
見出しとして判定したデータは、しおり設定条件に合わせて抽出され、しおりとして生成出力されます。
設定条件は以下の項目が細かく設定できますので、出力結果の調整も簡単です。
- 自動認識によるしおりから除外したい項目(文書タイトル、図、表、日付)の指定
- 一定サイズ以下のフォントサイズ、明朝体の見出しの除外指定
- 最大文字数、句点、ピリオド、括弧、ゴシック体等、見出しとする文字の条件指定
- 上下左右のページ余白から入力値(mm)領域の文字列除外
- 自動抽出の前提条件
-
見出しを自動抽出するためには、PDFの見出しの文字がテキストとして作成されている必要があります。
次のような場合は自動抽出できません。- 画像で作成されている見出し
- アウトライン画像化されている文字
- スキャナーで作成した画像のPDFの見出し
- OCRによる透明テキスト
既存の目次から自動生成
PDFのページ内に目次がすでにある場合、目次を解析してしおりを作成できます。
本文を解析してしおりを作る場合と異なり、目次の項目をそのまましおりの項目にするため、作成されるしおりの精度が高くなります。但し、目次の項目に飾りが付いているときなど認識精度が低下します。
しおりの自動生成時、PDF内の目次に該当ページへ移動するリンク注釈を挿入できます。
しおりの生成時に合わせて実行されますので手間いらずです。
矩形内のテキストから自動生成
しおりの自動生成時、「矩形を指定してしおりを生成する」オプションを使うことで、ドラッグアンドドロップで指定した範囲内の文字のしおりを複数一括で生成できます。
認識の際は対象とするページ、見出しとして検出する文字列を指定すると、矩形内の特定の見出しをしおりとして抽出できます。
ページ内の柱(書籍や雑誌などの冊子物で、主にページの右上や左上にある、章等の要点などを記した文字列)の箇所を指定し、柱の情報をそのまましおりにすることができます。
しおりの新規作成・編集機能
しおりの作成・削除・編集
アウトライナーの「しおりモード」では、しおりツリーの項目の作成・削除・編集ができます。
PDFページ上をドラッグで指定した矩形範囲内のテキストをしおりの項目にできます。一つ一つしおりを付けたい場合や、自動生成の出力結果を細かく修正したいときに便利です。
しおりはページ内移動だけでなく、外部ファイル(PDF、Word等)を開く、指定したURLを開く指定が行えます。自動生成で付与したしおりの移動先や指定箇所のチェックを行うこともできます。
作成したしおりはマウスクリックで階層構造を調整できます。章・節・項の階層を作成するのも容易です。
しおりのプロパティペインでは、PDF閲覧の際のしおり項目の見せ方と、しおりの移動先ページの指定・編集ができます。
しおりチェック
しおりチェック機能ではしおりに設定された飛び先、ファイルパスが有効かチェックします。
PDFファイルを指定している場合はファイル内に指定されたとび先ページが存在するかも確認します。PDFのしおりを一括でチェックできるため、一つ一つクリックして確認する必要はありません。
V3.2からはチェック結果をCSVで出力することができるようになりました。
→ サンプルファイルダウンロード
ファイルパスの方式をURI方式に変更可能
ファイルパスをWebのURI方式に変更できるようになりました。
PDF出力設定のURIアクションのタブからURI置換設定を有効にすると、PDF出力時、指定したURIから始まるURI方式にファイルパスを変更するようになります。
しおり情報の外部ファイル入出力
しおり情報をテキストデータで入出力
PDFに付与されたしおりの情報を一括でテキストデータにして出力したり、しおり情報のテキストデータを読み込むことができます。
それぞれ、テキストデータの形式は、CSV形式、XML形式、JSON形式の3種類です。どのファイル形式で出力しても同じしおり情報を出力できますので、作業者のやり易いファイルで編集し、PDFに書き戻すことができます。
- 外部ファイルに含まれる情報
-
- しおりのテキスト
- クリックした際の表示方法(固定、全体表示、ビューに合わせる等)
- しおりの移動先の座標(ページ左上からの距離、ページ上端からの距離等)
- クリックした際のアクション(移動、外部ファイルを開く、Webページを開く等)
複数のPDFに一括でしおり情報を付与
あらかじめ出力・作成したしおり情報ファイルを使用して、指定した複数のPDFに一括して同じ内容のしおりを付与できます。
国土交通省の電子納品のように、複数に分割されたPDFに対して同じ内容のしおりを付与したい場合によく使用されています。
こんな使い方も!
- 外部ファイルに出力してしおりを編集
- しおり情報のチェック
- テキストとして再利用
- PDF間でのしおり情報の共有
アウトライナーには、分割時のしおりの扱いを調整する機能もあります。
詳細は「機能紹介:PDFの分割・結合」ページをご覧ください。
→ 機能紹介:PDFの分割・結合