PDF/Aとはなにか
更新日:
このページの目的
契約書や請求書、報告書をPDFでやり取りするのは当たり前になりました。しかし、「普通」のPDFは、必ずしも耐久性や耐用性を担保しません。これを解決するために、ISOで国際規格化した形式が「PDF/A」です。
このページでは、PDF/Aの概要についてまとめています。
PDF/Aの概要
PDF/Aファミリー
PDF/Aは長期保存のためのPDFの国際規格です。PDFを長期に渡って保存しても、表示される内容・色・見栄えが変らないで再生表示できることを目標とし、そのためにPDFの作り方について要求条件、制約条件、禁止条件を付けています。
PDF/Aは国際規格のISO 19005として定義されています。この規格はさらに3つのパートに分かれています。
- パート1:PDF/A-1 (ISO 19005-1)2005年リリース
- パート2:PDF/A-2 (ISO 19005-2)2011年リリース
- パート3:PDF/A-3 (ISO 19005-3)2012年リリース
以下に、各パートの概要をご紹介します。
PDF/A-1の概要
表題
ISO 19005-1 (2005年9月出版)
Document Management - Electronic document file format for long-term
preservation - Part 1: Use of PDF 1.4 (PDF/A-1)
概要
PDF/A-1は、PDF 1.4仕様に基づく、電子文書の長期保存用の形式。2つの準拠レベルを定義します。
- PDF/A-1a (レベルA) :ISO 19005-1完全準拠
- PDF/A-1b (レベルB) :ISO 19005-1の一部準拠
PDF/A-1bは、PDFを表示するときの見栄えがデバイス(機器)や表示ソフトから独立して、常に同じであることが保証されることと、メタデータの埋め込みを要求します。
これに対して、PDF/A-1aでは、さらにPDF内にドキュメントの論理構造を示すタグがついていることが必要です。大雑把には、PDF/A-1aとはPDF/A-1bでかつタグ付きPDFであるといえます。
なお、一般に、ドキュメントの論理構造は存在しないものから自動的に作成できないので、PDFを出力する前のオリジナルのテキストに論理構造が示されている必要があります。
例えばアンテナハウスのFormatter(V4.2以降)は、XSL-FOの論理構造を元にタグ付きPDFを生成できますが、これはXSL-FOの構造をもとにPDFのタグをつけています。
(参考)タグ付きPDFとはどんなもの
経過
米国のAIIM他の団体が中心となり、2002年から策定作業を開始、2005年9月にPDF/A-1としてISO標準になりました。
PDF/A-1とPDF1.4の関係
PDF1.4をベースとし、PDF1.3以前に規定されていてPDF1.4で廃止された機能は使えません。また、PDF1.5以降で追加された機能も使えません。
PDF1.4の幾つかの機能を必須(要求項目)とし、一部の機能を禁止または制限しています。次に主な要求項目、禁止項目、制限項目を挙げます。ただし、これ以外にも細かな規定が数多くあります。
主な要求項目(PDF/A-1b)
- カラーの再現性を保証
- デバイス独立カラーまたはPDF/A OutputIntent指定でカラー特性を指定する
- フォント埋め込み
- 基本14フォントを含む全てのフォントの埋め込み
- 使用している全グリフがあればサブセット埋め込み(フォントの全てのグリフを埋め込むのではなく、PDF文書で使用されているグリフのみの埋め込み)でも良い
- 埋め込むフォントは、表示用途で埋め込み許可があること(フォントの不正な埋め込みを避ける)
- リーダは、文字コードでなく、埋め込みフォントで表示する(文字コードで表示するとフォント環境によって字形が変わるため)
- XMPメタデータの埋め込み
(参考)PDFへのフォント埋め込みとは?
要求項目(PDF/A-1a)
PDF/A-1bの要求項目に加えて次の項目を要求します。
- タグ付きPDFで論理構造を埋め込む
- ToUnicode CMapでUnicodeへの対応(一部フォントを除く)
主な禁止事項(PDF/A-1a、PDF/A-1b共通)
- 暗号化を禁止する。このため、パスワードによるアクセス許可はできない
- LZW圧縮
- 文書の代替可視化(印刷用と表示用のイメージを埋め込み使い分けすることなどは禁止)
- 埋め込みファイル(ファイル添付操作)
- PostScriptコード
- 外部コンテンツへの参照など外部依存性
- 透明
主な制限事項
注釈やアクションは全て禁止ではなく、一部の機能が禁止されています。
- 注釈の制限
- 隠し注釈、印刷不可の注釈
- FileAttachment(添付ファイル注釈)
- Sound、Movie(マルチメディア)
- アクションの制限
- Launch, Sound, Movie, ResetForm, ImportData, JavaScriptアクションは禁止。
- NextPage, PrevPage, FirstPage, LastPage以外の名前付きアクションは禁止。
- 対話フォームからアクションを実行禁止
微細な要求
ISO 19005-1では、準拠すべき項目を非常に細かく指定しています。例えば、フォントデータ構造のエントリの存在、TrueTypeフォントの符号化への要求などがあります。こうした微細な要求を満たしているかどうかは、ソフトウエアを使って適合性をチェックしないと保証できません。
PDF/A-2の概要
表題
ISO 19005-2 (2011年7月出版)
Document Management - Electronic document file format for long-term
preservation - Part 2: Use of ISO 32000-1 (PDF/A-2)
概要
PDF/A-2は、ISO 32000-1(PDF 1.7)仕様に基づく、電子文書の長期保存用の形式。3つの準拠レベルを定義します。
- PDF/A-2a (レベルA) :ISO 19005-2完全準拠
- PDF/A-2b (レベルB) :ISO 19005-2の一部準拠
- PDF/A-2u (レベルU) :ISO 19005-2の一部準拠
レベルAとレベルBの区分については前述のPDF/A-1の場合と同等です。レベルUはPDF/A-2で追加された区分で、レベルBに加えて、PDF内のテキストのUnicode値が取得できることを保証します(一部のフォントを除く)。
PDF/A-1とPDF/A-2の関係
PDF/A-2はPDF1.7をベースとし、使用してはいけない機能や指定しなければならない事項などを各種制限として課しています。
PDF/A-1では禁止されていた項目の一部が使用できるようになったほか、PDF1.7になったことによる新しい機能の一部が利用できます。なお、PDFのバージョンは問いません。次に追加・改良された主な項目を挙げます。これ以外にも細かな変更や追加の規定が数多くあります。
追加・改良された主な項目
- タグ付けの改良(アクセシビリティの強化)
- 圧縮されたオブジェクトストリームとXrefストリーム(ファイルサイズの縮小)
- PDF/A準拠の添付ファイルが使える
- 透明が使用可能
- JPEG2000圧縮
- オプショナルコンテンツ(レイヤー)
- ISO 32000-1に規定される注釈は一部を除いて使用可能
主な制限事項
PDF1.5以降に追加された一部の機能が禁止されています。
- 3D注釈、Screen注釈
- XFA form
- アクション:Hide、SetOCGState、Rendition、Trans、GoTo3Dview
PDF/A-3の概要
表題
ISO 19005-3 (2012年10月出版)
Document Management - Electronic document file format for long-term
preservation - Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3)
概要
PDF/A-3は、PDF/A-2同様ISO 32000-1(PDF 1.7)仕様に基づく、電子文書の長期保存用の形式。3つの準拠レベルを定義します。
- PDF/A-3a (レベルA) :ISO 19005-3完全準拠
- PDF/A-3b (レベルB) :ISO 19005-3の一部準拠
- PDF/A-3u (レベルU) :ISO 19005-3の一部準拠
レベルA、レベルBおよびレベルUの区分については前述のPDF/A-2の場合と同等です。
PDF/A-2とPDF/A-3の関係
PDF/A-2とPDF/A-3の最も大きな違いは、添付ファイルまたはファイル添付注釈としてPDF/A準拠のファイル(PDF)のみでなく、ワープロ文書やXMLファイルなど様々な形式のファイルが使えるようになったことです。
それ以外では、PDF/A-2とPDF/A-3の違いはほとんどありません。