PDF、組版と文書変換のアンテナハウス株式会社
PDF、組版と文書変換のアンテナハウス株式会社
トップページ > PDF資料室 > PDF/UA-1(ISO 14289-1)について
更新日: 2017/9/25
本記事は、アンテナハウスブログI love software2!に掲載された「PDF/UA-1 (ISO 14289-1)」関連の記事を一つにまとめ、さらに内容を加筆したものです。
PDF/UA-1規格書の正式名は:
Document management applications —
Electronic document file
format enhancement for accessibility —
Part 1: Use of ISO 32000-1
(PDF/UA-1)
PDF/UA-1はタイトルのとおり、PDFのアクセシビリティを高度化することを目的としています。PDFにおけるアクセシビリティの向上とはどのようなものでしょうか。現在、PDFは最も広範に利用されている電子文書形式ですので、多くの人に使いやすいものであることが求められます。障害を持つ人、高齢者にも簡単に使える必要があります。
たとえば、視覚に障害を持つ人が利用する場合、音声読み上げソフト等によって、テキストが確実に読み上げ可能である必要があります。画面に文字が表示されているPDFでも、読み上げが確実とは限りません。コピー&ペーストで他のアプリケーションに文字がコピーできないPDFがありますが、このようなPDFは文字コードを取り出せないため、音声読み上げソフトでも読み上げできません。
また、同じ漢字でも日本語と中国語では読み方が異なる為、そのテキストがどの言語のものなのか、といった情報も必要となります。
また、画像、図形等が使用されている場合、それがどのような意味を持つものなのか、テキストによる説明があると、利用しやすくなります。
PDF/UA-1は、PDFの国際標準であるISO 32000-1(PDF 1.7)で定める機能をベースとして、アクセシビリティの観点から使用すべき機能を決め、使用方法に制限を付けたり・禁止する機能などを決めています。
ISO 14289-1仕様書は2012年7月25日初版、2012年8月1日修正版が出版されました。2016年8月現在では2014年12月15日版が最新です。
この規格はISO 32000-1のほかに、W3Cの Web Content Accessibility Guidelines (WCAG) 2.0をベースとしています。PDF/UA-1ファイルの作成、使用に必要とされる要件は、PDFファイルをWCAGに沿って利用するために必要とされるPDFの機能の使用方法ともいえます。
仕様書の中心はPDF/UA-1ファイルの作成者(書き手)側に対する要件です。主な項目は次のとおりです。
PDFの内部のオブジェクトの並びにタグを付ける仕組みは次の図のようになります。タグ付きPDFではPDF内部のオブジェクトの並びにBMC~EMCなどでマークアップします。BMCの前にタグとプロパティがつきます。マークアップした部分から構造ツリーを作成します。
ISO 32000-1は次の49種類の標準タグを決めています:
Document Part Art Sect Div BlockQuote Caption TOC TOCI Index NonStruct Private H H1 H2 H3 H4 H5 H6 P L LI Lbl LBody Table TR TH TD THead TBody TFoot Span Quote Note Reference BibEntry Code Link Annot Ruby RB RT RP Warichu WT WP Figure Formula Form
PDF/UA-1では、これらのタグの使い方を厳しく指定しています。たとえば、表のタグは論理的な行と列の関係をもつコンテントのみで使うことになっています。上のようにタグを列挙したコンテントを仮に3列の表形式でタグ付けしたならば、PDF/UA-1の教条主義的適用では違反と判断されるでしょう。
PDF/UA-1ファイルが持つアクセシビリティ機能を利用可能とするためにリーダー(読み手)に必要とされる要件が決まっています。準拠リーダーの主な要件は、ISO 32000-1:2008で定義されているドキュメントの論理構造とアーティファクトを処理する能力を持つこと、および、ATとのインターフェース機能を持つこと、とあります。
AT(Assistive Technologies:W3CのWCAG2.0の邦訳では「支援技術」)とのインターフェース機能とは、
とあります。
以下、PDFの各オブジェクトに対して個別に記載されている要件となります。
ATにはPDF/UA-1を使用するスクリーンリーダーや、音声入力をサポートするデバイス、キーボード入力を容易にする装置、点字に変換して印刷するソフトウェアなど広範なソフトウェア、ハードウェアが含まれます。
ATの要件は、主に次の項目です。
PageLabelとは、たとえば、目次部分は小文字のアラビア数字、本文はローマ数字といったページ番号を持つ文書がありますが、PDFでそのような表現をする機能です。ナビゲーションに、このPageLabelや、文書の章・項といった論理構造の階層情報を使用する機能が必要とされます。
ISO 32000-1では14.7にマークアップと構造ツリーの枠組みを、14.8に標準的なタグを規定しています。ただし、タグによるマークアップの仕方や構造ツリーの作り方はあまり厳密に決めていません。
PDF/UA-1では、ISO 32000-1で厳密に決めていなかった点について、ISO 32000-1よりも厳密に規定しています。
たとえば、見出しを<P>でタグ付けしてもISO 32000-1のタグ付きPDFの規定には違反しません。しかし、PDF/UA-1では、すべての見出しに見出しタグを付けなければなりません。また、ISO 32000-1ではタグ付けが曖昧であるとしておくことが許されます。しかし、PDF/UA-1は曖昧なタグ付けを許していません。そこで、ISO 32000-1のタグ付きPDF(すなわちPDF 1.7のタグ付きPDF)とPDF/UA-1の関係は次の図の点線と実線の丸のような包含関係で示せるでしょう。
ISO 32000-1のタグ付きPDFの仕組みを採用した規格として、PDFの長期保存のためのPDF/Aシリーズがあります。PDF/Aには1から3までのパートがあります。それぞれについて、完全準拠版としてPDF/A-[1|2|3]aという仕様があり、PDF/A完全準拠ではタグ付きPDFであることが要求されています。PDF/A完全準拠版は、ISO 32000-1のタグ付きPDFになります[1]。
PDF/UA-1には長期保存のための要件はありません。たとえば、PDF/Aシリーズでは長期保存の目的上セキュリティ設定は禁止です。しかし、PDF/UA-1は、スクリーンリーダーなどの支援技術サポートが許可されていればセキュリティ設定しても問題ありません。このように用途によって許される機能が異なっていますので、使いこなしには、内容の相違を理解する必要があります。
国連の障害者権利条約では、障害者が情報、通信その他のサービス(電子サービス及び緊急事態に関わるサービスを含む)を簡単に利用できるようにする措置をとることを定めており、日本を含む世界の主要国が批准しています。こうした動きを受けて先進国では、政府・行政機関や議会を中心にPDFのアクセシビリティに対する要求が高まっています。
米国の議会図書館では、望ましい受け入れ文書形式を発表しています。デジタル出版物ではBITS/JATSやEPUBの優先順位が高くなっていますが、PDFの優先順位はそれに次いで高く、なかでもPDF/UAはPDF/Aよりも優先度の高い形式とされています。次の図は2016年8月時点の米国議会図書館のデジタル文書形式受け入れ優先順位です。
ただし、上述のようにPDF/UA-1では、形式的のみならず、意味的に厳密なタグ付けが求められています。一般のオフィス文書から作成するPDFをPDF/UA-1対応とするのは、現時点では高コストになってしまうでしょう。しかし、オリジナル文書がXMLなどで構造化されていれば比較的簡単にPDF/UA-1準拠のPDFを作成できます。
なお、弊社のXML自動組版エンジン:AH Formatterは、V6.4からPDF/UA-1対応のPDF生成に対応済みです。