PDFとWebにはどんな違いがありますか? インターネットやWebがますます普及するとしてPDFは使い続けられますか?
更新日:
このページの目的
Webシステムはインターネットを介在して、デジタル文書を広く閲覧するための仕組みとして現代社会に欠かせないインフラです。Webシステム上ではデジタル文書のほか、多種多様なデータが流通しています。特に近年では動画による配信が増えています。
デジタル文書は、テキスト、画像や図形などの内容から構成されます。デジタル文書配信形式として、もっともポピュラーなのはPDF(PDFファイル)およびWebページ(「Webページ」とはHTMLで表現されるファイル)の二つといえるでしょう。ここでは、PDFとWebページの特徴や相違点を概観し、特にPDFの役割について考えてみます。
PDFとWebページの共通点
最初に両者の共通点を考えてみましょう。PDFとWebページは両方とも1990年代前半というほぼ同じ時期に、インターネットの一般への広がりと共に誕生しました。
PDFの誕生と特性
PDFはアドビがページ記述言語PostScriptの後継として発明したものです。PostScriptはDTPソフトで制作したレイアウト済のデータをページプリンタに渡すための言語です。PDFファイルを新に発明したのは、PostScriptはインターネットで配布するには機能的に不十分であったことなどが理由です。
このようにPDFは印刷技術に由来します。2007年にアドビはPDFの仕様を国際標準機関に寄贈しており、現在、PDF形式はISOの国際標準仕様となっています。
PDFは文章・図・表などの文書の内容に紙に印刷するためのレイアウトを施した状態を、そのままデジタルデータとして保存したものです。PDFはインターネットのサーバーにアップして蓄積しておき端末にダウンロードして閲覧します。
例えば、数学や物理学などの論文をPDF形式などで保管するarXiv(アーカイブ)は、1991年8月にスタートしています。
(参考)PDFの国際標準化への歩み
Webページの誕生と特性
Webシステム(World Wide Web)は分散したコンピュータに配置された情報を取り出して閲覧するための技術としてTim Berners-Leeが発明したものです。
Webシステムでのコンテンツを表すために考え出されたのがHTML形式です。HTMLの仕様は当初はTim Berners-Leeが中心となって運営していたW3Cが決めていましたが、現在はWHATWGが決めています。
HTML形式で表現された文書はHTMLファイルとして、Webサーバー上に用意されたホームページに蓄積・保存されます。
WebページはPCやスマホなどの端末のWebブラウザで閲読します。1990年代中頃にはネットサーフィンという言葉が流行ったものですが、Webブラウザを操作してWebのサイトからサイトを渡り歩いて情報を閲覧する行動を表すにはまさしくそのような言葉が適切でした。
PDFとWebページによる情報配信
PDFとWebページは、それまでのアプリケーションファイル形式と異なり、配信用の情報を作成するアプリケーション、情報を受領して表示するアプリケーションが異なります。そのため国際的な標準形式として決められていることに大きな意味があります。
このようにPDFやWebページはインターネットを介した情報配信のために発明され、インターネットと共に普及しました。そして、これらは商業的なメディアとしては、紙による情報提供媒体である新聞や雑誌などと激しく競合しています。
作成-公開・配布-保存―閲覧のプロセス
PDFやWebページの作成、配布、閲覧にはさまざまなアプリケーションが関与しています。次にそれぞれの作成から閲覧までのプロセスでどのように扱われるかを簡単に比較してみます。
HTMLファイル | ||
---|---|---|
主な作成手段 |
|
|
公開・配布手段 |
|
|
保存手段 |
|
|
閲覧手段 |
|
|
PDFとWebページの使われ方でもっとも大きな相違点は次の点にあります。
- PDFは情報の送り手から情報の受け手に受け渡され、受け手によって保存されることが多い。
- HTMLは送り手によってWebサーバー上に配置したされたものを受け手が端末で閲覧する使い方が多い。
レイアウト指定方法の相違
PDFとWebページは文書内容を可視化する際のレイアウト方法が根本的に異なっており、それが両者を利用する上で大きな違いとなります。
PDFのレイアウト指定方法
PDFは文書の作成者・制作者が、A4、B4といった書面上に文字、画像および図形などのオブジェクトのレイアウトを指定します。レイアウトが指定され、オブジェクトが配置された状態でデジタルデータとして作成されます。
このため、原則として、受け手がPDFを閲覧する環境によってレイアウトが変わって見えることはありません。但し、受け手の環境が変わっても見栄えが全く同じになるために、制作時に注意すべきことがあります。
Webページのレイアウト指定方法
一方、Webページは、HTMLファイルには文字や図形などのレイアウト対象のみを指定し、それらをレイアウトするための指定(例えば、フォント・ファミリー、フォントの大きさ、あるいは段落の周囲の空き、段落内のテキストの揃え方、図形の大きさなど)をCSSで別途指定しておくのが標準です。
そして受け手の使用するデバイス上のブラウザがWebページの内容を画面(ウインドウ)のサイズに合わせて配置しながら可視化するのが一般的です。
このためWebページのレイアウトは受け手が閲覧する画面によって変化します。
PDFによる文書公開の役割
PDFをWeb上で公開する
PDFによる公開には様々なメリットがあります。一番簡単なところでは、WebサイトにPDFファイルをアップするだけですぐに情報が共有できるということでしょう。昔は端末のパソコンにAcrobat Readerが必要でしたが、現在はブラウザのリーダーが充実しているため、それも必要なくなってきています。
Chrome、EdgeおよびFireFoxといった主要なブラウザにはPDFリーダー機能が備わっています。また、PDFをブラウザ上で可視化するJavaScriptライブラリーも用意されています。
こうして、現在では、Webページをブラウザで表示した状態から、PDFへのリンクをクリックするだけでスムースにPDF閲覧の状態に移行できるようになっています。
PDFは保存が可能
Webページと違って、PDFであれば手元にダウンロードして印刷もできます。また、ECなどから取引情報などを含むPDFを入手して、証憑として保存しておくこともできます。
さらにはPDF/Aという長期保存の形式も規定されているので、PDFの作り方が適切であれば、20年以上の長期保存もできます。
(参考)PDF/Aとはなにか?
PDFは使われ続ける
現在、情報流通の世界は紙からデジタル媒体への転換が進んでおり、特にWebページが中心になりつつあるようです。
しかしながら、PDFは作成者の意図したとおりのレイアウトを保持したまま、受信者の手元に長期保存できるという大きな特性があります。Webページの普及にかかわらずPDFも長く使われ続けるでしょう。
参考資料
- Adobe PostScript
- https://www.adobe.com/jp/products/postscript.html
- arXiv.org e-Print archive
- https://arxiv.org/
- HTML Living Standard
- https://html.spec.whatwg.org/
- Tim Berners-Lee『Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web』Harper Business (2000/11/7)
- 『PDFインフラストラクチャ解説』1.2 PDFの歴史
- ページって何?「ページ」と本のかたちとの関係