PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr
スペース

デジタル組版の基本用語

最終更新日:

アンテナハウス株式会社


自動組版とDTP

テキストや画像などの素材をコンテンツという。テキストに指定するフォント名、文字の大きさ、行中の文字配置方法、約物の詰め処理、行頭・行末処理、行の間隔などを総称してスタイル指定という。本文領域外の余白・柱・ページ番号、本文領域内の段落・表・図など、様々な組版対象の配置指定をレイアウト指定という。

組版とはコンテンツを、スタイル指定とレイアウト指定に従って、見栄え良く紙面の上に配置する処理である。活字の時代には職人の技であったが、情報化の進展に伴い、徐々に職人の技がコンピュータ・プログラムによって置き換えられている。

DTPとWYSIWYG

DTPはデスクトップ・パブリッシングの頭文字であり、従来は専門の制作会社によって行われていた組版処理をデスクトップ・コンピュータで行うこと(DTP組版)またはそのためのソフトウエア(DTPソフト)を意味する。Macintosh上のPageMakerを発売したアルダス社の社長であるポールブレナール氏が提唱した言葉とされている。DTP組版では、オペレータが、DTPソフトを使ってパソコンの画面上にテキストや画像などのコンテンツを配置しながらページを組み上げて行く。オペレータがコンテンツの入力、スタイル指定、レイアウト指定を同時並行で対話的に編集するので木目細かいページを実現できる。DTPと同時に流行った言葉にWYSIWYGがある。

WYSIWYGはWhat You See Is What You Getの頭文字であり、編集画面上の組版結果を画面に表示されるとおりに印刷結果として得られることを意味する。

自動組版

DTP組版はオペレータが画面上で対話的に組版処理を行うのに対して、自動組版は組版処理をコンピュータによる自動処理で行う。自動組版ではコンテンツはデータベースからダイナミックに取出し、あるいは、予め別に準備されているものを利用する。スタイル指定やレイアウト指定はプログラムやパラメータとして予め準備しておく。DTP組版オペレータの代わりをプログラムとパラメータが担うことになる。

但し、DTP組版もレイアウト指定、スタイル指定、文字や行単位の組版処理にはDTPソフトに組み込まれたプログラムの支援を利用するので半自動組版といっても良いだろう。自動組版システムにはDTPソフトに組み込まれた組版プログラムを使って、最小限の自動処理機能をプラグインで追加して実現する方式と、組版処理すべてを自力で行う自動組版専用ソフトを使う方式がある。DTP組版と自動組版ではコスト構造が根本的に異なることに注意したい。DTP組版ではオペレータが1ページ単位に人手で組版処理を行うのでコストがページ数に比例する傾向がある。自動組版はスタイル指定、レイアウト指定を予めプログラムしておくため初期投資がかかるが、ページ数が多くなってもそれに比例してコストが増えるわけではない。DTP組版はオペレータの知恵を必要とする柔軟な紙面構成の出版物、自動組版は所定の同じスタイル・レイアウトを繰り返して使用する出版物に向いている。

XML

狭い意味では1998年にW3Cの勧告となったExtensible Markup Language仕様(XML勧告)のことを意味する。XML勧告に定められた条件を満たすデータのことをXML文書という。概念的な意味でXML文書の応用をXMLということもある。XML文書本文はテキストで論理構造をマークアップ表記で表す。図形等バイナリファイルを外部において参照できる。次は日々の交通費のデータをマークアップ表記で示した例である。

<交通費>
  <データ record="1">
    <日付>5月10日</日付>
    <勘定科目>交通費</勘定科目>
    <金額>1,260</金額>
    <備考>B社まで、タクシー</備考>
  </データ>
  <データ record="2">
    <日付>5月10日</日付>
    <勘定科目>交際費</勘定科目>
    <金額>15,000</金額>
    <備考>B社Aさんを接待</備考>
  </データ>
</交通費>

<データ record="2"><日付>など、< >でくくられた表記をタグという。タグには開始タグ(< >)と終了タグ(</ >)がある。開始タグから終了タグまでを要素、タグで囲まれた範囲を要素の内容、recordを属性、”2”を属性値という。

XML文書のマークアップ表記は①文書全体を囲む唯一のルート要素があること、②ある要素は必ず別の要素の内部になること、③開始タグと終了タグが常にペアになることなどの条件を満たす。

あるXML文書に使用するタグの種類(タグセット)を決めるのは、文書の雛形を決めることに相当する。これを文書型定義という。XML勧告は文書型を定義する方法、XML文書を処理するパーサというソフトが処理すべきことなども定めている。

このようにマークアップ表記の規則を細かく規定したものをマークアップ言語といい、起源は30年以上前にの一般化マークアップ言語GMLに始まる。1986年に標準一般化マークアップ言語SGMLが作られたが複雑すぎてあまり普及しなかった。この反省を踏まえて、1998年のXML勧告はSGMLと比べて簡素化され、またWebで利用しやすいように決められた。XMLはシステム間・企業間のデータ交換需要が高まった時代背景もあり短時間で普及した。

DTDとスキーマ

XMLの文書型を定義する方法は幾つかある。伝統的な方法はDTD(Document Type Definition文書型定義宣言)を使うものでSGMLの時代から引き続いている。ただし、DTDには、①XMLになって導入された名前空間が規定できない、②データの型の表現が不十分、などの限界がある。

このため新しくXML Schemaという定義方法が標準化された。XML SchemaはXSD (XMLスキーマ定義)を使って文書型を定義するが、例えば数値の型や数値の範囲などの規定が可能となっておりDTDよりも強力である。但し、オフィス用の文書処理に応用する文書型定義のためにはDTDの機能で充分と考えられている。

DITA

DITADarwin Information Typing Architectureの頭文字)は、XMLの文書型の一種類を規定する国際標準である。DITAは文書を部品化して記述し、再利用する目的で設計された。

DITAでは文書をトピックという基本単位で記述して、多数のトピックをマップという構成情報を利用して組み立ててマニュアルなどを作成する。マークアップ言語はもともと文書の再利用のために発案されたが、特にDITAでは一歩進んで文書処理のシステム化を志向していると言える。

トピックはタイトルとある種の形式の内容をもつ情報の単位であり、ひとつの主題・質問の回答として意味をもつ範囲で最も短く、かつ一単位として編集するのに適当な長さをもつようにする。トピックの文書型としてtopic、task、referenceなどの既定の文書型が幾つか用意されている。この既定の文書型は徐々に増えている。また、既定の文書型をユーザが拡張することもできる。DITAで作成したコンテンツは、HTMLに変換してWebペーとして利用したり、PDFに変換して出版物として利用する。

画像とSVG

ドキュメントのコンテンツとしての画像はラスター画像とベクトル画像に分けることができる。ラスター画像の代表例は携帯電話の画像交換によく使われるJPEGである。ベクトル画像は線や折れ線、多角形を組み合わせて図形を表現したものでAdobe Illustratorなどアプリケーション専用形式やWindows用のWMF/EMFなど多数ある。SVGはWebなどで使うためのベクトル画像の標準形式として提唱されており、XML文法を使って定義されているのが特徴である。SVGには、携帯電話や組み込み系のシステムで使うためのSVG Tinyという小規模セットも提唱されている。Web上では当初アドビシステムズのSVG Viewerが無償配布されている。また、FireFoxなどのブラウザはSVGをある程度表示できるが、マイクロソフトのInternet ExplorerがSVGをサポートしていないなど、Webでの普及が遅れている。

なお、SVGの中にはimageタグを使ってJPEG、PNGを指定することでラスター画像を含むこともできる。

XSLTとXSL-FO

XSL-FO(Extensible Stylesheet Language – Formatting Objects)はXMLを印刷するために開発された標準仕様である。SGMLの時代には同じ目的のDSSSLという国際標準があったが、XMLの時代になってXSL-FOがDSSSLにとって代わる存在となっている。

XSL-FOの仕様はページマスター、ページ上の領域、ブロック・オブジェクト、インライン・オブジェクト、表などの様々な組版対象オブジェクト(Formatting Object)を規定している。また、ページマスターの出現順序、ブロック前後の強制改ページの有無、ブロック間の空き量、ブロック内での改ページ禁止など、自動組版の際のオブジェクトの振る舞いを事前にプロパティとその値で指定することができる。

XSL-FOを使ってXMLを印刷するときは、第一段階でXMLファイルをレイアウト指定済みのXSL-FOファイルに自動変換する。第二段階でXSL-FOファイルのレイアウト指定を解釈しながらページ上にオブジェクト配置処理する。第二段階が組版処理であり、組版処理された結果はPDFに出力することが多い。

なお、第一段階でXMLからXSL-FOに変換するときに使用するのがXSLTというスタイルシートである。XSLT(XSL Transformations)はXMLからXSL-FO変換のために導入されたが、前半の変換だけでも有用なのでXSLTのみで独立した標準仕様となっている。

PDF

組版した結果をWeb経由で大勢が共有する場合、または、組版した結果を印刷会社に受け渡すためには、組版結果を保持することのできる電子ファイル、すなわちページを表現できる電子ファイルが必要である。

この機能を実現する電子ファイル形式の中で最もポピュラーなものがPDFである。PDFは1990年代初頭にアドビシステムズが発明したものであるが、PDFの仕様書は2008年にISOの32000-1という国際標準仕様として刊行された。

Web、HTMLとXHTML

DTP、自動組版、XSL-FO、PDFといった技術とその応用は印刷をベースとして形作られたものである。これに対して、Webの起源は印刷ではなくまったく異なった領域である。すなわち、Webは分散して存在する文書など情報をインターネット経由で利用するという目的で発明された。その後、パソコンの画面の上に視覚的に情報を表しながらWebを閲覧するWebブラウザが現れたことで爆発的に普及した。

HTML(Hyper Text Markup Language)は、Web上に情報を表現し、散在する情報を利用するためにSGML文法を利用して定義された文書型である。HTMLをXML文法によって定義しなおしたものがXHTMLである。

CSS

CSSはCascading Style Sheetsの略であり、HTMLでコンテンツを表現し、CSSを使ってレイアウトを表す役割分担と共に提案されている。スタイルを適用するHTMLのタグ名とそのタグをどのように表示するかを、次の例のように指定する。

h1 {font-size: 2em; font-weight: 900;}
 /*(h1要素のフォントの大きさ、太さを指定)*/
h1 a { background-color:rgb(240,240,212);}
 /*(h1要素内のa要素に背景色を指定)*/

上の例ではh1要素の内容を可視化するときは文字を本文の2倍の太字で表すことになり、さらに、h1要素内のa要素の内容を可視化するときは色を変える。CSSではスタイルを適用する対象を選択するセレクタ(h1、h2など)と、それに適用するスタイルを表すルール({ }内の記述)が基本である。CSSは、①ブラウザやCSS組版ソフト(UA)に内蔵、②CSSファイルとしてHTMLにリンク、③HTMLの<style>~</style>要素の内容として指定、④タグのstyle属性に指定など分散して配置できる。ひとつの要素に多数のセレクタが該当するとき、④>③>②>①の優先度でスタイルを適用する。これをカスケード方式という。CSSが提唱された背景には、Webブラウザが普及して、Webを画面で対話的に操作するようになる段階で、HTMLに視覚的なレイアウト指定をする機能が追加され、その利用が増えたことがある。ブラウザの表示媒体であるコンピュータの画面は、大きさ、縦横比、解像度などは千差万別であり、Webページの情報を記述するHTMLにレイアウト指定をも埋め込んでしまうと、多様な画面表示に対応し難いなどの問題が生じるので、コンテンツとスタイルを分離することが推奨されている。

なお、CSSはHTMLのみでなく、XHTMLやXML文書のレイアウト指定もできる。

ツール

DTPでは、データは使用するDTPソフト毎に独自の形式で作成されて外部のファイルとして保存される。ドキュメントを記述する形式がアプリケーション・ソフトウエアから切りはなされていないため、InDesignやQuarkXpressなどの特定のツールで作成した文書ファイルを他のツールで利用するには1対1対応のコンバータを使う必要がある。

これに対して、XML、SVG、XSL-FO、DITA、HTML、CSSは標準仕様である。誰でも、また様々なツールを使って標準仕様に準拠するデータを作成することができる。そして、標準仕様で作成されたデータを異なるツールを利用している企業間で受け渡すのも比較的簡単である。

XMLを初め、これらの標準仕様が普及する背景には、こうしたオープンな環境を誰でも簡単に手に入れることができることがある。

オーサリング・ツール

ドキュメントを編集するツールのことはエディタという。最近は、コンピュータによるマルチメディアの編集機能の充実に伴い、グラフィックス、映像、音楽、Webサイトなどの様々な情報の制作をコンピュータで行なうことができるようになってきた。このようなコンピュータ上で様々な情報を編集して、作品を制作するツールをオーサリング・ツールという。

自動組版ツール

XSL-FOやHTML+CSSはレイアウト指定を行なった状態である。レイアウト指定された情報をページの中に配置していく処理は、自動組版の一種である。XSL-FOをPDFに変換するツールは20種類以上ある。但し、日本語組版のできる製品は少ない。

HTML+CSSはこれまでWebブラウザでのサポートが先行してきた。CSSは現在レベル3の標準化が進んでおり、レイアウト指定機能が強化されている。これに伴い、HTML+CSS3で印刷組版のレベルまで可能になる時代が近づいている。

Webと印刷の技術は起源がまったく異なっており、現在は、Web制作と印刷物の制作過程は全く別のプロセスになっている。しかし、将来はHTMLとCSS3によってWeb表示物と印刷物の制作過程が一元化され、コンテンツも統合される可能性が大きい。

初出

  • 「印刷雑誌」2009年5月号 印刷学会出版部発行
スペース
トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.