本書の作成について
本書『Open Office XML Formats入門』初版の原稿は、Word 2007で作成された後、XMLを出力し、それをSimple DocというXMLアプリケーションに変換した上で、さらにXSL-FOに変換し、Antenna House XSL Formatter V5にてPDFに出力、印刷という工程を経たようです。
第2版の制作にあたっては、第1版のSimple Doc段階の原稿ファイルを元原稿として扱うこととしました。編集のため、章ごとにファイルを分割して参照できるように改造を行いました。また、画像ファイルのパスも集約して管理できるように、間接参照が可能なように変更しました。
第2版の原稿形式をWord原稿としなかった理由を説明するため、まずWordを使うメリットについて次にまとめました。
- Wordユーザーが多いため、他の人と原稿のやり取りがしやすい
- 見た目上のレイアウトが他の人に見せやすい
- GUI操作でのアウトライン表示、ファイル分割・結合、リンク、目次自動生成、参考文献自動生成
- 履歴管理機能、コメント機能
- 誤字脱字の校正機能
概ね、「Word上で作業が完結する限りにおいては便利」と言えるでしょう。
ただしこれらの結果をWordの外に持っていこうとしたとき、望ましい結果を得るには綿密にWordprocessingML(あるいはWordML)を処理する必要がある、ということを理解した上でなおWordを使うべきかを検討することになります。
たとえばWordのGUI上でスタイルを適用する作業と、原稿を変換した編集用XMLで直接要素のタグを編集する作業はあまり変わりありません。編集用XML側でしか対応できないマークアップを行う場合、Wordで作業する分二度手間となるかもしれません。
原稿ファイルをWord文書から変更した大きな理由として、WordprocessingML文書上で、コンテンツの基本単位がParagraphであることが挙げられます。WordprocessingMLで用意されていない構造はParagraphとRunにスタイル付けをしただけになってしまうため、定義箇条やソースコードの例示などを区別することは困難です。
原稿の執筆者とXMLの編集を行う人間が同じであるとき、省略できる作業もあります。
このとき、組版してのプレビューは、PDF出力を簡単に行える体制を調えれば問題にはなりません。
初版で利用したXSLTのバージョンは1.0でした。XSLT 1.0に対応したプロセッサーは現在でも様々にあるため大部分は流用はできたのですが、メインテナンスされるのを前提としていない箇所も見受けられました。原稿の改稿、XML構造の編集、XSLTの変更は同時に進めるべきでないということを痛感しています。
AH XSL Formatter自体の組版以外での進化も作業の助けになりました。V7.2からGUI表示でPDFに設定するしおりが表示可能になりました。この機能でPDFにせずとも修正箇所の確認が容易になりました。
また、オプション機能のdocx出力を行い、部分的な誤字チェックが行えました。このdocxファイルとXML原稿を行き来することは難しいものの、PDFの文字列検索では出来ないような作業をある程度Wordに持ち込むことができました。