XMLとSGMLの公開DTD集
公開DTD集の作成意図
複数の企業・団体の間でXMLファイルを交換するためには、XMLがDTDに従って作成されていなければなりません。しかもファイル交換につかうためのDTDは、公開されており、配布が自由、誰でも無償で自由に使うことができなければなりません。
企業の中で、ドキュメントをXML化する場合でもDTDを最初に設計することが重要なステップになります。しかし、DTDを作成するには文書の構造を分析、XMLの仕様に正しく準拠するDTDを設計するためにXML仕様に関する正しい知識と経験が必要です。
独自のDTDを作成するには、公開されているDTDをベースに独自の機能を追加したり改良していくのが良いと思われます。
以上の理由から、XMLドキュメントが普及するためには、良質なDTDが多数公開されていることが重要と考えます。そこで、公開DTDのリストを作成することに致しました。また、弊社で独自に開発しましたDTDにつきましても、公開して一般の方々に自由にお使い頂けるようにしたいと考えています。
収集対象DTD
- ドキュメントを表現するためのDTDを中心とします。コンピュータ同士のデータ通信に使うDTDや業務の手続きのためのDTDは、収集対象としていません。但し、境界は曖昧です。
- XMLのDTDを中心とします。XMLのDTDに付きましては、国内・海外を問わず収集対象とします。
- SGMLのDTDに付きましては、日本の国内で公開されており、比較的重要と考えられるものに限定致します。
XML DTD
XHTML(Extensible HyperText Markup Language)
- 制定者
- W3C HTML Working Group
- 用途
- HTML 4.01 をXML仕様に従うように再構築したもの。HTMLにXMLの厳密さを適用し、かつ既存のブラウザで表示できることを目的としたものです。
- URL
-
XHTML-1.0-Strict:http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd
XHTML-1.0-Transitional: http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd
XHTML-1.0-Frameset:http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd
実体セット
Latin-1 characters:http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent
Special characters:http://www.w3.org/TR/xhtml1/DTD/xhtml-special.ent
Symbols:http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent - 解説
- XHTMLのDTDは、2000年1月26日にW3Cの勧告になりました。
文字実体の集合はHTML4.0と同じですが、XML仕様に準拠するように少し変更されています。スペシャルキャラクターにユーロ通貨記号が追加されています。- XHTMLは、モジュール化する方向で進んでいます。モジュール化の仕様である「Modularization of XHTML」は、2000年10月20日Candidate Recommendationになりました。
- 「Modularization of XHTML」に基づき、モバイル機器にも適するXHTMLの最小セットである「XHTML Basic」の仕様策定が進んでいます。「XMTML Basic」は2000年11月3日にProposed Recommendationになりました。
PureSmartDoc
- 制定者
- 浅見 智晴氏
- 用途
- コンピュータのテクニカル・ドキュメント用のフォーマット。
- URL
- PureSmartDoc.dtd, PureSmartDoc.rlx, sdoc2fo.xsl
このファイルです。 - 解説
-
SmartDocは、浅見 智晴氏が開発した、テクニカル・ドキュメント記述用のドキュメント形式とその処理系の総称です。
SmartDoc形式で作成したドキュメントのソースは外部からプログラム・ソース等を取り込んでHTML、TeXなどの形式として出力されます。同時に、PureSmartDoc形式のXMLファイルも生成されます。
PureSmartDoc形式は、SmartDocの中核のXMLファイル形式で、Relaxで記述されており、RelaxerでDTDに変換されています。
SmartDocはXMLの応用として優れた方式と考えられます。アンテナハウスでは、PureSmartDoc形式のファイルをXSL Formatting Objectsに変換するスタイルシート(sdoc2fo.xsl)を公開致します。SmartDocについては、http://www.asahi-net.or.jp/~dp8t-asm/java/tools/ をご覧ください。
DocBook XML V4.1.2
- 制定者
- OASIS(The Organization for the Advancement of Structured Information Standards)
- 用途
- コンピュータのハードウエアとソフトウエアに関する書籍等向けのDTD
- URL
- http://www.oasis-open.org/docbook/
ミラーサイト
http://www.docbook.org/ - 解説
- DocBookDTDは、1991年より開発が始った。当初はSGMLのDTDとして設計されたが、現在は、SGML版とXML版の両方がある。1991年当初は、HaLコンピュータ社とO'Reilly & Associates 出版社が設計したが、その後、1994年よりDavenport Groupがメンテナンスを担当した。1997年にV3が発行されたが、その後、XMLに関心が移ってメンテナンスが止まった。そこで、Davenportグループを閉鎖し、1998年にOASISにDocBookの技術委員会が設置された。現在、OASISからV4版が発行されている。
XML Scheme版、Relax Scheme版が試験的に公開されている。
DocBook XML CALS Table Model 4.1.2
- 制定者
- OASIS(The Organization for the Advancement of Structured Information Standards)
- 用途
- CALSテーブル・モデルのXMLバージョン
- URL
- 最新版は、DocBook XML 4.1.2 の中に含まれています。
- 解説
- CALS Table Model (PUBLIC "-//USA-DOD/DTD Table Model 951010//EN")のXML版。XML CALS Table モデルは、ドキュメントDTDにインクルードされることを前提としています。
参考資料「CALS Table Model History」
http://www.tiac.net/users/bingham/tables/calstbhs.htm
XML Exchange Table Model Document Type Definition
- 制定者
- OASIS(The Organization for the Advancement of Structured Information Standards)
- 用途
- CALSテーブル・モデル交換形式のXMLバージョン
- URL
- 最新版は、DocBook XML 4.1.2 の中に含まれています。
- 解説
- DocBook XML CALS Table Model V4.1.2 の交換形式。CALS Table Model は、色々なDTDの表形式のモデルとして採用されました。しかし、それが実装されるに従って、曖昧な点、省略点が目立ってきました。このため、相互運用と言う点から問題が多くなりました。OASISでは、CALS Table Model を実装しているベンダの関係者を集めて問題を調査し、結果として交換用のテーブル・モデルを定義しました。交換用テーブル・モデルは、フルセットのテーブル・モデルのサブセットで、表の中に表をネストさせることを禁止したり、表にフッタを含めることを禁止するなど、簡易化しています。
JepaX
- 制定者
- 日本電子出版協会 出版データフォーマット標準化研究委員会
- 用途
- 日本の電子出版の出版業界の中で、電子出版コンテンツの蓄積と交換用の形式として提唱されています。
- URL
- JepaX 仕様書/DTD
http://x.jepa.or.jp/jepax/spec/index.html - 解説
- 電子書籍のフォーマットは、既に複数存在しているが、各出版社が電子書籍を配布する前段階として、中立的な交換フォーマットとして使用できるように策定したもの。
http://x.jepa.or.jp/jepax/ - 注意事項
- SXParserでパージングする場合、公開されているjepax09.dtdの公開識別子を修正してご使用ください。
- DTD中の公開識別子を XHTMLのものに変える。
- 3つの .entファイルを最新のものに切り替え、ファイル名も変更する。
<現状>
<!ENTITY % HTMLlat1 PUBLIC "-//W3C//ENTITIES Latin1//EN//HTML" "HTMLlat1x.ent">
<!ENTITY % HTMLsymbol PUBLIC "-//W3C//ENTITIES Symbols//EN//HTML" "HTMLsymbolx.ent">
<!ENTITY % HTMLspecial PUBLIC "-//W3C//ENTITIES Special//EN//HTML" "HTMLspecialx.ent">
<修正後>
<!ENTITY % HTMLlat1 PUBLIC "-//W3C//ENTITIES Latin 1 for XHTML//EN" "xhtml-lat1.ent">
<!ENTITY % HTMLsymbol PUBLIC "-//W3C//ENTITIES Symbols for XHTML//EN" "xhtml-symbol.ent">
<!ENTITY % HTMLspecial PUBLIC "-//W3C//ENTITIES Special for XHTML//EN" "xhtml-special.ent">
Open eBook Publication Structure Specification Version 1.0
- 制定者
- Open eBook Authoring Group
- 用途
- 版社や著者が単一のフォーマットで著作物を配布する事ができるようにするために策定されました。いろいろな電子書籍リーダーは、このフォーマットを読むことができることが期待されています。
- URL
-
Open eBook initiative
http://www.openebook.org/oebpsdownload.htm - 解説
- Open eBook Forum
http://www.openebook.org/
日本語ページ(日本からの参加メンバーである「イースト株式会社」が日本語訳し、公開しているページです。)
http://www.est.co.jp/ks/dish/openebook/index.html
Common NET EB
- 制定者
- 日本電子ブックコミッティー
- 用途
- 「次世代電子ブック仕様」として、XMLを基にし日本語で記述された本を表現するためのタグセットを規定
- URL
-
Common NET EB フォーマット仕様案 Version0.80
http://www.ebxa.gr.jp/faq/pdf/neteb.pdf - 解説
- DTDファイルは配布されていないようです。
NewsML 1.0版
- 制定者
- 国際新聞電気通信評議会(International Press Telecommunications Council)
- 用途
- ニュースの交換を目的とするが、ニュースの蓄積、作成、編集、管理、発行の補助としても使用する。
- URL
- NewsML Document Type Definition Version 1.0
http://www.iptc.org - 解説
- NewsMLは、XMLベースのマルチメディア・ニュースの生成、蓄積、配信の標準である。テキスト、写真、グラフィックス、ビデオなどのマルチメディア・ニュース・アイテムのコンセプトを中核にして、さらに、受け手が各コンポーネントの間の関係を認識し、各コンポーネントの役割を認識することができるようになっている。
NewsMLは、権利から自由な標準として、IPTCより配布されているがIPTCの知的所有物である。
MML(MedicalMarkupLanguage)
- 制定者
- MedXMLコンソーシアム(MedXML)
- 用途
- 患者情報や診療記録などを電子的に記録した「電子カルテ」を、異なる医療機関の間で送受信するための規格。
- URL
- MML ver 2.21final情報
http://www.seagaia.org/sgmeeting/sg.html - 解説
-
1995年にSGMLを用いて具体化がはじめられましたが、様々な診療分野に特化した構造が必要となり、1999年3月にW3C勧告案となったXML Namespaceを用いて,MMLをモジュール化し,必要に応じてモジュールを組み合わせて使う方法に変更されました。
MedXMLコンソーシアム
http://www.seagaia.org/medxml/
NVML(NaVigation Markup Language)
- 制定者
- 株式会社富士通研究所
- 用途
- 道案内を、様々な携帯端末や携帯電話を用いて、電車、バス、徒歩などでの移動時にも利用できるようにするために開発した、道案内情報を記述するための統一的なデータフォーマット。
- 株式会社 富士通研究所
http://www.labs.fujitsu.com/theme/nvml/ - 解説
- NVMLの開発の他に、NVML 用のプレーヤ、およびNVML を作成/編集するためのエディタも開発。実験サービスを行っていましたが、1999年6月にて実験は終了しました。
RWML(Road Web Markup Language)
- 制定者
- 北海道開発局 開発土木研究所 加治屋安彦氏を代表とする共同研究機関(オムロン・名古屋電機工業・三菱電機・日本工営・日本気象協会)
- 用途
- 電子商取引やデジタル放送の分野で注目されつつあるXML技術を道路情報分野に活用するため, 道路用Web記述言語として策定
- URL
- 道路用Web記述言語Road Web Markup Language (RWML)仕様書 Ver.0.71
http://rwml.its-win.gr.jp/Draft/RWML-071-DTD.html - 解説
- 北海道開発局開発土木研究所の発案に基づき, 道路に関連する情報をXMLで記述するための道路用Web記述言語RWMLを規定するため, 企業及び団体からなる共同研究機関により結成されたワーキンググループにおいて, 平成10年6月より実質的な討議を重ねてきた仕様です。道路情報, 気象情報, 防災情報, 地域情報により構成される道路関連情報。
道路用Web記述言語RWMLの提案について
http://rwml.its-win.gr.jp/
POIX (Point Of Interest eXchange language)
- 制定者
- モバイル標準化検討委員会(MOSTEC:MObile Information Standard TEchnical Committee)
- 用途
- インターネット上で位置に関する情報を交換することを目的として作成された
- URL
- POIX仕様書(POIX version 2.0 Document Revision 1 )
http://mostec.aplix.co.jp/poix.html - 解説
- 車での利用だけでなくモバイル機器など全般において、よりスムーズに情報交換が出来るよう検討しています。
モバイル標準化検討委員会
http://mostec.aplix.co.jp/index.html
GDA(Global Document Annotation)
- 制定者
- 通商産業省 工業技術院 電子技術総合研究所
- 用途
- 多言語間に共通の統語・意味等に関する XML タグの標準を作って普及させようというプロジェクト
- URL
- 大域文書修飾
http://www.i-content.org/gda/ - 解説
- タグを用いた機械翻訳、情報検索、要約、質問応答、知識発見などを実用化し、いろいろな言語で翻訳・検索ができ、安価で情報発信が出来ることを狙いとしています。
国税庁:電子申告実験システム・申告データファイル仕様
- 制定者
- 国税庁
- 用途
- 電子申告実験システムにおいて実験参加者が送信する申告データファイルの仕様を規定するもの(実験段階)。
- URL
- http://www.nta.go.jp/category/topics/data/h13/04/01.htm
- 解説
- 東京国税局麹町税務署及び練馬東税務署の2署において、平成12年11月27日から平成13年3月15日までの間、納税者及び税理士の協力を得ながら、所得税、法人税及び消費税について電子申告の本格的な実験を実施しております。 受付システムに送信する申告データファイルは、XML形式で保存します。
平成12年11月27日から平成13年3月15日までの間行われた、所得税、法人税及び消費税について電子申告の実験を結果(http://www.nta.go.jp/category/topics/data/h13/07/01.htm)が公開されている。
国土交通省:土木設計業務等の電子納品要領(案),工事完成図書の電子納品要領(案),CAD製図基準(案)
- 制定者
- 国土交通省
- 用途
- 建設費の縮減と品質の確保・向上を図るために、各種の情報の電子化と効率的な情報交換・共有・連携を創出するために検討されました。
- URL
- http://www.pwri.go.jp/pwriweb/japanes/download/kikai3/calsrule.htm
- 解説
- 平成13年4月以降に国土交通省が発注する業務及び工事を対象として、成果品を電子媒体で提出する場合の仕様として適用を開始する予定
これらのDTDは、ドキュメント類を管理するためのインデックス部の形式を定義しています。文書本体の記述形式を規定するものではありません。
国土交通省 土木研究所は、平成13年4月1日に設立された国土交通省 国土技術政策総合研究所及び、独立行政法人 土木研究所 に移行しました。
国土交通省:デジタル写真管理情報基準(案)
- 制定者
- 国土交通省
- 用途
- 受発注者双方で、工事写真に関するデータの交換・共有することを可能とし、写真管理業務の効率化を図るため。
- URL
- http://www.pwri.go.jp/pwriweb/japanes/download/kikai/phot_top.htm
- 解説
- 工事管理用のデジタル写真の属性情報を記述するための文書型です。現場写真を管理するソフトウエアから出力する交換形式として使用するものです。
The MathML(Mathmatical Markup Language)
- 制定者
- W3C The Math working group
- 用途
- WEB上で数式を表現するために策定されました。
- URL
- The MathML 1.01 DTD
http://www.w3.org/Math/DTD/ - 解説
- XML1.0に準拠しており、数式の表記方法を指定するタグと、数式の意味を伝えるためのタグの2種類があります。
W3Cの数学のWebサイト:W3C's Math Home Page
http://www.w3.org/math/
W3CのMathMLの勧告:Mathmatical Markup Language Specification
http://www.w3.org/TR/REC-MathML/
現在、MathML2.0のワーキング・ドラフトが最終段階です。
VoiceXML
- 制定者
- VoiceXML Forum からW3Cに提出中
- 用途
- インターネットで音声、電話などを扱うアプリケーションや機器のインターフェイスを規定するものです。
- URL
- http://www.voicexml.org/specs_1.html
- 解説
- AlphaWorks(http://www.alphaworks.ibm.com/tech/voicexml)にVoiceXMLの実装とサンプルもあります。
W3Cの「ボイス・ブラウザ」の仕様策定の基礎として使われることになっています。
XDirect.dtd
- 制定者
- 富士ゼロックス情報システム株式会社
- 用途
- 富士ゼロックス情報システム株式会社が、大手顧客向けに公開しているWWWサイトの各記事を表現するために設計されたDTD
- URL
- SGML/XML化の事例研究
http://www.fxis.co.jp/DMS/sgml/xml/saloon/jirei/jirei.html - 解説
- W3CのXHTMLをベースに、XDirect独自の管理情報を追加しています。モジュール化のひとつの例として参考になります。
XBRL(eXtensible Business Reporting Language)
- 制定者
- XBRL Japan
XBRLは、米国公認会計士協会(AICPA)が中心となって設立された団体である米国XBRLが財務諸表電子開示のための情報形式を定義しています。日本公認会計士協会がAICPAより依頼を受け設立準備を進め、米国XBRLの日本組織としてXBRL Japanが2001年4月25日に設立されました。 - 用途
- XBRL形式の財務諸表データは、表示・印刷ができるだけでなく、インターネット経由で分類・検索・集計・統計分析等が可能なデータとして再利用できます。
- URL
XBRL Japan
http://www.jisa.or.jp/discloser/xbrl/米国XBRL
http://www.xbrl.org/
G-XML
- 制定者
- 産学官協同プロジェクト
- 用途
- インターネット上で各種GIS(Geographic Information System:地理情報システム)コンテンツを広範囲に流通させることを可能にする為に制定された。
- URL
- G-XML
http://gisclh.dpc.or.jp/gxml/contents/ - 解説
- 平成13年8月25日に、G-XML2.0版に基づくJIS規格「JIS X 7199 地理情報-地理空間データ交換用XML符号化法」として正式に制定され、8月27日に官報公示(第3187号)されました。
G-XML仕様書(第1版,第2版)はホームページにて公開されていますが、仕様書を入手するためには、データベース振興センターが主催する「G-XML実用化連絡会」に入会する必要があるようです。
http://gisclh.dpc.or.jp/gxml/contents/whatgxml/howtoget.htm
SGMLのDTD
総務庁:電子公文書DTD
- 制定者
- 総務庁・行政管理局モバイル標準化検討委員会
- 用途
- 霞ヶ関WANにおける省庁間等で流通する電子公文書の標準DTD
- URL
- 電子公文書の文書型定義(DTD)の統一的な仕様
http://www.soumu.go.jp/gyoukan/kanri/dtd.htm
別紙 電子公文書の文書型定義(DTD)
http://www.soumu.go.jp/gyoukan/kanri/dtd01.htm
電子公文書の文書型定義(DTD)の統一的な仕様の別紙7.2の修正について
http://www.soumu.go.jp/gyoukan/kanri/990409a.htm
電子公文書の文書型定義(DTD)の統一的な仕様の別紙7.2の再修正について
http://www.soumu.go.jp/gyoukan/kanri/000321a.htm - 解説
- 各省庁等で通常取扱われる通達、通知、照会、回答、報告、事務連絡等の公文書であって、省庁間電子文書交換システム等により省庁間で電子的に運用されるもの(以下、「電子公文書」という。)を対象として、その形式を定義しています。
白書DTD
- 制定者
- 総務庁行政管理局
- 用途
- 各省庁が共有して保有する行政情報のうち、白書、年次報告書、調査研究報告書及びこれらに類する物を作成するために設計されたDTD
- URL
- 白書等データベースの統一的な仕様における文書構造形式に係る定義についてhttp://www.soumu.go.jp/gyoukan/kanri/c_03.htm
- 解説
- 白書等データベースの統一的な仕様
http://www.soumu.go.jp/gyoukan/kanri/c_02.htm
特許庁:特許HTML
- 制定者
- 特許庁
- 用途
- 特許のオンライン申請のための入力データ形式として定義されたフォーマット
- URL
- このファイルです。
特許庁の公開した仕様書に基づいて、SXParser用に独自に書き起こしたものです。 - 解説
- 汎用パソコンでオンライン手続が可能となる電子出願ソフトの開発を行い、平成10年4月より受付を開始しましたが、電子出願ソフトの入力データの記述形式です。
パソコン電子出願情報
医療用医薬品の添付文書DTD
- 制定者
- 厚生省
- 用途
- 医療用医薬品(体外診断薬、体内診断薬、ワクチン、抗毒素及び検査に用いる生物学的製剤を除く)の添付文書情報の提供用に制定されました。
- URL
- このファイルです。
DTD Version 2.0, Feb. 19, 1999 - 解説
- 医薬品添付文書の情報は、各製薬会社が提供している情報をまとめて、医薬品情報提供ホームページ(http://www.pharmasys.gr.jp/
)より提供されています。DTDも医薬品情報(SGML文書)と共にダウンロードすることができます。