■「タグ付けルール」のカスタマイズ
1.Tagme98のタグ付け概要
- さまさまなワープロ文書を読み込み、段落に分解し、各段落の書式などの特徴から、通常の段落、見出し、箇条書き、番号付けされた箇条書きなどの文書構造の解析をします。
- その文書構造の解析結果に基づいて中間ファイル(Tagme独自のDTDによるSGML 文書です)に書き出します。
- 中間ファイルからご使用となるDTDにあわせたタグ付けルールを適合して、目的 のSGML/XML/HTML文書に変換します。
2.Tagme98の中間形式
Tagme98の中間形式は、文書のフォーマットの特徴(各種ワープロ文書内に設定された書式情報や各種修飾情報)を表現するSGML文書です。通常のワープロ文書は、表題、大見出し、小見出し、段落などの文書のレイアウトによって表現されています、これに対し中間形式SGML文書は、<title>,<htp numlvl="1">,<htp numlvl="3">,<p> などのマークアップタグによって文書の構造が示されています。
3.タグ付けルール
タグ付けルールはTcl言語(Tool Command Language)で記述されたスクリプトファイルです。ターゲットDTDに対応したタグ付けルールを作成してTagme98に組み込んでいただくことにより、Tagme98内臓のTclインタープリタがこのスクリプトを解釈して実行し、Tagme98の中間形式から目的のSGML/XML/HTML文書へのトランスフォーメーションをします。
4.Tagme98標準添付のタグ付けルール
Tagme98では、以下のDTDに対応しており、これらのターゲットDTDに適合したSGML/HTML文書への変換用スクリプトを標準添付しています。
- SGML GeneralDTD
- HTML3.2 DTD
- 特許庁HTML DTD
- 総務庁電子公文書DTD
5.タグ付けルールのカスタマイズ
- 標準添付のDTD以外のDTDをお使いの場合、事前にタグ付けルールのカスタマイズが必要です。
- お使いのDTDに対応したスクリプトを作成して、Tagme98に組み込んでいただくことで、目的のDTDに適合したSGML/XML/HTML文書への変換が可能となります。カスタマイズはSGML/XML/HTMLに関する知識またはプログラマの経験を要求します。
- アンテナハウスでは「Tagme98+TagEditor」をご購入、ご利用のお客様を対象に、有償にてルールスクリプトのカスタマイズを承ります。詳しくは下記までお問い合わせください。
トップページへ戻る