TEI Lite入門 第3章:TEIテキストの構造

TEI Liteのドキュメンテーションの第3章です。

過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]

要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。

ライセンスはGNU General Public License (version 2)
==========================================



TEI Lite: 文書交換のためのコード化:TEI入門―TEI P5 準拠版
ルー・バーナード & C.M. スパーバーグ=マクイーン
原文



3 TEIテキストの構造

TEI準拠のテキストはすべて、(a)TEIヘッダteiHeader要素としてマークアップ)と、(b)テキスト自体のトランスクリプション(text要素としてマークアップ)からなります。これらふたつの要素は、単一のTEI要素内にまとめられます。

TEIヘッダは、印刷テキストの標題紙と似たような情報を提示します。これは、最大で4つの部分をもちます。機械可読テキストの書誌記述、コード化の方法に関する記述、テキストに関する書誌情報以外の記述(テキスト・プロファイル)、更新履歴の4つの部分です。ヘッダについては、19 電子版標題ページで詳細な説明をおこないます。

TEIテキストには、単一的なもの(単独作品)と複合的なもの(アンソロジーのような単独作品の集成)があります。どちらの場合も、テキストには前付け後付けを任意に付与できます。テキストの本文はそれらのあいだにくることになります。複合的テキストは、いくつかのグループからなり、そのそれぞれのなかに、下位グループあるいはテキスト自体がおかれます。

単一的テキストは、つぎのような全体構造をあたえてコード化することができます。


<TEI>
 <teiHeader>
<!-- [ TEI Header information ] -->
 </teiHeader>
 <text>
  <front>
<!-- [ front matter ... ] -->
  </front>
  <body>
<!-- [ body of text ... ] -->
  </body>
  <back>
<!-- [ back matter ... ] -->
  </back>
 </text>
</TEI>

複合的テキストもまた、任意の前付けと後付けをもちます。あいだには、ひとつ以上のテキストのグループがおかれ、そのそれぞれもまた任意の前付けと後付けをもちます。そのようなわけで、複合的テキストはつぎのような全体構造をあたえてコード化できます。


<TEI>
 <teiHeader>
<!--[ header information for the composite ]-->
 </teiHeader>
 <text>
  <front>
<!--[ front matter for the composite ]-->
  </front>
  <group>
   <text>
    <front>
<!--[ front matter of first text ]-->
    </front>
    <body>
<!--[ body of first text ]-->
    </body>
    <back>
<!--[ back matter of first text ]-->
    </back>
   </text>
   <text>
    <front>
<!--[ front matter of second text]-->
    </front>
    <body>
<!--[ body of second text ]-->
    </body>
    <back>
<!--[ back matter of second text ]-->
    </back>
   </text>
<!--[ more texts or groups of texts here ]-->
  </group>
  <back>
<!--[ back matter for the composite ]-->
  </back>
 </text>
</TEI>

TEIテキストからなる複合体を定義することもできます。この場合、それぞれのTEIテキストにヘッダがあたえられます。このような集成は、TEIコーパスと呼ばれ、このコーパス自体にもヘッダをつけることができます。


<teiCorpus>
 <teiHeader>
<!--[header information for the corpus]-->
 </teiHeader>
 <TEI>
  <teiHeader>
<!--[header information for first text]-->
  </teiHeader>
  <text>
<!--[first text in corpus]-->
  </text>
 </TEI>
 <TEI>
  <teiHeader>
<!--[header information for second text]-->
  </teiHeader>
  <text>
<!--[second text in corpus]-->
  </text>
 </TEI>
</teiCorpus>

ただし、複数のコーパスからなる複合体をつくることはできません。複数のteiCorpus要素をまとめてひとつのオブジェクトとしてあつかうことはできないということです。これは、現行のTEIガイドラインにおけるひとつの制限事項となっています。

この文書では、主に単純なテキスト構造について論じます。それぞれのケースについて、関係あるTEIの要素のリストをお見せし、それぞれについて簡単な定義をまとめます。つづいて、その要素に特有の属性の定義をおこないます。また、その要素が属するクラスについてのリファレンス情報を示します。これらのリファレンスは、TEIガイドラインのなかの、それぞれのオブジェクトについての完全な仕様にリンクされています。ほとんどの場合では、みじかい例も示します。

たとえば、ここまででとりあげた要素は、つぎのように示されます。



  • TEI
    (TEI文書)には、TEI準拠の文書がひとつ入れられる。これは、TEIヘッダとテキスト自体からなり、単体のものあるいはteiCorpus要素の一部として構成される。


  • teiHeader
    (TEIヘッダ)は、記述的あるいは宣言的な情報を提供し、各TEI準拠テキストの頭につけられる、電子版標題紙を構成する。


  • text
    には、さまざまな種類のテキストがひとつ入れられる。ここに入るのは、たとえば、詩や戯曲、随筆集、小説、辞書、コーパス標本など、単一的なものでも複合的なものでもよい。