TEI

TEI Lite入門 5 ページ番号と行番号

TEI Liteのドキュメンテーションの「5 ページ番号と行番号」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライ…

TEI Lite入門 4.3 散文、韻文、戯曲

TEI Liteのドキュメンテーションの「4.3 散文、韻文、戯曲」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライ…

TEI Lite入門 4.2 表題と結句

TEI Liteのドキュメンテーションの「4.2 表題と結句」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライセンス…

TEI Lite入門 4.1 テキスト区分要素

4章の導入部を訳してから時間があきましたが、TEI Liteのドキュメンテーションの「4.1 テキスト区分要素」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能してい…

TEI Lite入門 第4章:本文のコード化(導入部)

TEI Liteのドキュメンテーションの第4章の導入部です。つづく部分はあとで訳します。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたら…

TEI Lite入門 第3章:TEIテキストの構造

TEI Liteのドキュメンテーションの第3章です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライセンスはGNU General…

RでXMLテキストにタグ付け

TEI R

どうやらうまくできたみたいなので、とりあえず保存のために載せておきます。 TEI-XMLでは、構造化のためのマークアップと、名前の明示のためのマークアップの方法が用意されていますが、後者は一括処理ができるはずです。というより、一括処理したほうがい…

TEI Lite入門 第2章:簡単な例

TEI Liteのドキュメンテーションの第2章です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]ライセンスはGNU General Public License (version 2)。 ========================================== TEI Lite: 文書交換の…

TEI Lite入門 第1章:はじめに

TEI Liteのドキュメンテーションの第1章です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]ライセンスはGNU General Public License (version 2)。 ========================================== TEI Lite: 文書交換の…

TEI入門

まえにはじめようとしてとどこおっていた、TEI Liteのドキュメンテーションの翻訳をまたやります。間違いや直したほうがいい点などあれば教えてくださると助かります。わたしははじめてお話しするかたからとつぜん話しかけられても楽しくかんじるほうなので…

OCRで読み取ったものをRでXML文書にする

R TEI

OCRで読み取った文書をTEI準拠XMLにしたい。OCRの結果には、ゴミのような記号や不要なスペースが入ってきてしまったりします。それをきれいにして、TEIヘッダをつけるくらいのところまでを自動でできるようにしたいと思います。授業で教わったことを思いだし…

TEI Lite 入門

本来なら、ぼくのようなドシロウトよりも、もっと適切なひとがたくさんいると思うのですが、だれもやらないので TEI Lite のドキュメンテーションを少しずつ翻訳してみることにしました。お付き合いください。少しずつコツコツやります。間違いなどがあれば…

歴史研究のひとのための、テキスト化ことはじめ

前回のつづきで、TEI のお勉強にはいりたいと思ったのですが、いちおうこのブログはトリセツであることを目指していて、しかも一般に資料のデジタル化にそれほど熱心とはいえない歴史研究のひとたちをこっち側にひきこむことをひとつのねらいともしています…

TEI のお勉強

TEI

資料のテキスト化をしなければなりませんね、といいつつ移動が重なったり考えがまとまらなかったり、ということでしばらく何も書いていませんでした。テキスト化をするにしてもマークアップはどうしても避けて通れないわけですが、どういったタグ付け規則を…