文書のテキスト化 5 ― マークアップのお話 2

前回にひきつづき、TEIを中心にマークアップ言語のお話をしようと思います。このお話は、どこにでも書いてあるようなことですが、とりあえずコード化についてあまり知らないできたような歴史研究の愛好家に向けてトリセツさせていただくものであります。今回は、規格化がなぜたいせつなのかというお話。


■規格化がとってもたいせつ

歴史研究だけに没頭していると教科書にも載っていないので教えてもらう機会もあまりなく、うっかりと知らないまま生きてしまうこともままあるのですが、マークアップ言語(に限らずコード一般)の歴史において決定的に重要なポイントは規格化であります。


前回お話した、バーナードとバウマンの「テキストの解釈を明確化するための手段」というマークアップの定義についてもう一度考えてみましょう。よく考えてみると、実はこうした意味でのマークアップは誰でも読書をするときにやっていることでありましょう。人名や年あるいは重要だと思う部分に下線を引いたり、余白にコメントを入れたりということは誰でもやっていますし、歴史研究の愛好家となると資料を読むときには必ずやることです。しかし、わたしたちが普段おこなっているこうした手書きマークアップに関しては、他の誰かとルールを共有などということはまずしないでしょうし、同一個人による書き込みですら基準が一貫していないことなどざらなわけであります。


よろしい、では自分の中で書き込みルールを統一することにしたと思しめせ。お勉強の能率はかなりアップすると期待できましょう。少なくとも書き込み済みの文書を2度め以降に読んだとき、自分がなぜ書き込みをしたのかということについて、記号を見るだけで一定の情報を得ることができるようになるからです。自分専用の記号をつくったり、書き込み用のペンの色を変えたりと、多種多様な工夫がしばしば提案されていることからも、こうした個人用の規格化にはある程度の関心が寄せられていることが伺えます。


さて、情報の処理をする脳みその数がひとつだけである場合、この程度の工夫で十分用にたるといえましょう。しかし、脳みその数が複数である場合(=共同作業)、効率を上げたければグループの書き込みルールを共有するための相談が、遅かれ早かれ始まることでありましょう。たとえば、人名はかならず四角で囲むことにして、年は丸で囲むとか。こうしておけば、他のひとが書き込みした文書についても、一定の情報が把握しやすくなります。さらに極端なことを言えば、地球上すべてのひとが同じ書き込み規則を採用すれば、誰が書き込みをした文書についても同じことが言えるというわけであります(そんな規則をみんなに採用させるには膨大なコストがかかるでしょうから実現はしないでしょうけど)。


注意しておいていいのは、複数個の脳みそが共有する規則は、べつにどんなものであろうと共有しているというだけで取引費用を下げるということです。人名を示すのに四角い線で囲むという規則であろうと、丸い線で囲むという規則であろうと、あるいは「名まえ」と脇に記入することにしようと、ひとつに決められていれば規則を共有している脳みそはどれでもその意味を理解することができます。もちろん、ルールそれ自体の効率というものも問題にはなりますが(例えば、似たり寄ったりの記号がいくつもあって混同しやすいとか、あまりにも複雑な記号でいちいち記入するのに手間がかかるとか)、規則の共有(=規格化)は一般的に取引費用を下げるのです。*1


ここで脳みそにいえることはもちろん人工的につくられたコンピュータにもいえる。テキストのマークアップをするコンピュータがひとつだけならばその中で一貫性を保てばことたりましょう。しかし、コンピュータが複数ある場合はそのあいだで規格が統一されていなければ、あるコンピュータは他のコンピュータがマークアップしたテキスト・ファイルを解釈できないということになってしまうわけであります。かつて、あるマシンで作られた文書をほかのマシンでマークアップしなおさなければならないというような時代がありました。特に古いコンピュータから新しいコンピュータに移行するときに、古いコンピュータでつくられたマニュアルや文書を新しいコンピュータで読めるよう整形するために、たいへんなお金と時間が必要とされました。そのため、どのようなマシンでも認識できるようなテキストの規格化が要請されることになったわけであります。


どのような規格化がなされていったのかについてはまた次回。

*1:人文系の研究や論争などで典型的に見られるよく似た話は、概念の意味がしっかりと共有されていないために、なんだかかみ合わない議論が続けられるというような少々イタい事態でありましょう。これは学問の制度化がうまくできているかどうかという問題です。