TEI Lite入門 第2章:簡単な例

TEI Liteのドキュメンテーションの第2章です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]ライセンスはGNU General Public License (version 2)。 ========================================== TEI Lite: 文書交換の…

TEI Lite入門 第1章:はじめに

TEI Liteのドキュメンテーションの第1章です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]ライセンスはGNU General Public License (version 2)。 ========================================== TEI Lite: 文書交換の…

TEI入門

まえにはじめようとしてとどこおっていた、TEI Liteのドキュメンテーションの翻訳をまたやります。間違いや直したほうがいい点などあれば教えてくださると助かります。わたしははじめてお話しするかたからとつぜん話しかけられても楽しくかんじるほうなので…

Ubuntu に Tesseract を導入

グーグルのOCRとして名高いTesseractをインストールしてみました。 Ubuntuだと超かんたん。Synaptic Package Manager をひらいて、「tesseract」と検索をかけるとでてきます。インストールしなければならないのは、ソースファイルと言語ファイルのふたつです…

ドキュメント・スキャナ選びのかんたんなポイント

ドキュメント・スキャナの選びかたについて。個人の顧客がすっかり定着したようで、グーグルで検索かければレビューもたくさんでてくるので、いまさら言うこともあまりなさそうですが、わたしがかんがえるほんとに重要なポイントをかんたんに書いてみようと…

OCRで読み取ったものをRでXML文書にする

R TEI

OCRで読み取った文書をTEI準拠XMLにしたい。OCRの結果には、ゴミのような記号や不要なスペースが入ってきてしまったりします。それをきれいにして、TEIヘッダをつけるくらいのところまでを自動でできるようにしたいと思います。授業で教わったことを思いだし…

TEI Lite 入門

本来なら、ぼくのようなドシロウトよりも、もっと適切なひとがたくさんいると思うのですが、だれもやらないので TEI Lite のドキュメンテーションを少しずつ翻訳してみることにしました。お付き合いください。少しずつコツコツやります。間違いなどがあれば…

Hacking the Academy

アメリカのジョージメイスン大学の、歴史・ニュー・メディア研究所のプロジェクト、Hacking the Academy がいいなというお話。 アイディア自体はそんなに突飛なものではありません。コンピュータの技術と学問や高等教育の話題で、5月21日から28日の1週間のあ…

Python の教科書

ミシガン大学の先生Chuck Severanceがたった11日でつくったと話題になった教科書Python for Informatics: Exploring Informationがよさそうだという話。11日で書けたのは、Allen B. Downeyによるオープン・ライセンスのThink Python: How to Think like a Co…

Ubuntu で chm ファイルを開く

Ubuntu で chm ファイルを開くにはこうすればいいそうです。 sudo apt-get install gnochm 情報元→How to view CHM files on Ubuntu Dapper

Wilco

アーカイヴとか歴史研究とかまったく関係ありませんが、おととい Wilco のライブに行ってきました。以来、寝ても覚めても Wilco ばっかりなわけです。あまりに好きすぎるので、まとめてみることにしました。あと、ウィキペディアの日本語の記事の中身がなか…

デジタル・カメラで文書を複写する 13 ― 携帯用複写ポール

このまえ作った複写ポール、だれもすごいと言ってくれないけど、なかなか使い勝手がよろしいので、再度宣伝。組み立て方は前掲エントリをご覧あれ。万力で挟むところがなくても、イスなどを利用してけっこういろんなところに固定できます。 これはラクナウ(…

文書のテキスト化 5 ― マークアップのお話 2

前回にひきつづき、TEIを中心にマークアップ言語のお話をしようと思います。このお話は、どこにでも書いてあるようなことですが、とりあえずコード化についてあまり知らないできたような歴史研究の愛好家に向けてトリセツさせていただくものであります。今回…

文書のテキスト化 4 ― マークアップのお話

紙媒体文書のテキスト化についてのお話を、ずいぶん前にはじめたはずであったのですが、なぜテキスト化をするのかというお話をして以来、カメラをいじったりしているあいだにすっかりわき道にそれ、忘却のかなたに置いてきてしまったのでありました。 しかし…

デジタル・カメラで文書を複写する 12 ― マイクロフィルムのスキャン

フランス(いまはメキシコかな?)の小原くんが、マイクロフィルムのデジタル化に燃えているようです。 マイクロフィルムというのは、保存用に紙媒体の文書をカメラで撮影したものを、ちいさーく縮小して記録したフィルムで、デジタル機器が普及する前は図書…

デジタル・カメラで文書を複写する 11 ― 三脚で複写

文書の複写のための試行錯誤について書いてきましたが、だーれも見てくれているかんじがないのでやる気をなくしかけていたら、メキシコの歴史研究をしているおともだちのおばらくんから反応がありました。ちょっとうれしかったです。だんぜんやる気が出ます…

デジタル・カメラで文書を複写する 10 ― 携帯用複写台を自作

アームやクランプを組み合わせて複写台をつくりたいのですが(前々回のエントリ参照)、マンフロットのアームとかちょっと高いので、もう少し安上がりに自作してみようと思いました。形状としては前回紹介した、LPLのユニバーサルカメラスタンドUCS-10を参考…

デジタル・カメラで文書を複写する 9 ― 携帯用複写台

いろんな検討の結果、個人的にはアームやクランプを組み合わせて、複写台を自分で作ってしまうのがいいという結論にいたりました(前回のエントリ)。自分でつくるといっても部品をいくつか組み合わせるだけなので、プラモデル感覚でできちゃいます。ところ…

デジタル・カメラで文書を複写する 8 ― アーム・三脚・複写台 2

アーム・クランプ・万力・ポール 専用の複写台はけっこう値がはります。しかしこれをよく見てみるとつくりは簡単なんです。そこで、部品を組み合わせて同様のものを自分でつくれないか。新宿はヨドバシカメラ(カメラ館)の照明器具売り場の店員さんに相談に…

デジタル・カメラで文書を複写する 7 ― アーム・三脚・複写台

文書を複写するとき、どうやってカメラを固定するかというおはなしです。お手軽に既製品を使うなら、主な選択肢は三脚を使うか専用の複写台を使うかということになります。 三脚 9,000円くらいからエレベータの下端にカメラをとりつけられるタイプの三脚を購…

連絡

なつかしいひとから個人的なコメントをいただいたのですが、連絡先がわからずお返事ができなかったので、プロフィール欄に連絡先を入れました。個人的なご連絡などあればどなたでもお気軽にお願いします。

デジタル・カメラで文書を複写する 6 ― 複写キットの見直し

この冬、東京に帰ってきたので、念願の電気屋さん・カメラ屋さんめぐりをしてきました。秋葉原は年末で超混んでそうなので新宿に行きました(ていうか、秋葉原にちゃんと行ったことないんですけどね。行ってみたいなあ)。東京のお店の店員さんたちは知識が…

デジタル・カメラで文書を複写する 5 ― コンパクト・デジタル・カメラの選びかた

うーん、どうも話題があっちにいったりこっちにいったりでよくないですが、ひさしぶりにデジカメ複写の話をします。今日は出先の資料室でちょっとこまったことがあってかんがえることがあったので、複写目的のコンデジ(「コンパクト・デジタル・カメラ」の…

歴史研究のひとのための、テキスト化ことはじめ

前回のつづきで、TEI のお勉強にはいりたいと思ったのですが、いちおうこのブログはトリセツであることを目指していて、しかも一般に資料のデジタル化にそれほど熱心とはいえない歴史研究のひとたちをこっち側にひきこむことをひとつのねらいともしています…

TEI のお勉強

TEI

資料のテキスト化をしなければなりませんね、といいつつ移動が重なったり考えがまとまらなかったり、ということでしばらく何も書いていませんでした。テキスト化をするにしてもマークアップはどうしても避けて通れないわけですが、どういったタグ付け規則を…

横山伊徳・石川徹也編著『歴史知識学ことはじめ』

資料のテキスト化についてつづきを書こうと思っていたのですが、一時帰国中せっかくなので前々から気になっていた、横山・石川編『歴史知識学ことはじめ』を読んだ感想を書きます。これは、東大史料編纂所前近代日本史情報国際センター主催の2007年の公開研…

ダン・スペルベル『表象は感染する』

文書のテキスト化について前回にひきつづき書こうと思っていたのですが、このところ移動していたのであいだが開いてしまいました(テキスト化のことについてはまたこんど書きます)。移動のあいだ、稲葉振一郎『社会学入門』(この本はおススメです!)で紹…

文書のテキスト化 2

みんなで文書のテキスト化をしましょうよ、という前回のつづきのお話です。前回はお話の導入のはずだったのですが、歴史研究仲間のおばらくんからじっくりなコメントをもらったので、導入のつづきとしてあらためてエントリを書きます。今回は、主に歴史研究…

文書のテキスト化

今回のおはなしは、いいかげんみんなでよってたかって文書のテキスト・ファイル化をしましょうよというお話です。 書籍のテキスト化を進めているプロジェクトには、もはや誰にもおなじみの感があるプロジェクト・グーテンベルクや青空文庫などがあります。一…

オックスフォード「超短い入門」シリーズの印象に残ったところ

待ち時間その他の細切れ時間は有効活用したいものです。本を読めばいいと思うのですが、分厚い本しかもってなかったような日には軽い気持ちで読めないし、計算が必要なものだったりしたら紙とペンも出さなきゃならないし。あと、わたしの場合は分厚い本はそ…