Fluxboxのメニューバーなどの日本語表示

UbuntuにFluxboxをいれたとき、ウィンドウのメニューバー(と呼ぶのでしょうか?)の日本語表示が文字化けしていましたが、つぎのように設定ファイルに書き込むとよいことを学びました。こちらのCookiesさんのfluxboxを入れてみたという記事にあるとおりです…

imagemagickでPDFファイルをTIFFにする

PDFファイルをTIFFに変換したときのメモです。imagemagickを使って複数ページのPDFファイルをページごとにJPEGにするというのはかんたんにできます。 $ convert filename.pdf filename.jpgこれで出力ファイル名の拡張子の前に自動的に連番が付けられます(PN…

デジタル・カメラで文書を複写する 14 ― 二刀流

ひさしぶりにカメラを使った複写について書いてみます。このところあまり複写に時間を使えなかったのでカメラをしまい込んでいたのですが、久しぶりに取り出したので、カメラを2台使って書籍を複写する方法について少し書きます。基本的にはつぎのような方針…

英辞郎をLinuxのコマンドラインで使う

書き物をしていたり翻訳していたりするときに、コマンドラインで英辞郎が使えたらいいのに、と思っていたらあっさりできたのでメモします。ぼくは少し古い第4版を持っていたのでそのデータを使っていますが、新しい版だと違うかもしれません。DebianとUbuntu…

Ubuntuの古いカーネルを消す

Ubuntuを起動するときにOSの選択肢がふえすぎたので、古いカーネルを削除しました。そのメモ。Winとデュアルブートにしているのですが、最近は選択肢がふえすぎてWinのところまでいくのに次画面までいかなくてはならなくなったので、とっても面倒でした。ま…

連番の名前がついたファイルを操作(bash)

カメラやスキャナから取り込んだ連番のついたデータを、たとえばタイトルごとにディレクトリをわけて整理したいとき、Linuxのコマンドではどのように操作するのがいちばんラクか。その答えはおそらく、ブレース展開{}を使ってforループで回す。たとえば、リ…

How to Protect Yourself

海外からのひと向けにHow to Protect Yourselfが作られています。東京外国語大学の学生さんたちがはじめたのかな?ぼくも何かしたいのだけれど。

Zoteroの内容をXMLで書き出すならMODSで

最近論文を書いているので、Zoteroがやっぱり便利だなと思って使っているのですが、文献リストの自動生成のスタイルにほしいものがないので、自分で文献リストをつくるためのスクリプトをかくことにしました。そのためにXMLで出力したいので、エクスポートの…

Wubi Ubuntu が起動しなくなったのでフィックス

WubiでUbuntuを使っているのですが、寝る前にUpdate Managerでアップデートし、朝起きてみたらUbuntuのほうが起動できなくなっていました。検索してさがしたら解決法が見つかったのでここに記す。環境にもよると思うので誰でもうまくいくかは知りません。ま…

英国図書館からの文献の注文のしかたまとめ

イギリスの英国図書館British Library(BL)から文献を取り寄せたのですが、ウェブサイトがだいぶわかりづらく、注文までにかなり時間がかかったので、手順をここに書いておきます(ときどき変わると思うので、あくまで参考までにという情報です)。1. ほし…

Unicode のアラビア文字の入力について

あまり明確に書いてあるところがないので、アラビア文字の入力について、混乱しそうな点について書いておきます。特にウルドゥー語やペルシャ語などの入力に関係します。結論を先に書くと、新規にアラビア文字でテキストを入力するには、Unicode では 0600-0…

カール事務機のディスクカッターの比較

ドキュメントスキャナでスキャンするために、本など紙を裁断することにまつわるお話。カール事務機のディスクカッターにはいろいろありますが、詳細を比べてみたかったので表にしました。値段等は商品カタログに書いてあるものです。A4サイズ(裁断幅310mm)…

Gedit で正規表現を使う

Emacs や vi などのエディタをしっかり勉強する時間がなく、ついつい Ubuntu 付属の GUI のエディタ Gedit を使ってしまうのですが、正規表現が使えないと思い込んでいました。わざわざ Python や R なんかで処理していたのですが、思いついて調べてみたら簡…

ウルドゥー語(Nastaliq)を Ubuntu で入力するための環境設定

Urdu Nastaliq Unicode という、ウルドゥー語で使う Nastaliq 体のフォントが、GNU General Public License で配布されています。その名のとおり、Unicode 対応です。Urdu Nastaliq Unicode ダウンロード先のリンク10年前には、互換性のない独自規格による I…

Ubuntu でのウルドゥー語の入力

Ubuntu でウルドゥー語を入力するにはどうすればいいのかを調べてみたところ、とっても簡単でした。参考にしたのは次のブログ記事。Installing Urdu Support in Ubuntu - My Ubuntu Blog上の記事では、Ubuntu 9.04 での設定方法が紹介されていますが、10.04 …

Unicode の訓読記号

Unicode に返り点などの訓読記号があったので覚書。3190-319Fにレ点、一点から四点、上中下点、甲点から丙点、天地人点など。Wikipedia の Unicode 一覧の3000-3FFF

TEI Lite入門 5 ページ番号と行番号

TEI Liteのドキュメンテーションの「5 ページ番号と行番号」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライ…

Abbyy Fine Reader 10 Professionalが欲しくなっていた

OCR

ううーん。Atlas 先生のページを見ると、いろいろいろいろ欲しくなってしまうので、普段はあまり見ないようにしているのですが、Abbyy Fine Reader 10 Professionalの最新版の比較・格安購入法についてという記事が、ぼくのお財布のために非常に良くない気が…

公共図書館は紙の管理に特化すべきではないか─あるいは「紙本位制」について

こういうことを言うと「保守派」みたいでかっこ悪いのですが、今日は暑すぎて頭がイカれてただけという言い訳がききそうなので、ちょっと言ってみようと思います。税金で運営する公共図書館は、紙の管理に特化するべきだ。まず、電子資料の「扱いやすさ」と…

TEI Lite入門 4.3 散文、韻文、戯曲

TEI Liteのドキュメンテーションの「4.3 散文、韻文、戯曲」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライ…

本について希少性の経済は働くのか

多少出遅れた観はありますが、先月出た『ブック・ビジネス 2.0』を買ってきて読みはじめました。まだ最初の津田さんと橋本さんの論考しか読んでいませんが、触発されてかんがえたことをメモしておきます。ブックビジネス2.0 - ウェブ時代の新しい本の生態系…

TEI Lite入門 4.2 表題と結句

TEI Liteのドキュメンテーションの「4.2 表題と結句」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライセンス…

Anthologize - Word Pressを書籍作成プラットフォームにする

ジョージ・メイスン大学歴史ニューメディア研究所(CHNM)の新しいプログラム。Anthologize。Word Pressのプラグインです。Anthologize ダン・コーエン先生のブログでの紹介 Word Press 日本語版これを使えば、ブログや画像などオンラインのコンテンツを整理…

TEI Lite入門 4.1 テキスト区分要素

4章の導入部を訳してから時間があきましたが、TEI Liteのドキュメンテーションの「4.1 テキスト区分要素」です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能してい…

Pythonの自然言語処理用パッケージNLTKをインストール

自然言語処理用のPythonのパッケージ、NLTKをインストールしてみました。Ubuntu 10.04にはNLTKが最初からはいっているけれど、ぼくがまだ使っている9.04には入っていないので、インストールしてみました。最初にエラーが出てちょっとだけ手間がかかったので…

出版社、著者、図書館、アーカイヴ〜本という「場」の管理人?

『マガジン航』にのっていた、ボブ・スタインの「メモ」がとってもおもしろいのでここに記します。 ネットワーク時代における出版の統一場理論 本のための綺麗で明るい場所 オリジナルによると、「統一場理論」が2008年9月の記事、「綺麗で明るい場所」が200…

TEI Lite入門 第4章:本文のコード化(導入部)

TEI Liteのドキュメンテーションの第4章の導入部です。つづく部分はあとで訳します。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたら…

Ricoh CX1 文書の撮影用カメラに

海外ではカメラを使った本のスキャナを自作するひとがたくさんいるみたいで、ぼくも作りたくなったのでカメラを購入しました。そこで、やはりカメラを2台つかって作業を高速化したいので、安くていいものをさがしたのですが、リコーのCX1の値段がいま破格に…

TEI Lite入門 第3章:TEIテキストの構造

TEI Liteのドキュメンテーションの第3章です。過去に訳した部分:右側のコラムにある、[カテゴリー]->[TEILite-Documentation]要素名につけられたリンクはいまのところ正しく機能していません。翻訳が全部できたらつながります。ライセンスはGNU General…

RでXMLテキストにタグ付け

TEI R

どうやらうまくできたみたいなので、とりあえず保存のために載せておきます。 TEI-XMLでは、構造化のためのマークアップと、名前の明示のためのマークアップの方法が用意されていますが、後者は一括処理ができるはずです。というより、一括処理したほうがい…