Pythonの自然言語処理用パッケージNLTKをインストール
自然言語処理用のPythonのパッケージ、NLTKをインストールしてみました。
Ubuntu 10.04にはNLTKが最初からはいっているけれど、ぼくがまだ使っている9.04には入っていないので、インストールしてみました。
最初にエラーが出てちょっとだけ手間がかかったので手順をメモしておきます。
NLTKのサイトからソースをダウンロード。
作業フォルダに解凍して、できたフォルダ(ぼくのときはnltk-2.0b9)にcdで移動。できたら、つぎのコマンドでインストール
sudo python setup.py install
すると、ぼくの場合はyamlというのが入っていなかったらしく、つぎのようなメッセージが。
ImportError: No module named yaml
なので、つぎのサイトからyamlをダウンロード。
作業フォルダに解凍、cdでできたフォルダに移動、上記と同じコマンドをうつ。
sudo python setup.py install
すると、yamlが無事にインストールされ、最初の手順でnltkのインストールを試みると、今度はちゃんとできました。できたら、pythonを起動して、
>>> import nltk
>>> nltk.download()
これで、練習用のデータのインストールができます。これから、この本で勉強します。
Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit
- 作者: Steven Bird,Ewan Klein,Edward Loper
- 出版社/メーカー: O'Reilly Media
- 発売日: 2009/07/10
- メディア: ペーパーバック
- クリック: 58回
- この商品を含むブログ (10件) を見る