タグ

mecabに関するgomanのブックマーク (3)

  • LinuxにMecabとmecab-rubyをインストールする | mwSoft

    概要 我が家のLinux機(Fedora10)にMecabを入れた際のログです。 入れたものは以下。 MeCab0.98 mecab-ipadic-2.7.0-20070801 mecab-naist-jdic-0.6.1-20090630 unidic-mecab-1.3.12 mecab-ruby-0.98 以上5つです。 ここでは入れた際に打ったコマンドと、簡単なサンプルを載せておきたいと思います。 MeCabのインストール ダウンロードはこちら http://sourceforge.net/projects/mecab/files/ Linuxであれば、mecab-x.xx.tar.gz(x.xxはバージョン番号)を持ってきます。持ってきたら解凍してinstall。 $ tar xzvf mecab-x.xx.tar.gz $ cd mecab-x.xx $ ./configure

    goman
    goman 2009/12/16
  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
  • mecab-rubyを使ってみる

    (1)MeCab体のインストール。今回は既にインストール済みでした。 $ sudo aptitude install mecab mecab-ipadic mecab-jumandic mecab-utils (2)mecab-rubyをコンパイルするのにg++が必要なのでインストール。 $ sudo aptitude install g++ (3)mecabのVersion確認。 $ mecab -v mecab of 0.93 (2)SourceForgeからmecab-ruby-0.93.tar.gzをダウンロードして展開。 $ sudo tar xvzf mecab-ruby-0.93.tar.gz $ cd ./mecab-ruby-0.93 インストール。 $ ruby extconf.rb checking for main() in -lmecab... yes chec

    goman
    goman 2008/10/04
    バージョンが同じじゃないとmakeでつまづく
  • 1