タグ

自然言語処理に関するprozorecのブックマーク (2)

  • perlでTreeTaggerを使う – taichino.com

    英語の文章からキーワードを抽出したくなったので 形態素解析ツールを探していた所、TreeTaggerというツールを見つけました。 英語の他にもフランス語、ドイツ語など色々などにも対応しているようです。 英語以外は解りませんので、英語をインストールしました。 インストールはここから、以下のファイル群を適当なディレクトリにダウンロードしてinstall-tagger.shを走らせます。ファイルの解凍含めて全て処理してくれます。 tree-tagger-linux-3.2.tar.gz (体) tagger-scripts.tar.gz (実行スクリプト) install-tagger.sh (インストーラ) english-par-linux-3.1.bin.gz (English parameter file) english-chunker-par-linux-3.1.bin.gz (E

  • 言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改

    言語処理のための機械学習入門というが出版される、という話はtwitterで知っていたのだが、8月ぐらいに出るのだろうとばかり思っていたら、なんかもう発売されているらしい。Amazonでは早速売り切れていたので、某大学生協の書籍部まで行って購入してきた。おかげで、この週末は280円で過ごすハメになってしまった。 まだざっと眺めただけだが、 ラベルを人手でつけるのに隠れマルコフモデルと言うのは来はちょっとおかしいんだけどNLPの分野だとそう表現する事が多いよ 対数線形モデルと最大エントロピーモデルは同じものだよ 出力変数の間に依存関係がなければCRFではなく対数線形モデルとか最大エントロピーモデルと表現するべきだよ といった、これまでの教科書にはあまり載っていなかったような事が載っているのはとても良いと感じた。こういった情報は、これまではどこかの大学の研究室で学ぶか、もしくはウェブ上の資料

    言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改
  • 1