タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

toolkitとJUMANに関するgologo13のブックマーク (1)

  • JUMAN-形態素解析

    システムは, 計算機による日語の解析の研究を目指す多くの研究者に共 通に使える形態素解析ツールを提供するために開発されました。その際, 学校 文法が計算機向きではないという問題を考慮し, 使用者によって文法の定義, 単語間の接続関係の定義などを容易に変更できるように配慮しました。 新バージョン5.Xの拡張点の概要は以下の通りです. 日語の基的語彙,約3万語(固有名詞を除く)を選定した. 表記バリエーションの整備を行い,代表表記を出力することとした. その他の整備(読みの音訓情報の付与,「読ます」「読まされる」などの使役形への対応) 例えば,以下のような解析結果がえられます. % cat sample.txt 子どもはリンゴがすきだ かぜでおくれた % juman -B -e2 < sample.txt 子ども こども 子ども 名詞 6 普通名詞 1 * 0 * 0 ”代表

    gologo13
    gologo13 2010/04/05
    2010-05-27 yoshino先輩も言ってたけど,確かに沢山意味情報が新バージョンの説明に書かれてある
  • 1