タグ

ブックマーク / www.r.dl.itc.u-tokyo.ac.jp/~nakagawa (1)

  • 出現頻度と連接頻度に基づく専門用語抽出

    出現頻度と連接頻度に基づく専門用語抽出 論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価 を報告する。論文では名詞 ´単名詞と複合名詞µ を対象として専門用語抽出につい て検討する。基的アイデアは、単名詞のバイグラムから得られる単名詞の統計量を 利用するという点である。より具体的に言えば、ある単名詞が複合名詞を形成するた めに連接する名詞の頻度を用いる。この頻度を利用した数種類の複合名詞スコア付け 法を提案する。ÆÌ Áʽ ÌÅÊ テストコレクションによって提案方法を実験的に 評価した。この結果、スコアの上位の ½¸ ¼¼ 用語候補以内、ならびに、½¾¸¼¼¼ 用語候 補以上においては、単名詞バイグラムの統計に基づく提案手法が優れていることがわ かった。 キーワード 用語抽出,専門用語,単名詞,複合名詞 Ì ÖÑ ÜØÖ Ø ÓÒ × ÓÒ Ç ÙÖ

    sseze
    sseze 2013/01/11
    FLR法、tfxidf法と組み合わせると良さそう。
  • 1