タグ

NERに関するniamのブックマーク (2)

  • 出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blog

    この前の続き。先週の週末にやるつもりだったけど、暇がなかった。 MeCabで区切った単語を再びつなげる - yasuhisa's blog 前回の流れとしては 専門用語を一つの単語として取ってくるのは難しい MeCabを使うと細かくなりすぎる 専門用語には名詞のsequenceが多そう じゃあ、名詞つなげてみればいいんじゃね? ということで名詞を繋げてみるだけというところをやりました(それだけ。。。)。id:niamさんがコメントしてくださったように"出現頻度と連接頻度に基づく専門用語抽出",自然言語処理, 2003を使うと専門用語らしさ(?)のようなスコア付けができるようなので、それをやってみることにしました。とりあえずp6のLR(CN)のところまでを実装。あとはスコア付けの関数を2つくらい用意して、評価指標の関数を用意すれば、という感じです。 # -*- coding: utf-8 -

    出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blog
    niam
    niam 2009/05/23
    おぉ。TermExtract(言選)を実装してくださった。コメントがコードになると嬉しいですww
  • Sekine's Extended Named Entity Hierarchy

    Satoshi Sekine (New York University) Initial: February 27, 2003 Latest: July 2, 2016 Call for annotators for Japanese ENE categorization! The latest definition (version 7.1.2) in Japanese is released on August 24, 2016 Definition version 7.1.2 Japanese. Simple text definition (utf8 encoding) version 7.1.2 Japanese. The definition (version 7.0.0) in Japanese is released on March 23, 2007. Now 105 c

  • 1