タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

自然言語処理と情報検索に関するTomato-360のブックマーク (1)

  • いろんなtf-idf - Debug me

    ちゃお……† 舞い降り……† 今回はtf-idfの話をしようと思います……† tf-idfとは tf-idfは、文書中の単語に関する重みの一種であり、主に情報検索や文章要約などの分野で利用される。 tf-idfは、tf(英: Term Frequency、単語の出現頻度)とidf(英: Inverse Document Frequency、逆文書頻度)の二つの指標にもとづいて計算される。 from tf-idf - Wikipedia ということで、 による単語の重み付けの方法です. 上記Wikipediaの記事ではオーソドックスな例が挙げられてますが, 実はいろいろな重み付けの方法があります. tf 以下、文書中の語の頻度を と記します. 2進重み (binary) $$ \displaystyle tf = \begin{cases} 1 & (f_ij \gt 0) \\ 0 & (

    いろんなtf-idf - Debug me
  • 1