エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Webテキスト解析のRubyのGem作った (tf-idfとは?編) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Webテキスト解析のRubyのGem作った (tf-idfとは?編) - Qiita
開発合宿で作ってみて楽しかったので記事化 社会人はアウトプットが大事ってどっかの偉い人が言ってたし... 開発合宿で作ってみて楽しかったので記事化 社会人はアウトプットが大事ってどっかの偉い人が言ってたし。。。 Gemの使い方は長くなるので別記事へ GEMのGithubレポジトリ tf-idfとは?? もうすでに有名かと思われるが一応説明。 知ってる人は飛ばしてください!! TF Term Frequencyの頭文字をとったもの 計算式 tf = 単語の頻度 / 文章中の単語数 説明 "たくさん出てくる言葉ほど重要"を数値化するもの 例えば りんごおいしい。りんご好き。りんご神。 と言う言葉があった場合、6つの単語から成り立つ文書の出てくる単語の回数はそれぞれ りんご:3, 好き:1, おいしい:1, 神: 1 となる。 よってこのりんごという単語のtfは 3("りんご"が文章中に出てくる回数) / 6(文章中の単語数) となり、tfは0.5となる。 また同様に神という単語のtfは 1 / 6