[B! perplexity] sakidatsumonoのブックマーク

sakidatsumono id:sakidatsumono

perplexityに関するsakidatsumonoのブックマーク (3)

トピックモデルを用いた併売の分析 - gensim の LdaModel 使用 - なんとなくな Developer のメモ
トピックモデルは潜在的なトピックから文書中の単語が生成されると仮定するモデルのようです。であれば、これを「Python でアソシエーション分析」で行ったような併売の分析に適用するとどうなるのか気になったので、gensim の LdaModel を使って同様のデータセットを LDA（潜在的ディリクレ配分法）で処理してみました。ソースは http://github.com/fits/try_samples/tree/master/blog/20180313/ 1. はじめにデータセット gensim で LDA を処理する場合、通常は以下のような lowcorpus フォーマットを使った方が簡単なようです。（LowCorpus で処理できるので） <文書数> <文書1の単語1> <文書1の単語2> ・・・ <文書2の単語1> <文書2の単語2> ・・・・・・ただ、1行目が冗長なように
sakidatsumono 2019/05/22
perplexity
リンク
蒙古タンメン中本コーパスに対してのLDAの適用とトピック数の探索 – かものはしの分析ブログ
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーターほしいものリストモチベーション前回の記事では、Webスクレイピングにより入手した、蒙古タンメン中本の口コミデータに関して、Word2Vecを適用した特徴量エンジニアリングの事例を紹介しました。今回はせっかく興味深いデータがあるので、どのようなトピックがあるのかをLDAを適用したいと思います。加えて、これまで記事で扱ってきたLDAの事例では評価指標であるPerplexityやCoherenceを扱ってこなかったことから、トピック数がどれくらいであるべきなのか、考察も含めて行いたいと
sakidatsumono 2019/05/22
perplexity
リンク
トピックモデルの評価指標 Perplexity とは何なのか？
『トピックモデルによる統計的潜在意味解析』読書会ファイナル ~佐藤一誠先生スペシャル~ LT 資料 http://topicmodel.connpass.com/event/27999/
sakidatsumono 2019/05/22
perplexity
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx