タグ

LDAに関するDiomedeidaeのブックマーク (2)

  • StanでLDA - 竹林由武のブログ

    #library(RWordPress) #library(XMLRPC) library(RISmed) library(tm) library(wordcloud2) library(RColorBrewer) library(topicmodels) wordcloud この記事はStanアドカレ14日目のエントリーです。今回のテーマはwordcloud、LDAです。wordcloudはしたの図にあるように、文章中で出現頻度が高い単語を複数選び出し、その頻度に応じた大きさで図示する手法で、単語の出現頻度が視覚的に理解できて便利。なによりイケてる。RではテキストデータをCorpusやdataframeとして整えてあげれば(ここがくっそ面倒)、wordcloudやwordcloud2といったパッケージで簡単にwordcloudを作成できます。特にwordcloud2は、以下のようにカッコ

  • Stan:LDA - 機械学習・自然言語処理の勉強メモ

    はじめに 自然言語処理の領域では広く知られいるLDA(Latent Dirichlet Allocation)について復習する。 LDAはトピックモデルの1種であり、文書がどのようなトピックから構成されているかを推論するモデル。 推論するパラメータは以下の2つ。 トピック分布:文書ごとのトピック構成比率 単語分布:トピックごとの単語比率 トピックモデルに関する理解はこの1枚に尽きると思う。 Fast and Scalable Algorithms for Topic Modeling | Center for Big Data Analyticsより引用 後、日語でのLDAの説明としては視覚的にも以下が分かりやすかった。 LDA for Pokemon analysis | haripo.com モデリング 数式によるLDAはググれば色々出てくるのでここでは割愛する。今回は「尤度計算」の

    Stan:LDA - 機械学習・自然言語処理の勉強メモ
  • 1