タグ

ldaとnlpに関するgologo13のブックマーク (3)

  • 5月16日 SIGSLP/SIGNL@東大まとめ | aitoの日記 | スラド

    途中から入場。 (3) 文書上の潜在トピックを捉える事象の検討とその応用(お茶の水女子大) LSIやPLSIにおける「単語」を「イベント」(単語列など)に拡張した潜在意味解析。実行が大変そうだ。イベントとして,係り受けがある単語(名詞と述語,任意の自立語)の組,文内で共起する自立語の組などいくつかを検討。トピック推定はLDA。楽天トラベルのレビューを対象にした文書検索課題で評価。結論としては,接続詞などで文を区切り,係り受けがある単語間の共起を使うのが良いとのこと。また,要約課題での評価では,係り受けのある単語の組のうちヒューリスティックに種類を選んだものが良い性能だった。 (4) 多言語トピックモデルによる言語横断リンク検出(神戸大) 江口研。多言語トピックモデルであるCI-LDA,SwitchLDA,CorrLDAの性能比較。CI-LDAは2つの言語が同じトピックを共有するモデル,Sw

  • 論文100本ノックの感想&独断と偏見に満ち溢れた今年読んだ中で面白かった論文紹介 - yasuhisa's blog

    100いってないじゃん!! いつまで高見の見物してるんですか??? 目を通してるConference その他 LDA関係 LDA自体について LDAをベースにした応用モデル 形態素解析、分かち書き ノンパラベイズ その他 クラスタリング 最適化 教師なし学習 今年の1月1日から始めた論文100ノックですが、年末ギリギリだと書けるか分からなくなりそうなので、そろそろ振り替えります。3月くらいまでは読んだ論文の一覧を2010/12/31の日記のところに書いてたんですが、研究室localな勉強会で紹介された論文は(OKが出ないと)外で書けないという都合があったので削除しましたが、プライベートはてなグループのほうで続いています。12/7現在で76だそうです。数のペースは以下のグラフで(実は)公開されています。 2月から3月がほとんど止まってますが、論文読むというよりディリクレ過程の勉強とか

  • tsubosaka-Tokyotextmining

    Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. tsubosaka-Tokyotextmining - Presentation Transcript Latent Dirichlet Allocation入門 @tokyotextmining 坪坂 正志 Why LDA • 白鵬が単独首位 琴欧洲敗れる Why LDA • 白鵬が単独首位 琴欧洲敗れる • 人は上の文を見て相撲に関係する文である ことを理解できる – 文中に相撲という単語は出てこないのにもかか わらず Why LDA • 白鵬が単独首位 琴欧洲敗れる • 人は上の文を見て

  • 1