[B! テキストマイニング] midnightseminarのブックマーク

midnightseminar id:midnightseminar

テキストマイニングに関するmidnightseminarのブックマーク (17)

トピックモデルの話
Mining topics in documents standing on the shoulders of Big Data. #KDD2014読み...Hiroki Takanashi
midnightseminar 2017/11/03
トピックモデル

NLP

★

テキストマイニング

き機械学習
リンク
数式をなるべく使わずにトピックモデルの解説にチャレンジ - Qiita
トピックモデルは応用範囲が広く、使えるところが多いモデルですが・・数式が鬼難しく分かりづらいので、なるべく数式を使わずに分かりやすくしたい。そして備忘録にしたいってことで記事を書きました。間違いがあれば指摘して頂けると幸いです。トピックモデルの使える範囲端的に言えば、文書からそれが何について記述されているかを推定するモデルです。実は適用範囲はトピックを抽出をしていくだけではないです。トピックに分けるだけでなく、文書の補助情報に関連付けをさせたり、ユーザーの情報に依存させたトピックのみに限定したり、トピックに相関関係を持たせたりできます。また文書だけでなく、画像、ソーシャルネットワーク、論文の引用関係にも応用可能です。トピックモデルの仕組み重要な点をいくつか先に述べます。確率分布、共役事前分布、パラメータ推定の３点がかなり重要になってきます。１：確率分布確率の分布な
midnightseminar 2017/11/03
NLP

トピックモデル

き機械学習

テキストマイニング
リンク
KH Coder 2 チュートリアル（スライド版）
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41stkhcoder
midnightseminar 2017/09/30
KHCoder

テキストマイニング

NLP
リンク
株式会社 Accel Brain – 活用なき「AI論」は、無学に等しい。
語られている事柄は全て、観察者によって語られている。Alles was gesagt wird, wird von einem Beobachter gesagt. Maturana, H. R. (2013). Erkennen: die Organisation und Verkörperung von Wirklichkeit: ausgewählte Arbeiten zur biologischen Epistemologie. Springer-Verlag., S.34.
midnightseminar 2017/09/25
Python

け研究ノウハウ

テキストマイニング

★
リンク
https://dl.acm.org/citation.cfm?id=2063892
midnightseminar 2016/12/05
も物語論

き機械学習

テキストマイニング

ろ論文
リンク
https://dl.acm.org/citation.cfm?id=2487940
midnightseminar 2016/12/05
も物語論

き機械学習

テキストマイニング

ろ論文
リンク
Syntactic Tree Kernels for Event-Time Temporal Relation Learning
midnightseminar 2016/12/05
も物語論

き機械学習

テキストマイニング

ろ論文
リンク
[PDF]using Tree Kernels for Classifying Temporal Relations between Events
midnightseminar 2016/12/05
も物語論

き機械学習

テキストマイニング

ろ論文
リンク
An event ontology construction approach to web crime mining
midnightseminar 2016/12/05
も物語論

き機械学習

テキストマイニング

ろ論文
リンク
ゼロから学ぶテキストマイニング。参考書籍・Webサイトまとめ9選。概要、仮説の構築、R言語、RMeCab、twitteRなど
ゼロから学ぶテキストマイニング。参考書籍・Webサイトまとめ9選。概要、仮説の構築、R言語、RMeCab、twitteRなど先日、形態素解析に関するまとめ記事(新しいタブで開く)を書きましたが、いまいち煮え切れません。なぜなら、Tiwtterのつぶやきについて、形態素解析だけを行っても、それだけで何か面白い知見を得られるわけではないからです。そこで、最近個人的に目をつけたのが、テキストマイニングという技術です。そこで、今回はゼロから学ぶテキストマイニングとして、参考になりそうな本やWebサイトの「まとめ」をしてみました。テキストマイニングの概要 Webサイトよりも、本の方が参考になりました。読んだのは、テキストマイニングを使う技術/作る技術―基礎技術と適用事例から導く本質と活用法です。第1章しか読んでませんが、30分ほどでテキストマイニングを使って、何ができるか分かりました。個人的
midnightseminar 2015/06/22
ページ内で紹介されているSlideshareがよい。

テキストマイニング

★
リンク
テキストマイニングの流れとその準備 - Qiita
テキストマイニングの概要テキストマイニングとはテキストデータを計算機で定量的に解析、有用な情報を取り出すための技術の総称です。主に、自然言語処理、統計、データマイニングといったものを基礎とします。かつてはこれらの実証分析や論理的研究には、自然言語を計算機で扱うために高価なソフトウェアが必要であり、高い敷居がありました。今日では無料で本格的なテキストマイニングをするための環境が整ってきており、また計算機も高速で安価になったことから、例えば人文社会科学分野などでの応用においても大きな注目と期待が集まっています。今回はテキストマイニングで雑多な外部のデータを集積し、データセットを作成して、分析手法の選択と適用、可視化までの大雑把なプロセスを整理します。ツールの準備テキストマイニングのためのフリーなソフトウェアとしては主に次のようなものがあります。名称説明
midnightseminar 2015/06/22
テキストマイニング

★
リンク
テキストマイニングのための機械学習超入門　一夜目 - あんちべ！
テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい（けれど高度な数学は厳しい…）」というビジネスマンや学生さんです。数式は出来る限り「使います」。使わないと意味するところは理解できません。ただし、愚直に数式の一行一行を手計算で順を追って解いていきますし、必要な数学知識はその都度説明し、前提知識は求めませんので「数式出てくるの？じゃあついていけないのでは…」という心配は不要です。この記事の特徴は「機械学習の手法をやたら冗長な数式と過剰なまでの例を用いて、くどくどと同じ話を何度も説明する」ことです。筆者ことあんちべは純文系出身で、数学や統計学、プログラミングは全然学生時代やってこなかった上、業務でも機械学習を使うことなんて皆無、それどころか機械学習なんて言葉は就職してからよう
midnightseminar 2014/05/24
テキストマイニング

パターン認識

き機械学習

★
リンク
白ヤギが要約します
テキストを自動で要約しますこのサービスはごくシンプルなルールに基づいてテキストの自動要約を行う実験的サービスです。与えられたニュース記事の中から最も重要な3つのポイントを抜き出すことで、限られた時間の中でも効率よく情報を吸収できることを目的にしています。なお、商用利用をご希望の方は、白ヤギコーポレーション（info at shiroyagi.co.jp) までお問い合わせ下さい。なお、現在のところ英語のサイトには対応しておりませんので、ご了承下さい。
midnightseminar 2013/08/16
文章を貼ると要約してくれるというサービスで、まだまだ精度が低いけど面白い取り組みですな。要約のアルゴリズムって、いろいろ研究されてるみたいですが。

げ言語学

テキストマイニング
リンク
[PDF]ビッグデータに対するテキストマイニング技術とその適用例（ユニシス）
midnightseminar 2013/07/11
ビッグデータ

テキストマイニング
リンク
KGR_2: Rによるテキストマイニング
Statistics Favorites 4 Downloads 11 Comments 0 Embed Views 1,120 Views on SlideShare 997 Total Views 2,117 KGR_2: Rによるテキストマイニング — Presentation Transcript Rによるテキストマイニング小林雄一郎（日本学術振興会） KG.R #22012年6月16日（土）、関西学院大学 1 自己紹介• 小林雄一郎（こばやしゆういちろう） – 言語学と言語処理と言語教育の挟間をふらふら – 最近の研究テーマは、「パターン認識と自然言語処理の技術を用いた習熟度判定」など 2 パターン認識技術を用いた英作文の自動評価レベル別英作文の自動分類レベル判定に寄与する要因の特定* 6月23日（土）電子情報通信学会思考と言語研究会＠早稲田大学で発表 3
midnightseminar 2013/01/08
テキストマイニング

け研究ノウハウ
リンク
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧くださいメーリングリスト一般ユーザ向けメーリングリスト開発者向けメーリングリスト新着情報 2012-01-27 MeCab 0.993 MeCab::Tagger::formatNode()が正しく動いていなかった問題の修正スタックの消費を抑えるため、ほとんどのローカル変数(配列)をヒープ上に退避 2012-01-14 MeCab 0.992 ソースコード中のTypoの修正 2012-01-14 MeCab 0.991 空文字列もしくは空白文字列を解析した時に解析エラーとなる問題を修正ユーザ辞書の作成に失敗する場合がある問題を修正 2011-12-24 MeCab 0.99 MeCab::Model, MeCab::Lattice クラスを追加マルチスレッド環境でのユーザビリティの向上。複数スレッドが同一
midnightseminar 2012/12/08
MeCabの解説からも学ぶことは多い。

テキストマイニング

げ言語学
リンク
テキストマイニングのフリーツール: 知財ファイナンス・モデリング
（共起ネットワークの図。関連する単語がグラフネットワークで見える化されている。）久々の更新になってしまった。今回は小生の専門であるテキストマイニングについて少しだけ。今関わっているプロジェクトの関係でテキストマイニングをちょっとやることになった。テキストマイニングをやるためのツールは結構充実している。しかも、便利なツールがフリーで使えてしまうのである。かつては、SASのような年間数百万円もする高価なソフトを使わなければならなかったので、今はその意味でとても恵まれている。高価なSASの代わりに爆発的に流行ってきているのがRである。このソフトはオープンソースであり、しかも最新の統計やマイニングに関する関数が素早く提供される。ある意味では既にSASよりも優れているという専門家もいるくらいだ。これを使って遊んでみない手はない。 Rを使って日本語のテキストマイニングもできるようになってきた。阪
midnightseminar 2012/11/09
テキストマイニング

け研究ノウハウ

も物語論
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx