青空文庫に吉川英治本が公開されていたので言語分析を試してみました。バガボンドの原作になっている宮本武蔵と、昔読んでかすかに記憶がある三国志を分析します。分析結果だけを見たい方は、"試してみる"の項目まで飛ばしてください。 今回は、pythonを使わずにnode.jsで学習と学習データの活用をしています。 word2vec-nodeという素晴らしいパッケージがあったためです。 環境 mac OSX Elcapitan 10.11.6 Mecab mecab-ipadic-neologd node.js 6.1.0 mecab-async word2vec-node node.jsでword2vecのデータを作ります。 学習データ作成 データ入手 ここから青空文庫の吉川英治本を持ってきて解析しています。更新が止まっているようで新書太閤記などが無いですが、三国志と宮本武蔵は入っているので、これを