[B! mecab] tsu-neraのブックマーク

Ubuntu 16.04.1 LTSにPython 3(Anaconda)とMeCabをインストールする : 二日坊主な私

今回は、今後必要になるであろうライブラリがまとまったAnacondaというディストリビューションを使ってPythonをインストールします。まず最初に、ここにアクセスしてPython 3.5 versionの64bit版のAnaconda(Anaconda3-4.2.0-Linux-x86_64.sh)をダウンロードします。

tsu-nera 2017/06/04

MeCab
mecab

リンク

MeCabをUTF-8でインストールしたい。 - Qiita

mecabといえば、10年前から公開されている日本語の形態素解析エンジン。研究用途やWebサービスのNGワード抽出など、今でもバリバリ活躍しています。インストールしてみるこちらを参考に、インストールを進めていきます。 MacやLinuxなどで使いたいときは、./configureのときに--with-charset-=utf8するのがミソみたいです。 $ tar zxfv mecab-X.X.tar.gz $ cd mecab-X.X $ ./configure --with-charset=utf8 $ make $ make check $ sudo make install ここまでは良さそう。辞書をインストール MeCab本体と同様に、辞書もインストールします。ここでもやっぱり./configure --with-charset=utf8がミソなんですが…。

tsu-nera 2017/05/14

mecab
linux

リンク

Word２Vec, MeCab, ComeJisyo で病気の症状類似語を出してみた - Qiita

エムスリー（ヘルスケア系）のAdvent Calendar に参加しているので、ヘルスケア系機械学習ネタちょっと前に業務とは関係なく、症状類語辞書をつくりたいなーーというときがあった。（結局できてないけどそのときに去年流行った word2vecを使って機械学習で症状の類義語がどれくらい精度よく出てくるかをやってみたのでその話を書く今回の流れ医療文書が入ったtextファイルを作成 MeCab へ医療用辞書 ComeJisyo を設定 MeCab で分かち書く word2vec で学習 word2vec を利用浅い浅い考察と感想医療文書が入ったtextファイルを作成今回は精度を比較するために、２つのテキストを用意した。一つ目は word2vecでは鉄板の大量の単語があるWikipediaのデータから、もう一つは医療系文書のデータを使用した。 1.Wikipediaのテキストファ

tsu-nera 2017/05/14

リンク

https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

tsu-nera 2017/05/13

リンク

Ubuntu 14.04 に Mecab と mecab-python3 をインストール - Qiita

概要 Mecabはオープンソースの形態素解析エンジンです。機械学習のための前準備として、日本語の文章を分かち書きにするため利用することができます。Mecab をインストールして Python から利用できるようにするのがこの記事の目標です。環境 Ubuntu 14.04 64bit gcc 4.8.4 Python 3.5.2 :: Anaconda custom (64-bit) インストール手順 1. Mecab この記事を参考にしました。

tsu-nera 2017/05/13

Python
mecab

リンク

word2vecを使って、日本語wikipediaのデータを学習する - Qiita

環境 OS X El Capitan 10.11.5 MacBook Pro (Retina 13-inch、Early 2015) [2016/8/1現在] MeCab, mecab-ipadic-NEologd のインストール MeCabはオープンソースの日本語形態素解析ソフトです。 mecab-ipadic-neologdは、Web上のリソースから新しい言葉を登録したMecab用の辞書のことです。さらに、定期的に新しい言葉をアップデートするので、最新の言葉を正しく形態素解析をすることができます。必要なライブラリをインストール brew install mecab mecab-ipadic git curl xz git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git cd mecab-ipadi

tsu-nera 2017/05/12

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

mecabに関するtsu-neraのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス