タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

形態素解析に関するchimerastのブックマーク (3)

  • IgoのLucene用Analyzerを使ってみた

    開発環境はEclipseを利用。 まず適当なプロジェクトを作成し、libディレクトリを掘ってさっきの3つのjarを入れる。で、3つのjarをクラスパスに追加する。 上図のような感じで。これでIgoのAnalyzerが使えるようになった。 Javaで呼び出す時は下のソースみたいな感じになる。内容はIgoのAnalyzer(IpadicAnalyzerという名前)を使って、2つほど短いドキュメントを追加しているだけの簡易な処理。 尚、Taggerの引数の「ipadic」は辞書ファイルのパスをしている。辞書ファイルやTaggerについてはIgoの導入の方を参照されたし。 import java.io.File; import net.reduls.igo.Tagger; import net.reduls.igo.analysis.ipadic.IpadicAnalyzer; import or

  • Igo - a morphological analyzer

    目次 概要/特徴 リリースノート インストール/使い方 jarファイル 解析用辞書作成 形態素解析 コマンド BuildDic Igo Java API Tagger Morpheme サンプルコード MeCabとの相違点 解析結果 機能 辞書ファイル 単語エントリフォーマット 制限/注意点 禁則文字 バイナリ辞書エンディアン ライセンス バグ報告など 概要/特徴 Javaで実装された形態素解析器。→ Common Lisp版 辞書フォーマット及び解析結果は、ほぼMeCab互換。 単機能。 Java形態素解析器としては比較的高速。 スレッドセーフ。 リリースノート version 0.4.3: 2011年06月17日 形態素解析部の微細なパフォーマンスチューニング インストール/使い方 1) jarファイルの取得/作成 jarファイルは以下のいずれかの方法で取得/作成する。 ダウンロード

  • Mooter 形態素解析(Codename マリモ)

    ・『新しい単語』、『言い回し』、『話し言葉』を辞書不要で解析可能。 ・専門用語の解析、ケータイサイトやブログに適している。 参考サイト ムーターブログによる日形態素解析の説明 @IT - アットマーク・アイティ様にマリモの特徴を取り上げて頂きました。 ・Java 2 Developer Kit(JDK) version 1.2.2以上のJava2開発環境 ・推奨マシンスペック Pentium(R)III相当 450MHz以上 ・必要メモリ容量 512MB以上のRAM ・必要ディスク容量 500MB以上の空き容量

    chimerast
    chimerast 2011/03/22
    新語登録の必要無い形態素解析器
  • 1