ブックマーク / qiita.com/nnahito (1)

  • MeCabでオリジナル辞書を作成する - Qiita

    MeCabにデフォルトで入っていない言葉を形態素解析した時に,意図しない区切られ方になることが有ります. 例えばレシピ中に出てくる「水を切る」という言葉は,「水」「を」「切る」と形態素解析されます. これは間違いではありませんが,「水を切る」という意味ではなくなってしまい,それが困る場合があります. なので,MeCabの辞書に登録されていない語句をまとめた,「オリジナル辞書」の作り方を書いていこうと思います. 辞書の作成方法 ここでは,MeCabのオリジナル辞書の作成方法を記載します. データは全てCSV形式(カンマ区切り)で作成します. 文字コードはShift-JIS,改行コードは¥r(Linux)で作成してください. 名詞 名詞は,以下のように登録します. 左から, 登録したい名詞,ID,ID,重み,品詞,品詞の説明,*,*,*,*,登録したい名詞,カタカナ表示,カタカナ表記 と並んで

    MeCabでオリジナル辞書を作成する - Qiita
  • 1