こんにちは。GMOアドマーケティングのS.Rです。 前回は形態素解析のツール「MeCab」へユーザー辞書を追加する方法を紹介しました。 MeCabを使うことで日本語の形態素解析を簡単に行うことができます。 ただ、NLPの開発には形態素解析だけではなく、構文解析も非常に重要です。 MeCabには形態素解析の機能はありますが、構文解析の機能はありません。 そこで、今回は日本語の構文解析ツールセットJUMAN++/KNPを紹介します。 1. 構文解析とは 構文解析については以下のWikipediaの解説をご覧ください。 構文解析(こうぶんかいせき、syntactic analysis あるいは parse)とは、文章、具体的にはマークアップなどの注記の入っていないベタの文字列を、自然言語であれば形態素に切分け、さらにその間の関連(修飾-被修飾など)といったような、統語論的(構文論的)な関係を図式