タグ

ブックマーク / lab.astamuse.co.jp (2)

  • CoreNLP を使ってみる(1) - astamuse Lab

    山縣です。 今回は 自然言語処理ツールである Stanford CoreNLPについて書きたいと思います。 Stanford CoreNLPとは Stanford CoreNLP は自然言語処理ツールのひとつです。スタンフォード大学がオープンソース(GPL3) で公開しています。 英語中国語など主要な言語をサポートしています。が残念ながら日語は対応していません。 日語以外の自然言語処理ツールについては先日、白木が Polyglot について記事を書いていましたが、こちらは Python 用です。私は Scala で書くことが多いので、Java/Scala で使えるものとして CoreNLP を使っています。 CoreNLP を使うには CLI として呼び出す方法、サーバとして起動して呼び出す方法、プログラムからライブラリとして使用する方法があります。 今回は CLI とサーバとして使

    CoreNLP を使ってみる(1) - astamuse Lab
  • 英文の自然言語処理におススメ!お手軽なPolyglotを使ってみた。 - astamuse Lab

    こんにちは。白木(@YojiShiraki)です。デザイナーです。 今日はPythonで英文形態素解析をする上でお手軽便利なpolyglotについて紹介します。 背景 当社ではデータを分析・解析する機会がままありまして、こうしたときに自然言語解析の処理のツールを利用しています。特に最近では英語データが多く、このあたりのツールのニーズが高くなっています。 しかし、いざ英語の解析となると意外に情報がありません。 例えば、日語の解析ならMeCabやChaSen、Kuromojiといったものはすぐ見つかります。しかし英文の自然言語解析ではTreeTaggerの情報は目につくもののイマイチまとまった情報がありません(このページやこのページに他の選択肢がまとまっていますが)。 おそらくこの領域ではNLTKが王道なのかと思いますが、やや重厚感あります。 そこでもう少しライトなものをということでPoly

    英文の自然言語処理におススメ!お手軽なPolyglotを使ってみた。 - astamuse Lab
    gayou
    gayou 2017/07/19
    Stanfoed CoreNLP(Java8以降)も全部入りなライブラリだな。
  • 1