[B! library][自然言語][JavaScript] efclのブックマーク

efcl id:efcl

libraryと自然言語とJavaScriptに関するefclのブックマーク (3)

自然言語にマッチする正規表現を書いて、形態素解析結果でテストして、置換するライブラリを書いた
textlintのルールを色々書いていて自然言語のマッチの問題がいくつかありました。 textlint-ja/textlint-rule-preset-JTF-style: JTF日本語標準スタイルガイド for textlint.は基本的に正規表現をベースに実装していました。正規表現で自然言語に対してマッチするのは簡単でいいのですが、意図しない範囲にマッチすることもあるためfalse-positiveになりやすい問題がありました。一方、ですます or である調の混在をチェックするtextlint-rule-no-mix-dearu-desumasuでは、kuromoji.jsなどで形態素解析した結果を使っています。形態素解析をすることで(正しい日本語なら)より正確にマッチできます。しかし、形態素解析のトークンに対してマッチする処理やその情報を元に置換するのは結構面倒です。 kur
efcl 2017/11/01
日本語,英語のパーサと品詞情報にマッチするライブラリとか、大雑把に正規表現でマッチして、testで詳細にチェックしてから置換できるライブラリとかを作った話

JavaScript

library

自然言語
リンク
GitHub - spencermountain/compromise: modest natural-language processing
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
efcl 2017/10/06
NPL処理ライブラリ。英単語のPOS、時制の取得、人や場所ん抽出、パターンマッチ、結果をobjectなどで出力など

JavaScript

自然言語

library

english
リンク
GitHub - leungwensen/cjk-tokenizer: A CJK text tokenizer
efcl 2017/01/27
中国語、日本語、韓国語に対応した分かち書き分類器 TinySegmenter的な

自然言語

JavaScript

library
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx