[B! nlp] [4ページ] muddydixonのブックマーク

muddydixon id:muddydixon

nlpに関するmuddydixonのブックマーク (142)

「知識」のDeep Learning
最先端NLP勉強会�“Learning Language Games through Interaction”�Sida I. Wang, Percy L...Yuya Unno
muddydixon 2015/06/09
nlp

presentation

expression

representation

parse
リンク
単語の分散表現と構成性の計算モデルの発展
岡崎直観. 2015. 単語の分散表現と構成性の計算モデルの発展. 2015年度人工知能学会全国大会(第29回), OS-1 意味と理解のコンピューティング (2), 2F5-OS-01b-1.Read less
muddydixon 2015/06/07
neuralnetwork

meaning

semantic

presentation

nlp

expression
リンク
日本語で読める自然言語処理のチュートリアルスライドまとめ
先日、自然言語処理の講演などをしていたときに、そもそも私なんかが話すよりも公開されているチュートリアルスライドを集めたほうが有用なんではないかと思い立って、これから自然言語処理を学びたい人や、ちょっと新しい分野を知りたい人向けに、日本語で読めるチュートリアルスライドを分野別にまとめてみました。主に、学会のチュートリアルや招待講演、それから研究者の方のWebページなどを参照しながら作りました。自然言語処理全般系の資料や、少し境界的なテーマは入っていません。また、ぱっと読めるスライドだけにしています。幾つか手前味噌な資料も載せてます・・。頑張って集めてみましたが、思ったほど集まりませんでした。作っていてわかったのですが、意外とスライドを公開している人は少ないようです。埋もれてしまうのはもったいないですね。いずれ、英語で読めるスライドを集めてみようと思います。そっちはそっちで、
muddydixon 2015/04/20
nlp

presentation
リンク
[O] MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました
MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました Tweet [NLP] 日本語の文書を機械的に処理しようと思った時に、ほとんどの人が MeCabとIPADIC(IPA辞書)の両方、または、どちらかを使うことになります。 IPADICはとてもよく出来ていますが、更新されないまま年月が過ぎているので、例えば2015年3月上旬に急に流行ったような言葉は収録していません。そのため、今日生まれたような新しい文書(例、Apple Watch発売)を解析する時に困ります。困らない人もいますけど、僕は困ります。その課題に対処するために、日本全国津々浦々、自然言語処理に関わる全ての人は独自にMeCabの新語辞書を作って対応しているわけです。その際に元データとして使われることが多いのは Wikipedia 日本語版やはてなキーワードなどです。困ったことに、新語辞書を生成
muddydixon 2015/03/14
素晴らしい仕事だ！！！

dictionary

nlp
リンク
言語処理100本ノック 2015
言語処理100本ノックは，実践的な課題に取り組みながら，プログラミング，データ分析，研究のスキルを楽しく習得することを目指した問題集です実用的でワクワクするような題材を厳選しました言語処理に加えて，統計や機械学習などの周辺分野にも親しめます研究やデータ分析の進め方，作法，スキルを修得できます問題を解くのに必要なデータ・コーパスを配布しています言語はPythonを想定していますが，他の言語にも対応しています
muddydixon 2015/03/13
nlp

training
リンク
情報抽出タスクで流行りの distant supervision について調べてみた - あらびき日記
この記事は abicky.net の情報抽出タスクで流行りの distant supervision について調べてみたに移行しました
muddydixon 2015/03/09
machinelearning

nlp

extract

information

paper
リンク
https://ja.epitomeup.com/
muddydixon 2015/02/27
english

machinelearning

nlp

abstract

news
リンク
WOVN.io: Website Localization | Translate web pages in 5 minutes
Make your website multilingual in just a few simple stepsExpand your reach, in any language. Speak to your potential clients in a language they understandInternet users browse and buy in their language. To get your business noticed, start by making your website available in your audience’s language. Website localization projects are not a costly and development-heavy project anymore — you can mana
muddydixon 2015/02/12
language

nlp

translate

webservice
リンク
深層学習時代の自然言語処理
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Probl em...joisino
muddydixon 2015/01/25
nlp

presentation
リンク
大規模データ時代に求められる自然言語処理 -言語情報から世界を捉える-
1. The document discusses the history and recent developments in natural language processing and deep learning. It provides an overview of seminal NLP papers from the 1990s to 2010s and deep learning architectures from 2003 to present. 2. Key deep learning models discussed include neural language models, word2vec, convolutional neural networks, and LSTMs. The document also notes the increasing int
muddydixon 2015/01/20
nlp

presentation

smartphone
リンク
GitHub - takuyaa/kuromoji.js: JavaScript implementation of Japanese morphological analyzer
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
muddydixon 2015/01/14
nlp

japanese

kuromoji
リンク
kuromoji.js使って構文解析した - Qiita
こんにちは、らこです。先日から話題になってるJavaScriptの形態素解析器kuromoji.jsを使って、確率自由文脈文法で構文解析してみました。(注意:アルゴリズムの解説記事ではないです) 結論 kuromoji.js遊びまくれるのでみんな使おう kuromoji.d.ts書いた私は型大好き人間なのでTypeScript使ってkuromoji.js使いました。型定義ファイルは自分が使う部分だけエイヤっと自作しました(laco0416/kuromoji.d.ts)。あと、プロジェクトに↑の自作型定義ファイルを読み込むのにdtsm使いました。tsd使ってたのが馬鹿らしくなるくらい便利です。作者のvvakameさんによるわかりやすい紹介はこちら確率自由文脈文法とはちゃんと説明すると長くなりますしうまく説明できる自信もないので、ばっさりカットします。雰囲気つかむにはここらへんを
muddydixon 2015/01/05
javascript

nlp

kuromoji

japanese
リンク
EMNLP2014読み会で単語の表現学習と語義曖昧性解消を同時に解く論文を紹介しました
先週の土曜日にPFIで行ったEM NLP2014読み会で、Skip-gramモデル（word2vec）と語義曖昧性解消を同時に解く論文の紹介をしました。発表スライドはこちら。単語の表現学習と語義曖昧性解消を同時に解く話は、もう一つ論文がありましたが、なんだかいまいちだったのでこちらになりました。要点だけ整理します。 Skip-gramモデルは、単語に対するベクトル表現を学習する手法として注目を集めています。このモデルは、ある単語の出現が周囲の出現単語に影響を与えるため、中心単語のベクトルと周囲の単語のベクトル（word2vecの実装では両者は別のベクトルとして区別します）の内積のexpに比例する確率で、周辺単語が決定されるというモデルを置きます（詳細は以前のスライド参照）。実データを使って、対数尤度が最大になるようにベクトルを学習します。ここまでがSkip-gramでした。この
muddydixon 2014/12/09
nlp

presentation

ambiguous

paper
リンク
語句類似度算出API ｜ソフト・アプリ開発のAPIなら【gooラボ】
いつもgooラボ・語句類似度算出APIをご利用いただきまして、誠にありがとうございます。 2018年12月3日をもちまして、語句類似度算出APIの提供を終了させて頂きました。今後ともgooラボをご利用いただきます様よろしくお願いいたします。語句類似度算出APIはリクエストで送られた2つのキーワードについて、その語句の発音内容を比較してその類似度を算出します。例えば、"東京"と"トーキョー"といった読みの似通ったキーワードの組に対して、高い類似度を算出できます。類似度は0から1の範囲となり、0.36..より大きい数値ほど似通っていると判定できますこのAPIを用いることにより、人名などの記述内容に差異のあるデータベース間で同一内容を示すレコードを探し出す分析などが容易になります。また顧客からの問い合わせ情報で、自社商品名が多様な書き方で表現されている場合の集計作業などにも適用可能です。
muddydixon 2014/12/04
nlp

goo

api
リンク
企業における自然言語処理技術の活用の現場（情報処理学会東海支部主催講演会@名古屋大学）
行動計量シンポジウム20140321　http://lab.synergy-marketing.co.jp/activity/bsj_98thYoichi Motomura
muddydixon 2014/10/29
presentation

nlp

paper

academic
リンク
レシピ言語処理マニュアル
レシピを対象とした研究・開発が近年さかんになってきています．そこでは，レシピの手順文書に対して形態素解析した結果を素材として用いることが多いですが，その準備には意外と手間がかかります．このような素材の準備は，研究・開発に依存することは少なく，共通化できる処理も多いと考えています．少しでも前準備の労力を減らし，本来の研究に打ち込める環境を提供するため，我々は本マニュアルを公開しました．これによって，レシピを対象とした研究・開発がますますさかんになっていくことを期待しています．本マニュアルは，レシピの手順文書を入力として，単語分割結果や品詞判別結果，食材・道具などの判別結果，終止形復元結果を出力する方法を記したものです．例えば，以下のような結果が得られます．入力糸蒟蒻を下茹でします。形態素解析結果糸/名詞/名詞-普通名詞-一般+/し蒟蒻/名詞/名詞-普通名詞-一般+/こんにゃ
muddydixon 2014/10/28
nlp

recipe
リンク
形態素列パターンマッチャー�MIURAをつくりました @DSIRNLP#6
This document discusses using the Miura and Mrep tools for natural language processing tasks like part-of-speech tagging and named entity recognition on Japanese text. It provides examples of using Miura to extract POS tags and surface forms from text and evaluates its time complexity. It also introduces the Mrep tool as an alternative to Miura and discusses installing it using pip.Read less
muddydixon 2014/10/18
nlp

parser

pattern

presentation
リンク
mrep 0.1.1 をリリースしました
先日、三浦海岸で行われたYANS合宿内で作った、形態素列パターンマッチャーmrepをリリースしました。昨日行われたDSIRNLPでこれについて発表しました。 mrepとは何か？ mrepは形態素列に対して、正則言語によるマッチングをかけるためのツールです。もともとMIURAという名前にするつもりだったんですが、すでにpypiに登録されていたので急遽リネームしました。先にgithubで0.1.0をリリースしてしまっていたので、何故か0.1.1になります・・。日常的にテキストデータなり、テキストを含んだjsonデータなりに対して、条件にマッチする行を検索することが有ります。例えばお客さんからもらったデータの中で、特定の単語を含むところだけ抽出したり。これには grep コマンドがよく使われて、その後は典型的には sort | uniq -c で数を数えたりしますよね。ところが g
muddydixon 2014/10/12
懐かしい！卒業研究が形態素列検索・置換システムだった

nlp
リンク
YAPC::Asia 2014で自然言語処理について発表してきました。 - WebService::Blog->new( user => ’hide_o_55’ )
YAPC::Asia 2014 で自然言語処理を支える技術〜要素技術とPerlの活用〜というタイトルで発表してきました。発表はペース配分を間違えて、時間切れになってしまい、見に来て頂いた方々には申し訳ないです。発表資料は以下です。ビギナー向けという位置づけなので、確率の数式などは出さないようにしています。感想今年は前夜祭から参加しましたが、非常に楽しかったです。今回はPerl以外のトークが多かったですが、それが結果的にこれまで YAPC に参加してこなかった人を呼ぶ結果になり、そういった方々に Perl の文化を伝えるきっかけになったのではないかと思います。なにはともあれ、yusukebeさんを始めとするスタッフの皆様、参加者のみなさまお疲れ様でした！ Chiba.pm 後夜祭的な感じでHUBで飲んでいたのですが、Chiba.pmな方々がいたので主催者多忙のためしばらく開
muddydixon 2014/09/04
presentation

nlp

perl
リンク
Slackの検索機能を強化するSSlackをリリースしました - WebPay Engineering Blog
WebPayではメインのコミュニケーションに2014年2月よりSlackを使っています。洗練されたインタフェースとエンジニアフレンドリーな機能をもったすばらしいチャットツールですが、いくつか不便な点があります。そのうちのひとつが検索の性能の悪さです。英語の文字列でも全然関係ない結果を返してくることが多く、日本語ではほとんど壊滅的になりますっていました（現在はかなり改善されています）。 Slackを利用している日本のチームはいくつもありますが、おそらく同じ問題で悩んでいるのではないでしょうか。この問題を解決するために、SSlackというツールを作成しました。（Slack API: Community Built Integrations | Slackにも掲載されました） SlackからOutgoing Webhookで監視しているチャンネル上の発言を取得し、elasticsear
muddydixon 2014/09/02
webpay

slack

searchengine

elasticsearch

kuromoji

nlp
リンク
前のページ 1 2 3 4 5 6 7 8 次のページ