NLPに関するkana0355のブックマーク (1,751)

  • 特集号提案募集の案内

    特集号提案募集の案内 言語処理学会会員各位 編集委員会 編集委員会では,特定の領域分野の技術・研究に時期を得た発表の場を提供し,広く知識を共有することを目的に,論文誌「自然言語処理」の年4回の通常の発行とは別に随時特集号を発行しています.特集号の企画については,会員各位による提案を歓迎しております. 特集号の企画を提案される方は,提案者の氏名・所属,提案日,特集テーマ名,特集の趣旨,対象領域,投稿の方法ならびに形式,スケジュール,特集号編集委員を記載した特集号企画提案書を ()にお送りください. 提案された企画は,編集委員会で審議し,承認の後,特集号の論文を公募することとなります.審議の際に提案内容を御説明いただくために提案者あるいはその代理の方に編集委員会への出席をお願いする場合もあります.

  • 長尾真(情報工学者)新井紀子(数学者)|INFORIUM|NTTデータ

    人間を理解し、人工知能をさらに先へ。 情報処理学で多大な功績を残した長尾真氏と 「ロボットは東大に入れるか」プロジェクトで人間の能力に注目するようになった 国立情報学研究所の新井紀子教授が、 AI技術の発展にはこれから何が必要になるのか、徹底討論しました。 人間の知能を支えるもの新井 私が「ロボットは東大に入れるか」というプロジェクト(※1)を始めたときに人工知能学、特に言語処理の方面から「何でこんな役に立たないことをするのか」という批判的なご意見を受けました。そんな中、長尾先生が「それは今やるのはなかなか面白かろう」と、言語処理学会の記念大会などに私を講師として呼んでくださったのが印象に残っています。 長尾 でも、それから4~5年のうちに東ロボをおやめになった。「もうちょっとやったら面白いところまで展開するのでは」と思っていたので、それが残念です。 新井 いえ、まだプロジェクトはやめてい

    長尾真(情報工学者)新井紀子(数学者)|INFORIUM|NTTデータ
    kana0355
    kana0355 2018/09/13
    “完全一致や論理的推論などよりも、類似性を見出せることこそ人間の頭脳の根本的な働きではないかと思います。私は死ぬまでに『類似性とは何か』という本を書きたいです。”
  • え、1秒で書けちゃうの? AI記者が野球で見せた実力:朝日新聞デジタル

    今夏の全国高校野球選手権記念西兵庫大会決勝。神戸新聞社はツイッターで、記事を発信した。 「明石商は同点の7回、二死二塁から3番田渕翔のセンターヒット、なおも二死二塁から4番右田治信のレフト二塁打などで計3点を挙げ、逆転した」 AIを活用して記事をつくる「ロボットくん」が書いたものだ。地方大会のデータや、過去に記者が書いた同種の記事などを「学習」。試合データを読み込ませると1秒あまりで「執筆」する。 準々決勝から実験的に配信を始めた。デジタル事業局メディアプロモート室の川上隆宏さん(44)によると、社内では「そつなくまとまっていた」という評価の一方、「試合の熱量や雰囲気が伝わらない」という声も。今後の活用方法は検討中だが、開発の現場では「記者が行けない試合のデータをもらい、AIで記事化してはどうか」という意見もあがっているという。 NHKは、野球の解説で「ZUNO(ズノ)さん」を電通と開発し

    え、1秒で書けちゃうの? AI記者が野球で見せた実力:朝日新聞デジタル
    kana0355
    kana0355 2018/09/02
    この辺,Encoder-Decoderで大分進化した印象.
  • 論文を読む能力 - なーんだ、ただの水たまりじゃないか

    去年の4月くらいから、論文を読む事が出来るようになった、という気がしている。 もう一年以上前の話なんだが。なんとなくその事をブログに書いてなかったな、と思ったので、ここに書いておく。 論文を読む、というのは、みんなやっている、と主張はするものだ。 ちゃんと理解できているかは怪しいものだが、 一方でその区別もそんなにはっきりとはしていないので、 誰が論文は読めて誰が読めてないのかもよく分からない。 論文の分野にもよるからますます一概には言えない。 ただ、機械学習仕事では論文を読むのは重要な日常業務の一つで、 この能力が明らかに不足している人というのはかなり居る。 明確な境界を決めるのは無理だけれど、明らかに足りてない場合は明白に分かるし、皆が言う程はこの能力は簡単な物では無い。 実際、自分も2015年ころには、この論文を読む能力が低くて困っていた。 2017年の4月頃には読めるようになった

  • 『Customized Regression Model for Airbnb Dynamic Pricing』を読んでまとめた 【KDD2018】 - honawork

    はじめに 2018年8月19日から23日にかけてロンドンで行われたKDD2018(データマイニングの世界的なカンファレンス)に採択されていた『Customized Regression Model for Airbnb Dynamic Pricing』なる論文を読みました。 Airbnbで実装されている価格推薦モデルについての論文で、 ビジネス・ユーザー視点を取り入れており、 「価格を下げれば予約されていた」と、「もっと価格を上げていてもよかった」というニーズ それをうまくモデル化していて、 上記を損失関数として定量化 さらにシンプルな構造で理解しやすい ①予約確率の予測→②最適価格の提案→③パーソナライズと、マクロ→ミクロに落ちていく構造 という点において優れたデータサイエンスの応用例であると感じたため、主要な論点を要約しつつ解説に取り組んでみようかと思います。 はじめに 論文の要旨 最

    『Customized Regression Model for Airbnb Dynamic Pricing』を読んでまとめた 【KDD2018】 - honawork
    kana0355
    kana0355 2018/08/26
  • Rによる機械学習:caretパッケージの使い方 | Logics of Blue

    ニューロンの個数を2パタン。 データへの依存度を3パタン用意すると、2×3=6パタンも試さなければなりません。 大変に面倒ですが、このハイパーパラメタを雑に設定すると予測精度が落ちてしまうこともよくあります。 めんどくさいですが、なるべくやったほうがいいです。 4.モデルを使って予測する これは簡単。単に予測をするだけです。 パッケージを使っていれば、たいていは予測用の関数が用意されています。 5.予測の評価をする 最後は評価です。 評価をすることによって、 ・どの手法の ・どのパッケージの ・どのパラメタを 採用すべきかを判断します。 で、一番予測精度がいいやつを使って予測することになります。 たくさんの手法、たくさんのパッケージ、たくさんのパラメタの組み合わせをしらみつぶしに評価する。 普通にこれをやろうと思うと、気が遠くなってしまいますね。 そこで登場するのがパッケージ「caret」

  • Googleの音声認識エンジンを使って音声ファイルから文字起こししてみた

    Googleがクラウドサービスとして提供している「Google Cloud Platform」の中に、「Cloud Speech-to-Text」というサービスがあります。このサービスは音声ファイルをAIが認識して文字にしてくれるというものなのですが、一体AIはどれくらい正確に文字起こししてくれるものなのか実際に使って試してみました。 Cloud Speech-to-Text - Speech Recognition  |  Cloud Speech-to-Text API  |  Google Cloud https://cloud.google.com/speech-to-text/ まず、GoogleのクラウドサービスであるGoogle Cloud Platformの登録を済ませておきます。まだ登録していないという人は以下の記事の冒頭部分を参考に登録しておいてください。 無料でGoo

    Googleの音声認識エンジンを使って音声ファイルから文字起こししてみた
    kana0355
    kana0355 2018/08/25
    Speech2Text
  • AI研究者「仕事を奪われないよう 教科書は読めるように」 | NHKニュース

    東京都と都の教育委員会が教育政策の意見を交わす総合教育会議が開かれ、AI=人工知能の研究者がAIに仕事を奪われないため、中学校の卒業時に少なくとも教科書を読めるようにすることが、これからの公教育の最重要課題だと訴えました。 会議では、東京大学への合格を目指す人工知能の開発に携わった国立情報学研究所の新井紀子教授が意見を述べ、「人は意味を理解するというAIにない能力がある。しかし、読解力が低くて教科書を読めない子どもは、学習の方法もわからず、結果として、AIに仕事を奪われかねない」と指摘しました。 そのうえで新井教授は、中学校の卒業時に少なくとも教科書を読めるようにすることが、これからの公教育の最重要課題だと訴えました。 これを裏付けるように出席した都立高校の教員も、テストの問題文を理解できず、数学の問題に正解できないケースや、知っている単語の数が不足しているため、問題文の一部を読み飛ばすな

    AI研究者「仕事を奪われないよう 教科書は読めるように」 | NHKニュース
  • 機械学習で使うベクトルや行列の微分を使った公式の導出 - Qiita

    はじめに 機械学習の勉強をしていると,次のようなベクトルや行列を使った公式達を使わなければならない場面が出てくると思います.機械学習の巻末に書いてあることが多いと思います.(これらはPattern Recognition and Machine Learning (Bishop著, 2006)の巻末に載っている公式です) \frac{\partial}{\partial\boldsymbol{x}}(\boldsymbol{x}^\mathrm{T}\boldsymbol{a}) =\boldsymbol{a} \\ \frac{\partial}{\partial\boldsymbol{A}}\mathrm{Tr}(\boldsymbol{A}\boldsymbol{B})=\boldsymbol{B}^\mathrm{T} \\ \frac{\partial}{\partial\b

    機械学習で使うベクトルや行列の微分を使った公式の導出 - Qiita
    kana0355
    kana0355 2018/08/23
  • トヨタも虜にする「天才が憧れる天才」AI企業、PFNゴールデンチームの全貌

    研究者やグーグルApple、CYBERDYNEなど名だたる企業から人材が集まる(画像をタップすると高解像度版を表示します)。 取材をもとにBusiness Insider Japanが作成 メルカリが上場し、日で有数のユニコーン(未上場で企業価値10億ドル以上の企業)とされるプリファード・ネットワークス(以下、PFN)。 トヨタやファナック、日立製作所など日を代表する技術系大手企業から資金を調達し、事業面でも連携を進める、いま日でもっとも注目を集めるスタートアップの1社だ。 PFNが開発したオープンソースの深層学習フレームワーク「Chainer」は、世界中の企業や開発者に利用され、AIの研究開発の最前線にい込んでいる。 そのPFNは、プリファード・インフラストラクチャー(PFI)から分社する形で2014年3月に創業、現在の社員数は150人を超えた。そして、いまなお優秀な技術者が集

    トヨタも虜にする「天才が憧れる天才」AI企業、PFNゴールデンチームの全貌
    kana0355
    kana0355 2018/08/22
    はてなーの根拠のない自信がすごい.
  • 機械学習技術とその数理基盤

    kana0355
    kana0355 2018/08/21
    簡潔にまとまっていて分かりやすい.
  • 【深層学習入門】画像処理の基礎(画素操作)からCNN設計まで|はやぶさの技術ノート

    こんにちは。 コンピュータビジョン(『ロボットの眼』開発)が専門の”はやぶさ”@Cpp_Learningです。 最近は、PythonOpenCVを使った画像処理にハマっています! OpenCV便利ですよね~画像処理に関する知識があまりなくても、関数をレゴブロックのように繋げるだけで目的の処理ができますからね~ ただ、OpenCVが便利すぎるせいで『画像処理の基礎』を学ぶ機会を失っている人が多いような気がしています。。

    【深層学習入門】画像処理の基礎(画素操作)からCNN設計まで|はやぶさの技術ノート
    kana0355
    kana0355 2018/08/17
  • Yusuke Kondo on the Web | 霑題陸縲�謔�莉九�繝壹�繧ク

    ツ祥� 2007窶扼窶忸窶堋ゥ窶堙ァ2008窶扼窶忸窶堙懌�堙��ーテ闇�wナ陳、窶ケ窶�窶敕ッ窶「テ「ツ鞘�「窶ケテ�ツ (ナステ。ナスティナ陳、窶ケ窶�(B) ヒ�ェ窶敕� ナ�Oツ坂�佛津ェ窶ケツウヒ�ァ: 窶ーpナ津ェナ�wツ習ナステ停�堙娯�ーツケ窶愿��堙俄�堋ィ窶堋ッ窶堙ゥ窶ーC窶板・窶堙固陳、窶ケ窶�ツ:ツ坂ぎ窶禿壺�ーナセ窶愬。窶板斃彑窶堙俄�堙ヲ窶堙ゥ窶「]窶ーツソ窶堙娯�「ツェツ静坂�堙��ーツケ窶ケツソナ�w窶廬窶伉ェ窶凖ィ)窶堙個鞘�「ツ青ャ窶堙ーナステウ窶堋ッ窶堙�行窶堙≫�堋スナ陳、窶ケ窶�窶堙個青ャ窶ーテ岩�堙��堋オ窶堙�、窶ーpナ津ェナ�wツ習ナステ停�堙娯�ーツケツ青コ窶堙ーナ津カナ�J窶堋オ窶堙懌�堋キツ。ヒ�遺�ーツコ窶堙家断ツーニ耽窶堙固�T窶牌窶堙ーナスツヲ窶堋オ窶堙懌�堋キツ。ナ陳、窶ケ窶�窶禿壺�廬窶堙��堋ア窶堙姑断ツーニ耽窶堙ーナスg窶

  • 【C94新刊】Text Mining Maniax Advance――R, KH Coder, Excelによる計量テキスト分析の拡張 - 後藤和智事務所OffLine サークルブログ

    【書誌データ】 書名:Text Mining Maniax Advance――R, KH Coder, Excelによる計量テキスト分析の拡張 発行日:2018(平成29)年8月12日(コミックマーケット94) 著者:後藤和智(後藤和智事務所OffLine http://www45.atwiki.jp/kazugoto/) サイズ:A5 ページ数:40ページ 価格:即売会…600円/書店委託…800円(税抜) 通販取扱:メロンブックス https://www.melonbooks.co.jp/detail/detail.php?product_id=390206 COMIC ZIN(予定) 国立国会図書館登録情報:納予定 サンプル: www.pixiv.net 電子書籍:メロンブックスDL、BOOK☆WALKER 【目次】 目次 はじめに 0.1 まえがき 0.2 RとKH Coderの

    【C94新刊】Text Mining Maniax Advance――R, KH Coder, Excelによる計量テキスト分析の拡張 - 後藤和智事務所OffLine サークルブログ
  • B'zの歌詞をPythonと機械学習で分析してみた 〜LDA編〜 - 下町データサイエンティストの日常

    1. Part概要 前PartではB'zの歌詞を「TF-IDF」を用いた分析を行いました。 Partではトピックモデルの一つである「LDA」を用いた分析についてお話しします。 pira-nino.hatenablog.com 2. LDAとは 2.1 LDAのイメージ 先に簡単な説明をしてしまいます。 LDAは「たくさんの文書データから単語のグルーピングを行う」モデルです。 このグループ1つ1つを「トピック」と呼びます。 例えば、大量のニュース記事にLDAを適用する例を考えます。 ニュース記事データにLDAを適用した例 LDAでは「各トピック(トピック数は予め指定)における各単語の所属確率」が算出されます。 理論的なことはさておき、文書データから単語をいくつかのグループに自動で分けてくれる手法 との理解で大丈夫です。 よく勘違いされることとして以下の2点を示します。 トピック数(いくつ

    B'zの歌詞をPythonと機械学習で分析してみた 〜LDA編〜 - 下町データサイエンティストの日常
  • 知らなかった……“青空文庫”の全データは“GitHub”から一括ダウンロードできる!/“データを丸ごとほしい!”という場合に便利【やじうまの杜】

    知らなかった……“青空文庫”の全データは“GitHub”から一括ダウンロードできる!/“データを丸ごとほしい!”という場合に便利【やじうまの杜】
  • GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less

    CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。 超解像とは? 超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を 超解像(Super Resolution)と呼ばれます。 (参照元:二次元画像を拡大したいと思ったことはありませんか? - デー) このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう

    GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less
  • 音響処理の基礎 with CNN 〜機械学習で「太鼓の達人」の自動作譜をしてみた〜 - Qiita

    この記事の対象者 音響処理の基礎を概観したい ディープラーニングを用いた音響処理に興味がある 太鼓の達人が好きだ つまり初心者向けってことです。プロの方のツッコミもお待ちしています。 結果 見て(聴いて?)もらうと早いと思います。これは今回作ったモデルで生成した譜面を太鼓さん次郎2で演奏したものです。 米津玄師さんの「ピースサイン」: 「音楽から全自動で太鼓の達人の譜面を作るAI」を作りました またいつか解説記事書きます pic.twitter.com/IW6qrd9knS — うっでぃ (@woodyOutOfABase) July 16, 2018 UndertaleよりToby Foxさんの"Your Best Nightmare" @no_TL pic.twitter.com/UW5ntQg0KC — うっでぃ (@woodyOutOfABase) July 20, 2018 ki

    音響処理の基礎 with CNN 〜機械学習で「太鼓の達人」の自動作譜をしてみた〜 - Qiita
  • 高校野球の戦評、AIが「1秒あまり」で自動作成、Twitter配信 神戸新聞「経過戦評ロボットくん」運用スタート

    高校野球の一打席速報の内容を、機械学習を使った人工知能AI)で解析し、戦評を自動作成するプログラム「経過戦評ロボットくん」を、神戸新聞社が開発した。7月23日(夏の東・西兵庫大会・準々決勝)以降の全試合で運用しており、試合終了後わずか1秒あまりで戦評を執筆。Twitterに配信中だ。「AI機械学習に関心をもつ社員が開発した」という。 ロボットくんは、各打席の結果をリアルタイムで配信する一打席速報をリアルタイムで監視。終了した試合を見つけるとページの内容を読み込み、打席結果を解析して経過戦評をまとめる。 具体的には、試合の中で起きたひとつひとつの打席結果を分析し、それぞれの得点シーンについて勝敗への影響度を算出。高い点数がついた得点シーンを複数組み合わせてテキストにまとめるという手順だ。どのようなシーンを重要と判断するかは、あらかじめ機械学習作成した点数表をもとに計算。人間の記者が書いた

    高校野球の戦評、AIが「1秒あまり」で自動作成、Twitter配信 神戸新聞「経過戦評ロボットくん」運用スタート
  • AIが文章を推敲、より自然な言い回しに 東北大の学生が開発目指す

    伊藤氏は、気持ちや考えを適切に言葉にするのに苦手意識があり、起業するきっかけになったという。「どういった言葉を選べば自分の言いたいことを適切に伝えられるのか、日々考えている。Langsmithの活動を通じてより円滑なコミュニケーションが実現できればと思う」(伊藤氏) 栗林氏は「慣れない場面や外国語で文を書く際は、自分が作った文が適切なのか、もっと魅力的な表現はないのか、というフィードバックを手軽に得たいと感じる。大量のデータに基づいて、言葉選びに対してフィードバックを与えてくれるシステムが実現できると面白いのではないか」としている。 関連記事 AI小説執筆、電子出版ベンチャーが大学と連携 「商業出版目指す」 電子出版ベンチャーのBooks&Companyが、AIによる小説執筆プロジェクトでカンボジアのキリロム工科大学と提携。商業出版できるレベルの小説の完成を目指す。 総務省がSF小説創作

    AIが文章を推敲、より自然な言い回しに 東北大の学生が開発目指す
    kana0355
    kana0355 2018/07/21