タグ

言語と統計に関するkenzy_nのブックマーク (2)

  • 長尾真(情報工学者)新井紀子(数学者)|INFORIUM|NTTデータ

    人間を理解し、人工知能をさらに先へ。 情報処理学で多大な功績を残した長尾真氏と 「ロボットは東大に入れるか」プロジェクトで人間の能力に注目するようになった 国立情報学研究所の新井紀子教授が、 AI技術の発展にはこれから何が必要になるのか、徹底討論しました。 人間の知能を支えるもの新井 私が「ロボットは東大に入れるか」というプロジェクト(※1)を始めたときに人工知能学、特に言語処理の方面から「何でこんな役に立たないことをするのか」という批判的なご意見を受けました。そんな中、長尾先生が「それは今やるのはなかなか面白かろう」と、言語処理学会の記念大会などに私を講師として呼んでくださったのが印象に残っています。 長尾 でも、それから4~5年のうちに東ロボをおやめになった。「もうちょっとやったら面白いところまで展開するのでは」と思っていたので、それが残念です。 新井 いえ、まだプロジェクトはやめてい

    長尾真(情報工学者)新井紀子(数学者)|INFORIUM|NTTデータ
    kenzy_n
    kenzy_n 2018/09/12
    数学と人工知能
  • 古典文学やベストセラーを統計を通して分析する──『数字が明かす小説の秘密』 - HONZ

    小説を評する、分析するといえば基的には一人の人間が精読することによってそこで用いられている技法や、他の作品との関連、歴史的な意義などをあぶり出していく行為のことである。だが、それだけではなく、統計を通して語句の使用頻度、プロットの盛り上がり、書き出しについてなどを分析する手法も現在では発展してきた。書『数字が明かす小説の秘密』は、そんな後者のアプローチを古典文学からベストセラーまで幅広く応用した一冊だ。 かつては作家の文章における使用単語の頻度などを調べたい場合、地道に人間が数え上げていく他なかったが、近年はプログラムを組んでテキストデータを流し込めば、お手軽かつ精確に同様の分析を行うことができる。著者らも自然言語ツールキットを用いて、文章を品詞ごとに分解した調査を行っている。この分野に関して、類書として邦訳だけでもすでに『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリ

    古典文学やベストセラーを統計を通して分析する──『数字が明かす小説の秘密』 - HONZ
    kenzy_n
    kenzy_n 2018/07/25
    データからひも解く
  • 1