タグ

研究と人工知能と統計に関するkamei_rioのブックマーク (11)

  • アンケート調査の偏ったデータをバランス調整するPythonモデル「balance」 米Metaが開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Metaに所属する研究者らが発表した論文「balance - a Python package for balancing biased data samples」は、参加者グループの範囲指定により発生する、アンケート調査の偏ったデータをバランス調整するオープンソースのPyPythonパッケージを提案した研究報告である。 アンケートは重要な研究ツールであり、他の手段では測定できない感情や意見などの主観的な経験に関するユニークな測定値を提供する。しかし、調査データは自ら選択した参加者グループから収集されるため、そこから対象集団への洞察を直接

    アンケート調査の偏ったデータをバランス調整するPythonモデル「balance」 米Metaが開発
    kamei_rio
    kamei_rio 2023/07/25
    母集団が先か標本が先かみたいな話になるけど、母集団が解ってれば機能するのかしらね
  • チャット相手が人間かボットか30%以上が判別できず--チューリングゲームの参加者

    Human or Notが使用したAIボットは、「GPT-4」やAI21 Labsの「Jurassic-2」といった最上位クラスの大規模言語モデル(LLM)をベースにしている。これらのLLMは、チャットボットやAIツールがより人間に近いテキストを生成できるように、深層学習を利用する。AI21は独自のフレームワークも開発し、ゲームごとに異なるキャラクターを持つボットを作成したという。 参加者はさまざまな工夫をこらして、相手が人間なのかボットなのかを見極めようとした。しかし、AIは十分に訓練され、多くの情報を持っていたため、必ずしもうまくいかなかった。 例えば、チャット相手が綴りや文法でミスをしたり、スラングを使ったりすると、多くの人は相手が人間である可能性が高いと考えるが、言語モデルは特定の間違いやスラングを使うように訓練されていた。 また中には、AIの学習データには最近の出来事は含まれてい

    チャット相手が人間かボットか30%以上が判別できず--チューリングゲームの参加者
    kamei_rio
    kamei_rio 2023/06/05
    "違法行為に関するアドバイスを求めたり、不快な言葉を引き出そうしたりする試みは、ほかのトリックよりも、ややうまくいった可能性がある" 倫理面での制約を突くなるほど
  • 京大、AIの性能を正確に評価する方法を開発

    京大、AIの性能を正確に評価する方法を開発
    kamei_rio
    kamei_rio 2018/03/08
    指標の特性と有効性を、ヒートマップ(可視化グラフ)とiCDF (逆累積分布関数)を使った統計学的な解析で検証。シンプルな評価方法なので、どんなAIにも使えるって話なのかな
  • Google、人間のように学習を積み上げるAIを開発

    Google、人間のように学習を積み上げるAIを開発
    kamei_rio
    kamei_rio 2017/03/16
    "学習の完了後にそれぞれの要素がどの程度タスクに重要であったか判定し、その構造を記憶して保護する" 用途を広げるならこうなるか
  • 「IBM Watson」は(いまのところ)火山噴火を予測することはできない

    kamei_rio
    kamei_rio 2015/12/18
    "なぜなら噴火は、マントルの流れと直接の関係がないからである" さらにビッグなデータが手に入らないと。そりゃそうだ
  • 膨大なデータ処理が不要 – 人間のように学習する新たなAI技術

    膨大なデータ処理が不要 - 人間のように学習する新たなAI技術 2015.12.14 Updated by WirelessWire News編集部 on December 14, 2015, 11:02 am JST 人間と同様のやり方で学習する新しいアプローチの人工知能AI)が開発されたとするレポートが、米国時間10日発行「Science」誌に発表されたと一部の媒体が報じている。 NYTimesなどによると、「Bayesian Program Learning(BPL)」とよばれるこのアプローチは、マサチューセッツ工科大学、ニューヨーク大学、トロント大学に在籍する研究者が共同で研究開発したもの。膨大なデータを処理しながら認識精度を上げていく従来のAIとは異なり、確率的なアプローチを採用したBPLでは、少数の例を参照しただけで、比較的高い精度の認識が可能になるという。 NYTimesで

    膨大なデータ処理が不要 – 人間のように学習する新たなAI技術
    kamei_rio
    kamei_rio 2015/12/16
    Bayesian Program Learning(BPL)らしい。ニューラルより速いのは何となくわかるけど、無知なアテクシには革新性が解らなかった
  • Deep Learningの実力と限界、人工知能のロードマップ

    人工知能が人類を追い越す特異点(Singularity)は来ない」「深層学習(Deep Learning)が大流行しているが、壁に突き当たる」「人工知能は、目先の技法にとらわれることなく、来の目的に向かって進め。つまり、人工知能は人間のインテリジェンスを目指せ」──ショッキングで考えさせられる内容の講演だった。 人工知能開発への厳しい意見 New York University心理学部教授Gary Marcusは、2015年8月、人工知能学会「SmartData Conference」(上の写真)で、このように講演した。Marcusは心理学者として、頭脳の知覚機能を人工知能に応用する研究を進めている。GoogleやIBMを中心に、IT業界人工知能開発につき進む中、その手法は正しいのか。厳しい意見が続いた。 Marcusの発言の根底には、人工知能は我々が考えているより“未熟”である、と

    Deep Learningの実力と限界、人工知能のロードマップ
    kamei_rio
    kamei_rio 2015/09/16
    "データが大量に揃っていることが前提となる" 知能というより統計手法。現状の限界を示すP4の画像とP5の文章が面白い
  • 人とコンピュータの論理的な対話実現へ テキスト解析で意見の根拠を示す技術、日立が開発

    賛否が分かれる議題について、大量のテキストを解析し、肯定的・否定的な意見の根拠や理由を英語で提示する技術を日立が開発した。 日立製作所は7月22日、賛否が分かれる議題について、大量のテキストを解析し、肯定的・否定的な意見の根拠や理由を英語で提示する技術を、東北大学大学院の協力を得て開発したと発表した。 人とコンピュータの論理的な対話を可能とする人工知能の実現向けた基礎技術としており、将来、企業の文書や病院の電子カルテなどを解析し、業務を支援するデータや意見を生成するシステムへの応用が期待できるとしている。 人やコミュニティーにとって重要と考えられる健康や経済、治安などの「価値」に着目。多数の議題に対する賛成・反対の意見を登録したディベートのデータベースを基に、「健康」という価値に「運動」はポジティブ、「病気」に「肥満」はネガティブ――など、単語と価値の関連性を体系的にまとめた「価値体系辞書

    人とコンピュータの論理的な対話実現へ テキスト解析で意見の根拠を示す技術、日立が開発
    kamei_rio
    kamei_rio 2015/07/24
    新鮮なデータをどこから大量に取得するのか?が結局Google先生頼みになりそう
  • 元専門誌記者が抱く「イマドキのAI」への期待とモヤモヤ感

    かつて「日経AI」という専門誌があった。その名の通り、AI人工知能)を中心とする先端技術や製品、利用動向を扱ったメディアで、創刊は“以前の”AIブームの最中である1986年。のちに「日経インテリジェントシステム」へと名称を変えて、1994年まで続いた。ちょうど20年前の話だ。 筆者は1989年から1994年まで、この日経AI(日経インテリジェントシステム)に在籍した。まさにAI普及の曲がり角から一段落するまでの過程に付き合ったことになる。 いま振り返っても、この時期は筆者にとって最も楽しく、実りのあった時代だと感じる。当時のAI応用の代表例であるエキスパートシステムからニューラルネットワーク、ファジィ、カオスのような非線形技術、さらにハイパーメディアやオブジェクト指向データベース、知的CASE(コンピュータ支援によるソフトウエアエンジニアリング)といった先端ソフトウエア技術まで、幅広く刺

    元専門誌記者が抱く「イマドキのAI」への期待とモヤモヤ感
    kamei_rio
    kamei_rio 2014/12/22
    "AIはシンボリック的なアプローチから数学的アプローチに完全に移っている" のにニューラルネット(というか深層学習)が復権してるのが興味深いんだよなー
  • 1