はじめに Machine Learning Summer School 2020 でなされた、機械学習の公平性についてのレクチャー(by Prof. Moritz Hardt)が面白かったので勉強用にノートを残します。もとのレクチャーの動画はYoutubeに公開されています。この記事内で引用しているスライドは特に指定しない限り、レクチャーのスライドから引用しています。 Link集 [動画Part1][動画Part2][スライド] TL;DR 「センシティブ情報はデータに含まれないから差別していない」は通用しない センシティブ情報を保護するために満たすべき基準が提案されている しかし、これは差別的扱いを完全には防げない 特に、データのSelection Biasがあると、差別的な扱いにつながってしまう 因果関係を考慮した基準ならSelection Biasがあっても差別的な扱いをある程度は防
みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。— 森岡正博 (@Sukuitohananika) 2020年3月25日 このツイートと、 森岡正博 on Twitter: "みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。" ブコメがひどい。水曜日のダウンタウンとやらによれば志村けんは日本の知名度ランキング15位。そんな人が感染してるなら、実際
#統計 「95%の信頼区間」の95%はどういう意味か? 「真の値がその区間に含まれる確率」という解釈はよくある誤解。 この手の事柄では、教科書的な統計学の説明を忘れて、 * 数学的モデルを現実から得たデータで評価する とい… https://t.co/K8EHNW0Hza
こんにちは。林岳彦です。エ・レ・ファ・ン・ト・カ・シ・マ・シ(←滝川クリステル風に声に出して読みたい日本語)。 さて。 今回は8月6日に迫った日本生態学会関東地区会シンポジウム(a.k.a 因果フェス)についてのプレビューを書いてみたいと思います。 今回のシンポにおける問いを一言で言うと:「系列Aと系列Bはいかなる関係か?(*但し共変量および背景に関する情報は無いものとする*)」 統計的因果推論というと「介入効果/措置効果の推定」のことを思い浮かべる方も多いのかもしれませんが、そのテーマは昨年に扱いました。 で、今年については本質的には以下の問いが中心になると言えるのかなと思います: 「系列Aと系列Bはいかなる関係かについて答えよ(*但し共変量および背景に関する情報は無いものとする*)」 はい。 これはシンプルではありますが非常に奥の深い問いです。 今回のシンポでは、この問いに対する4つの
このページをご覧頂き、ありがとうございます。 「ベイズと最尤のどちらが正しいのか」と、いつも何度でも尋ねられます。 「事前分布は何が正しいのか」と、いつも何度でも尋ねられます。 ここでは、できるだけ短く、その質問についての返答を述べます。 1.正しい統計的推論は存在しない 統計学が扱う問題では、ほとんどの場合、基礎となる確率がわからないので、 特別な場合を除いて、正しいモデル・正しい事前分布・正しい推論というものは存在しません。 条件が不足したり過剰だったりして答えられない問題のことを【不良設定問題】と いいます。 統計学は不良設定問題を扱う学問です。 この世にあるほとんどの問題は程度の違いこそあれ、みな不良設定です。 まずは「統計学は不良設定問題を扱う学問である」ということを理解しましょう。 基礎となる確率が定められていなければ【正しい統計的推論】は存在しません。 (注) 基礎となる確率
人間を理解し、人工知能をさらに先へ。 情報処理学で多大な功績を残した長尾真氏と 「ロボットは東大に入れるか」プロジェクトで人間の能力に注目するようになった 国立情報学研究所の新井紀子教授が、 AI技術の発展にはこれから何が必要になるのか、徹底討論しました。 人間の知能を支えるもの新井 私が「ロボットは東大に入れるか」というプロジェクト(※1)を始めたときに人工知能学、特に言語処理の方面から「何でこんな役に立たないことをするのか」という批判的なご意見を受けました。そんな中、長尾先生が「それは今やるのはなかなか面白かろう」と、言語処理学会の記念大会などに私を講師として呼んでくださったのが印象に残っています。 長尾 でも、それから4~5年のうちに東ロボをおやめになった。「もうちょっとやったら面白いところまで展開するのでは」と思っていたので、それが残念です。 新井 いえ、まだプロジェクトはやめてい
今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象がおきるので頭の体操としてとても面白いです。 あまりに有名なパラドックスであるため日本語でも解説がいくつか出ていますが、人によって言っていることが違っていたり、不完全であったりします。多くはシンプソンによるオリジナルの論文を読んでないことから起因するのだと思います。 例えばシンプソンのパラドックスを交絡の問題だと捉える人は多いですが、個人的に不完全だと思います(間違いではない)。このように誤解が広まった歴史的背景も含めて、詳しく書いていきたいと思います。ちなみにアニメのシンプソンズはこの問題と全く無関係です。 そもそもシンプソンのパラドックスとは? シンプ
曖昧・多義的に使われている専門用語は全然珍しくありません。確率・統計の分野でも、たくさんの曖昧語・多義語が登場します。そのなかでも、特に曖昧性がひどく、意味不明の四天王だと僕が思っている言葉は、 確率変数 分布 母集団 標本 です。どれも手強くて、「四天王の中でも最弱」とか「最強」とかの順位付けは難しいです。 *1 「確率変数」については何度も話題にしています。2つだけ過去記事を選ぶなら: 「確率変数」と言うのはやめよう 「確率変数」の正体は米田埋め込み 「分布」に関しては: 確率・統計の「分布」の意味と使用法 心が安らぐ「分布の空間」を定義してみる 今回この記事では、残る2つの超曖昧語「母集団」「標本」について、出来る限りの解明を試みます。中心的話題は、「標本」に対するまったくかけ離れた2つの定義を結びつけることです。2つの定義を結びつけるために、「独立ベキ測度の前送り定理」を紹介します
数理論理学者の新井紀子さんと、雑誌『現代思想』2015年12月号(青土社)で対談した。 タイトルは、「東ロボくんから見えてきた、社会と人類の未来」。 現代思想 2015年12月号 特集=人工知能 -ポスト・シンギュラリティ- 作者: 新井紀子,小島寛之,石黒浩,茂木健一郎,竹内薫,西垣通,池上高志,深田晃司,三宅陽一郎,山本貴光,ドミニク・チェン,西川アサキ,藤原辰史,磯崎新出版社/メーカー: 青土社発売日: 2015/11/27メディア: ムックこの商品を含むブログ (3件) を見る東ロボくんとは、情報研究所の「ロボットは東大に入れるか」というチャレンジな企画のこと。言い換えると、「アンドロイドは東大入学の夢を見るか」っつうことだね(いやあ、寒いジョークだ。笑)。これは、情報研究所が、東大入試を突破するAI(人工知能)を開発するプロジェクトというわけだ。 この企画はインパクトが大きいらし
October 22, 2015 統計的研究に体験談で反論する人と、体験談は証拠にならないと思う人とが話をするためのチェックリスト 以下のようなチェックリストを作ってみたので役に立ちそうだと思った方は使ってみてください。 統計的研究に体験談で反論する人と、体験談は証拠にならないと思う人とが話をするためのチェックリスト あなたは以下の主張のどこまでだったら(あるいはどれにだったら)同意できますか。 1 一般論として、人間の体のしくみにはまだわからないことが多い 2 そのため、一般論として、病気は良く分からない理由で治ったり治らなかったりすることがある。 2’この一般論は今問題になっている病気にもあてはまる 3 一般論として、ある治療をうけたあとにたまたま「良く分からない理由で治る」こともある 3’この一般論は、今問題となっている治療と病気にもあてはまる 4 そのため、一般論として、ある治療を
スマートニュース、データサイエンス・マシンラーニングチームの高橋力矢と申します。記事選定や広告ターゲティングといった、高度な機械学習アルゴリズムを必要とする仕事全般に携わっています。 記事や広告を選択する際には、 人の好みをアルゴリズムで予測する必要があります。本エントリーでは、機械学習と近年流行った行動経済学とをつなげる試みを通じて、人の好みや選択規範がどれだけ機械的に予測できるものかについて、ご紹介したいと思います。 San Diegoの風にふれて Mission Bay San Diegoは米国カリフォルニア州南部の、メキシコとの国境付近にあるリゾート地です。米国海軍の基地があることで有名ですが、La Jolla ShoreやMission Bayに代表される、マリンリゾート・マリンスポーツのメッカでもあります。加えて、University of California, San Di
OR学会50年の歴史の中で,OR事典の編纂・改訂は通算3度目となる.いろいろな理由からOR事典編集委員会は,「OR事典」をWebに公開するという手段をとることになった.前回はCDによる出版であった. 資料編だけは「OR事典」から切り離して,OR学会の通常のホームページの中に移すことになった.これは逆瀬川浩孝委員長のアイディアである。内容の性格上,資料追加も間違いの訂正も広報委員会の責任で簡単に出来るようになる. 前回までの学会の歴史資料はそのまま残してある.今回はデータ追加作業を基本に多少の資料追加を行った.前事務局長の藤木秀夫さんには,その後の学会活動全般にわたる記録をまとめて原稿を作成してもらった.学術会議関係も藤木さんが前回の形式に習って資料原稿を作成し,FMES会長の高橋幸雄さんに目を通していただいた. 各支部から増補追加の原稿が送られてきた.Webのサンプルを見てくださいと言って
OR学会50年の歴史の中で,OR事典の編纂・改訂は通算3度目となる.いろいろな理由からOR事典編集委員会は,「OR事典」をWebに公開するという手段をとることになった.前回はCDによる出版であった. 資料編だけは「OR事典」から切り離して,OR学会の通常のホームページの中に移すことになった.これは逆瀬川浩孝委員長のアイディアである。内容の性格上,資料追加も間違いの訂正も広報委員会の責任で簡単に出来るようになる. 前回までの学会の歴史資料はそのまま残してある.今回はデータ追加作業を基本に多少の資料追加を行った.前事務局長の藤木秀夫さんには,その後の学会活動全般にわたる記録をまとめて原稿を作成してもらった.学術会議関係も藤木さんが前回の形式に習って資料原稿を作成し,FMES会長の高橋幸雄さんに目を通していただいた. 各支部から増補追加の原稿が送られてきた.Webのサンプルを見てくださいと言って
どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には
相関関係と因果関係(そうかんかんけいといんがかんけい)では、相関関係と因果関係の違いおよび関係について解説する。 概要[編集] 因果関係は相関関係を含意するが、相関関係は因果関係を含意しない。 相関関係と因果関係の関係は、以下のようにも説明される。 因果は相関の十分条件である。 相関は因果の必要条件である。 相関は因果の十分条件でない。 因果は相関の必要条件でない。 「相関関係は因果関係を含意しない」[注 1]は、科学や統計学で使われる語句で、2つの変数の相関が自動的に一方がもう一方の原因を意味するというわけではないことを強調したものである(もちろん、そのような関係がある場合を完全に否定するものではない)[1][2]。全く逆の言葉である「相関関係は因果関係を証明する」は、同時または前後に生じた二事象間の因果関係を主張するが、これは誤謬である。このような誤謬は虚偽の原因の誤謬[注 2]という
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く