タグ

論理と統計に関するomega314のブックマーク (19)

  • 「データは真実」はほんとうか

  • PsycheRadio on Twitter: "理系の学問は自己相対化とか客観性とかの担保が実験や統計などの「研究法」に外部化されているから、「研究」の外側に出ると途端に思い込みや偏見丸出しになる人が時々いるラジよね。"

    理系の学問は自己相対化とか客観性とかの担保が実験や統計などの「研究法」に外部化されているから、「研究」の外側に出ると途端に思い込みや偏見丸出しになる人が時々いるラジよね。

    PsycheRadio on Twitter: "理系の学問は自己相対化とか客観性とかの担保が実験や統計などの「研究法」に外部化されているから、「研究」の外側に出ると途端に思い込みや偏見丸出しになる人が時々いるラジよね。"
    omega314
    omega314 2020/11/15
    道具としての「統計」も適切に扱うのは難しいラジね。統計、日頃から使っている研究者でも使いこなせないのに、さらに複雑な機械学習だのAIだのの民主化とか気軽に言ってくれるなあと正直思ってる。
  • 公平な機械学習へ向けての技術と課題 - Qiita

    はじめに Machine Learning Summer School 2020 でなされた、機械学習の公平性についてのレクチャー(by Prof. Moritz Hardt)が面白かったので勉強用にノートを残します。もとのレクチャーの動画はYoutubeに公開されています。この記事内で引用しているスライドは特に指定しない限り、レクチャーのスライドから引用しています。 Link集 [動画Part1][動画Part2][スライド] TL;DR 「センシティブ情報はデータに含まれないから差別していない」は通用しない センシティブ情報を保護するために満たすべき基準が提案されている しかし、これは差別的扱いを完全には防げない 特に、データのSelection Biasがあると、差別的な扱いにつながってしまう 因果関係を考慮した基準ならSelection Biasがあっても差別的な扱いをある程度は防

    公平な機械学習へ向けての技術と課題 - Qiita
  • データマイニング・機械学習分野の概要

  • 『志村けんのパラドックス - アスペ日記』へのコメント

    ブックマークしました ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください Twitterで共有

    『志村けんのパラドックス - アスペ日記』へのコメント
    omega314
    omega314 2020/03/28
    でぃーぷらーにんぐもいいけど、(ベイズ)統計モデリングもいいぞ。 / 私も件のツイートから推察される前提を妥当とはあまり思わないが、己が何を前提としてるか意識してなさそうな人にバカにされてるのは腹が立つ。
  • 志村けんのパラドックス - アスペ日記

    みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。— 森岡正博 (@Sukuitohananika) 2020年3月25日 このツイートと、 森岡正博 on Twitter: "みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。" ブコメがひどい。水曜日のダウンタウンとやらによれば志村けんは日の知名度ランキング15位。そんな人が感染してるなら、実際

    志村けんのパラドックス - アスペ日記
    omega314
    omega314 2020/03/28
    確率とは何かしらの前提・仮定を置いた上で計算されるが、あなたが指摘したいのは「前提が妥当でない」なのか(前提を認めた上で)「前提を表現するモデリングが妥当でない」「計算や推論が間違っている」なのかという
  • 黒木玄 Gen Kuroki on Twitter: "#統計 「95%の信頼区間」の95%はどういう意味か? 「真の値がその区間に含まれる確率」という解釈はよくある誤解。 この手の事柄では、教科書的な統計学の説明を忘れて、 * 数学的モデルを現実から得たデータで評価する とい… https://t.co/K8EHNW0Hza"

    #統計 「95%の信頼区間」の95%はどういう意味か? 「真の値がその区間に含まれる確率」という解釈はよくある誤解。 この手の事柄では、教科書的な統計学の説明を忘れて、 * 数学的モデルを現実から得たデータで評価する とい… https://t.co/K8EHNW0Hza

    黒木玄 Gen Kuroki on Twitter: "#統計 「95%の信頼区間」の95%はどういう意味か? 「真の値がその区間に含まれる確率」という解釈はよくある誤解。 この手の事柄では、教科書的な統計学の説明を忘れて、 * 数学的モデルを現実から得たデータで評価する とい… https://t.co/K8EHNW0Hza"
    omega314
    omega314 2020/01/24
    『他140件の返信』長い / 現実とモデルの区別は付けましょうという話。 / 統計・確率、需要に対して難し過ぎんよな。 / https://twitter.com/sammy_suyama/status/1220624407346868224
  • 8/6因果フェスのプレビュー:「系列Aと系列Bの関係は?」という問いに対する4つの素敵な解法について - Take a Risk:林岳彦の研究メモ

    こんにちは。林岳彦です。エ・レ・ファ・ン・ト・カ・シ・マ・シ(←滝川クリステル風に声に出して読みたい日語)。 さて。 今回は8月6日に迫った日生態学会関東地区会シンポジウム(a.k.a 因果フェス)についてのプレビューを書いてみたいと思います。 今回のシンポにおける問いを一言で言うと:「系列Aと系列Bはいかなる関係か?(*但し共変量および背景に関する情報は無いものとする*)」 統計的因果推論というと「介入効果/措置効果の推定」のことを思い浮かべる方も多いのかもしれませんが、そのテーマは昨年に扱いました。 で、今年については質的には以下の問いが中心になると言えるのかなと思います: 「系列Aと系列Bはいかなる関係かについて答えよ(*但し共変量および背景に関する情報は無いものとする*)」 はい。 これはシンプルではありますが非常に奥の深い問いです。 今回のシンポでは、この問いに対する4つの

    8/6因果フェスのプレビュー:「系列Aと系列Bの関係は?」という問いに対する4つの素敵な解法について - Take a Risk:林岳彦の研究メモ
  • ベイズ推論:いつも何度でも尋ねられること

    このページをご覧頂き、ありがとうございます。 「ベイズと最尤のどちらが正しいのか」と、いつも何度でも尋ねられます。 「事前分布は何が正しいのか」と、いつも何度でも尋ねられます。 ここでは、できるだけ短く、その質問についての返答を述べます。 1.正しい統計的推論は存在しない 統計学が扱う問題では、ほとんどの場合、基礎となる確率がわからないので、 特別な場合を除いて、正しいモデル・正しい事前分布・正しい推論というものは存在しません。 条件が不足したり過剰だったりして答えられない問題のことを【不良設定問題】と いいます。 統計学は不良設定問題を扱う学問です。 この世にあるほとんどの問題は程度の違いこそあれ、みな不良設定です。 まずは「統計学は不良設定問題を扱う学問である」ということを理解しましょう。 基礎となる確率が定められていなければ【正しい統計的推論】は存在しません。 (注) 基礎となる確率

    ベイズ推論:いつも何度でも尋ねられること
    omega314
    omega314 2019/12/08
    事前分布にだけやたらと懐疑的になったりするような人、「とりあえずこれやっとけば怒られないやり方」を欲しているんだろうなと思うときある。けどまあ、道具としてだけ使いたいならある程度はしゃーないよなとも。
  • 長尾真(情報工学者)新井紀子(数学者)|INFORIUM|NTTデータ

    人間を理解し、人工知能をさらに先へ。 情報処理学で多大な功績を残した長尾真氏と 「ロボットは東大に入れるか」プロジェクトで人間の能力に注目するようになった 国立情報学研究所の新井紀子教授が、 AI技術の発展にはこれから何が必要になるのか、徹底討論しました。 人間の知能を支えるもの新井 私が「ロボットは東大に入れるか」というプロジェクト(※1)を始めたときに人工知能学、特に言語処理の方面から「何でこんな役に立たないことをするのか」という批判的なご意見を受けました。そんな中、長尾先生が「それは今やるのはなかなか面白かろう」と、言語処理学会の記念大会などに私を講師として呼んでくださったのが印象に残っています。 長尾 でも、それから4~5年のうちに東ロボをおやめになった。「もうちょっとやったら面白いところまで展開するのでは」と思っていたので、それが残念です。 新井 いえ、まだプロジェクトはやめてい

    長尾真(情報工学者)新井紀子(数学者)|INFORIUM|NTTデータ
  • データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly

    今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象がおきるので頭の体操としてとても面白いです。 あまりに有名なパラドックスであるため日語でも解説がいくつか出ていますが、人によって言っていることが違っていたり、不完全であったりします。多くはシンプソンによるオリジナルの論文を読んでないことから起因するのだと思います。 例えばシンプソンのパラドックスを交絡の問題だと捉える人は多いですが、個人的に不完全だと思います(間違いではない)。このように誤解が広まった歴史的背景も含めて、詳しく書いていきたいと思います。ちなみにアニメのシンプソンズはこの問題と全く無関係です。 そもそもシンプソンのパラドックスとは? シンプ

    データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly
  • 超曖昧語「母集団」「標本」にケリをつける - 檜山正幸のキマイラ飼育記 (はてなBlog)

    曖昧・多義的に使われている専門用語は全然珍しくありません。確率・統計の分野でも、たくさんの曖昧語・多義語が登場します。そのなかでも、特に曖昧性がひどく、意味不明の四天王だと僕が思っている言葉は、 確率変数 分布 母集団 標 です。どれも手強くて、「四天王の中でも最弱」とか「最強」とかの順位付けは難しいです。 *1 「確率変数」については何度も話題にしています。2つだけ過去記事を選ぶなら: 「確率変数」と言うのはやめよう 「確率変数」の正体は米田埋め込み 「分布」に関しては: 確率・統計の「分布」の意味と使用法 心が安らぐ「分布の空間」を定義してみる 今回この記事では、残る2つの超曖昧語「母集団」「標」について、出来る限りの解明を試みます。中心的話題は、「標」に対するまったくかけ離れた2つの定義を結びつけることです。2つの定義を結びつけるために、「独立ベキ測度の前送り定理」を紹介します

    超曖昧語「母集団」「標本」にケリをつける - 檜山正幸のキマイラ飼育記 (はてなBlog)
  • 新井紀子さんと、東ロボくんのことで、対談しますた - hiroyukikojima’s blog

    数理論理学者の新井紀子さんと、雑誌『現代思想』2015年12月号(青土社)で対談した。 タイトルは、「東ロボくんから見えてきた、社会と人類の未来」。 現代思想 2015年12月号 特集=人工知能 -ポスト・シンギュラリティ- 作者: 新井紀子,小島寛之,石黒浩,茂木健一郎,竹内薫,西垣通,池上高志,深田晃司,三宅陽一郎,山貴光,ドミニク・チェン,西川アサキ,藤原辰史,磯崎新出版社/メーカー: 青土社発売日: 2015/11/27メディア: ムックこの商品を含むブログ (3件) を見る東ロボくんとは、情報研究所の「ロボットは東大に入れるか」というチャレンジな企画のこと。言い換えると、「アンドロイドは東大入学の夢を見るか」っつうことだね(いやあ、寒いジョークだ。笑)。これは、情報研究所が、東大入試を突破するAI(人工知能)を開発するプロジェクトというわけだ。 この企画はインパクトが大きいらし

    新井紀子さんと、東ロボくんのことで、対談しますた - hiroyukikojima’s blog
  • Daily Life:統計的研究に体験談で反論する人と、体験談は証拠にならないと思う人とが話をするためのチェックリスト

    October 22, 2015 統計的研究に体験談で反論する人と、体験談は証拠にならないと思う人とが話をするためのチェックリスト 以下のようなチェックリストを作ってみたので役に立ちそうだと思った方は使ってみてください。 統計的研究に体験談で反論する人と、体験談は証拠にならないと思う人とが話をするためのチェックリスト あなたは以下の主張のどこまでだったら(あるいはどれにだったら)同意できますか。 1 一般論として、人間の体のしくみにはまだわからないことが多い 2 そのため、一般論として、病気は良く分からない理由で治ったり治らなかったりすることがある。 2’この一般論は今問題になっている病気にもあてはまる 3 一般論として、ある治療をうけたあとにたまたま「良く分からない理由で治る」こともある 3’この一般論は、今問題となっている治療と病気にもあてはまる 4 そのため、一般論として、ある治療を

    omega314
    omega314 2015/10/22
    統計的・確率的事実って、ある(少数の)人にとっては全く救いにならずどころか絶望を深くするだけなことがままある。
  • 人間の心を読む機械学習 見かけの不合理性を超えたベイジアンな個人の行動規範とは - SmartNews Engineering Blog

    スマートニュース、データサイエンス・マシンラーニングチームの高橋力矢と申します。記事選定や広告ターゲティングといった、高度な機械学習アルゴリズムを必要とする仕事全般に携わっています。 記事や広告を選択する際には、 人の好みをアルゴリズムで予測する必要があります。エントリーでは、機械学習と近年流行った行動経済学とをつなげる試みを通じて、人の好みや選択規範がどれだけ機械的に予測できるものかについて、ご紹介したいと思います。 San Diegoの風にふれて Mission Bay San Diegoは米国カリフォルニア州南部の、メキシコとの国境付近にあるリゾート地です。米国海軍の基地があることで有名ですが、La Jolla ShoreやMission Bayに代表される、マリンリゾート・マリンスポーツのメッカでもあります。加えて、University of California, San Di

    人間の心を読む機械学習 見かけの不合理性を超えたベイジアンな個人の行動規範とは - SmartNews Engineering Blog
  • ORWiki

    OR学会50年の歴史の中で,OR事典の編纂・改訂は通算3度目となる.いろいろな理由からOR事典編集委員会は,「OR事典」をWebに公開するという手段をとることになった.前回はCDによる出版であった. 資料編だけは「OR事典」から切り離して,OR学会の通常のホームページの中に移すことになった.これは逆瀬川浩孝委員長のアイディアである。内容の性格上,資料追加も間違いの訂正も広報委員会の責任で簡単に出来るようになる. 前回までの学会の歴史資料はそのまま残してある.今回はデータ追加作業を基に多少の資料追加を行った.前事務局長の藤木秀夫さんには,その後の学会活動全般にわたる記録をまとめて原稿を作成してもらった.学術会議関係も藤木さんが前回の形式に習って資料原稿を作成し,FMES会長の高橋幸雄さんに目を通していただいた. 各支部から増補追加の原稿が送られてきた.Webのサンプルを見てくださいと言って

  • ORWiki

    OR学会50年の歴史の中で,OR事典の編纂・改訂は通算3度目となる.いろいろな理由からOR事典編集委員会は,「OR事典」をWebに公開するという手段をとることになった.前回はCDによる出版であった. 資料編だけは「OR事典」から切り離して,OR学会の通常のホームページの中に移すことになった.これは逆瀬川浩孝委員長のアイディアである。内容の性格上,資料追加も間違いの訂正も広報委員会の責任で簡単に出来るようになる. 前回までの学会の歴史資料はそのまま残してある.今回はデータ追加作業を基に多少の資料追加を行った.前事務局長の藤木秀夫さんには,その後の学会活動全般にわたる記録をまとめて原稿を作成してもらった.学術会議関係も藤木さんが前回の形式に習って資料原稿を作成し,FMES会長の高橋幸雄さんに目を通していただいた. 各支部から増補追加の原稿が送られてきた.Webのサンプルを見てくださいと言って

    omega314
    omega314 2013/05/13
    nonassociative algebra の一例(他にリー代数など)。非結合的な積を持つが、正の整数の冪に対しては指数法則が成り立つ…とのことだったので、ちょっとやってみたら確かに指数法則が成り立つこと示せた。わーい。
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • 相関関係と因果関係 - Wikipedia

    相関関係と因果関係(そうかんかんけいといんがかんけい)では、相関関係と因果関係の違いおよび関係について解説する。 概要[編集] 因果関係は相関関係を含意するが、相関関係は因果関係を含意しない。 相関関係と因果関係の関係は、以下のようにも説明される。 因果は相関の十分条件である。 相関は因果の必要条件である。 相関は因果の十分条件でない。 因果は相関の必要条件でない。 「相関関係は因果関係を含意しない」[注 1]は、科学や統計学で使われる語句で、2つの変数の相関が自動的に一方がもう一方の原因を意味するというわけではないことを強調したものである(もちろん、そのような関係がある場合を完全に否定するものではない)[1][2]。全く逆の言葉である「相関関係は因果関係を証明する」は、同時または前後に生じた二事象間の因果関係を主張するが、これは誤謬である。このような誤謬は虚偽の原因の誤謬[注 2]という

  • 1