タグ

統計に関するgazi4のブックマーク (10)

  • 「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE

    ほんのわずかな初期の要因の変化が最終的に思いがけないほど差のある結果を招く現象を「バタフライ効果」と呼びますが、そんな現象は身近なところでも起こっているのかもしれないと思わせるような、一見すると関係のない2つのデータに相関性を見いだすプロジェクトが「Spurious Correlations」です。 Spurious Correlations http://www.tylervigen.com/ 1999年~2009年までの「アメリカの科学・宇宙・テクノロジーに関する支出」と「首つり自殺数」の上昇傾向が一致。 「水泳プールでの溺死数」と「ニコラス・ケイジの映画出演数」が、なぜか似たような傾向で上下しています。つまり、ニコラス・ケイジが映画に出演しなければプールでの事故が激減するのかもしれません。 「アメリカ人1人あたりのチーズ消費量」と「ベッドシーツに絡まって死亡する数」がほぼ一致。 「ア

    「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE
    gazi4
    gazi4 2014/05/13
    しょっぱなが「宇宙開発反対=貧困者に回せ」で適用できそうな例
  • P値が有意になるように頑張りすぎちゃっていませんか?

    Natureに統計学的検定の問題についてのエッセイが出ていた。フィッシャー、ネイマン、ピアソンの言い争いの紹介も含めて、P値にまつわる議論を短くまとめている。何でも、この世には統計学的に有意であるのに再現性の無い調査や研究は多々あるのだが、統計学的な検定を盲信してしまい考察が疎かになっているせいだそうだ。 P値を扱うときの問題が三つ上げられている。一つは、偽陽性の可能性がP値から連想する以上に高いことだそうだ。統計学的な厳密な議論は説明されていなかったが、例えば帰無仮説が0.5のときに、P値が0.01で有意になったとしても、再現実験では11%以上の確率で再現が得られないそうだ。一つは統計的有意であることに満足して、その効果の大きさを考察しないことがあるそうだ。一つは、P値が有意になるように分析方法を工夫しすぎてしまうケース(P-hacking)があるそうだ。 エッセイでは探索的研究と検証的

    P値が有意になるように頑張りすぎちゃっていませんか?
  • 2014新春 はてなブックマーク、はてな村。まとめと展望 - コウモリの世界の図解

    この度、はてな村に入村することにいたしました。 そこで入村届として、ここまでに得た「はてブ・はてな村」等の印象をまとめます。 (上に例示したグラフなどの詳細は項目3から) これから初めて、あるいはこれからも継続して「はてな」のサービスを利用していきたいと考える人の参考になれば嬉しいです。 目次 1、はてなブックマークの基 2、はてな村とは何かの基 3、はてなの規模と情報の海とインフルエンサー問題 4、超有名ブックマーカーとブクマやりちん指標 5、情報の質はアクト率、これからはアクト率の時代でしょ!? 6、エントリを5行でまとめる ※通常エントリ5分を優に超える情報量があるため(2万字)、あと読みを推奨します。 ※新しい情報は!?とお探しの村民は、太字だけ確認しといて項目3以降へ。 ※ネタ好きな方、ブクマやりちん疑惑のあるid:RE〇さんは項目4へ。 ※「情報」について考えるのが好き

    2014新春 はてなブックマーク、はてな村。まとめと展望 - コウモリの世界の図解
  • rauru-block.org - このウェブサイトは販売用です! - rauru block リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • 無から有(意差)を生む:多重比較でウソをつく方法 - Take a Risk:林岳彦の研究メモ

    前回の記事では多重検定がキーワードとなりましたが、良い機会なので、今回は例を交えながら多重検定がもつ問題のインパクトについて説明したいと思います。 (*「多重検定って何?」という方はこちら) 結論を先に書くと、多重性を調整しない多重比較がなぜ忌むべきものかというと、それはそのような多重比較を悪用すると「いとも簡単に無から有(意差)を生むことができる」からです。 では、そのことを「マウスへ化学物質を投与して影響を調べる」という仮想実験を例に見てみましょう。 仮想実験:マウスへ5種類の化学物質を投与する 仮想例として、5つの化学物質(物質A, B, C, D, E)をマウスに投与してその影響を調べる実験を考えてみます。 影響のエンドポイントとしては5つの器官(肝臓・腎臓・脳・肺・皮膚)の各細胞における量的なバイオマーカーの変化を用います。 それぞれの「エンドポイント・化学物質」ごとのサンプルサ

    無から有(意差)を生む:多重比較でウソをつく方法 - Take a Risk:林岳彦の研究メモ
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • 「毎日の数字を追いかけ、毎日改善する」ことの意外な落とし穴 - 渋谷駅前で働くデータサイエンティストのブログ

    (※今回の記事の内容はかなり難解かもです) 大竹文雄の経済脳を鍛える(2月13日分記事) 幾何ブラウン運動と見せかけの回帰 - My Life as a Mock Quant 得てして多くの企業では、「毎日の数字(売上高・利益・在庫etc.)を追いかけ」、「その結果を元手に毎日改善する」ということを日々励行しているのではないかと思います。 ところで、こんな体験したことはありませんか? 「毎日毎日、物凄く一生懸命数字を見ながら頑張ってカイゼンし続けて、確かに頑張った時は数字は上がったし、頑張りが足りない時は数字が下がった。それに一喜一憂しつつもずっと物凄く頑張り続けた・・・でも、あれからもう数ヶ月経ったのに全体としては数字は下がってきている。どうしてなんだろう???」 なるほど、もしかしたらその時の改善努力が正しくなかったのかもしれません。でも、実は「そもそも改善努力と数字とは何の関係もなか

    「毎日の数字を追いかけ、毎日改善する」ことの意外な落とし穴 - 渋谷駅前で働くデータサイエンティストのブログ
  • 人間の測りまちがい / グールド - 誰が得するんだよこの書評

    科学と政治の根源的な癒着を暴いた名著。科学と政治の癒着と聞くと、悪徳官僚とマッドサイエンティストが「越後屋お主も悪よのう」「いえいえお代官様ほどでは」「フハハ!」「フヒヒ!」と悪巧みしている構図が目に浮かびますが全然違います。むしろ「政治家って悪いヤツばっかですよねー。え、僕? やだなあ、僕は善良な市民ですよ、ハハ」とか真顔で言っちゃうような人がいかに政治的に動いているか、ということを言っているのです。 書のテーマは、科学がいかに政治的に利用されてきたか、逆に政治がいかに科学を歪曲してきたかです。人種差別のためにでっち上げられた数字、階級支配の維持のために利用されるIQテストなどなど……。いかに社会的なフィルターによって科学が測りまちがいをしてきたか、データの細かな検証によって誰の目にも明らかなように示しています。 科学がなぜ政治色を帯びてしまうのでしょうか。グールドに言わせれば、科学と

    人間の測りまちがい / グールド - 誰が得するんだよこの書評
    gazi4
    gazi4 2013/03/18
  • ミニスカートで元気になった - 24時間残念営業

    2013-03-02 ミニスカートで元気になった 俺はよく自分のブログを見て「ブログの俺は楽しそうだなあ」とか思う。起きてる時間帯のうち3割くらいは「もうだめだ」と思っている。「ややだめだ」まで含めると5割くらいで、「しみじみとだめだ」とか「ひょっとしたらだめなのかもしれない」まで含めると、だいたい7割くらいがだめな感じである。 今日はかなりだめなほうの日で、だめな気分のままについったーに連投していたらなんかわりとひどいことになっていた。だめなときは音楽聞くくらいしかやることないので、音楽聞きながらぼんやりとネットを巡回していたらこんな記事に出会った。 すごかった。腹かかえて笑った。だめな気分だったのだがかなり復活した。これだけツボに入る文章もひさしぶりだ。 まずタイトルがすごい。 「ミニスカートは寿命を伸ばす」 もうすごい。 俺の知ってる限り、ミニスカートはただの布である。まあフェティッ

  • 問題12 朝食を食べる子どもは成績がいい?: リスク感覚を磨く練習問題

    ある中学校で以下のような学級通信が配られた。 ----------------------------------------------------------- 全国学力・学習状況調査。いわゆる全国学力テストで、子どもたちの生活習 慣と学力との相関が明らかになりました。 中学3年生の数学の得点率と朝の関係を表したのが次のデータです。 朝べている……75.5% どちらかといえばべている……65.1% あまりべていない……57.9% まったくべていない……54.4% 朝べている生徒ほど学力が高い傾向がはっきり表れています。 これは、中学3年生の数学のデータですが、国語においても小学生において もまったく同じ傾向が見られました。 朝が学力の向上にいかに大事かが分かりますね。 みなさんも、朝を毎日べて学力向上を目指しましょう。 --------------------

    gazi4
    gazi4 2012/12/11
  • 1