タグ

統計に関するhisawoooのブックマーク (37)

  • 全くの偶然による相関関係の図表がなんか笑える「ニコラス・ケイジが映画に出るとプールで人が死ぬ?」

    岩塩 @ganen_hinakawa 図表1-3、ニコラスケイジが映画出る→みんながそれを見てハゲでもイケてる人はおるやんけという気分になる→来ならば濡れることを嫌う頭髪に自信のない人もプールに行くように→プールの利用者増からの溺死者増、という可能性があるのではないかな! >RT 2017-06-12 00:44:00

    全くの偶然による相関関係の図表がなんか笑える「ニコラス・ケイジが映画に出るとプールで人が死ぬ?」
  • 『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版|Colorless Green Ideas

    科学における統計の誤用について説明した『ダメな統計学――悲惨なほど完全なる手引書』というの日語版が翻訳され、出版されることになった。この翻訳書について、どういった内容であるか、どういった人におすすめであるかを紹介する。 はじめに このたび、私の翻訳した『ダメな統計学――悲惨なほど完全なる手引書』というが勁草書房から出版されることになった。2017年1月27日ごろから書店などで手に入るようになる予定である。 アレックス・ラインハート〔著〕・西原史暁〔訳〕.(2017).『ダメな統計学――悲惨なほど完全なる手引書』東京:勁草書房. 訳書版元サイトでの紹介:ダメな統計学――悲惨なほど完全なる手引書|勁草書房 訳書版元サイトでの紹介その2(けいそうビブリオフィル):訳書の「はじめに」を閲覧可能 [1] 原書:Reinhart, A. (2015). Statistics Done Wrong

    『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版|Colorless Green Ideas
    hisawooo
    hisawooo 2017/01/22
    せっかく自分で勉強しても興味ない人が多いとトンチンカンなご指摘を受けてゲンナリする分野/注文してみました
  • p値の価値 - himaginary’s diary

    今月初めに米統計学会がp値の使用に関する6つの原則を公表した。その責任者である同学会Executive DirectorのRonald L. Wassersteinは、Retraction Watchという論文撤回監視ブログ*1のインタビューに応じ、最近の再現性危機問題が今回の声明の背景にあることを説明している(H/T Mostly Economics)。日でもこの6原則は各所で取り上げられており、Naverまとめがその辺りに詳しい。 米統計学会のサイトでは、この6原則を提示した声明文書と共に、同文書のp値の議論に関する21人の統計学者の反応も併せて公開している。そのうちUCバークレー教授のPhilip B. Starkが、表題の小論(原題は「The Value of p-Values」)で、今回の声明の精神は買うが、内容には若干の違和感がある、として以下の点を指摘している。 The i

    p値の価値 - himaginary’s diary
  • コンプガチャだけじゃない!? ガチャに潜む確率の罠

    twitter をみていたら、こんなツイートが回ってきました。 モバゲー・GREEが確率明示しないのは、搾り取るためというよりは、クレーム対応減らすため。1%でSR、って書くと「100回引いたのに出ない。詐欺だ」。確率だから、って説明すると彼らはこう返す「だから、100回に1回出るんでしょ?」…さあ、どう返そうか。 — saintear/セインティアさん (@saintearRX) 5月 6, 2012 たしかに「1% のガチャを 100 回引いたら当たる」と思い込んでしまう人は多そうです。 では、1% のガチャを 100 回引くと、どれぐらいの人が当たり、どれぐらいの人が当たらないのでしょうか。 1% のガチャを 100 回引いて当たらない確率は? さっそく計算してみましょう。 1 回ガチャを引いて当たらない確率は です。当たる確率は = 1% です。 2 回ガチャを引いたときに、1 度

    コンプガチャだけじゃない!? ガチャに潜む確率の罠
  • 重回帰分析で交互作用を検討する | Sunny side up!

    この記事では,重回帰分析で交互作用を検討するとはどういうことか,ということを書きます。数学的な話はありません。またより詳しいことを知りたい場合は,前田先生のWebサイトを参照してください。 交互作用効果のおさらい 分散分析では,2要因以上の計画の場合,要因間の交互作用効果を検討することがあります。 交互作用効果とは,要因の効果が,別の要因によって変化することを指します。例えば,次のような例を考えてみましょう。 何人かの人にコーヒーと紅茶の好みをそれぞれ尋ねてみたとしましょう。日だとコーヒーのほうが飲まれている頻度は多いように思うので,(推測ですが)おそらくこんな感じのグラフになるでしょう。 しかし,どちらかというと,コーヒーは男性が好きで,女性は紅茶のほうが好きなのかもしれません。このように,コーヒーと紅茶という飲み物の効果が,男性と女性で異なる,ということを考えるとそれは交互作用を考え

  • グラフによれば、たばこは無害?:朝日新聞デジタル

    2020年のオリンピック・パラリンピックの東京開催に向けて、競技場の建設や交通網の整備など、いろいろな分野で準備が進んでいます。世界各国から人々が集まり、夢と希望と感動を届けてくれるイベントが開かれるのは今から楽しみです。 開催に向けては、健康面でも取り組みがなされています。ただ、2015年5月15日の朝日新聞によりますと、「2020年東京五輪に向けて、東京都の検討会は禁煙・分煙の条例化を進めてきたが、条例化を先送りする最終提言をまとめた」そうです。 http://www.asahi.com/articles/ASH5X6GZ6H5XUTIL048.html  この記事によりますと「2004年以降、定着していた『禁煙五輪』の流れを断ち切りかねない動き」だそうです。 すでに欧米をはじめとする先進国では、たばこの健康に及ぼす悪影響は広く国民に周知されています。そして喫煙対策として、公共施設・レ

    グラフによれば、たばこは無害?:朝日新聞デジタル
  • 「福島の甲状腺がん50倍」論文に専門家が騒がないわけ(上) – Global Energy Policy Research

    先日、ある学会誌に「福島の子供たちの間で、甲状腺がんが他の地域の20-50倍上がっている」という論文が受理されたようです。(注1)最近になり、この論文が今でも世間で物議をかもしているという事を聞き、とても驚きました。なぜならこの論文は、多少なりとも甲状腺やスクリーニングの知識のある研究者の間ではほとんど問題にされないものだったからです。 しかし、このような研究者の態度がジャーナリストの反応とあまりにかい離しているために、むしろ 「福島の研究者が不当に真実を隠している」という誤解も生んでいるようです。 なぜこのようなかい離が生まれたのでしょうか? ひとつの理由は、統計や疫学、甲状腺がんやスクリーニングに関する知識の違いの差があります。もうひとつは、研究の妥当性と政府に対する批判の妥当性が混在してしまっていることがあるように思います。 ここではまず論文の限界について述べた後、この論文が報道され

    hisawooo
    hisawooo 2015/11/11
    「それはなー・・・うわー!めんどくさい!」ってなるところを丁寧に説明している/かなり率直な語り口に思うが、これ読んでも「隠してる」「騙そうとしている」と感じる人はいるんだろうか
  • 相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ

    2022年3月15日 Googleドライブの権限変更のため,ファイルが共有されていませんでした.リンクを変更しました. 「相関係数が0.7あれば、相関が高いと言える」 などの目安を、教科書や入門書で見かけたことは ありませんか? 私は、ちょくちょく目にするのですが、 どこの 誰が いつ 言い出したのか、ずっと不思議に思っています。 下記のリンクにあるPDFファイルで、その歴史的 変遷を追ってみました。 相関係数の大きさに対する目安の歴史的変遷.pdf 相関係数の大きさに対する目安の歴史的変遷.pdf - Google ドライブ 長くてすみません。 上手にまとめることができませんでした。 今回調べたところでは、20世紀初頭のアメリカに おける統計学や教育統計学の入門書において、 いくつかの目安が誕生したようです。 イギリスのGalton, K. Pearson, Spearmanなども 相関

    相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ
    hisawooo
    hisawooo 2015/08/18
    絶対的比較としては用いずに一連の統計の中での相対的比較のための数字として取り扱ったほうが安全なのだろうか
  • グラフの作り方講座にげんめっ!(引き続き東京は暑くなっているのか問題を例に)

    まとめ グラフの作り方講座(東京は暑くなっているのか問題を例に) 【20150811追記】続き作りました→http://togetter.com/li/859488 基的には同じところ(気象庁)からデータを引っ張ってきていてもグラフの作り方次第でこうも違ったものになるという見のようなあれこれを見たので半ば自分用にまとめました。グラフ大事。 42934 pv 514 176 users 149 おさらい まげぱさんが作成された日最高気温を5℃ずつ区切って11年分数えた積み上げグラフです 各日の最高気温を5度刻みで何日あるかをカウントして11年分累計 5年ずつ開始年をずらして1996年-2007まで25グループを計算 各グループで、各日数が何%あるかを計算 計算した値を積み上げグラフにプロット (11年は太陽周期を意識したそうです)

    グラフの作り方講座にげんめっ!(引き続き東京は暑くなっているのか問題を例に)
    hisawooo
    hisawooo 2015/08/12
    幻滅したのかと思った/積み上げグラフはあまり使われないのでぱっと見で「わかりにくい」って言われてしまって。/周期変動があるならそれが答えでは??明治時代とくらべて暑いっていってるわけじゃないでしょ
  • グラフの作り方講座(東京は暑くなっているのか問題を例に)

    気象庁から1950年以降の夏の(平均)気温データを取ってきてプロットしてみると 平均気温をセ氏0℃~40℃のスケールでグラフにしてみると、確かに年ごとの変動以上のものは見えないような気もします 斑賢二(HAN-NEKO,Kenji) 💜💙💛🟠🌈🎌🇷🇺🇺🇦 @Tvvitter_com 「ほんの30年前はクーラーもないのにみんな普通に生活していた、30度を超える火は珍しく猛暑日という言葉もなかった、近年暑くなった」 という話を小耳にはさんだので、気象庁から1950年以降の夏の気温データをとってきてプロットしてみた pic.twitter.com/x6rx7cbNAt 2015-08-03 10:46:17

    グラフの作り方講座(東京は暑くなっているのか問題を例に)
  • プリキュア40人の中で「 肌色率 」が一番高いのは、: 過去のプリキュア 話の流れ一覧表と視聴率等まとめ

    というわけで、前回の記事(娘を、プリキュアにするために就くべき職業)を実行して、 無事、自分の娘がプリキュアになったとしましょう。 でも、よく考えたらプリキュアの衣装って結構、肌を露出しているような気がします。そこで、プリキュアの「肌色率」について調査しました。(要は露出度ってのになるのかな) (おそらく、真面目に数値更新しているブログにおいて、最もくだらない記事になっていると思いますので 肌に合わない方はそっとブラウザ閉じて下さい) 多分、プリキュアを見ている人が思う、「肌色率の高いプリキュア」と聞いて思いつくのは この人かな、と思いますが、実際に計測してみたら、ちょっと意外な結果が出ました。 調査方法はすごく簡単で 各シリーズの公式HPの各プリキュアの画像のうち、正面からの画像をちょっとお借りしまして、 (こういうの↓) キャラの「全面積」と、「肌色面積」の比率を計算しました。 (た

    プリキュア40人の中で「 肌色率 」が一番高いのは、: 過去のプリキュア 話の流れ一覧表と視聴率等まとめ
  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • なぜ、東大、京大の入試に「統計」の問題は出ないのか?

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 『統計学が最強の学問である[実践編]』発刊記念対談 35万部を突破したベストセラー『統計学が最強の学問である』の続編、『統計学が最強の学問である[実践編]』の出版を記念し、著者・西内啓氏をホストに統計学をめぐるシリーズ対談の連載がスタートします。 ゲストは前統計学会会長、気鋭の経済学者、統計学者など。普段は知ることのできない統計学者の斬新な視点と意見をお楽しみください。 バックナン

  • 日本経済新聞、勢いと雰囲気で押し切るトンデモグラフを朝刊紙面に堂々と掲載 : 市況かぶ全力2階建

    決算発表が出ないことを怪しんでストップ高まで買われたエックスネット、TOBされるどころか逆に資提携解消で切られて過剰にお金が流出するお笑い劇場に

    日本経済新聞、勢いと雰囲気で押し切るトンデモグラフを朝刊紙面に堂々と掲載 : 市況かぶ全力2階建
  • Understanding the different types of variable in statistics | Laerd Statistics

  • js-STAR_XR+ カイ二乗検定 i×J表

    カイ二乗検定 i×J表 メイン データ形式 グラフ 説明 データ 読込 保存 消去 シミュレーション N = イェーツの補正(2×2のみ選択可) ● Rオプション ● 多重比較のp値調整法: ベイズファクタ: 【 パッケージ BayesFactor が必要 】 計算! 結果を追加 結 果 保存 コピー 消去 タブ変換 伸▼ ▲縮 Rプログラム 保存 コピー 消去 伸▼ ▲縮 データ形式 セル形式 行列タイプのデータリスト はい(人) いいえ(人) 群1 9 21 群2 4 26 群3 14 16 9 21 4 26 14 16 スタック形式 行列タイプのデータリスト 列1 列2 列3 行1 2 1 3 行2 1 3 1 スタックデザインのデータリスト 参加者 行 列 参加者1 1 1 参加者2 2 2 参加者3 1 2 参加者4 2 1 参加者5 2 2 参加者6 1 1 参加者7 2 2

  • 統計的学習理論(1): フィッシャー情報量とクラメールラオ下限と最尤法 - アドファイブ日記(ミラー版)

    勉強したことメモ。数式を使わずに書く。 また、行間をスキップせずに、多少くどいかもしれないくらいにきっちり順を追って説明を書いたので長いけどわかりやすくなっているはず。 第一回はベイズの手前まで、最尤法のあたりまでの話をする。 推定量 データを表す確率変数があってその密度関数は何らかのパラメータであらわされているとする。観測したデータから合理的にパラメータを決定するタスクのことを推定という。 推定を世界で最初にガッチリ研究したのはフィッシャーという人で、彼は推定方法の良しあしを判断する基準として、(A)不偏性、(B)有効性、(C)一致性、(D)漸近正規性、(E)十分性、などを考えた。 データからパラメータを推定する手続きは、データの関数として表せる。そういう関数を推定関数、そうやって計算した値を推定量と呼ぶ。 観測されうるデータは確率変数なので、推定量も確率変数となる。 推定量が確率変数だ

    統計的学習理論(1): フィッシャー情報量とクラメールラオ下限と最尤法 - アドファイブ日記(ミラー版)
  • 「相関が無い事の証明」は可能か - Interdisciplinary

    えっとですね。この種の(タイトルに書いたような)議論の時には、「証明」「相関」「無い」という言葉について意味内容を確認しておく事が肝要です。それが疎かになっては、話がいつまでも噛み合いません。 範囲 範囲を考える事も重要でしょう。空間的時間的な範囲のとり方によって、確認出来るか出来ないか違ってくる。私の部屋に○○という生き物がいるかどうか、というのと、広大な宇宙空間を対象にする物理学や天文学とでは、全然異なってくるでしょう。あるいは、医学のように、ある病気にどのような治療が効果的かを探る、といった場合には、その範囲は無限であると考える事も出来ます(将来その病気になる人、という所を概念的に考慮したりする)。 証明 私達が経験する現象について、数学のように厳密な意味で何かを「証明」する、と言う事が出来るかどうか。帰納的推論の難点もあります。上に書いたように、対象のとる範囲が無限の場合(有限の場

    「相関が無い事の証明」は可能か - Interdisciplinary
  • インフルエンザにタミフルは本当に意味がないのか?コクランの落とし穴

    ⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL インフルエンザに対してタミフルには限定的な効果しかないというコクランレビュー(CDSR 2014;4:CD008965)が出た.まあ毎回ながら牽制しておく.この手のメタ解析で,あらゆる患者層でタミフル意味がないと勘違いする人が毎回出るので 2014-04-11 18:39:15 ⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL 承前)この結果からは免疫力がある健常成人においてはタミフルを含む抗インフルエンザ薬を投与せずともさほど影響はないと考えられ,少なくともインフルエンザ患者全員に一律に抗インフルエンザ薬を投与する必要性はないと考えるのは妥当.インフルエンザは多くの場合,自然治癒しうる疾患. 2014-04-11 18:40:10

    インフルエンザにタミフルは本当に意味がないのか?コクランの落とし穴