タグ

統計の嘘に関するgntのブックマーク (416)

  • Excelで学ぶ、やさしいデータ分析

    データ分析に興味はあるけれど、どこから手を付けていいか分からない……そんなあなたにぴったりなのが、この無料の電子書籍Excelで学ぶ、やさしいデータ分析』です。ここから、データ分析の第一歩を気軽に踏み出してみましょう! この電子書籍は、「Microsoft Excel」「Googleスプレッドシート」など日常的に触れる表計算ソフトウェアを使って、自分の手で体験しながら段階的に学べるように設計されています。概念や手順は誰でも理解できるように丁寧に易しく説明されており、数学やプログラミングの前提知識も必要ありません。 書は、データ分析を初歩から学びたい方々に向けた「包括的な教科書」として、データの取り扱い方から基的な分析方法まで、幅広いテーマを網羅しています。具体的には、以下の全16回で構成されています。 データ分析の基礎: 第1回 データ分析を学ぶべき理由と連載概要 第2回 前提基礎:

    Excelで学ぶ、やさしいデータ分析
  • Lizardman’s Constant Is 4%

    Economics Artir Kel Bryan Caplan David Friedman Pseudoerasmus Scott Sumner Tyler Cowen Effective Altruism 80000 Hours Blog Effective Altruism Forum GiveWell Blog Rationality Alyssa Vance Beeminder Elizabeth Van Nostrand Gwern Branwen Jacob Falkovich Jeff Kaufman Katja Grace Kelsey Piper Less Wrong Paul Christiano Robin Hanson Sarah Constantin Zack Davis Zvi Mowshowitz Science Andrew Gelman Greg Co

    Lizardman’s Constant Is 4%
  • 「米国人の4%がコロナの予防に漂白剤を飲んだ」は本当か? 直感に反するデータをむやみに信頼すべきではない | 戦略|DIAMOND ハーバード・ビジネス・レビュー

    2020年夏、米国疾病対策センター(CDC)が驚愕のデータを発表した。新型コロナウイルスの感染予防策として、米国人の4%が漂白剤を飲んだり、うがいに使ったりしたというのだ。米国全体に換算すると、実に1200万人が飲んだことになる。しかし、この結果は真実なのだろうか。第2の調査が実施されたところ、そのカラクリが明らかになった。 2020年初夏に米国疾病対策センター(CDC)は、新型コロナウイルスへの感染予防策として米国内で行われている危険な行為について、報告書を発表した。 その内容によれば、調査に回答した502人のうち4%は、過去1カ月の間に薄めた漂白剤を飲んだ、またはうがいに使ったと答え、石鹸水についても4%、家庭用消毒剤についても4%が同じ行為をしたと答えたという。 この報告書は瞬く間に、警告を告げる多数の見出しを誘発した(たとえばロイターは「漂白剤でうがい? 米国民はコロナ予防に消毒剤

    「米国人の4%がコロナの予防に漂白剤を飲んだ」は本当か? 直感に反するデータをむやみに信頼すべきではない | 戦略|DIAMOND ハーバード・ビジネス・レビュー
    gnt
    gnt 2024/03/15
    「トカゲ人間の定数(Lizardman's Constant)」どんな荒唐無稽な選択肢でも、選択肢がある限り4%程度票が入るという話。
  • 「これは酷い」 東京都、保育士ら有給取得率グラフが「印象操作」と批判…… 東京都が修正

    東京都福祉局が福祉業界の労働環境を発信する特設サイトに掲載された「有給取得率」の推移を示すグラフに、数字をよく見せるための不適切な加工が施されているのではないかとして批判が集まっています。 東京都特設サイトの「グラフ」が物議(画像は「教えて! ハローキティ 福祉の仕事ホントのところ」よりから) 「グラフの内容について指摘があったため、見直しました」 物議をかもしているのは、都福祉局がサンリオのキャラクター「ハローキティ」とコラボした特設サイト「教えて! ハローキティ 福祉の仕事ホントのところ」。サイトは介護施設や保育園、障害者施設などの福祉業界での働き方を発信するという内容です。 国のデータをもとに、福祉業界の有給休暇平均取得率の2019年~2022年の推移を示したグラフでは、2019年には取得率が53.2%だったのが2021年には58%、2022年には60.3%と上昇していることが分かり

    「これは酷い」 東京都、保育士ら有給取得率グラフが「印象操作」と批判…… 東京都が修正
    gnt
    gnt 2024/02/07
    副都知事激怒案件 / シンプルに請負業者(たぶん人材広告業界出身者。顔写真の扱い方とかでなんとなく)が手癖でやらかしたんやろなあ
  • 米国で東アジア系がインド人より出世できない理由

    多くのアジア系移民が米国で成功を収めてきた。統計的にもアジア系移民は他の人種グループより高い教育を受け、より豊かな傾向があるという。だが依然として、東アジア系が米国の組織のリーダーとして注目される事例は極めてまれだ。とりわけ大企業や大学では、アジア系の中ではインド出身の人物がトップに出世しているケースが目に付くが、東アジアの日中国韓国出身者は存在感がない。中国出身である米マサチューセッツ工科大学(MIT)のジャクソン・ルー助教授が慎重に分析したところ、いわゆる「差別」や「格差」とは違ったところに、大きな要因があったという。5カ国語を話すというルー助教授に、日語で聞いた。 ルーさん、今日は日語での対応をありがとうございます。中国出身ですね。 ジャクソン・ルー米マサチューセッツ工科大学(MIT)助教授(以下、ルー):はい、実は学生時代に日語を専攻し、早稲田大学に留学したことがあるの

    米国で東アジア系がインド人より出世できない理由
    gnt
    gnt 2023/05/26
    一歩まちがえると本質論になりがちだけどおもしろいー
  • 「男女不平等」で脳にも性差 皮質薄く、発達に影響か | 共同通信

    Published 2023/05/10 21:32 (JST) Updated 2023/05/10 23:56 (JST) 日を含む29カ国のジェンダー(社会的性差)などを指数化し、各国の男女約8千人の脳データを分析すると、性差が大きい国ほど女性の大脳皮質の厚みが男性より薄い傾向にあることが分かったと、京都大などの国際チームが10日までに米科学誌に発表した。 京大病院の植野司特定病院助教(精神医学)は「女性にとって不平等な環境が脳に悪影響を及ぼしている可能性がある」としている。ストレスが脳の神経細胞の変化を引き起こすことや、幼少期に受けたストレスが成人後も大脳皮質の厚みに影響を与えることがこれまでの研究で報告されている。 日中国、米国など各国のジェンダー・ギャップ指数などから性別間の不平等の度合いを指数化。18~40歳の男性約3800人と女性4千人余りのMRIデータを分析し、大脳

    「男女不平等」で脳にも性差 皮質薄く、発達に影響か | 共同通信
    gnt
    gnt 2023/05/11
    いつもの相関と因果の話。散布図ぱっと見では相関ありそうな感じ(左半分で下象限が重く、右半分で上象限が多い)はするけど生データいじってみないとなんとも。みたいないつもの。
  • 「書籍が買われる構造」を約10000文字かけて定量/定性で分析したので出版社・書店関係者に届いて欲しい|松本健太郎

    出版社にとっても屋大賞は、芥川賞や直木賞よりも欲しい賞だといわれる。「店頭で開くお祭りにみんなで参加してもらう感覚。書店がフェアを大きく展開するので、ノミネートだけでの売り上げが大きく伸びる」。屋大賞実行委員会理事長で「の雑誌」編集発行人の浜茂氏はそう話す。 なぜこの賞がこれほどの存在感を持つようになったのか。スタートは2004年。選考委員が協議して決める従来の文学賞と異なり、書店員による投票方式を取り入れた。書店員が「いちばん売りたい」を選ぶという同賞のコンセプトは、偉い選考委員のお墨付きより、等身大のお薦めを求める今の読者のニーズにぴたりとはまったのだ。 「の賞」なぜ活況 「お墨付き」より「お薦め」の時代 筆者はこれまでビジネス書16冊を執筆する機会に恵まれ、フアンからの応援もあって、紙・電子合わせて約10万部の実績を残すことが出来ました。厚く御礼申し上げます。 ただ、お

    「書籍が買われる構造」を約10000文字かけて定量/定性で分析したので出版社・書店関係者に届いて欲しい|松本健太郎
    gnt
    gnt 2023/05/10
    基礎としてはこれで。現場だと「で、おれは今日何すればいいの?」って言われちゃうやつ。
  • みんな統計的差別は実行していると思う

    anond:20230306202237 あとは罪の意識の違い 具体的には 差別対象の人数犯罪率によって個人が勝手に「これは仕方ない差別」「これはやりすぎな差別」と判断しているにすぎない そしてその基準が曖昧で人により違うので議論になりやすい 例えば特定の属性犯罪率が50%を超えてから警戒する人と犯罪率5%から警戒する人がいる 50%を超えてからしか差別しない人からすると5%で差別を開始する人は「差別する人」扱いになる 5%から開始しようが両方差別する人なんだけどね 対象人数も同じようなことで、対象が増えれば増えるほど罪の意識が薄れる人もいれば ごく僅かな人数であるほど罪の意識が薄れる人がいる その違いによって「◯◯を警戒するのは差別ではない」と言い始める これは男女逆転話でお茶を濁そうとする人がよく使うレトリックだが 女性は男性の犯罪率が高いから警戒という差別を実行しているのに 「男性だ

    みんな統計的差別は実行していると思う
    gnt
    gnt 2023/03/08
    ヨシわかった!今日から人類を差別しよう!(増田がうっかり漏らしているように。そのカテゴリ、彼我の恣意性自体が虚構であり権力ですよね)
  • 松浦大悟(日本維新の会 秋田1区支部長) on Twitter: "多くのオタクの人たちが、同性婚反対を表明し始めている。 「オタク、キモい」と差別してきた左派が「同性愛者の差別解消を」と訴えているからだ。 萌え絵を燃やしてきたジェンダー学者やLGBT 活動家が同性婚を推進しているのも理由だろう… https://t.co/cHubYuugAO"

    多くのオタクの人たちが、同性婚反対を表明し始めている。 「オタク、キモい」と差別してきた左派が「同性愛者の差別解消を」と訴えているからだ。 萌え絵を燃やしてきたジェンダー学者やLGBT 活動家が同性婚を推進しているのも理由だろう… https://t.co/cHubYuugAO

    松浦大悟(日本維新の会 秋田1区支部長) on Twitter: "多くのオタクの人たちが、同性婚反対を表明し始めている。 「オタク、キモい」と差別してきた左派が「同性愛者の差別解消を」と訴えているからだ。 萌え絵を燃やしてきたジェンダー学者やLGBT 活動家が同性婚を推進しているのも理由だろう… https://t.co/cHubYuugAO"
    gnt
    gnt 2023/02/15
    えびでんすーぅべーすとーぉぽりしーめいきんぐー。
  • 東京で車は必要ないと思っていたけれど、心の底から買ってよかった。エンジニアお父さんが車購入を決めた理由 #くるまも - くるまも|三井住友海上

    こんにちは。白山と申します。職業はソフトウェアエンジニアです。 30代後半で、同年代のと5歳と9歳の子どもの4人で東京23区内に暮らしています。 お出かけというと、一般的には前々から予定を立てた上で行う特別なイベントかもしれませんが、我が家ではむしろ学校行事や通院などの特別な事情がない限り、毎週末必ず家族や友人と車に乗って首都圏近郊のいろんな場所に出かけています。 車で「ふなばし三番瀬海浜公園」へ出かけたときの、娘との1枚 首都圏、特に23区内に住んでいると、車を所有しなくても便利に生きていくことは十分可能です。 事実、我が家は駅から徒歩5分以内で何不自由なく生活しており、数年前までは車を持つことを全く考えていませんでした。端的に言うと、掛けたコストに見合うリターンを得られるイメージがつかめなかったのです。 もし遠出をしたいのであれば昔からレンタカーがありますし、最近ではカーシェアが増え

    東京で車は必要ないと思っていたけれど、心の底から買ってよかった。エンジニアお父さんが車購入を決めた理由 #くるまも - くるまも|三井住友海上
    gnt
    gnt 2023/01/27
    年間で交通事故死亡者が3000人くらい、重傷者が3万人くらい、事故件数が40万件くらい。国内自動車台数7800万台で割って30とか40かけると生涯の率の感じがざっくりわかる。あとはバランスかゼロリスクか判断すね
  • 紅白歌合戦を「視聴率以外」のデータから可視化してみる|こちら徒然研究室(仮称)|note

    2022年の紅白歌合戦については既に視聴率を元にした論評がたくさん出ていると思いますが、当研究室ではデジタル空間上でアクセス可能な様々なオープンデータとプログラミング言語Pythonを使って、その影響を分析してみたいと思います。その結果、世帯視聴率のみから論ずるのとはまた異なった紅白像がみえてきました。 実は過去最高のツイート数今回の紅白のテーマは「LOVE & PEACE -みんなでシェア!-」でした。この時点で紅白が、主にSNSを通じて番組が多数シェアされることを目指し、そのための企画を準備してることが推察できますね。ロゴもTwitterやInstagramでの「いいね」ボタンのアイコンを想起させるものでした。 「第73回NHK紅白歌合戦」 出場歌手発表は 今日・11月16日(水)17:00頃を予定 今年の紅白のテーマは 「LOVE & PEACE -みんなでシェア!-」 そこで今年は

    紅白歌合戦を「視聴率以外」のデータから可視化してみる|こちら徒然研究室(仮称)|note
    gnt
    gnt 2023/01/13
    当日視聴率は(当然と言えば当然で)放映順が大きな要素になってくるが、YouTube上の切り出し動画は傾向が違うという分析。セカオワ1位なのは世代? 12/31Wikipedia閲覧数もおもしろい。
  • 衝撃の若年女性支援 ~若草プロジェクト編~|Kurt

    当たり前のことですが、この記事はもちろん暇空茜さんのTwitterにインスパイヤされたものです。暇空茜さんが、訴訟のカンパを集めています。文章の一番下にリンクをはっておきました。 Colaboばかりをみていたので、まともな若年女性支援を見たくなりました。 若草プロジェクト、ここは担ぎ上げているのも、村木・”冤罪をはらした”・厚子さんだし、なくなった瀬戸内寂聴さんも見守っている写真も載ってるし、さすがに大丈夫でしょうと、2021年度の活動報告書をみはじめました。 ちなみにここは、ペーパーカンパニーではないですよ、ペーパーカンパニーっていうのが正確に何を指すのか不明ですけど、ちゃんとお茶の水と秋葉原の間にある一軒家をつかって、若年女性保護の活動もしています。 ただ、活動内容は、衝撃しかありません。 2021年度の相談件数 若草プロジェクト2021年度報告書より合計欄を拡大して、大きく見せましょ

    衝撃の若年女性支援 ~若草プロジェクト編~|Kurt
    gnt
    gnt 2022/12/07
    利用者向け質問票(何でこの場所を知りましたか?)の選択肢に「アウトリーチ」って書いちゃってる気がする。あとアウトリーチ活動ってSearch前のAttentionだから直接流入経路にはなりにくい。マーケの基本では
  • 「両親は創価学会に数千万円寄付した」 宗教2世・長井秀和が告発「100万円の壺なんて安すぎて学会員にはピンとこない」(全文) | デイリー新潮

    仏壇だけで約2千万円 宗教団体への高額献金を規制する必要性が叫ばれる中、“ブレーキ”となっている存在と伝えられるのが公明党だ。献金額の多さが規制されるとなれば、支持母体の創価学会にも降りかかってくる問題となるのは想像に難くない。“エリート学会員”として育ち、10年前に創価学会を脱会した、芸人の長井秀和が高額献金の実態、池田大作名誉会長の素顔について告発する。 *** 【写真を見る】必死の形相で公明党議員の応援演説を行う「久雅美」「柴田理恵」 両親が熱心な学会員だった長井は、東京創価小学校、創価中、創価高、創価大と進学するなど、まさにエリート学会員だった。さらに芸人としてブレークした後は、「芸術部」に所属して広告塔としての役割も果たしてきた。その後、長井は学会に絶望し、2012年に脱会を表明。そんな長井に高額献金の実態を聞くと、「集まる金額は毎年1千億円以上ともいわれる」としながら、 「学

    「両親は創価学会に数千万円寄付した」 宗教2世・長井秀和が告発「100万円の壺なんて安すぎて学会員にはピンとこない」(全文) | デイリー新潮
    gnt
    gnt 2022/11/17
    ばっこり平均単価を推定すると、創価学会1000億÷250万世帯=4万円/年。統一教会600億÷10万世帯=60万円。桁が1つくらい違いそう。でも山上家の例とか見ると「あるところからは全部絞る」なんだろうな。
  • https://twitter.com/eternalhigh/status/1577137702339719168

    https://twitter.com/eternalhigh/status/1577137702339719168
    gnt
    gnt 2022/10/04
    これ社会人として普通に考えれば伏せてる数日の間で高市側と「ソースで名前出していっすか?」「いいよ」という承認と認知があったということよね。政府の調査結果開示請求班ーー!!!/光の速さでWADAさんが出してた
  • 都心3区が強すぎ?SUUMOの「住み心地ランキング」から市区ごとの住みやすさを数値化&新築マンション平均価格との相関図が興味深い

    タビー @tubby_TW お盆明けのsuumoはめっちゃ"薄い"になり23区の掲載物件数24。特集は「首都圏146市区データ付き 東京23区住み心地ランキング」。港区の小売店舗数が23.5/万人で市部を入れても最下位だけど、子ども人口割合はとうとう1位の13.9%。通勤時間ともとども都心3区がトップ3独占で、お店なくても子は育つ?! pic.twitter.com/wB4vL4qitw 2022-08-17 08:35:25

    都心3区が強すぎ?SUUMOの「住み心地ランキング」から市区ごとの住みやすさを数値化&新築マンション平均価格との相関図が興味深い
    gnt
    gnt 2022/08/25
    なんか散布図のソース表、港区の1人あたり公園面積おかしくない? さすがに皇居周りチートの千代田区にダブルスコアはヘンなのでは。
  • 国会の「丁寧に説明」を可視化する - 日直地獄

    「丁寧に説明する」や「丁寧な説明を心がける」の印象がとにかく悪い。というのも、偉い人がこういうだけで、特に丁寧な説明が行われた試しがないと感じるからだ。誰も彼も「丁寧に説明」と言うだけで、それを履行しないというメソッドがはびこっている印象があるのだ。これをデータで確認したい。 「丁寧な説明」の運用と私が持っているイメージ データの作り方 「丁寧な説明」発言ダッシュボード 見どころ 与党は丁寧に説明しがち 第二次安倍政権は丁寧に説明しがち 安倍さんと岸田さん 「丁寧な説明」メソッドを発明したのは誰だったのか 注意事項 「丁寧な説明」の運用と私が持っているイメージ 最近もこういう感じで「丁寧な説明」が出現していた。 まあこれは組織として動け、みたいな観点での批判を入れたいのでちょっと違う気がするが、各議員から丁寧な説明がされてるとは感じない。 「丁寧な説明」というと安倍さんが連発していたイメー

    国会の「丁寧に説明」を可視化する - 日直地獄
    gnt
    gnt 2022/08/02
    データドリブンだ。
  • ホームとアウェイ、無観客試合でどう変わる? ホームアドバンテージとオーディエンスの関係

    現役スポーツアナリストとスポーツ分析に興味のある方々が情報を共有するイベント「Sports Analyst Meetup」。今回、名城大学理工学部の教員である小中氏が、「無観客試合におけるホームアドバンテージ」のテーマで、無観客時にホームで行う試合の勝敗について、実際に欧州5大サッカーリーグのデータを調べてわかったことを発表しました。 スポーツ統計とシステム制御の研究者 小中英嗣氏(以下、小中):「無観客試合におけるホームアドバンテージ」といったタイトルでお話をします。まずは自己紹介から。名古屋の名城大学で理工学部の教員をしている小中です。システム制御や最適化、機械学習とかの研究をしています。最近は趣味と実益を兼ねて、スポーツ統計を一生懸命やっている最中です。 イベントには2回目と4回目でもお話をしていて、資料(https://spoana.connpass.com/)も残っていると思い

    ホームとアウェイ、無観客試合でどう変わる? ホームアドバンテージとオーディエンスの関係
    gnt
    gnt 2022/06/02
    「ホーム/アウェイでは13:10くらいの有利が有るのは過去サーベイで明確」「移動、設備、声援など要素が複合」「コロナの無観客試合で声援効果を測ろうとしたら国によってはホームアドバンテージが0になった」
  • NDL Ngram Viewer | NDLラボ

    サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の

    gnt
    gnt 2022/05/31
    おもちろーい。
  • Google Analytics(UA)が使えなくなるのはどのくらいヤバくて、いつまでに何をしたら良いのかの話。 - フジイユウジ::ドットネット

    タイトルにも書いていますが、Google Analytics(UA)がもうすぐ使えなくなるんですよ。 GA4っていうのになるらしいんですが、自動で切り替わったりしないし、何もしてないと単に使えなくなるんですよ。知ってました? ※追記※2023年になって 自動的にGA4プロパティが作成されることになりました。しかし、むしろ手動ではないことで混乱しているようです。切り替えではなくGA4プロパティが追加されるんですが、そのデメリットについてはググって調べてね。 (UA)っていうのはGA4ではない、これまで使われてきたGoogle Analyticsだと思ってください。やや正確ではないのですが「GA4という最新版ではないGoogle Analyticsはすべてサービス終了される」くらいのイメージで捉えてもいいです。 業務で関わってる人たちからはGA4移行についての記事やツイートがたくさん流れてきま

    Google Analytics(UA)が使えなくなるのはどのくらいヤバくて、いつまでに何をしたら良いのかの話。 - フジイユウジ::ドットネット
    gnt
    gnt 2022/04/19
    そう。導入自体はガイドもあるしさっくり出来る。ただ根本から別物(IEとEdgeくらい違う)。なので、数字が変わる。問題なのはGA触らないアホのためにしばらく※を入れ続けなければいけないこと
  • 全国130万件の交通事故マップ-みえない交差点-プレミアムA:朝日新聞デジタル

    人身事故が起きた全国130万件分の地点を日地図に置き、あなたの近くに潜む危険な場所を可視化しました。各地の小さな交差点で交通事故が多発していることも明らかに。

    全国130万件の交通事故マップ-みえない交差点-プレミアムA:朝日新聞デジタル
    gnt
    gnt 2022/04/11
    地点でいうと交通量(密度)とほぼ比例しているように見えてしまうので「交通量に比して事故が多い」をピックできると「魔の交差点」が可視化出来る気がする。「魔の時間帯」は明確。