タグ

統計に関するanimistのブックマーク (86)

  • 夜の明かりを調べれば独裁者の「経済成長」のウソがバレバレとの研究結果

    「ベニート・ムッソリーニは暴君だったが、少なくとも定刻通りに列車を走らせた」という言葉があるように、独裁者はよく冷酷だが有能な人物だと思われがちです。しかし、夜の照明の明るさを衛星から調べた研究により、独裁国家が発表する経済成長率が実態とはかけ離れていることが分かりました。 How Much Should We Trust the Dictator’s GDP Growth Estimates? | Journal of Political Economy: Vol 130, No 10 https://doi.org/10.1086/720458 How Much Should We Trust the Dictator’s GDP Growth Estimates? | BFI https://bfi.uchicago.edu/insight/finding/how-much-shou

    夜の明かりを調べれば独裁者の「経済成長」のウソがバレバレとの研究結果
  • 独裁国家のGDPデータ水増し 「光」で照らし出す

    独裁政権が必ずしも正確なデータを公表していると信じてはいけない――特に、内容が素晴らしい経済データの場合は。これは当然だと受け止められているが、従来その問題の深刻さを正確に知る手がかりはなかった。

    独裁国家のGDPデータ水増し 「光」で照らし出す
    animist
    animist 2023/02/11
    このネタどっかで前にも見たな。GDPの統計の数字は誤魔化せても、衛星画像で観測できる光量の伸びは誤魔化せないという奴。もっともこの手法による分析がバレると、無駄に光らせるのが流行るだけかも知れんが…
  • NHK #AIに聞いてみた 「統計や人工知能の専門家の方々はどう評価するのかしら…」『数学ガール』作者・結城浩さんのツイートまとめ

    NHKスペシャル公式 @nhk_n_sp 【今夜7時半】NHKが開発したAIの分析結果から読み解いた「日の未来をよくする5つの提言」って何?マツコさん・有働アナと一緒にお楽しみ下さい! #AIに聞いてみた nhk.or.jp/special/askai/ pic.twitter.com/TzHIg6Q4MX 2017-07-22 12:00:33

    NHK #AIに聞いてみた 「統計や人工知能の専門家の方々はどう評価するのかしら…」『数学ガール』作者・結城浩さんのツイートまとめ
  • NHK「Aiに聞いてみた」へのツッコミで、逆に注目が集まる「相関」「因果関係」「疑似相関」などの概念

    めたろじ @MetaLogic_3DCG NHK-AIは激怒した。必ずかの無知怠惰の40代独身男性を除かなければならぬと決意した。NHK-AIには因果関係がわからぬ。NHK-AIはデータ処理機能しか持たぬ。大量のデータを突き合わせてきた。けれども相関関係に対しては、人一倍に敏感であった。 2017-07-23 00:25:49 絶対に痩せる2021_67.5 @Conscript1942 「病院が減るほどみんな健康になる」とか言い出したNHKのクソポンコツAI、要するに「ピアノを習う子は成績がいい」みたいな分析をしたのか。こんなの有難がってるようじゃ神権政治の方がマシだし、21世紀にもなって邪馬台国未満ですわ。 2017-07-23 12:11:17 http://d.hatena.ne.jp/gryphon/20100224/p5 https://www.amazon.co.jp/exe

    NHK「Aiに聞いてみた」へのツッコミで、逆に注目が集まる「相関」「因果関係」「疑似相関」などの概念
  • 有意差とは?帰無仮説/対立仮説の考え方とビジネスでの活用を解説-GMOリサーチ

    有意差とは統計学の指標の一つです。 仮説と標の観察による結果の差が出たとき、その差が「誤差の範囲内」なのか「誤差では済まされない意味のある差」なのかを明らかにする必要があります。 「意味のある差」のことを統計学では「有意差」と表現します。 記事では有意差の概要や使い方について解説します。 “仮説”と”実際の観察によって導き出された結果”の差が誤差では済まされないような、統計的に意味がある差を「有意差」と呼びます。 例えば、無作為に抽出した女性のグループと男性のグループで「ある商品Aを購入したことがある」という回答を収集したとします。 その回答が、 女性=2,000回答 男性=1,000回答 だった場合、明らかに女性の方が購入率が高く、ほとんどの場合「有意差がある」と言えそうではないでしょうか。 しかし、 女性=1,003回答 男性=1,000回答 といった場合はどうでしょうか? たしか

    有意差とは?帰無仮説/対立仮説の考え方とビジネスでの活用を解説-GMOリサーチ
  • 【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita

    統計学や機械学習をを勉強していると「尤度」という概念に出会います。まず読めないというコメントをいくつかいただきましたが、「尤度(ゆうど)」です。「尤もらしい(もっともらしい)」の「尤」ですね。犬 じゃありませんw 確率関数や確率密度関数を理解していれば数式的にはこの尤度を処理できると思うのですが、少し直感的な理解のためにグラフィカルに解説を試みたいと思います。 コードの全文はGithub( https://github.com/matsuken92/Qiita_Contents/blob/master/General/Likelihood.ipynb )にも置いてあります。 正規分布を例にとって 正規分布の確率密度関数は f(x)={1 \over \sqrt{2\pi\sigma^{2}}} \exp \left(-{1 \over 2}{(x-\mu)^2 \over \sigma^2

    【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita
  • 決算資料で公開された「Nintendo Switchで遊んでる人の年齢分布グラフ」、一部だけ異様に飛び出してるのはこんな理由…?

    くまねこ @kuma_neko_ 先日の任天堂の決算資料でSwitchで遊んでるひとらの年齢分布がグラフ化されてたが、20代が飛び抜けて伸びてて、恐らく年齢を誤魔化してるキッズ層が相当数おるよ。 pic.twitter.com/yPeJCmDP9X 2021-11-09 20:02:11

    決算資料で公開された「Nintendo Switchで遊んでる人の年齢分布グラフ」、一部だけ異様に飛び出してるのはこんな理由…?
  • エイジ・ヒーピング - Wikipedia

    ナイジェリアの人口ピラミッド(1963年) エイジ・ヒーピング(英: age heaping)とは、年齢統計において、キリの良い年齢(たとえば0または5で終わる年齢)の人口の値が突出して多くなる現象のこと[1][2]。 原因[編集] この現象は、自分の年齢を正確に知らない人が自分の年齢を回答する場合に、自分の年齢に近いと思われる、切りの良い数字で回答することが原因となる[1]。 「その国の発展の度合いと統計の質の間には相関関係がある」と言われており[1]、発展途上国に多く見られる傾向である[1]。こうした5年ないし10年おきの偏りの傾向を検出する指標としてウィップル指数 (Whipple's index) があり、国際連合は年齢分布に関する統計の正確性を判断する際にウィップル指数の使用を推奨している。このほか、任意の下一桁に着目したマイヤーズ・インデックス (Myers' Index) な

    エイジ・ヒーピング - Wikipedia
  • アダム・ダン率を再定義する|38

    大谷翔平画像:The Mainichiの記事より 大学在学中に済ませておかなければならないことはあらかた済まし、あとは卒業論文に取り組むのみですが、どうも腰が重くてかないません。 卒論から逃げるなら逃げるで、ずっと憧れのあった楽器にチャレンジしてみるとか興味のある授業に潜ってみるとか有意義な時間の過ごし方はいくらでもあるわけですが、そういった気概もなく、結局だらだらとインターネットに興じています。私は野球と政治家が好きです。 インターネットはたいへん優れているので、これに興じていると日々予期せぬ新たな発見があります。例えば最近では、今シーズン活躍の著しい大谷翔平選手のレビューを見ていたところ、MLBがどうやらあらゆる選手のかなり詳細な成績やデータを公開しているらしいということを発見しました。 このデータの数字をいじって少しばかり遊んでみたのですが、その後どうにも空しくなったため、この初めて

    アダム・ダン率を再定義する|38
    animist
    animist 2021/12/30
    良い打者が見たいんじゃない。ロマン砲が見たいんだ!という気分になることはままある
  • 野球で送りバントが減らないのはなぜか 認知科学研究者が分析する送りバントをする心理学的理由

    Sports Analyst Meetupは、現役スポーツアナリストとスポーツ分析に興味のある方の情報共有イベント。ここでは認知科学研究者のなういず氏が、時間割引の視点からどうしてバントは減らないのか、心理学的アプローチから解説しました。 どうして送りバントは減らないのか? なういず氏(以下、なういず):『どうして送りバントをやめられないのか』というタイトルで発表いたします。なういずと申します。よろしくお願いします。 初めましての方もいると思いますので、最初に簡単に自己紹介させてください。私、なういずというハンドルネームで活動しています。Twitterは@nowism_sportsでやっていますのでフォローしてもらえると嬉しいです。サッカーは柏レイソルを、野球は巨人を応援しています。 普段は東京大学の大学院で認知科学を研究しています。研究の中では人間の非合理的な意思決定というものに興味があ

    野球で送りバントが減らないのはなぜか 認知科学研究者が分析する送りバントをする心理学的理由
    animist
    animist 2020/07/28
    なるほど。送りバントが統計的に有効でない事はもう常識で、それでも選択される理由の説明が、ゲッツーのリスク回避というのも語られるのを聞いたことあるが、得点に至るまでの打席数で時間割引されてる説は新しい!
  • 「検察庁法改正案に抗議します」500万ツイートを集めた「最初の1ツイート」はどのように広まったか?(ねとらぼ) - Yahoo!ニュース

    【※記事末尾に追記あり】 内閣の判断で検察官の定年延長を可能にする検察庁法改正案について、Twitter上では抗議の意見が広がり続けています。 【きっかけとなった「最初のツイート」を見る】 5月8日夜に初めて投稿されたハッシュタグ「#検察庁法改正案に抗議します」を含むツイートは、5月11日時点で500万件を突破。どのような流れでここまで大きなムーブメントになったのか、どんな人たちがツイートしていたのかを調べました。 発端となったのは、5月8日19時40分に投稿された以下のツイートです。 ===== 1人でTwitterデモ #検察庁法改正案に抗議します 右も左も関係ありません。犯罪が正しく裁かれない国で生きていきたくありません。この法律が通ったら「正義は勝つ」なんてセリフは過去のものになり、刑事ドラマも法廷ドラマも成立しません。絶対に通さないでください。 ===== 「1人でTwitter

    「検察庁法改正案に抗議します」500万ツイートを集めた「最初の1ツイート」はどのように広まったか?(ねとらぼ) - Yahoo!ニュース
  • #検察庁法改正案に抗議した人は本当はどのくらいいたのか|tori

    5月8日から,突然 #検察庁法改正案に抗議します というタグがトレンド入りしました. どのくらいの量ツイートされたのかを見てみると,5月8日20時から5月11日15時までの間に,リツイートを含めて4,732,473件,リツイートを除くと,564,797ツイート,拡散に関わったユーザは588,065アカウントでした. 1時間ごとのツイート数を見るとこんな感じ. なんでこんな爆発的に広まったんでしょうか.これだけ広まると,逆にボットとかスパムの影響じゃないの?と考えてしまうのがソーシャルメディア研究者の基です. というわけで,調べてみましょう. 早速データを収集します.今回は周辺データも見ようということで,「#検察庁法改正案に抗議します」だけじゃなくて,「検察庁」「定年延長」「三権分立」でデータを収集しました. ツイートしたのはボットだったのか?まず最初に疑われるのが,ボットが大量にRTした

    #検察庁法改正案に抗議した人は本当はどのくらいいたのか|tori
  • 「新しい生活様式」での商圏はどこにある? スマホ位置情報の「人流ビッグデータ」解析AIツールで飲食店などを支援【地図と位置情報】

    「新しい生活様式」での商圏はどこにある? スマホ位置情報の「人流ビッグデータ」解析AIツールで飲食店などを支援【地図と位置情報】
  • 世界中で日本だけ「コロナ感染のグラフがおかしい」という不気味 絶対的な死者数は少ないのだが…

    新型コロナウイルスによる日の死者数は欧米に比べて少ない。だが感染者数と死亡者数を「対数グラフ」で分析すると、日だけが異常な推移をたどっている。統計データ分析家の川裕氏は、「他国のように収束へ向かう横ばい化への転換が認められず、増加ペースが落ちていない。そこには3つの理由が考えられる」という——。 新型コロナウイルスは、海外でも日でも「感染爆発」と呼ばれた一時期ほどの急拡大は見られなくなってきた。だが、それでもなお深刻な感染状況が続き、医療が対応しきれないこともあって各国で死者が増えている。 1月に中国・武漢ではじまった新型コロナの感染拡大は、その後、韓国、イラン、イタリアなどと広がり、また、さらに欧州各国や米国などを中心に全世界に拡大してきている。この4カ月余りを過ぎた時点で、地域によって感染拡大のテンポや規模がどのように違っているかを、世界各国と日の国内で振り返ってみたい。 感

    世界中で日本だけ「コロナ感染のグラフがおかしい」という不気味 絶対的な死者数は少ないのだが…
  • 今、統計の現場で起きている危険なこと

    公的統計データなどを基とに語られる“事実”はうのみにしてよいのか? 一般的に“常識“と思われていることは、当に正しいのか?気鋭のデータサイエンティストがそうした視点で統計データを分析・検証する。結論として示される数字だけではなく、その数字がどのように算出されたかに目を向けて、真実を明らかにする。 ※文中にある各種資料へのリンクは外部のサイトへ移動します 連載バックナンバーはこちら 統計不正は現在進行形の「事件」 昨年末から話題に上がっていた、「毎月勤労統計」などの統計不正問題。一時は国会をも揺るがす大問題になりましたが、いつの間にか「過去の事件」として忘れられていないでしょうか。 しかし、そうではありません。全省庁が血眼になって不正を探し、見つけてもなお、後から不正が発覚しているように、統計不正は今なお現在進行形の「事件」なのです。 19年8月16日、民間企業の賃金や労働時間を把握する「

    今、統計の現場で起きている危険なこと
  • 食べログ3.8問題に終止符を打つ

    import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp

  • 統計学でパン屋の不正を見破ったポアンカレの話

    19世紀から20世紀にかけてのフランスに、ポアンカレという数学者がいて、統計学を使ってパン屋の不正を見抜いた逸話があります。 パンの重量は1000gを平均として正規分布するはず… あるパン屋では1000gのパンが売られていました。1000gのパンをつくるには、当然1000gを目指してつくりますが、その重量からは少し重くなったり、少し軽くなったりしてしまうものです。要するにある程度の誤差が生まれます。ただ、その誤差は大きいものほど発生しにくいのが普通です。 1020gになったり、980gになったりすることはよくあるでしょう。1050gになったり、950gになることもあるかもしれません。しかし、1100gになったり、900gになったりすることはまずないといえますよね。これは、誤差と呼べるものではなくて、なんらかの大きな間違いがあったのだろうと考えることができます。 パンに限らず、基的にある重

    統計学でパン屋の不正を見破ったポアンカレの話
  • 遺伝率が8割ということは両親の身長で子どもの身長は決まるのですか|Atsushi Oshio

    「身長の遺伝率は8割くらいらしいですね」 「そうだね。だいたい70から80パーセントくらいが身長の遺伝率だとされるね」 「知能指数も同じくらいですよね」 「うん。知能指数も同じくらいだと言われるよ」 「じゃあ,やっぱり両親の背の高さで子どもの身長の8割は決まってしまうのですね」 「え?そんなことはないよ」 「そうなのですか?だって,遺伝率8割なのですから,親から子に8割伝わるのではないのですか?」 問題の混同この会話では「遺伝率が8割」という問題と,「親と子の身長が8割同一」という話が混同しています。後者は言い換えれば,「両親の身長がわかると子どもの身長を80%予測することができる」です。 「身長の遺伝率が8割」とは,身長が個々でばらついているときに,そのばらつきの80%は遺伝で決定されるという話です。その「遺伝」については,どこにも「親から子に遺伝的に伝わる身長」とは書かれていません。

    遺伝率が8割ということは両親の身長で子どもの身長は決まるのですか|Atsushi Oshio
  • 「“統計的に有意差なし”もうやめませんか」 Natureに科学者800人超が署名して投稿

    「統計的に有意差がないため、2つのデータには差がない」──こんな結論の導き方は統計の誤用だとする声明が、科学者800人超の署名入りで英科学論文誌「Nature」に3月20日付で掲載された。調査した論文の約半数が「統計的有意性」を誤用しており、科学にとって深刻な損害をもたらしていると警鐘を鳴らす。 「統計的に有意差がない=違いがない」は間違い 例えば、ある薬の効能を調べたいとする。統計学では一般的に「仮説検定」を行って薬を与えたグループとそうでないグループを比較し、薬効の指標となる何らかのパラメータに統計的有意差があるかどうかを見る。仮説検定は、2つの事象の差異が偶然生じたものかどうかを統計的に結論付けるものだ。 もし、統計的有意差がある(薬を与えた群のパラメータの方が有意に大きい)なら「薬には効能がある」という結論を導けるが、有意差がなかった場合はどうだろうか。 「統計的有意差がある=薬効

    「“統計的に有意差なし”もうやめませんか」 Natureに科学者800人超が署名して投稿
  • 「勢い」が存在するかを統計的に確認する(大相撲編) - rmizutaの日記

    はじめに スポーツの世界においては「勢いがある」、「流れが来ている」等の表現がよくされると思うのですが、これらはオカルトではなく実際に存在するものなのでしょうか?この分野ではバスケのホットハンドの話が有名で、色々な方が研究されているのようなのですが、気になったので自分でも検証してみることにしました。 今回対象とするのは大相撲です。 もし勢いや流れというものが存在するのであれば、連勝中の力士はそうでない場合と比較して勝利する確率が上がり、連敗中の力士は敗北する確率が高くなると考えられます。今回は、過去の取組結果のデータを用いてこの仮説が正しいかどうかの検証を行います。 ちなみに大相撲についてはあまり詳しくないです。 データの取得 ヤフーの大相撲のサイトに、年・場所毎の勝敗表がありましたので、そちらから2014-2018年の5年分の各場所の幕内と十両の勝敗表をスクレイピングで取得しました。 取

    「勢い」が存在するかを統計的に確認する(大相撲編) - rmizutaの日記
    animist
    animist 2019/02/19
    相撲の世界で「勢」って言うと力士のことっぽい。それはさておき、相撲のしかも勝敗で「流れ」とか「勢い」みたいなものを検証するの不向きな題材な気がする…。というかそもそも局面の話なので視野を長期に取ると…