タグ

統計に関するtakahiro_kiharaのブックマーク (36)

  • 白書、年次報告書|厚生労働省

    このホームページを、英語中国語・韓国語へ機械的に自動翻訳します。以下の内容をご理解のうえ、ご利用いただきますようお願いします。 1.

  • 仮説駆動型とデータ駆動型

    サイトリニューアル中につきガチャガチャしてます。ウェブサイトデザイン、記事執筆、添削指導する側に興味ある方はご連絡ください。謝礼をお支払いいたします。 研究の種類はしばしば仮説駆動型(hypothesis driven)とデータ駆動型(data driven)に分けて論じられることがあります。一般に、仮説駆動型とは「ある仮説を事前に設定し、その仮説を検証することで実験を進める手法」であり、データ駆動型とは「事前の仮説(バイアス)無しに対象を観察したり、データを取得したりし、それらの結果から何が言えるのかを考える手法」とされています。 仮説駆動型は悪なのか? ときどき、仮説駆動型は事前のバイアスがきつすぎて捏造などを生み出す温床となるという批判があります。確かに事前に「こうあるべきだ」「こうあって欲しい」という思いが強いと事実を見落としたり、誤認したりします。 たとえば、以下の動画を見て、白

    仮説駆動型とデータ駆動型
  • パス解析とは?共分散構造分析との違いもわかりやすく解説-GMOリサーチ

    商品を販売する上で最も重要な要素について考えたことはあるでしょうか? 商品のプロモーションを促進するためには、例えば以下の重要度を明確にする必要があります。 ブランディング 魅力 価格 人気度 デザイン オプション機能 では、顧客の購買決定要因に最も大きく関わるのはこの内の一体どれなのでしょうか? この購買決定要因の重要度の分析に役立つのがパス解析です。 パス解析を活用することで、商品販売戦略・自社サービスの更なる改善・顧客の創出などにますますリサーチを役立てやすくなります。

    パス解析とは?共分散構造分析との違いもわかりやすく解説-GMOリサーチ
  • 統計分析を理解しよう-よく使われている統計分析方法の概要-

    最近、個人や企業を対象としたアンケート調査やパネルデータ、そしてビックデータと呼ばれる大規模のデータ等が蓄積されることにより、統計データを用いた実証分析(以下、統計分析)が多く行われている。過去と比べると、SPSS、Stata、Eviews、R等のような統計パッケージの普及により、統計分析がやりすくなったものの、依然として統計分析は難しい、手を出しづらいと思う人も少なくないだろう。統計分析の初心者にとって、数式を展開することや方程式の解を計算することは大変な作業であり、難解なものであるものの、よく使われる統計分析方法の基概念さえ理解すれば、複雑な数式を使わなくてもより楽しく統計分析ができると筆者は確信する。そこで、稿では、統計分析で最もよく使われているいくつかの分析方法を紹介する。これにより、統計分析に対する理解を深めてもらえたら幸いである。 統計分析は大きく「差の検定」と「関係の検定

    統計分析を理解しよう-よく使われている統計分析方法の概要-
  • フランシス・ゴルトン - Wikipedia

    フランシス・ゴルトン(Sir Francis Galton、1822年2月16日 - 1911年1月17日)は、イギリスの人類学者、統計学者、探検家、初期の遺伝学者である。フランシス・ゴールトンとも表記される。母方の祖父は医者・博物学者のエラズマス・ダーウィンで、進化論で知られるチャールズ・ダーウィンは従兄に当たる。最後の財産のあるアマチュア科学者 (gentleman scientist) の一人として研究に生涯と私財を捧げた[1]。 生涯➀学生、冒険、気象学[編集] 生い立ち[編集] 1822年にプリーストリー(1780-91:ラヴォアジエとフロンギストン説で論争していた時代)のかつての家「フェアヒル」の敷地に建てられた家に生まれた[2]。 父はバーミンガム (Warwic kshire のDujjestone) の裕福な銀行家のサミュエル・テルティウス・ゴルトン、母ビオレッタはエラズ

    フランシス・ゴルトン - Wikipedia
  • 平均への回帰、相関係数―統計学史(2) | ブログ | 統計WEB

    ※コラム「統計備忘録」の記事一覧はこちら※ 19世紀はダーウィンの進化論とメンデルの遺伝の法則が立て続けに世に出た時代です。ダーウィンの従兄弟、ゴールトン(Francis Galton、1822-1911)は、「指紋」を使った鑑定法を考案したり、「優生学」という言葉をはじめて用いたりと何かと話題の豊富な人物ですが、統計学においても大きな功績を残しています。 ゴールトンは親から子を予測する方法を探すために、ロンドンに生物測定研究所を設立し、研究に協力してくれる家族を募って、身長や体重、骨格などを測定しました。そこで、長身の親から生まれた子供達の身長は、平均すると親たちよりも低くなる、背の低い親から生まれた子供達の身長は高くなる、全体の平均に近寄っていくという現象を発見します。ゴールトンはこの現象を「平均への回帰」と名づけました。 ところが、カプランの「確率の科学史」を読んでいたら、平均への回

  • 出生時男女比|年次統計

    スマートフォン版 出生時男女比|年次統計

    出生時男女比|年次統計
    takahiro_kihara
    takahiro_kihara 2023/08/24
    出生時男女比:年次統計
  • MMRワクチンは自閉症リスク? 「反ワクチン」派が世界に及ぼす脅威 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    はしか(麻疹)・おたふくかぜ・風疹の3種混合(MMR)ワクチンに関して過去に行われた幾つもの研究結果を裏付ける新たな研究結果が、先ごろ米医学誌「内科年報」に掲載された。自閉症とMMRワクチンに関連性がないことを、改めて確認したものだ。 新たに発表された研究結果の特に優れた点は、調査対象者が非常に多いことだ。研究チームは、デンマークで1999~2010年に生まれた65万7461人の子供たちを1歳の誕生日から2013年まで追跡調査した。 調査期間中には、6517人の子供が自閉症を発症した。だが、研究者らによれば、自閉症の発症リスクに関して、MMRワクチンを接種した子供とそうでない子供の間に差異は全く確認されなかった。 この研究は基的に、2002年に結果が発表された53万7303人の子供を対象とした研究と同じことを調べたものだ。いずれも非常に大規模で、MMRワクチン以外の予防接種が自閉症の発症

    MMRワクチンは自閉症リスク? 「反ワクチン」派が世界に及ぼす脅威 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
  • 捕獲再捕獲法(標識再捕獲法)で生物の数を推定する

    捕獲再捕獲法とは、指定された地域に存在する生物の個体数を推定する方法です。 生物を一度捕獲をし、印など標識をつけたら、自然に戻します。そして、再度捕獲をし、そのなかの標識がついた生物の数から、地域の生物個体数を推定します。 標識をつけることから、標識再捕獲法とも呼ばれます。 この記事では、捕獲再捕獲法の手順や、個体数の推定方法について説明します。 捕獲再捕獲法で生物の個体数を推定する 生態系についての調査で、生物の個体数を把握したい、生物の個体数の変動について研究したいといったときに役立つものです。 どのようなときに、生物の個体数を把握したいかというと、たとえば、外来種問題の解決を図るときです。 もともとそこに生息していなかった生物が人為的に持ち込まれ、生態系に悪影響を与えてしまう問題が、外来種問題です。外来種対策を考えていくためには、まずその個体数を数えなければなりません。 また、実際に

    捕獲再捕獲法(標識再捕獲法)で生物の数を推定する
  • もともとBMIは金儲けのための適当な数値だった | 雑学ネタ帳

  • 気温には棒グラフを使わない - データ可視化ミニ講座(7)|荻原 和樹 / Kazuki OGIWARA

    棒グラフと折れ線グラフは似た表現方法です。しばしば交換可能なものとして使われる両者ですが、使うべきポイントには違いもあります。 代表的な例が気温です。気温は棒グラフではなく、折れ線グラフで表現するのが正しいです。 そもそも棒グラフは、棒の長さ(≒ 棒部分の面積)の比率と数値の比率を対応させることで視覚的に数値を比較するものです。したがって、数値が2倍なら棒グラフの長さも2倍になります。棒グラフにおいて、縦軸を省略してはいけないのはそのためです。 しかし、気温において「X倍」に意味はありません。気温が10℃から20℃に上がっても「10℃上がった」とは言いますが「2倍の暑さになった」とは言いませんよね。気温とは、水が凍る温度を0℃、水が沸騰する温度を100℃とする相対的な指標です。気温がマイナスになることはしばしばありますが、これは当に何かがマイナスになっている、失われているのではなく、水が

    気温には棒グラフを使わない - データ可視化ミニ講座(7)|荻原 和樹 / Kazuki OGIWARA
  • イチローの安打数がポアソン分布にならず正規分布になる理由を考察してみた | ロジギーク

    滅多に起こらない現象を表すポアソン分布はイチローの安打数にも当てはまるのか? 1994年、プロ3年目のイチローはシーズン210安打、打率.385を記録して、一気にスーパースターになりました。 この年の打率10傑は次の通りです。 (年度別成績 1994年パシフィックリーグ|NPB.JP 日野球機構 より抜粋) 1位と2位以下の差が凄いですね。 いかにイチローが図抜けていたかが分かります。 今年のパ・リーグの規定打席以上の打者29人の安打数を見ると、試合数より少なくなっていて安打数÷試合数=0.93です。 これくらいだと、1試合当たりの安打数は「滅多に起こらない事象の確率分布」であるポアソン分布に従います。 しかし、普通でない打者のイチローは、1試合当たり1.6以上の安打を打っています。 そのような場合もポアソン分布に従うのでしょうか? それを調べてみました。 比較対象として1994年打率

    イチローの安打数がポアソン分布にならず正規分布になる理由を考察してみた | ロジギーク
  • 世界の殺人発生率 国別ランキング・推移 - GLOBAL NOTE

    データ更新日2024年1月16日 (年次更新日データの年次更新は2023年5月10日に実施) 最新値2021年 時系列推移1990-2021年まで収録 ご利用区分 公開 統計の解説 2021年の世界の殺人発生率 国際比較統計・ランキングです。 各国の人口10万人当たり殺人発生件数と国別順位を掲載しています。 1位はジャマイカの52.13件/10万人、2位はセントルシアの38.96件/10万人、3位はホンジュラスの38.25件/10万人となっています。 時系列データは1990-2021年まで収録しています。 【統計の内容】 単位は件/10万人。 各国のデータについては国連の犯罪調査統計(Crime Trends and Operations of Criminal Justice Systems -CTS)及び各国の司法当局、国際刑事警察機構(ICPO、Interpol)のデータに基づいて

    世界の殺人発生率 国別ランキング・推移 - GLOBAL NOTE
  • 「統計上はコロナではないが…」東京の4月死亡者数は例年より1000人以上多い 累計のコロナ死者は120人なのに…

    今年4月の東京都の死亡者数は1万107人で、過去5年間の平均に比べて1058人多かった。なぜ例年より死者が多かったのか。統計データ分析家の川裕氏は「新型コロナによる肺炎などの死亡だったのに、PCR検査が不十分だったため、コロナ陽性と判定されない死亡が多かったのではないか」という——。 過去5年の「4月」の東京都の死亡者数は平均9049人、2020年は1万107人 公表されている新型コロナ感染症による死亡者数は、PCR検査が十分に行われていないために、過少となっており、実際にはもっと多いという疑惑がなかなか消えない。そこで今回は、例年より死亡者数がどれぐらい多いかを示す「超過死亡」から実態を検証してみたい。 全国の月別の死亡者数については、死亡届のカウントによる方法で人口動態統計の速報で公表される。これは時期的には翌々月末にならないと分からないが、東京都の死亡数は、「東京都の推計人口」の発

    「統計上はコロナではないが…」東京の4月死亡者数は例年より1000人以上多い 累計のコロナ死者は120人なのに…
    takahiro_kihara
    takahiro_kihara 2021/09/14
    なんか、コロナでも統計だけを使った言説には気をつけよう、という読後感。
  • <4D6963726F736F667420576F7264202D20939D8C7689C682CC8D7393AE8AEE8F8089FC92F931334E6F7630352E646F6378>

    1 1 2013/04/27 提出 2 2013/05/07 改訂 3 2013/11/05 改訂 4 統計家の行動基準 5 6 <目次> 7 I. 前文 8 II. 統計家の使命と守るべき価値 9 III. 行動基準 10 11 I. 前文 12 13 1) 行動基準を策定した目的 14 この行動基準の目的は、統計手法やデータを扱う領域で、現在または将来活動する実務 15 担当者、研究者、学生などがそれぞれ、自らの実務・研究の拠りどころとなる基準(プリンシ 16 プル)を考え、身につけるために、その基軸となる統計家の使命ならびに守るべき価値を提 17 示することである。 18 また、統計家の行動基準を社会に対して明示することで、社会の人々が統計家の責任と 19 活動を理解し、統計業務や成果が信頼に足るものであると認知すること、統計家が適正に 20 活動できるよう支援すること、ならびに、活

  • シンプソンのパラドックスのはなし - 渋谷駅前で働くデータサイエンティストのブログ

    今月はモデルナワクチンの2回目接種*1やら仕事でも負荷の高い分析業務やら、はたまた執筆*2やらでネタ切れなのもあってあまりブログ記事を書けていなかったので、最近話題になった件について簡単に論じてみようかと思います。元ネタはこちらです。 これはイスラエルで公表されたCOVID-19ワクチンの重症化防止効果に関する統計について、いわゆる「シンプソンのパラドックス」が見られるのでそれを補正する必要があると指摘するブログ記事です。この件について僕が引用しながらボソッと放言したところ、思いの外大きな反響があったのでした。 イスラエルで起きている、「ワクチンが効いていないように見える」シンプソンのパラドックス。年齢で調整するとこうなるという分かりやすい解説https://t.co/gQrATCNzS7 pic.twitter.com/JI8Gq8h0Lk— TJO (@TJO_datasci) 202

    シンプソンのパラドックスのはなし - 渋谷駅前で働くデータサイエンティストのブログ
    takahiro_kihara
    takahiro_kihara 2021/08/24
    "「正しい因果推論は身を助く」"/うーん、わからん!
  • 世界の高齢化率(高齢者人口比率) 国別ランキング・推移 - GLOBAL NOTE

    統計の解説 2022年の世界の高齢化率(高齢者人口比率)国際比較統計・ランキングです。 各国の高齢化率と国別順位を掲載しています。 1位はモナコの35.92%、2位は日の29.92%、3位はイタリアの24.05%となっています。 時系列データは1990-2022年まで収録しています。 【統計の内容】 単位は%。 高齢化率は総人口に対する65歳以上人口の比率。 解説を全文を表示する

    世界の高齢化率(高齢者人口比率) 国別ランキング・推移 - GLOBAL NOTE
    takahiro_kihara
    takahiro_kihara 2020/02/19
    これでも多分、高齢者の定義を年齢だけで区切って良いのか、という問題がある。https://www.tyojyu.or.jp/net/topics/tokushu/chokoureishakai/chokoureishakai-teigi.html
  • 統計検定を理解せずに使っている人のために I

    Online ISSN : 1883-6852 Print ISSN : 0453-073X ISSN-L : 0453-073X

  • ダメな統計学:目次|Colorless Green Ideas

    2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』に大幅に加筆したものだ。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 ここに公開する『ダメな統計学』は、アレックス・ラインハート (Alex Reinhart) 氏が書いたStatistics Done Wrongの全訳である。この文章は全部で13章から構成されている。詳しくは以下の目次を参照されたい。 はじめに データ分析入門 検定力と検定力の足りない統計 擬似反復:データを賢く選べ p値と基準率の誤り 有意であるかないかの違いが有意差でない場合 停止規則と

    ダメな統計学:目次|Colorless Green Ideas
    takahiro_kihara
    takahiro_kihara 2014/12/18
    世の中には3つのウソがある。嘘、大嘘、そして統計だ。
  • なぜ、統計学が最強の学問なのか?

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 統計学が最強の学問である 2013年1月に発売されるや、ビジネス・経済書としては異例のベストセラーとなり、統計学ブームの端緒となった『統計学が最強の学問である』。同書の発刊1周年と30万部突破を記念して行われた、著者の西内啓氏と二人の科学者[多摩大学情報社会学研究所所長・公文俊平氏、物理学者・楽天株式会社執行役員・北川拓也氏]との対談を公開する。 バックナンバー一覧 35万部を突破