株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。
統計学の中でも特に頭を悩ませることの多い「p値(有意確率)」と「有意水準」。 有意水準は「ある仮説を否定した判断が誤りである確率 \(P(H_0|reject)\) 」と誤解されがちですが、実際には両者は大きく異なる値です。 有意水準は第一種の過誤確率、つまり「帰無仮説が正しい場合に、誤って帰無仮説を棄却(否定)してしまう確率 \(P(reject|H_0)\) 」を意味します。 有意水準5%とは仮説が正しい場合にこの手順を多数回実施して検定を行うとき、間違って帰無仮説を棄却する割合が5%であるという意味であり、特定の判断が間違っている確率が5%ということではない。 出典:改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎(東京図書)p144 かなりややこしい部分のため、誤解されることも少なくない用語ですが、統計的仮説検定を行う上で非常に重要な存在です。 今回は、そんなp値(有意確
何かこんなメディア記事が出ていたようです。 これを読んで色々な人がツッコミを入れまくっている模様ですが、この記事の不思議なところは「完全に間違った説明というわけでもないのに何故か(両分野に詳しい)誰が読んでも猛烈な違和感を覚える」ところなんじゃないかなぁと。 正直、これはライター・インタビュアー・コメンテーター・編集者の誰のせいなのかは全く分からないんですが、ツッコミ入れられまくっている内容について色々あげつらってもあまり建設的でないので、ここでは記事中で本題として取り上げられている「統計学と機械学習の違い」についてちょっとコメントしてみようと思います。 あ、もちろん僕がこれから書くコメントも別に正しいとは全く限らないので、おかしいところや間違ってるところがあったらバンバン突っ込んでいただければ幸いです*1。そしてガチ勢向けのコメントでもないので何卒悪しからず。 統計学はデータを「説明」す
統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 本記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも
ABテストにおける統計の重要性が語られ始めてきております。データアーティスト社内教育用に使っている資料でございます。 少しでも皆様のお役にたちますと幸いです。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く