タグ

統計学に関するH58のブックマーク (5)

  • 統計を学んで今をときめこう! 〜 統計検定2級でこんなこと出来るよ編 〜 - 無駄と文化

    去る11月29日、統計検定の2級を受験してきました。 私は資格試験を受けるとき、業務独占性やブランド感よりも、資格の学習を通じてどれだけの知識を獲得できるかを重視しています。 なので、今回の統計検定についても、統計学の体系立った基礎知識が身についたことをすごく喜んでいます。 で、せっかくなので受験したてのホヤホヤのこの熱意が冷めないうちに、実際に学習してみて分かった統計検定2級を通じて出来るようになる事をリストアップしてみようと思います。 「統計なんて勉強して何になる?」という疑問に対するひとつの解答になれば幸いです。 統計検定ってどんな試験? まずは試験の概要を、 「統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。 データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。 日統計学会は

    統計を学んで今をときめこう! 〜 統計検定2級でこんなこと出来るよ編 〜 - 無駄と文化
    H58
    H58 2018/03/11
    オチが、面白かった。いや、そこじゃないですね。ざっくり、雑談レベルで解説されていて、親しみやすかったです。
  • 「そのモデルの精度、高過ぎませんか?」過学習・汎化性能・交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ

    今年の1月にこんな話題を取り上げたわけですが。 この記事の最後にちょろっと書いた通り、実際にはこういう"too good to be true"即ち「そのモデルの精度いくら何でも高過ぎるんじゃないの?」→「実は汎化性能見てませんでした」みたいなケースって、想像よりも遥かに多くこの世の中存在するみたいなんですね。ということで、それこそ『はじパタ』の2章とかPRMLの最初の方に出てくる初歩中の初歩なんですが、その辺の話を改めてだらだら書いてみようと思います。 そもそも「精度100%」とか「相関係数0.9以上」とか見たら身構えるべき 冒頭に挙げた例は、そもそも「精度100%なんておかしい」という声があちこちから挙がったことで話題になり、蓋を開けてみたらleakageはあるわ訓練誤差でしか評価してないわで散々だったわけです。 一般に、実世界のデータセットで統計モデリングにせよ機械学習にせよモデリン

    「そのモデルの精度、高過ぎませんか?」過学習・汎化性能・交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ
  • グラフの描き方

    的な考え方 棒グラフは比例尺度の量を表すのに用い,棒の長さ(面積)が量に比例するように描くのが基。一つだけずば抜けて大きい値があるときに棒の上のほうで省略線を用いることはあるが,下を省略して全体の長さを切り詰めることは好ましくない。例えば気象観測データについては,雨量は比例尺度であるので棒グラフで表してもよいが,気温は(絶対温度でない限り)間隔尺度であり,棒グラフは使えない。 折れ線グラフは,両軸とも間隔尺度以上であるのが基。0点から始める必要はない。特に時系列データについてよく使われる。 円グラフは全体における割合を表すにはよいが,全体との比較ではなく個々の値どうしの比較には棒グラフがよい。いわゆる3次元(3D)円グラフは,錯覚を利用して特定の部分を大きく見せるためのもので,一般には用いない。 円グラフは複数回答のアンケート結果の図示には絶対に用いない。 色分けして凡例を付けるの

    H58
    H58 2016/12/29
    メチャ基本。
  • ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む

    【宣伝】2016/09/14 このページに来た方へ。あなたが求めているはこれです。 StanとRでベイズ統計モデリング (Wonderful R) 作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行この商品を含むブログ (10件) を見るまずこれを予約してから下記を読むといいです。 【宣伝終】 最近、ベイズ統計の入門書がたくさん出版されているので、ここで一旦まとめてみようと思います。 1. 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 (2015/6/25) 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2015/06/25メディア: 単行この商品を含むブログ (6件) を見る データ分析業界ではかなり有名な豊田秀樹先生のです

    ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む
  • サッカーの得点とポアソン分布(TAKENAKA's Web Page:)

    2002 FIFA ワールドカップの得点とポアソン分布 17 June, 2002 交通事故のように, 低い確率で起こることがら(事象)で, その事象がひょっとしたら起こるかもしれない状況が頻繁にあり(試行回数が多く), それぞれの事象はたがいに独立(一度起こった直後にはもう一回起こりやすいといったことがない) という条件が満たされると,ある期間やサンプル集団のなかに含まれる事象の回数は, ポアソン分布と呼ばれる分布に従います. 詳しくは,たとえば青木繁伸さん(群馬大学)の 統計学のページ のなかの ポアソン分布のところ などを参照してください. サッカーの得点はかなり低い確率で起こることがらです.また, ひょっとしたら点が入るかもしれない状況は頻繁にあります. 実力差が大きいチームの対戦なら,強いチームの側に集中して点が入るから, 一度点が入ったらそのあとも続けてそのチームが点を取りそ

  • 1