タグ

統計学に関するDrunkarのブックマーク (8)

  • Tech Lab Paak講演会 20150601

    「銀座で働くデータサイエンティストの勉強会 ~試行錯誤的データ分析、そのプロセスの全貌~」というタイトルでTech Lab Paak(渋谷)で行った講演内容です。

    Tech Lab Paak講演会 20150601
  • 同じデータセットに対するアプローチの違いから見る「データ分析のステージ」 - 渋谷駅前で働くデータサイエンティストのブログ

    追記 (2015/02/21) いくつか抜けてるところがあったなぁと思ったので、後から追記や加筆修正してみました。最初のオリジナル版から少し内容が変わっているところがありますがご了承ください。 ちょっと前の記事でこんなネタをやってみたわけですが。 世の中には色々な「データ分析」のやり方があるなぁと思った時に、この同じ2013年のテニス四大大会のデータからそれぞれのやり方をしている人たちがどんな異なるアプローチを取るのかなぁとふと想像したもので、半分ネタ的に書いてみました。便宜的に以下のようにステージを分けてあります。 集計ステージ 検定ステージ 相関ステージ 重回帰分析ステージ 機械学習を含めたモデリングステージ 厳密性に拘るステージ なお、データは以前の記事と同じこちらのものをお使い下さい。 その上で、Rで分析する際は以下のように前処理しておきます。単にプレイヤー名・獲得ゲーム数・総獲得

    同じデータセットに対するアプローチの違いから見る「データ分析のステージ」 - 渋谷駅前で働くデータサイエンティストのブログ
  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 東京大学出版会『統計学入門』は入門を一通り終えた人におすすめ|Colorless Green Ideas

    東京大学出版会から出ている『基礎統計学I 統計学入門』というがある。 東京大学教養学部統計学教室〔編〕 (1991). 『基礎統計学I 統計学入門』 東京:東京大学出版会. このは、統計を学ぶ際によくすすめられる一冊である。例えば、ウェブ上にある記事で、『統計学入門』を挙げているものに以下のようなものがある。 2014年春版:ビジネスにおけるデータ分析のプロを目指すなら揃えておくべき12冊(銀座で働くData Scientistのブログ) 一年で身に付ける!Rと統計学・機械学習の4ステップ(iAnalysis ~おとうさんの解析日記~) 統計分析を学ぶための書籍20選(XICA-Labs データ・統計分析研究所) それでは、なぜこのはすすめられるのだろうか? そして、どういう人がこのを読むべきなのだろうか? タイトルに『統計学入門』とあるように、統計の初心者にとって良いなのだろう

    東京大学出版会『統計学入門』は入門を一通り終えた人におすすめ|Colorless Green Ideas
  • Probability and Statistics Cookbook | Matthias Vallentin

    Probability and Statistics Cookbook This cookbook emerged as small collection of formulae while I was taking statistics courses at UC Berkeley, but quickly developed into a comprehensive summary of various topics in basic probability theory and statistics. Download Last updated: July 20, 2011 Language: english To reproduce, please contact me. Changes Here are the 3 most recent entries of the cha

    Drunkar
    Drunkar 2014/01/12
    確率統計のチートシートみたいなの
  • 指数型分布族とはなんぞ - Fire and Motion

    皆さん,ご存じの指数型分布族(exponential family)について私の拙い理解をまとめておきたいと思います.指数型分布族といえば,難しめの統計学や機械学習を読んだときに突如出てきて,「え,何それ,指数分布じゃないの?僕,指数分布しか知らないよ−」と思っている読者を撲殺し,しかし,殺されている人は「まぁ,たぶん指数分布みたいなものだろう,とりあえず読み進めよう」と見ない振りをしているアレです.えぇ.私もそういう理解です.しかし,このままではいかんので,そこらへんにあった文献を元に簡単な理解をまとめておきたいと思います.ちなみに私の初エンカウンターはPRMLでした.てか,(私が学んだゆるい)大学時代の講義ではこんなもの習わなかったのですが,この指数型分布族とはどういう統計の授業では学ぶモノなのでしょう….単なる勉強不足かもしれませんが…. あいつもこいつも指数型分布族 まず,P

    指数型分布族とはなんぞ - Fire and Motion
  • 確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科

    確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科 1 確率統計は大学の一番難しい科目? 私の知っている人で(中には大学の理科系の先生もいる),確率統計は習ったがよく分からない という人が多い.私自身もそうであった.大学で確率統計を習ったが(私の場合は 3 年次であっ た),まったく分からなかった.期末試験のためにいろいろなを読んだが,どうしても理解でき ない.個々の例題の計算の仕方の説明を読めば,そのやり方は分かるし,導出も書いてあるので, そのようになるのだということに疑いは起きない.しかし,どうしても「分かった」という気に ならない.自分の頭で考えることができない.そのため覚えらないのである. 大学に入ると難しい科目をいろいろ学ぶ.特に 1 年次の解析学(微分積分学)と線形代数学(ベ クトルと行列)を学んだときは,あまりに抽象的な記述に愕然とした記憶がある.しかし,その

  • 今年の8冊〜量子力学・統計学・マクロ経済学から〜 - ハリ・セルダンになりたくて

    東日大震災を始め、辛く悲しい出来事が多い一年でした。仕事も忙しくあまりblogを更新することも出来ませんでしたが、年末ですから今年、記憶に残ったをいくつかご紹介したいと思います。 [量子力学この一冊] 矢野の大学時代からの友人である森田邦久氏の新著が「量子力学の哲学」です。量子力学というのは物理学の一分野で、たとえば「電子」などというミクロな*1物質の振る舞いを分析します。 電子などのミクロな物質には「粒子と波」の両方の性質が観測されるなど、ミクロな世界では我々の日常生活では少し理解しがたい現象が発生します。 そのため、それをどのように理解すればいいのか、が重要な問題になってくるわけです。「シュレディンガーの」と言われる話に端的に表される問題ですが、学問的には「量子力学の解釈問題」とか「量子力学の観測問題」などと呼ばれています。 大学時代に森田氏と矢野(ともう一人の友人F氏)は物理を

    今年の8冊〜量子力学・統計学・マクロ経済学から〜 - ハリ・セルダンになりたくて
  • 1