タグ

statisticsに関するwata88のブックマーク (9)

  • Coding habits for data scientists

    If you’ve tried your hand at machine learning or data science, you know that code can get messy, quickly. Typically, code to train ML models is written in Jupyter notebooks and it’s full of (i) side effects (e.g. print statements, pretty-printed dataframes, data visualisations) and (ii) glue code without any abstraction, modularisation and automated tests. While this may be fine for notebooks targ

    Coding habits for data scientists
    wata88
    wata88 2020/05/18
    共感はあるが、本番前なら致し方ない感じもある
  • 女性のバスト、過半数がDカップ以上、Eカップも3倍に トリンプ調査

    下着メーカーのトリンプ(東京・中央区)は2017年6月6日、下着についてのアンケート調査「下着白書」(16年調査)を発表した。 豊満化が進む 同社は1980年以来、ブラジャーの販売実績をもとにした日人女性のカップ数の推移を調査している。 調査当初は、Aカップが約6割と最多を占めており、A~Cカップが全体の9割以上と低カップの女性が大多数という結果だった。 ところが年々カップ数は大きくなっていく。2000年以降、A~Cカップは減少し、一方でDカップ以上の割合が急増していく。1990年ではDカップはわずか10.0%だったが、2015年には約2.5倍となる。Eカップも約3倍に増えた。 今回の調査でもその傾向は続き、Dカップ以上の割合(51.3%)が、A~Cカップの割合(48.7%)をはじめて上回った。

    女性のバスト、過半数がDカップ以上、Eカップも3倍に トリンプ調査
    wata88
    wata88 2018/05/09
    母数が販売実績なので、製品ラインナップ次第だったり客層の変化とかから影響受けてそうだなあ
  • 170120 牧田翠「30分でわかる現代エロマンガ」.pptx

    30分でわかる! 現代エロマンガ エロマンガ統計研究者 牧田翠(@MiDrill) 1 全年齢版

    170120 牧田翠「30分でわかる現代エロマンガ」.pptx
  • 藤井四段で学ぶ最尤推定、MAP推定、ベイズ推定 - Qiita

    藤井四段の連勝が止まらないですね。 21日の対局に勝利して、連勝記録を1位タイの28連勝まで伸ばしてきました。26日の対局で勝利すれば単独トップになります。 そんな藤井四段の対戦成績は28勝0負。勝率でいうと1.000です。クラクラするような成績ですが、この「勝率」とは何かを少し数学的にみてみましょう。 単純に言葉だけをみると「藤井四段が勝利する確率」ではないかと考えられます。つまり $$P(\text{勝利}\ |\ \text{藤井四段}) = 1.0$$かのように感じます。 ではここで、26日の対局で藤井四段が勝利する確率はどれだけでしょう? $P(\text{勝利}\ |\ \text{藤井四段}) = 1.0$として考えると、これはつまり藤井四段は必ず勝つので、100%になってしまいます。しかし、もちろんそんなことはありません。藤井四段ですらも負けることはあるはずです。 実はここ

    藤井四段で学ぶ最尤推定、MAP推定、ベイズ推定 - Qiita
    wata88
    wata88 2017/06/28
    なつかしい
  • 可視化で理解するマルコフ連鎖モンテカルロ法(MCMC) - ほくそ笑む

    先日行われた第9回「データ解析のための統計モデリング入門」読書会にて、 「可視化で理解するマルコフ連鎖モンテカルロ法」というタイトルで発表させて頂きました。 発表スライドは以下です。 可視化で理解するマルコフ連鎖モンテカルロ法 from hoxo_m この発表は、みどりぼんに登場する、マルコフ連鎖モンテカルロ法(MCMC)のアルゴリズムである「メトロポリス法」と「ギブス・サンプラー」について、可視化して理解しようというお話です。 「マルコフ連鎖モンテカルロ法」というのは、字面だけ見ると難しそうですが、この発表で理解すべきポイントは、次のスライド 1枚に凝縮されています。 このことを念頭に置いて、それぞれの手法を見ていきましょう。 まず、メトロポリス法ですが、これは、 前の状態の近くの点を次の遷移先候補として選ぶ(マルコフ連鎖) そのときの確率比 r < 1 ならば確率 r で棄却する。それ

    可視化で理解するマルコフ連鎖モンテカルロ法(MCMC) - ほくそ笑む
    wata88
    wata88 2015/03/18
    mcmc
  • https://www.statsmodels.org/

    wata88
    wata88 2015/03/18
    pythonの統計ライブラリ
  • 多重代入法(Multiple Imputation)の発表資料

    An Introduction to Multiple Imputation Method for Missing data Analysis, and Its Application. ※修士1年課題研究発表の一部を削除したものです。

    多重代入法(Multiple Imputation)の発表資料
  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計解析ツールIncanterことはじめ - CLOVER🍀

    以前、こんなエントリを書きました。 Clojure/lucene-kuromojiでテキストマイニング入門 〜形態素解析からワードカウントまで〜 http://d.hatena.ne.jp/Kazuhira/20130911/1378914422 なんですけど、ぶっちゃけこの時は元の参照エントリで使っていたIncanterの意味がわからず、単純に持ってきただけでした。出力されていたグラフの内容はさすがにわかりますが…。 で、このIncanter、覚えておくと後々便利かな〜と思い、最近少し興味があったので試してみることにしました。 Incanter http://incanter.org/ Incanterは、Clojureで書かれた統計解析ツールらしいです。入力したデータを元に、表やグラフを表示したり図やPDFとして保存が可能な模様。 で、始めるにあたってドキュメントページを見て… htt

    統計解析ツールIncanterことはじめ - CLOVER🍀
  • 1