『「データ解析のための統計モデリング入門」6.6章 割算値はなぜダメなのか?』と言うエントリーが出ていて、タイトルにある署名の本の6.6章「割算値の統計モデリングはやめよう」に、タイトルの通りの疑問が呈されていた。 問題の本は生物系研究室の常識が詰まっているようなのだが、一般の統計利用ではやや窮屈な側面もあるようで、以前も離散データだから最小二乗法が使えないと言うような誤解を招いていた。今回の御題は統計モデルに観測データ同士の割り算値を持ち込めるかと言う事だが、大半のケースでは問題ないから気にするのはよそう。 「比率にすることで元のスカラー値の情報が失われる」と言うのは、計量モデルで何を見たいかと言う問題で、例えば男女比が学級崩壊を引き起こすかのような仮説を立てたら、観測データ同士の割り算値を持ち込まざるを得ない。経済系はもちろん、実験データの処理などでも見かける操作である。みんなガシガシ
以下メモ 第6回「データ解析のための統計モデリング入門」読書会 - connpass 第6回「データ解析のための統計モデリング入門」読書会 一番後ろの列は壁に面した机のない席のつもりで作りました、夏の座席表 - セキココ 第6章 「 GLMの応用範囲をひろげる」 前半 発表資料です。 #みどりぼん RE https://t.co/OcK2iI9YDG— gepuro (@gepuro) 2014, 7月 29 前回まではポアソン分布(0回以上上限なしのカウントデータ)でモデルを作成 今回は二項分布で回帰(0回以上上限ありのカウントデータ)でモデルを作成 glm()を使わなくてもoptim()などを使えば自力で推定できる Hackers Bar | ハッカーズバーで働いている 第6章 「 GLMの応用範囲をひろげる」 後半 あげました http://t.co/WKQAHC7ecm #みどりぼ
昨日 7/29 の「第6回「データ解析のための統計モデリング入門」読書会」は参加しなかったのだが、ニコ生で中継してくださっていたので後半を聞くことができた。 6.6章「割算値の統計モデリングはやめよう」では、タイトルの通り観測データ同士を割り算するなと話しているわけだが、読んでいていろいろ疑問に思うところがあり。 読書会中継でちょうど 6.6 章以降を担当された 0kayu さんの発表を聞くことができたのだが、気になっていたあたりは特に質疑でも話題にならず残念。 というわけで、誰かがツッコミを入れてくれることを期待して自分の疑問をここに書いておく。 「データ解析のための統計モデリング入門」6.6章では統計モデルに観測データ同士の割り算値を持ち込むことを批判している。その理由として、 比率にすることで元のスカラー値の情報が失われる 値それぞれが分布を持っている場合、それらの割り算値の分布がよ
6/10 に開催された「データ解析のための統計モデリング入門」、通称「みどりぼん」の第3回読書会にのこのこ参加& LT してきた。主宰のやまかつさん、発表者&参加者の皆さん、会場を提供してくださったドワンゴさん、ありがとうございました。 第3回「データ解析のための統計モデリング入門」読書会 - connpass LT は……正直、ネタを思いついた時は、ええやんおもしろいやん、とかなぜか思いこんでた。当日の朝くらいに「測度論とかないわー」ということにやっと気づき、一週間前の中谷の後ろ頭をしばき倒したくなったが、もはや後戻りはできず。この LT をちゃんと最後までやり通したという一点で褒めてあげて欲しい…… 猫に教えてもらうルベーグ可測 from Shuyo Nakatani さて気を取り直して。 質疑応答の時にあれこれ好き勝手なことを突っ込ませていただいてたのだが、読書会終了後にそのあたりを
7/8 に開催された「データ解析のための統計モデリング入門」、通称「みどりぼん」の第 5 回読書会にのこのこ参加。主宰のやまかつさん、発表者&参加者の皆さん、会場を提供してくださったドワンゴさん、ありがとうございました。 第5回「データ解析のための統計モデリング入門」読書会 - connpass 今回は第5章、尤度比検定。 みどりぼんは、この前の回の AIC も含めたモデル選択について比較的ゆるふわな説明で、これはこれでありなんだけど、しっかりしゃっきりしたものも読んでみたいなあ(でも数式少なめでよろしく!)という人は、伊庭さんの「モデル選択とその周辺」がおすすめ度高し。 伊庭幸人, モデル選択とその周辺 検定は(有用だろうけど)あんまり好きになれなくて、気分的な盛り上がりは今ひとつなのだが、知らなかったら好きも嫌いもないよね! ということでまじまじ手を動かす。 勉強会の質疑応答も、前回参
もうタイトルを読んで字の如しなんですが、要は「統計モデリングってぶっちゃけ何なのよ?」という問題意識が最近非常に局所的ながら影響力の大きいところ*1から出てきておりまして。 で、僕もその議論にマターリ参加しながら「このもやもやしたものをどうやったらうまく表現できるかなー」と思っていて、何日かして自分なりにちょっと整理がついた気がするので、自分向けの備忘録も兼ねてちょっとブログにまとめてみることにしました。ちなみに@berobero11さんは既にこの議論についてまとめていらっしゃるようで。 あてはめの原理・あてはめを実装する計算法・モデル そうそう、今回もお題はこちらの久保先生の緑本です。というかここから議論が始まったわけで。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 20
2008–11–06 (2012-07-01 10:11 ) 1 (2008 10-11 ) 5 (+2) 3 (2008–11–06) (GLM) 1 kubo@ees.hokudai.ac.jp http://hosho.ees.hokudai.ac.jp/~kubo/ce/EesLecture2008.html ! http://hosho.ees.hokudai.ac.jp/~kubo/ce/IwanamiBook.html 1. (GLM) ? 1 2. GLM : link 4 3. GLM : 5 4. : glm(..., family = poisson) 9 5. 14 6. + 16 7. Deviance ? 17 8. 21 9. 22 3 λ λ λ = β1 + β2 × ( 1) + β3 × ( 2) + · · · � {βj} = {β1, β2, ·
機能改善 イベント資料の投稿において、SlideShareやSpeakerDeckと同様に、Docswellの資料を埋め込みスライド表示できるように対応いたしました。資料の投稿機能は、資料URLを指定するだけで、URLから取得した情報を、適した形でconnpass上で表示・共有できる機能です
「データ解析のための統計モデリング入門」をひと通り読んだ.本書はGLMからMCMCによる分布推定までの一連の統計モデリングの流れを,生態学における研究の問題に即したテストデータやRを使った解析例とともに解説した本である.本書を書かれた久保さんの講義資料は前々から拝見していたのだが,今回はそれが全体を通して非常によくまとまっている印象を受けた.やはり実例に沿った例題があって,それを解決するためのストーリーが組まれていると,何が問題で何をすべきなのか,そしてその評価方法を含めてハッキリとしていて読みやすい.Rのコードに関しても,コマンドの実行方法からその解釈の仕方まで丁寧に解説が組まれており,数式とのつながりもわかりやすい.個人的には,後半のMCMCの実験に関しては大部分をWinBUGSにお任せで,シミュレーションの過程が少し不明瞭だった感じもするのだが,限られた紙面でMCMCの細かい実装方法
機能改善 イベント資料の投稿において、SlideShareやSpeakerDeckと同様に、Docswellの資料を埋め込みスライド表示できるように対応いたしました。資料の投稿機能は、資料URLを指定するだけで、URLから取得した情報を、適した形でconnpass上で表示・共有できる機能です
講義のーと の内容を詳しく説明したものです 著者: 久保拓弥 出版社: 岩波書店, シリーズ「確率と情報の科学」 編集: 甘利俊一,麻生英樹,伊庭幸人 このペイジの省略 URL: http://goo.gl/Ufq2 刊行と まちがい・修正一覧) 第 1 刷刊行: 2012 年 5 月 18 日 第 15 刷刊行: 2018 年 3 月 15 日 原稿時点の PDF ファイル (参考用) 目次, さくいん, まえがき 韓国語版 (翻訳は滋賀大の李鍾賛さん, 2017-09-15) 「統計モデリング入門」ネット上のあれこれ (のごく一部) 丸善・ジュンク堂書店の「今年驚いた! 1 冊」の「驚きの出版賞」 に選ばれました! (web archive, KuboLog 2012-12-20) Amazon カスタマーレビュー はてな出版物 -- 言及ブログへのリンクなどがあります! ブクログ,
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く