omega314のブックマーク - はてなブックマーク

omega314 id:omega314

ブックマーク / watanabe-www.math.dis.titech.ac.jp (13)

small large
小さな世界と大きな世界渡辺澄夫１質問質問学生の皆様から次の質問をいただきました。質問「統計学を紹介する動画を見ていたら小さな世界と大きな世界という言葉が出てきたのですが、それらは何ですか」このファイルでは上記の質問にお答えします。答えのみ知りたい人は「４回答」をご覧ください。小さな世界と大きな世界とは https://www.youtube.com/watch?v=4WVelCswXo4 40:30 あたりで、small and large worlds が説明がされています。いただいたご質問について、小さな世界と大きな世界は下記の動画で説明されています。 R.McElreath, Statistical Rethinking 言葉を作った人小さな世界という言葉は主観ベイズ法の提案者 L.J. Savage によって作られたようです。用語の混同に
omega314 2021/05/14
モデリング

確率

統計

機械学習

数学

人間の目線で数学を
リンク
PowerPoint プレゼンテーション　ベイズ推論　　東京工業大学渡辺澄夫電子情報通信学会ソサイエティ大会 AI-2 データ科学とコンピュータ科学の基礎理論と展開 2016年9月20日　北海道大学
ベイズ推論東京工業大学渡辺澄夫 2016/9/15 1 電子情報通信学会ソサイエティ大会 AI-2 データ科学とコンピュータ科学の基礎理論と展開 2016年9月20日北海道大学この講演の目的 2 2 統計的推論が命題論理の推論と異なる点を説明し、ベイズ推論において解明されていることの概略を述べる。もくじ 3 3 １．統計的推論は命題論理の推論と何が違うのか２．統計的推論では何を知りたいのか３．予測誤差と交差検証誤差４．総和誤差と自由エネルギー 4 4 １．統計的推論は命題論理の推論と何が本質的に違うのかなぜ人間は「正しい統計的推論」を求めたのか 5 数学や物理学では一定の水準の厳密さにおいて「正しい推論」というものが存在している。 → 正しいモデルで正しく推論すれば正しい結論が得られる。 → 間違った結論は間違ったモデルか推論から生まれる。（例）連続関数の列が一様収
omega314 2020/01/24
数学

統計

確率

モデリング

機械学習

概念

人間の目線で数学を
リンク
代数幾何と学習理論
渡辺研究室渡辺澄夫学習理論の専門書：代数幾何と学習理論(まえがきともくじ)(森北出版) アマゾンのページ渡辺澄夫この本は、代数幾何と学習理論の関係について、できるだけ具体的に説明したものです。「代数幾何と学習理論」のあらすじ要約本書では、統計学における周辺尤度を F とし、代数幾何学における実対数閾値を λとするとき、が成り立つことを証明しています。ここで n はデータの数です。（注） (1) 周辺尤度 F はデータから計算できます。統計モデルと事前分布の設計において最も基本的な量です。これは統計学で良く知られていました。 (2) 実対数閾値 λ は、代数多様体の特異点の性質を表す量です。これは代数幾何学で良く知られていました。実対数閾値は（真の分布、モデル、事前分布）から計算できます。 (3) 定理「 F = λlog n 」により、データに基づいて（真の
omega314 2020/01/11
本

数学

代数

幾何

情報

確率

統計

機械学習

モデリング

人間の目線で数学を
リンク
学習の状態方程式
もどる１．概略サンプルと学習モデルが与えられたとき、真の確率分布（サンプルを発生している分布）を推測することを統計的学習といいます。推測された確率分布を用いて未知のデータを予言したときの誤差が予測誤差であり、推測された確率分布を用いて既知のサンプルを予言したときの誤差が学習誤差です。予測誤差を小さくすることが学習の本当の目的ですが、予測誤差は真の確率分布がわからなければ計算できません。学習誤差はサンプルだけから計算できますが、予測誤差とは一致しません。もしも学習誤差から予測誤差を推測できれば、サンプルだけから未知のデータに対する予言の良さがわかるので、非常にありがたいということができます。しかしながら、予測誤差の平均値を知ることは、統計的正則モデルでは実現されていましたが、統計的に正則ではないモデルでは実現する方法がありませんでした。統計的に正則でないモデルはパラメ
omega314 2020/01/11
数学

機械学習

確率

統計

概念
リンク
ベイズ統計の理論と方法
ベイズ統計の理論と方法渡辺澄夫ベイズ統計の理論と方法、コロナ社、2012 ，アマゾンのページこの本ではベイズ統計の理論と方法を紹介しています。ベイズ統計については良い本がたくさん出版されていますので、他の本と合わせてお読み頂ければ幸いです。初めてベイズ統計に出あった人はもちろん、これまでにベイズ統計について勉強をされていて、多くの疑問を持たれているかたに本書をお薦めします。特に、ベイズ統計について『いろいろな本に○○○と書いてあるが、これは本当のところ正しいのだろうか』と思われていることが沢山あるかたに本書をお勧めします。例えば、 Q１．なぜ事前分布を信じることができるのだろうか？ Q２．ベイズ法は数理や理論に支えられていないのだろうか？『百人いれば百個の推論』でよいのだろうか？ Q３．私は BIC や DIC でモデルを設計して来たが、それで本当によかったのだろう
omega314 2020/01/11
本

数学

確率

統計

モデリング

機械学習

概念

代数

幾何

解析
リンク
ベイズ事後分布の相転移と数学・物理学 - 東京工業大学
ベイズ事後分布の相転移について渡辺澄夫東京工業大学相転移とは何ですか学生のみなさまから「学習理論における相転移とは具体的に何か」という質問をいただきましたので、具体的な例について紹介します。相転移とはデータの数 n やハイパーパラメータ α を変化させたとき、ある値を境界としてその前後で事後分布が急激に形を変えることにより、ベイズ自由エネルギーや汎化損失の値がそれらのなめらかな関数でなくなることがあります。そのような変化を相転移と呼びます。具体例として、ここでは次の問題を考えます。 (1) データの数 n が小さいうちは真の分布の構造を詳しく知ることはできないがデータの数が増えるにつれて真の分布の構造が見えてくる(構造の発見)。 (2) 事前分布を決めているハイパーパラメータを変えると事後分布が急激に変化する点がある (「事前分布は何でもよい」ではないのです）。
omega314 2020/01/10
渡辺澄夫。

数学

確率

統計

モデリング

機械学習

概念

物理

かたち
リンク
ベイズ推論：いつも何度でも尋ねられること
このページをご覧頂き、ありがとうございます。「ベイズと最尤のどちらが正しいのか」と、いつも何度でも尋ねられます。「事前分布は何が正しいのか」と、いつも何度でも尋ねられます。ここでは、できるだけ短く、その質問についての返答を述べます。１．正しい統計的推論は存在しない統計学が扱う問題では、ほとんどの場合、基礎となる確率がわからないので、特別な場合を除いて、正しいモデル・正しい事前分布・正しい推論というものは存在しません。条件が不足したり過剰だったりして答えられない問題のことを【不良設定問題】といいます。統計学は不良設定問題を扱う学問です。この世にあるほとんどの問題は程度の違いこそあれ、みな不良設定です。まずは「統計学は不良設定問題を扱う学問である」ということを理解しましょう。基礎となる確率が定められていなければ【正しい統計的推論】は存在しません。（注）基礎となる確率
$ベイズ推論：いつも何度でも尋ねられること$
omega314 2019/12/08
事前分布にだけやたらと懐疑的になったりするような人、「とりあえずこれやっとけば怒られないやり方」を欲しているんだろうなと思うときある。けどまあ、道具としてだけ使いたいならある程度はしゃーないよなとも。

数学

統計

確率

モデリング

機械学習

論理

心理

データ
リンク
学習理論よ　何処へ
omega314 2019/12/04
人間力だ。

機械学習

数学

社会

モデリング

人間の目線で数学を
リンク
真の分布を知ることができる限界について
渡辺澄夫に戻るこのページをお読みいただきありがとうございます。汎化誤差と WAIC の数学的関係に興味をお持ちいただき、本当にありがとうございます。このページでは「汎化誤差を推定することの理論的な限界」について考えています。議論をシンプルにするため、統計モデルが真の分布を実現できる場合を考えます。 Gn, Wn, S, Sn をそれぞれ、汎化損失、WAIC、真の分布のエントロピー、真の分布の経験エントロピーとします。またλを対数閾値とします。このとき (Gn-S) + (Wn-Sn )= 2λ/n +op(1/n)　　　　　式(1) が成り立ちます。Wn のかわりに一つ抜き交差検証誤差(LOOCV)を用いても同じ式が成り立ちます。 WAIC と LOOCV は漸近等価だからです。（注）証明が必要なかたは恐縮ですが拙著「ベイズ統計の理論と方法、コロナ社,2012,p.119」を
omega314 2019/12/04
汎化誤差及びその周辺をマジメに考えて勉強したことが無かったので、東大准教授の人を私は笑えない。

機械学習

数学

確率

統計

モデリング

情報

物理

データ
リンク
Bayesian statistics
統計学入門「主義」を心配するみなさまに東京工業大学渡辺澄夫このファイルの目的このファイルは統計学において「主義」を心配するみなさまのための解説です。１要約いつも何度でも尋ねられる質問頻度主義とベイズ主義はどちらが正しいですか。このファイルの回答１正しい主義は存在しません。好きな主義と好きな方法を使うことができます。推測が当たるかどうかが問題です。このファイルの回答２推測に「主義」は不要です。推測を当てるには数理科学が必要です。このファイルの回答３「主義」を争うことに意義はありません。論争をやめて数理科学へ進みましょう。時間がないかたにこのファイルを読むのがメンドウで結論だけを知りたいかたは最後のページをご覧ください。２統計的推測とは統計的推測とは未知である真の分布からデータが得られ
omega314 2019/12/04
『悲しい歴史があったのです。』

数学

統計

確率

モデリング

機械学習
リンク
渡辺澄夫
渡辺澄夫このページは2024年3月までに終了します。長い間ありがとうございました。
$渡辺澄夫$
omega314 2019/12/04
webサイト

数学

統計

確率

モデリング

機械学習
リンク
広く使える情報量規準(WAIC)
このページをご覧いただき、ありがとうございます。ここでは、情報量規準 WAIC を紹介しています。ベイズ推測のための情報量規準(WAIC)が導出されました。 WAIC は（真の分布、確率モデル、事前分布）がどのような場合でも使うことができます。他の規準と異なり理論的な基盤を持っています。 (0) モデル選択やハイパーパラメータの最適化に使えます。 (1) 漸近的に汎化損失と同じ平均値と同じ分散を持ちます。 (2) WAIC は簡単に計算できます。 (3) 真の分布が確率モデルで実現可能でなくても使えます。事前分布が真の事前分布でなくても使えます。 (4) 平均対数損失を最小にするパラメータがユニークでなくても使えます。平均対数損失を最小にするパラメータが特異点を含む解析的集合であっても使えます（注１）。 (5) フィッシャー情報行列が正則でなくても使えます。 (6) 事後分布が正
omega314 2019/12/04
Widely applicable, Watanabe–Akaike.

数学

統計

確率

モデリング

機械学習
リンク
最尤推定はいつなら大丈夫？
問い：混合正規分布や神経回路網などの構造を持つ学習モデルでは最尤推定は漸近的にも有効性を持たず、非常に大きな汎化誤差や符号長を持つと聞いたのですが、最尤推定はいつなら大丈夫でしょうか。答え：　パラメータの集合と確率分布の集合が一対一に対応していて、かつ、フィッシャー情報行列が逆行列を持つ場合であれば、最尤推定は漸近正規性を持ち、漸近有効です。このとき、非常に多くのサンプルがあれば、具体的には、フィッシャー情報行列の最も小さい固有値までが、はっきりと見えるくらい多くの学習データがあれば、最尤推定量を使っても安全といえるでしょう。尤度関数が正規分布で近似できるということが最尤推定量が安全に使える条件です。次のことに十分に注意してください。「最尤推定が安全に使えるかどうかは、最尤推定量を計算しただけではわからない」。以上の条件を満たさない場合には最尤推定量は統計的推
omega314 2016/12/19
『サンプル揺らぎのオーダーと、関数近似のオーダーの、どちらが、どのように効いているかを感じ取るという、統計的推測における最も重要な観点』

数学

科学

統計

確率

モデリング

機械学習
リンク
1