タグ

Stanに関するhoxo_mのブックマーク (66)

  • Michael Betancourt's Stan Lectureを開催しました - StatModeling Memorandum

    ドワンゴさんに会場提供していただき、2016/6/4にMichael Betancourt's Stan Lectureを開催しました。実はStanの勉強会というのはこれがはじめてではなく、約2年ほど前に催されていたBUGS/Stan勉強会がもととなっています。 また今回はニコ生で放送したのですが、400人以上の視聴者がいたのは驚きました。この内容で、しかも英語なのに。欲を言うともっと会場にも来てほしかったです。当日の進行は少し前倒しになり、そのために閲覧できなかった方には申し訳ありませんでした。動画を公開しますのでお許しください。 以下では内容を簡単に紹介します。 Hiroki ITO "Dealing with latent discrete parameters in Stan" 一人目は頼み込んで北海道から(自腹で)来てくれました伊東宏樹さんです。動画は次の僕の分と合わせて以下にな

    Michael Betancourt's Stan Lectureを開催しました - StatModeling Memorandum
  • Gaussian Process Hyperparameter Estimation

    Quick Way longer then expected post and some code for looking into the estimation of kernel hyperparameters using STAN HMC/MCMC and R.  I wanted to drop this work here for safe keeping. Partially for the exercise of thinking it through and writing it down, but also because it my be useful to someone.  I wrote a little about GP in a previous post, but my understanding is rather pedestrian, so these

    Gaussian Process Hyperparameter Estimation
    hoxo_m
    hoxo_m 2016/06/02
    おー、ここら辺ちゃんと知りたかったとこだ。あとで読もう。
  • https://cran.r-project.org/web/packages/loo/vignettes/Example.html

    hoxo_m
    hoxo_m 2016/05/28
  • Prior Choice Recommendations

    5 levels of priors Flat prior (not usually recommended); Super-vague but proper prior: normal(0, 1e6) (not usually recommended); Weakly informative prior, very weak: normal(0, 10); Generic weakly informative prior: normal(0, 1); Specific informative prior: normal(0.4, 0.2) or whatever. Sometimes this can be expressed as a scaling followed by a generic prior: theta = 0.4 + 0.2*z; z ~ normal(0, 1);

    Prior Choice Recommendations
  • [Stan] 二つの時系列データの間に「差」があるか判断するには

    詳しい経緯は このまとめ を参照してください。時間軸でぶった切って各時点で検定を使う手法は、百歩譲って「差があるかどうか」は判定できるかもしれないけど、「どれほど異なるのか」については何も言えない。「どの時刻から異なるか」についても言えるか分からない。そこでベイズ統計モデリングで判断しようと思います。ベイズ統計モデリングでは多くの事前知識を仮定としてモデルに組み込みますが、検定も多くの仮定を前提にしている点は同様と思います。 データは雰囲気だけ似せて自作しました。野生型100個体、変異体10個体で1~24まで1時間ずつ測定して24時点としました。まとめを見ると144時間みたいですが24時間に簡略化します。データの構成は以下です。 type X1 X2 … X23 X24 0 0.071 0.555 … -0.236 -0.597 0 0.445 0.483 … -0.149 0.231 0

    [Stan] 二つの時系列データの間に「差」があるか判断するには
    hoxo_m
    hoxo_m 2016/02/19
    すごいなー
  • [Stan] NUTSとADVI(自動変分ベイズ)の比較

    RStan2.9.0がリリースされました。今まで{rstan}パッケージのsampling関数を使っていたところを、vb関数に変更するだけでサンプリングのアルゴリズムをNUTSからADVI(Automatic Differentiation Variational Inference)に変更することができます。ADVIはユーザーが変分下限の導出や近似分布qを用意をすることなしに、自動的に変分ベイズしてくれます。得られるアウトプットはNUTSとほぼ同様で近似事後分布からの乱数サンプルです。ウリはスピードです。NUTSもADVIもデフォルトのオプションのまま実行して、NUTSと比べて50倍ぐらいスピードが出ることもあります。 NUTSと同様にADVIは効率的な探索のため偏微分を使っているので、離散値をとるパラメータは使えませんが、やはり同様に離散パラメータを消去すれば実行できます。そして、微分

    [Stan] NUTSとADVI(自動変分ベイズ)の比較
    hoxo_m
    hoxo_m 2016/01/08
  • 岩波データサイエンス

    岩波データサイエンス サポートページ 各巻に対応する内容は,上のバーの3線「三」をクリックして左に表示されるメニューからご覧ください (トップページの内容が空白の場合も,メニューで下位の階層をクリックして頂くと内容が表示される場合があります) 新グーグル・サイトに移行しました.自動変換のため,見難くなっている部分,表示されない部分がありますが,ご容赦ください シリーズ「岩波データサイエンス」では、統計科学や機械学習など、データを扱うさまざまな分野について、多様な視点からの情報を提供することをめざします。まったくの初歩からやや高度な話までのいろいろな手法の解説、実務に役立つソフトの使い方、さらには各領域のサイエンスや応用に踏み込んだ内容まで、多彩な記事を掲載します。 装丁には蛯名優子さんの作品を使わせて頂いています。蛯名さんのホームページはこちらです。 【公式ツイッターアカウント】ツイッタ

    岩波データサイエンス
    hoxo_m
    hoxo_m 2015/09/24
    岩波データサイエンス第一巻、10/7 発売だそうです!Stan (*´Д`)ハァハァ
  • RStanとShinyStanによるベイズ統計モデリング入門

    第50回 TokyoR 発表資料 Stanコードは下のサイトで公開しております。 https://github.com/teuder/TokyoR50

    RStanとShinyStanによるベイズ統計モデリング入門
    hoxo_m
    hoxo_m 2015/09/07
    これは素晴らしい!
  • 俺俺Stan manual翻訳:4章 - Qiita

    文章はStan Modeling Language Stan Development Team. 2015. Stan Modeling Language Users Guide and Reference Manual, Version 2.7.0.の4章: Containers: Arrays, Vectors, and Matricesの翻訳となります。 訳者は勉強がてら翻訳しようと思っただけで、プログラムの専門家でもデータ解析の専門家でもありません。そのため誤訳・意味の取り違えなどあると思いますが、その際はご指摘いただけると幸いです。5章はやりたいと思っていますが、その先は未定です。また、翻訳ペースも気分しだいです。ご了承ください。 4.データ格納形式: Arrays, Vectors, and Matrices Stanにはarrays, vectors, matrices3種

    俺俺Stan manual翻訳:4章 - Qiita
    hoxo_m
    hoxo_m 2015/08/29
    4章来ました!データコンテナの説明です。
  • 俺俺Stan manual翻訳:3章 - Qiita

    文章はStan Development Team. 2015. Stan Modeling Language Users Guide and Reference Manual, Version 2.7.0.の3章: Data Typesの翻訳となります。 訳者は勉強がてら翻訳しようと思っただけで、プログラムの専門家でもデータ解析の専門家でもありません。そのため誤訳・意味の取り違えなどあると思いますが、その際はご指摘いただけると幸いです。4章、5章はやりたいと思っていますが、その先は未定です。また、翻訳ペースも気分しだいです。ご了承ください。 3.データ型 章ではStanで変数の宣言や、式の値に使われるデータ型について議論します。変数の型はパラメータの宣言、データの一貫性、関数の呼び出し、変数に値を割り当てる場合のすべてにおいて重要な要素となります。 Stanにおいて、すべての式と変数の

    俺俺Stan manual翻訳:3章 - Qiita
    hoxo_m
    hoxo_m 2015/08/25
    素晴らしい!
  • Stan: RStan 2.7.0で並列化: Taglibro de H

    Stan 2.7がリリースされました。RStanがCRANにはいって、並列化に対応したとのことなので、ためしてみました。 以前の常微分方程式をつかったモデルのパラメーター推定のRコードをRStan 2.7標準の並列化に対応させてみます。環境はOS X 10.10.4、R 3.2.1、RStan 2.7.0-1です。 ## データ set.seed(123) r <- 0.1 K <- 1000 ts <- seq(0, 30) N <- vector("integer", length(ts)) N[1] <- 100 for (t in seq_along(ts)[-1]) { N[t] <- rpois(1, N[t -1] + r * N[t - 1] * (K - N[t - 1]) / K) } ## モデル library(rstan) rstan_options(auto_w

    Stan: RStan 2.7.0で並列化: Taglibro de H
    hoxo_m
    hoxo_m 2015/07/31
  • Google グループ

    Google グループでは、オンライン フォーラムやメール ベースのグループを作成したり、こうしたフォーラムやグループに参加したりすることで、大勢のユーザーと情報の共有やディスカッションを行うことができます。

    hoxo_m
    hoxo_m 2015/05/25
  • MCMCの収束診断におけるRhatの具体的な値についての引用メモ - Take a Risk:林岳彦の研究メモ

    Gelman et al. (2004)に「収束判断の際のRhatの具体的な値」に関する記述(p297)があるのでメモしておきます。 こういうのってメモしておかないといざ論文に引用しようというときに見つからないということがままありますので。 The condition of being 'near' 1 depends on the problem at hand; for most examples, values below 1.1 are acceptable, but for a final analysis in a critical problem, a higher level of precision may be required. ちなみにWinBUGSでRhatの値はgelman.diag()を使って計算できます。実装のしかたは 久保さんのページのR2WinBUGSの

    MCMCの収束診断におけるRhatの具体的な値についての引用メモ - Take a Risk:林岳彦の研究メモ
    hoxo_m
    hoxo_m 2015/05/07
    Rhat < 1.1 のソース。
  • RPubs - 超要約 Stan Reference

    Hide Comments (–) Share Hide Toolbars

    hoxo_m
    hoxo_m 2015/05/06
    今さらだけど、これ超優良記事じゃね?
  • rstanmulticore: A cross-platform R package to automatically run RStan MCMC chains in parallel | Nathan VanHoudnos

    rstanmulticore: A cross-platform R package to automatically run RStan MCMC chains in parallel *** This work has been supported by a grant from the Spencer Foundation (#201400002). The views expressed are those of the author and do not necessarily reflect those of the Spencer Foundation. *** It seems that the heir to WinBUGS is Stan. With Stan, reasonably complex Bayesian models can be expressed in

    rstanmulticore: A cross-platform R package to automatically run RStan MCMC chains in parallel | Nathan VanHoudnos
    hoxo_m
    hoxo_m 2015/05/03
  • [PDF]Prior distributions for variance parameters in hierarchical models(Gelman 2006)

    Bayesian Analysis (2006) 1, Number 3, pp. 515–533 Prior distributions for variance parameters in hierarchical models Andrew Gelman Department of Statistics and Department of Political Science Columbia University Abstract. Various noninformative prior distributions have been suggested for scale parameters in hierarchical models. We construct a new folded-noncentral-t family of conditionally conjuga

  • [PDF]A weakly informative default prior distribution for logistic and other regression models(Gelman 2008)

    The Annals of Applied Statistics 2008, Vol. 2, No. 4, 1360–1383 DOI: 10.1214/08-AOAS191 © Institute of Mathematical Statistics, 2008 A WEAKLY INFORMATIVE DEFAULT PRIOR DISTRIBUTION FOR LOGISTIC AND OTHER REGRESSION MODELS BY ANDREW GELMAN, ALEKS JAKULIN, MARIA GRAZIA PITTAU AND YU-SUNG SU Columbia University, Columbia University, University of Rome, and City University of New York We propose a new

  • R stan導入公開版

    StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~nocchi_airport

    R stan導入公開版
    hoxo_m
    hoxo_m 2015/03/06
    世界一簡単な rstan コード、二番目に簡単な rstan コード、そして世界一簡単な収束しない rstan コード。
  • ■Hamiltonian Monte Carlo - eizoo3010の日記

    2015-02-20 ■Hamiltonian Monte Carlo R PRML ここ最近、自分の周りのすごく局所的な範囲でStan需要が高まっている。このStanが取り入れているMCMCのアルゴリズムとしてNo-U-Turn samplerとHamiltonian Monte Carloがある。このHamiltonian Monte Carloについてよくわかっていないし、知らないまま使っていくのは気持ち悪いしかなり恥ずかしいので調べたことをまとめる。 導入:Metropolisアルゴリズム 現在の状態に依存した提案分布からのサンプリングは容易とし、これを使ってサンプルし辛い分布からサンプリングしたい。で、このについて正規化定数以外の分布型はわかっていてと書けるとする。要は分布の形はわかっていて値も計算できるけど、その分布からのサンプリングは難しい、そんな状況を仮定する。Metrop

    ■Hamiltonian Monte Carlo - eizoo3010の日記
    hoxo_m
    hoxo_m 2015/02/21
  • Stan で Lasso - 捨てられたブログ

    パラメーターが沢山あって困るのでパラメーターを減らしたいという場合があります。ところで lasso です。 lasso はおなじみの L1 ノルムでペナルティーをかけるやつです。その lasso には変数選択としての用法があるとのことです。つまり を最小にするような を求めてやると, がスパースなので 0 になるような係数はいらないと判断できるわけですね。 というわけでこれを Stan でやってみたいということです。 まず適当にデータを作ります。 20 パラメーターを用意して,実際には 1, 2, 5 番目のパラメーターのみ効いているというデータです。 P <- 20L N <- 40L x <- matrix(rnorm(N * P), nrow=N, ncol=P) y <- 1.5 + as.numeric(x %*% c(3, -2, 0, 0, 1, rep(0, P - 5L)

    hoxo_m
    hoxo_m 2015/01/02