並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 272件

新着順 人気順

Stanの検索結果1 - 40 件 / 272件

  • 統計・R・Stan関連の本、用途別のオススメ10冊 - StatModeling Memorandum

    2016 - 12 - 24 統計・R・Stan関連の本、用途別のオススメ10冊 書評 R Stan 年末年始向けに、比較的読みやすい本を中心にオススメします。 統計学 入門 色々読んでみましたが、現在決定版と言えるものは存在しないように思えました。個人的には、シグマと 積分 の復習、場合の数・数え上げの方法、確率、確率変数、確率密度、度数分布と ヒストグラム 、代表値・平均・分散、確率分布、同時分布、周辺分布、確率変数の変数変換、検定、散布図と箱ひげ図、回帰、相関あたりをRなどを使いながらシンプルに説明していく本があるといいと思うのですが、なかなかバランスのとれたいい本がありません。初歩の初歩しか説明してない、グラフが少ない、検定にページを割きすぎ、分厚い、ちょっと難しいなどの不満点があります。立ち読みして自分にあった本を選ぶのがいいと思います。ネットで検索して調べるのでもいいと思います

      統計・R・Stan関連の本、用途別のオススメ10冊 - StatModeling Memorandum
    • 『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング+ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ

      ここ2ヶ月ぐらいに渡って多くの方々からご著書をご恵贈たまわっているのですが、そのうちの一冊がこちら。かつて計量時系列分析を学んでいた頃に僕も大変お世話になった、Logics of Blueブログの馬場さんの手による『RとStanではじめるベイズ統計モデリングによるデータ分析入門』です。 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 作者:馬場 真哉出版社/メーカー: 講談社発売日: 2019/07/10メディア: 単行本 以前はベイズ統計モデリングの入門書というと「みどりぼん」こと『データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)』一択でしたが、皆さんもご存知のように既にメンテされていないWinBUGSを使っているなどout-of-dateな要素が多く、近年はこれに替わる良書

        『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング+ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ
      • 「StanとRでベイズ統計モデリング」松浦健太郎 という本を書きました - StatModeling Memorandum

        僕が筆者なので、この記事は書評ではなく紹介になります。まずこの本はRのシリーズの一冊にもかかわらずStanという統計モデリングのためのプログラミング言語の方がメインです。このようなわがままを許してくれた、ゆるいふところの深い石田先生と共立出版には感謝しかありません。 StanとRでベイズ統計モデリング (Wonderful R) 作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本 目次と概要 共立出版のページを見てください。GitHubのリポジトリもあります。 前提とする知識 「はじめに」の部分で触れていますが、確率と統計の基本的な知識はある方、R(やPython)で簡単なデータ加工や作図が一通りできる方を想定しています。そのため、確率分布なんて聞いたことがない、プログラミングがはじめて、Rがはじめて、という方が読み進めるのは厳しいかもしれません。なお、Rの基本的な関数し

          「StanとRでベイズ統計モデリング」松浦健太郎 という本を書きました - StatModeling Memorandum
        • Stanで統計モデリングを学ぶ(2): そもそもMCMCって何だったっけ? - 渋谷駅前で働くデータサイエンティストのブログ

          (前回記事はこちらから) ベイジアンの知識もいい加減な僕がこんなシリーズ記事を書くとかほとんどギャグの領域なんですが(汗)*1、2回目の今回の記事ではそもそもMCMCって何だったっけ?ってところから始めようと思います。 今回参考にするのは、主に久保先生の緑本です。そもそもGLM~GLMM~階層ベイズ+空間統計学について生態学研究をモチーフに分かりやすく書かれた本ですが、後半はMCMCの話題で統一されています。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 2012/05/19メディア: 単行本購入: 16人 クリック: 163回この商品を含むブログ (18件) を見る MCMCまわりでは他にも非常に多くの良書がありますが、「初心者向けにも分かりやすくて」「段階を追って」「なぜ

            Stanで統計モデリングを学ぶ(2): そもそもMCMCって何だったっけ? - 渋谷駅前で働くデータサイエンティストのブログ
          • Stanで統計モデリングを学ぶ(1): まずはStanの使い方のおさらいから - 渋谷駅前で働くデータサイエンティストのブログ

            (※Stan v2.4.0以降でインストール方法に若干変更があります!詳しくはこの記事の中ほどをご覧ください) さて、年初の抱負でも語ったように今年はStanを頑張って会得していこうと思います。理由は簡単で、ありったけの要素を詰め込んでMCMCサンプラーでガンガン推定していくような階層ベイズモデリングに自分の興味としても惹かれる上に、実務でも必要になりそうな見通し*1だからです。 Stan: Project Home Page 既に以前の記事でも簡単に触れてますが、StanはC++ベースのコンパイラで高速化させたMCMCサンプラーです。文法も簡単でなおかつ高速なので、BUGSでは時間がかかり過ぎて辛かった計算でも比較的サクサク回せます。 このシリーズを通して参考にするのは、@berobero11さんのブログです。 Small Data Scientist Memorandum 本当にもう、

              Stanで統計モデリングを学ぶ(1): まずはStanの使い方のおさらいから - 渋谷駅前で働くデータサイエンティストのブログ
            • 『ベイズ統計モデリング ―R,JAGS, Stanによるチュートリアル 原著第2版―』 John Kruschke著、前田和寛・小杉考司監訳 - StatModeling Memorandum

              タイトルの本を頂きました。ありがとうございます。僕は原著を少し読んだことがあり、こちらで非常に評判が高い本です。翻訳にもかかわらず原著とほぼ同じ値段で購入できます。 先にJAGSになじみのない方へ説明しておきますと、JAGSはRコアメンバーの一人でもあるMartyn Plummer氏によってC++で開発されたMCMCソフトウェアです。Rから使うのが多数派ですが、PythonからもPyJAGSによって使うことができます。 複雑なモデルでなければStanより収束が早く、離散値をとるパラメータも使えるため、プログラミングがそんなに得意でない人がベイズ統計モデリングをはじめるには一番向いていると思います。最近、再び活発に開発され始めたようで、先日JAGS 4.3.0がリリースされました。 JAGS 4.3.0 is released https://t.co/3jExabWcPI— Martyn

                『ベイズ統計モデリング ―R,JAGS, Stanによるチュートリアル 原著第2版―』 John Kruschke著、前田和寛・小杉考司監訳 - StatModeling Memorandum
              • 時系列データにt 検定を行うことに関してstan 神の解析がやばい - 驚異のアニヲタ社会復帰の予備

                時系列データにt 検定を行うことに関して、すごいもにょっていたのだが、そもそもstan 神が既にモデル化してくれていた。 リンクでは2階差分と、変化点検出のコーシー分布の合わせ技を用いている。 そのままパクってやってみる。 diの95%ベイズ信頼区間が0を含んでいない期間が差がある期間と言えるでしょう。さらに、どこから差がありそうなのか、どれほど差がありそうなのかも確率付きで述べることができます。 ということが、stan による柔軟なモデリングで述べることができます。 話は飛ぶけど、読んだ。 はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学― 作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2016/06/02メディア: 単行本(ソフトカバー)この商品を含むブログ (11件) を見る 書評はまた書くけれども、この時系列データと同じように、この本では、例えば分散分析や分

                • Stan

                  Stan is a state-of-the-art platform for statistical modeling and high-performance statistical computation. Thousands of users rely on Stan for statistical modeling, data analysis, and prediction in the social, biological, and physical sciences, engineering, and business. Stan interfaces with the most popular data analysis languages (R, Python, shell, MATLAB, Julia, Stata) and runs on all major pla

                    Stan
                  • p値を計算したくなる検定の数々を試しにStanによるベイジアンモデリングで代替してみた - 渋谷駅前で働くデータサイエンティストのブログ

                    この記事は、やたらはてブを稼いでしまった前回の記事の続きです。 ASAのプレスリリース及び声明の中には、確かに「p値に依拠しない新たなアプローチの例」として予測値を重視するアプローチ*5、ベイジアンモデリング、決定理論的アプローチ*6およびfalse discovery rate*7といったものを用いるべき、という趣旨のコメントが入っています。とは言え、重回帰分析とか機械学習のような多変量モデリング(なおかつサンプルサイズも大きい)を伴うテーマならともかく、統計学的仮説検定のようなサンプルサイズも小さい(データも少ない)シチュエーションでどうやるんだよ的な疑問を持つ人も多いのではないかと。 そんなわけで、実際にそれっぽい各種検定の数々をStanによるベイジアンモデリングで代替してみたので、この記事ではその結果をつらつら紹介してみようと思います。テーマは前々回のこちらの記事の1節で取り上げた

                      p値を計算したくなる検定の数々を試しにStanによるベイジアンモデリングで代替してみた - 渋谷駅前で働くデータサイエンティストのブログ
                    • STAN.|象印

                      象印のSTAN.シリーズは、今の時代に必要な家電、道具として暮らしに寄り添う家電を目指して、日々の様々なシーンに対してスタンバイし続けます。

                        STAN.|象印
                      • Alexandra Stan - Mr Saxobeat (Official Video)

                        This track is super hot and also our weekly new releases. Discover them here https://orcd.co/7q02ea8 Listen to our hottest music track | Novedad musical: http://bit.ly/BestSongOTW  Subscribe to Blanco y Negro and get the latest music updates: http://bit.ly/blancoynegromusic Our hottest music videos:  http://bit.ly/HotNowByN Escucha / Descarga /Download el tema Mr Saxobeat de Alexandra Stan en :

                          Alexandra Stan - Mr Saxobeat (Official Video)
                        • iPod touch、厚さ8mmを実現できた理由--アップルStan Ng氏に聞く

                          9月6日に発表されたアップルのiPodシリーズは、iPod classic、nano、shuffleに加えて、新たに「iPod touch」が誕生するなど大きなアップデートが随所に見られるものとなった。中でも大きく注目を集めたのは、iPhoneの指でディスプレイをなぞって操作する“マルチタッチインターフェース”を受け継いだiPod touchだ。 アップルの新製品の企画を担当する米国Apple社iPod製品企画担当シニアディレクターのStan Ng氏に、今回の製品のデザインや今後について話しを聞いた。 マルチタッチインターフェースは革新的なUI --今回リリースされた製品のなかでも、iPod touchはこれまでのiPodとはまったく異なるタイプの製品です。日本でも受け入れられる製品となるでしょうか? はい、我々はそう考えています。今回発表したiPod touchは、iPhoneで培われた

                            iPod touch、厚さ8mmを実現できた理由--アップルStan Ng氏に聞く
                          • StanとPythonでベイズ統計モデリング その2 Chapter5 - Easy to type

                            アヒル本(StanとRでベイズ統計モデリング)のChapter5にPythonで取り組んでいきます。 練習問題を解いて、本文中に書かれてるグラフをPythonで描いてみます。 なおChapter1~3は導入だったのと、Chapter4は練習問題の内容が「はじめての統計データ分析」と被っていたのでパスします。 Chapter5 基礎的な回帰とモデルのチェック 重回帰 複数の説明変数を用いた回帰のこと 重回帰も結局は正規分布を仮定している 目的 説明変数からの応答変数の予想、及び説明変数の寄与率 分布 複数の説明変数ならScatterplot matrixを利用すると良い MCMCの設定について スケーリング: MCMCを行う前に、各データのオーダーを大体(1前後に)そろえること。 収束がしやすく、早くなる 最大値、標準偏差、標準偏差の倍で割ったりすれば良い 結果の解釈 : モデルの改善に活か

                            • [Stan] kivantiumさんのブログ記事「アニメキャラのバストサイズとPixiv R-18タグ率の関係」の追加解析

                              @kivantiumさんの以下のツイートが面白そうすぎて追加解析してみました。 特に2つ目のツイートが重要で、これがないと階層ベイズでやってみようという気は起りませんでした。 調査の結果、アニメキャラのバストサイズとPixivでR-18タグが付く割合の相関係数は0.286・相関検定の結果はp=0.14であったため、バストサイズとR-18タグがつく割合には相関が無いという結論になりました pic.twitter.com/16bt8tyk4p— 川奈 清 (@kivantium) 2015, 5月 12同一作品の間では確かに相関があるっぽかったけど、作品間による差の方が大きかったため相関が消えてしまった— 川奈 清 (@kivantium) 2015, 5月 12 kivantiumさんはブログ記事およびデータもすぐにアップして下さっています(アニメキャラのバストサイズとPixiv R-18タ

                                [Stan] kivantiumさんのブログ記事「アニメキャラのバストサイズとPixiv R-18タグ率の関係」の追加解析
                              • R stan導入公開版

                                StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~nocchi_airport

                                  R stan導入公開版
                                • 象印IH炊飯ジャー「STAN.」と今までの炊飯器を比較しました - 白い平屋の家を建てました

                                  以前使っていた炊飯器との炊き比べや、大きさ比べをしてみました。 メリットやデメリットについてもまとめています。 STAN.を買おうかどうか考えている方の参考になったらうれしいです。 佇まいは、小さな武士って感じ。 象がちょこん♡ セットでついてきたのは、しゃもじと計量カップ(白米用・無洗米用)、レシピブックでした。 炊飯器を並べ比べ使っていたパナソニックの炊飯器と並べてみます。 同じ5.5合炊きだけれど、STAN.の方がひと回り小さいです。 パナの内釜は擦れ擦れでした。長い間どうもありがとう。 内釜の劣化とともに気になっていたのは、内蓋のパッキンです。 内蓋を取った蒸気口のパッキンも劣化がひどかった。 今までの炊飯器は洗うパーツが4つありましたが、STAN.はシンプル構造です。

                                    象印IH炊飯ジャー「STAN.」と今までの炊飯器を比較しました - 白い平屋の家を建てました
                                  • Stan:隠れマルコフモデル① - 機械学習・自然言語処理の勉強メモ

                                    はじめに 今回は隠れマルコフモデルをStanで実装する。 隠れマルコフモデル自体は以前に書いた。 kento1109.hatenablog.com 今回は教師ありモデルを考える。 教師あり「隠れ状態」が既知のモデル。 前回の例で考えると、「晴れ→雨」などの遷移状態が与えられているモデル。 その状態から、「遷移行列」と「出力行列」を推定する。 モデル コードは以下のようにシンプル。 data { int<lower=1> K; // カテゴリーの数 int<lower=1> V; // 単語(word)の数 int<lower=0> T; // 時点の数 int<lower=1,upper=V> w[T]; // 単語(word) int<lower=1,upper=K> z[T]; // カテゴリー vector<lower=0>[K] alpha; // 推移(transit)確率の事前

                                    • MCMCの計算にStanを使ってみた(超基礎・導入編) - 渋谷駅前で働くデータサイエンティストのブログ

                                      肝心のMCMCの勉強はどこ行ったゴルァとか怒られるとアレなんですが、先にツールの使い方覚えてしまおうと思ってStanで簡単な練習をやってみました。ちなみに参考にした資料はこちら。 Stanチュートリアルの資料を作成しました。 - Analyze IT. StanTutorial 割とよく一緒に飲んでるid:EulerDijkstra氏のブログがとにかく役に立ちました。ありがとさんです!!! あと、MCMCやるのはこれが初めてという人は最低限久保先生の緑本ぐらいは読んでおいて損はないと思います。ただしStanではなくWinBUGSを{R2WinBUGS}で回す系ですが。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 2012/05/19メディア: 単行本購入: 16人 クリック

                                        MCMCの計算にStanを使ってみた(超基礎・導入編) - 渋谷駅前で働くデータサイエンティストのブログ
                                      • [Stan] 二つの時系列データの間に「差」があるか判断するには

                                        詳しい経緯は このまとめ を参照してください。時間軸でぶった切って各時点で検定を使う手法は、百歩譲って「差があるかどうか」は判定できるかもしれないけど、「どれほど異なるのか」については何も言えない。「どの時刻から異なるか」についても言えるか分からない。そこでベイズ統計モデリングで判断しようと思います。ベイズ統計モデリングでは多くの事前知識を仮定としてモデルに組み込みますが、検定も多くの仮定を前提にしている点は同様と思います。 データは雰囲気だけ似せて自作しました。野生型100個体、変異体10個体で1~24まで1時間ずつ測定して24時点としました。まとめを見ると144時間みたいですが24時間に簡略化します。データの構成は以下です。 type X1 X2 … X23 X24 0 0.071 0.555 … -0.236 -0.597 0 0.445 0.483 … -0.149 0.231 0

                                          [Stan] 二つの時系列データの間に「差」があるか判断するには
                                        • [Stan]生存時間分析のコードと便利なデータセットについて – かものはしの分析ブログ

                                          都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト はじめに 仕事で生存時間分析を使うことは結構あるのですが、マーケティングの良いデータセットがない印象でブログにしにくいと感じていました。また、Stanでの生存時間分析の事例もあまり把握していません。そこで使えそうなデータセットやStanのコードを探して、そのデータに対して生存時間分析を適用してみたいと思います。 目次 ・生存時間分析とは ・生存時間分析で使えるデータ ・生存時間分析をマーケティングで使う際の用途 ・先行研究 ・生存時間分析で使えるデータセット ・Sta

                                            [Stan]生存時間分析のコードと便利なデータセットについて – かものはしの分析ブログ
                                          • 援助交際してそうなアニメキャラランキング2015をstanで考える - 驚異のアニヲタ社会復帰の予備

                                            注意:本解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2015というものがある。某キャラはこの数年ぶっちぎりトップを走っている。 これを見た師匠が 「アニメの人気度とかそういうのも加味したほうがいいんじゃない?」 と言っていたので、こちらを参考にrstanを使って援交しそうなキャラは声優とアニメ人気度でどれくらい説明できるのかやってみる。 階層ベイズモデルとかstanってアニメデータの解析に使うものだという認識がおれの中であるので、詳しい人は正しい使い方を教えてほしい。 まずは上のリンクのテキストデータをきちんとした形に加工する。 # Python import re import unicodedata g = open("enko.txt", "rU") pat = ["\d+位", "\d+票", "[票|\s{2}\S]

                                            • Rで様々な表を書く。<br />パラメータの多いStanの結果も美しい表に。 – MrUnadon – Bayesian Statistical Modelings with R and Rstan

                                              まずはTwitterでこの記事をシェアする author: Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.1; rstan 2.10.1 はじめに Rを使う時、私はわざわざ表など使わず、”head(data)”なんかでデータの確認を済ませてしまったりすることが多いです。 でも、他人と共有するとなると、見せ方を考えなければならない。それで、面倒だけどエクセルにコピペして…とやっていました。 また、Rのコンソールに収まりきれないデータを確認したいときなども、何らかの手立てを考える必要があるとおもいます。 今回は、そんなデータの確認に使える”表の出力”についてまとめていきます。 本稿のお品書き package{DT}: dataframeをHTMLの表に一発変換(データが大きい場合有用) package{knitr}: dat

                                              • PyStan で「StanとRでベイズ統計モデリング」11.3節 - StatsFragments

                                                著者の松浦さんから「StanとRでベイズ統計モデリング」をいただきました。ありがとうございます! 書籍では Stan の R バインディングである RStan を利用していますが、Stan には Python 用の PyStan もあります。松浦さんが書籍 5.1節の PyStan での実行例を書かれています。 statmodeling.hatenablog.com 補足 PyStan については過去にも書いた内容があります。 sinhrks.hatenablog.com 同じように、「StanとRでベイズ統計モデリング」の内容を Python で実施してみました。 11.3 ゼロ過剰ポアソン分布 以降、書籍 "11.3節 ゼロ過剰ポアソン分布" の流れに沿って Python のスクリプトを記載します。ロジックや処理自体の説明は書籍をご参照ください。データと Stan のスクリプトは Gi

                                                  PyStan で「StanとRでベイズ統計モデリング」11.3節 - StatsFragments
                                                • 第1回BUGS/Stan勉強会を開催しました - Analyze IT.

                                                  こんにちはStanエヴァンジェリストの駆け出しベイジアンです。掲題の通り、第1回BUGS/stan勉強会を開催したので報告します。 BUGS/Stanって何? 改めて、BUGS/Stanとは何ぞやということを説明しておくとベイズ推定による柔軟なモデリングを実現するためのDSL言語です。 これでモデルを記述すると、非エンジニアなデータ解析屋のみなさんでも(比較的)簡単にデータ分析が出来ます! このあたりの技術は日本語で枯れていないのでこの勉強会を通して色々と技術を枯らして行きたいと思います。 特にベイズモデリングは恣意性が高く、細かいテクニックと経験が必要なのでそういった悩みのあたりも共有できたらと思っています。 会場はドリコムさんの100人くらいは入る広い会場をお借りしました。ドリコムさんに感謝!! 参加者は全員で10名程度でした。かなり高学歴な方ばかりが集まっていらっしゃったので大変恐縮

                                                    第1回BUGS/Stan勉強会を開催しました - Analyze IT.
                                                  • 『Pythonではじめる数理最適化』の7章「商品推薦のための興味のスコアリング」をStanで解く

                                                    この記事は確率的プログラミング言語 Advent Calendar 2023の12/8の記事です。 概要 『Pythonではじめる数理最適化』はいい本ですよね。親しみやすい実例、分かりやすい数式、きれいなPythonコードと三拍子そろっています (今年のアドカレで改訂版が近いうちに出ることを知りました)。 7章「商品推薦のための興味のスコアリング」では、「何日前に直近の閲覧があったか」と「閲覧回数」の二つの軸で興味のスコアを考えます。興味のスコアが単調減少であるという制約のもと、再閲覧の割合と推定値の二乗誤差を最小化するという凸二次計画問題として解いています。この記事ではStanで解くとこんな感じですというのを示します。メリットとしてベイズ信頼区間も推定されます。 データ 公式のリポジトリの7章のipynbファイルを途中まで実行して得られるデータフレームrf_dfを使用します。他の人の扱い

                                                      『Pythonではじめる数理最適化』の7章「商品推薦のための興味のスコアリング」をStanで解く
                                                    • Stan超初心者入門

                                                      Stanの初心者が基本的な統計モデルを実行するまでの解説です。プログラミング初心者向けに書いているので,やや説明が遠回りなところもあります。

                                                        Stan超初心者入門
                                                      • [stan][R] RFM分析と階層ベイズ法 (解決編) - ill-identified diary

                                                        概要 前回の『[python] [stan] 潜在変数と階層ベイズ法と RFM 分析 [未完成] - ill-identified diary』の完成版. 忙しくて1年近く放置していた…… パラメータを推定し顧客ごとの生涯顧客価値 (CLV) の計算まで実行できた. stan は 2.14.0 を利用. 前回のは 2.9 で, 2.10 以降は構文が大きく変わっているので注意. 前回の「プログラム」以外のセクションを読んでからこちらを読むことをおすすめする. 文章量は4ページ (画像とプログラム除く) 反省点実は, こちらですでに RF 分析についての stan の一部正解コードが書かれている.abrahamcow.hatenablog.com 前回の一番の問題点は, 原理上離散的なパラメータを扱えないハミルトニアンモンテカルロ (以下, HMC) 法で を無理やり離散パラメータとして扱お

                                                          [stan][R] RFM分析と階層ベイズ法 (解決編) - ill-identified diary
                                                        • Stanコードの書き方 中級編

                                                          広島ベイズ塾夏合宿で発表したStanコードの書き方中級編です。 回帰分析から,一般化線形モデル,欠損値のあるモデル,潜在変数があるモデル,ゼロ過剰分布,混合分布モデルを扱いました。

                                                            Stanコードの書き方 中級編
                                                          • 「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」書評 - nora_goes_far

                                                            この記事について 著者の馬場真哉様より、2019年7月10日に講談社より発売の、「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」をご恵投いただきました。ありがとうございます!! www.kspub.co.jp 事前に献本をいただけるということを伺っていたので、その時から「ご恵投いただきました!」とTwitterで報告するだけでなく、簡単にでも読んでみた感想を書こうと決めていました。 まだざっと読んだ段階で、コードを実際に走らせてもいないのですが(もちろん後でじっくり読みながら実行します)、感想や関連書籍との比較をしていきたいと思います。 本記事の方針 本書の「はじめに」の部分やサポートページには、以下のような方を対象読者としていると書かれています。本記事も、そのことを念頭に書いていこうと思います。 統計学の基礎やベイズの定理などの基本事項を学んでみたものの、その有効性が

                                                              「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」書評 - nora_goes_far
                                                            • Tony MorrisとStan Millerとパナマ文書

                                                              一時はエンジニア業界で話題となっていたリクルーター「トニー・モリス」 彼のファンは多く、ミートアップまで開催されました。 http://connpass.com/event/23729/ トニー・モリスは、恵比寿にあるApex KKという会社の子会社である「J-Tech international」のリクルーターですが、どうやら(やっぱり)架空の人物みたいです。 ところで、最近、彼はなりを潜めたが「Stan Miller」というJ-Tech Internationalのキャリアコンサルタントからメールが新たに届いていますね。 Tony MorrisとStan Millerの所属するJ-Tech internationalのドメインをWhoisで調べてみると、会社の住所が出てきます。 http://whois.do-reg.jp/jtech-int.jp (ちなみに、この住所でググると建築事

                                                                Tony MorrisとStan Millerとパナマ文書
                                                              • Stan モデリング言語: ユーザーガイド・リファレンスマニュアル

                                                                図4.4: Stanの変数宣言の型と対応するプリミティブな実装の型の表. Stanの関数・演算子・確率関数は引数と戻り値の型を持ち, それらはプリミティブな型と配列次元数によって宣言されます. 型推定の規則 Stanの型推定規則は, 変数宣言の背後にある組み合わせに基づいて, ある式の実装の型を定義します. この規則は, プリミティブなリテラルと変数の式から, 複合した式へとボトムアップに作用します. リテラル 42のような整数リテラルの式はint型です. 42.0のような実数リテラルはreal型です. 変数 局所的に, あるいは前のブロックで宣言された変数の型はその宣言で決定されます. ループ変数の型はintです. 各変数の宣言は, スコープ毎に常に唯一となります. Stanでは, 既に宣言された変数をもう一度宣言することを禁止しているからです. 5 インデックス操作 xが全体の次元数が

                                                                • Stanによるベイズ推定の基礎 | Logics of Blue

                                                                  新規作成日:2015年12月5日 最終更新日:2016年9月22日 理論がわかっても、実践ができなければ意味がありません。 ここでは、Stanというフリーソフトを使って、ベイズ統計学をもとにしたパラメタ推定をパソコンで実行する方法を説明します。 ベイズとMCMCの組み合わせでもって統計モデルのパラメタを推定することができるのでした。この方法を、以下では「ベイズ推定」と呼ぶことにします。 ここでは、Stanを用いて統計モデルのパラメタのベイズ推定をする方法を説明します。 重要な点は、「Stanの使い方」を覚えるだけではうまくいかないということです。 Stanの内部で使われているのは乱数生成アルゴリズムです。乱数を生成してパラメタを推定するという行為は、最小二乗法なりで方程式を解き、パラメタを一発で推定するやり方とは大きく異なります。 その違いをぜひ理解なさってください。 コードをまとめたもの

                                                                  • Stan(MCMC サンプリング)を使ったクラウドサービスセットアップ時間の推定 - Cybozu Inside Out | サイボウズエンジニアのブログ

                                                                    サイボウズ・ラボの中谷です。 先日、このブログでインフラチームの湯谷さんが R と統計の社内勉強会での資料を公開する記事を書いていましたが、同じくその社内勉強会で行ったクラウドサービスのデプロイ時間を分析したお話をします。 blog.cybozu.io 5分で使えるクラウドサービス サイボウズでは cybozu.com というクラウドサービスを展開しています。 クラウドサービスといえば「申し込んですぐ使える」のが一般的なイメージでしょう。 cybozu.com も web サイトから申し込むと、5~10分でサービスが利用可能になります。 これを実現するために、インフラ担当者が24時間待機しておき、申し込みの通知を受付けたらデータベースを切って、サービスインスタンスに申し込まれたアプリケーションをデプロイして……なんてことをしていたら担当者がすぐに倒れてしまうので、そこのところは当然自動化さ

                                                                      Stan(MCMC サンプリング)を使ったクラウドサービスセットアップ時間の推定 - Cybozu Inside Out | サイボウズエンジニアのブログ
                                                                    • 第2回BUGS/Stan勉強会を開催しました - Analyze IT.

                                                                      新年、あけましておめでとうございます。今年もよろしくお願い致します。 さて、昨年末のことで遅くなってしまい大変恐縮ですが、第2回BUGS/Stan勉強会を開催致しました。 BUGS/Stanって何? 前回のBlogの繰り返しではありますが、BUGS/Stanとは何ぞやということを説明しておくとベイズ推定による柔軟なモデリングを実現するためのDSL言語です。 これでモデルを記述すると、非エンジニアなデータ解析屋のみなさんでも(比較的)簡単にデータ分析が出来ます! このあたりの技術は日本語で枯れていないのでこの勉強会を通して色々と技術を枯らして行きたいと思います。 特にベイズモデリングは恣意性が高く、細かいテクニックと経験が必要なのでそういった悩みのあたりも共有できたらと思っています。 Togetterまとめ xiangze750さんがTogetterで今回の勉強会に伴うつぶやきを纏めてくださ

                                                                        第2回BUGS/Stan勉強会を開催しました - Analyze IT.
                                                                      • Amazon.co.jp: StanとRでベイズ統計モデリング (Wonderful R): 健太郎,松浦 (著), 基広,石田 (監修): 本

                                                                          Amazon.co.jp: StanとRでベイズ統計モデリング (Wonderful R): 健太郎,松浦 (著), 基広,石田 (監修): 本
                                                                        • アディダスオリジナルス STAN SMITH(スタンスミス)AQ4651ネイビーを購入したのでレビューとオススメの手入れ法 - Jailbreak

                                                                          自分とスタンスミスは10年来の付き合いになる。2000年代のキレイ目の格好が流行った頃に出会ってはいたが、その頃はconverseのOne Starや同じadidasでもSUPERSTARを履いていた。これはこれで良いスニーカーだったのだが、その後はずっとSTAN SMITHをメインで愛用している。 Embed from Getty Images 10年ほど前にABCマートで購入した緑のSTAN SMITHがさすがにヘタってきて、歩くたびにギュウギュウ音を立てるようになった。おいおい、革靴の様に音を立てないで歩けるからスニーカー(sneaker)なのに、音を立てるのは流石にいただけない。綺麗には履いてきたが、もうそろそろ別な色にしたいし、去年一昨年くらいからSTAN SMITHがリバイバルしだしているのは知っていたので、タイミング的にも丁度よいかなと思ったのだ。 STAN SMITHの魅力

                                                                            アディダスオリジナルス STAN SMITH(スタンスミス)AQ4651ネイビーを購入したのでレビューとオススメの手入れ法 - Jailbreak
                                                                          • Stanで統計モデリングを学ぶ(3): ざっと「Stanで何ができるか」を眺めてみる - 渋谷駅前で働くデータサイエンティストのブログ

                                                                            実は業務でもStan使い始めてるんですが、まだまだ単位根ありパネルデータの分析に回すなど低レベルなものが多く、無情報事前分布と階層事前分布を巧みに使いこなして華麗にサンプリング。。。なんて夢のまた夢という情けない状況です(泣)。 で、気が付いたら@berobero11さんのStan関連ブログ記事が超絶充実していて、久保先生もびっくりみたいな状況に。もはや僕が何かをだらだら書くのもアホらしいので、先にStanの使い方を覚えたいという方は是非@berobero11さんのブログから読んで下さい(笑)。僕はひたすらそちらの記事を(例えばinfer.NETあたりの例題を解きながら)トレースしていくだけのショボい記事をだらだら書いていこうと思ってます。 ということで、とりあえずStanマニュアルであるstan-reference-2.1.0.pdfを斜め読みして*1、ざっと僕が興味のある範囲でまとめた

                                                                              Stanで統計モデリングを学ぶ(3): ざっと「Stanで何ができるか」を眺めてみる - 渋谷駅前で働くデータサイエンティストのブログ
                                                                            • Stanで統計モデリングを学ぶ(5): とりあえず階層ベイズモデルを試してみる(応用編:トレンドのあるモデル) *追記2件あり - 渋谷駅前で働くデータサイエンティストのブログ

                                                                              このシリーズ記事、全然真面目に事前分布の勉強をしていない人間がStanで無理やりフルベイズをやろうという無謀な代物でございますが、何だかんだで段々佳境に入ってまいりました。 ということで、今回は階層ベイズモデルをこんな感じでやってみましたという例を挙げてみようかと思います。ちなみに内容的には@berobero11さんのこちらの記事(「RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた」)をグレードダウンさせた感じのものだったりします(笑)。そして先日招待講演させていただいた時の最後の方で取り上げた例でもあります。 そんなわけで、どのようにしてやっていったかを含めてサクサク見ていきましょう。階層ベイズについて忘れちゃったという人は、前回の記事あたりを読んで復習してもらえれば。 データをインポートする いつも通り、サンプルデータをGitHubに上げてあるので持

                                                                                Stanで統計モデリングを学ぶ(5): とりあえず階層ベイズモデルを試してみる(応用編:トレンドのあるモデル) *追記2件あり - 渋谷駅前で働くデータサイエンティストのブログ
                                                                              • StanとRでレプリカ交換MCMC(parallel tempering) を実行する - StatModeling Memorandum

                                                                                本記事は発展的な話題です。かつて@Med_KUさんのブログ記事「てさぐれ!!RStanもの」で出てきた例題は局所最適値(local minimum)が多くて、Stanで実行する際も初期値をかなりピシッと決めておかないとダメな例題でした。 しかし、モデルが高次元になってくると最初から“それらしい”初期値なんて分かりようがないし、そもそも理論的にはどんな初期値からはじめても長い間iterationをとれば大域最適値に到達してほしいです。しかし、Stanとは言え、現実的な時間内では局所最適値につかまります。溝が少し深いと出てこれません。そんな状況を打破するための発展的なMCMCの手法の1つに「レプリカ交換MCMC(replica exchange MCMC)」というものがあります。パラレルテンパリング(parallel tempering)としても知られています。 例によってここでは詳しく説明し

                                                                                  StanとRでレプリカ交換MCMC(parallel tempering) を実行する - StatModeling Memorandum
                                                                                • Tokyo.stanの感想 - xiangze's sparse blog

                                                                                  stan開発者の一員であるBetancourtさんを招いたTokyo.stanを聴きにいきました。 Michael Betancourt's Stan Lectureを開催しました - StatModeling Memorandum 自分はstanを余り使いこなせていないのですが、主にアルゴリズムと実装に関する感想を書きます。 HMCの説明をされている中で推定されるべき事後分布の関数の等高線を回るようにサンプルしているという説明が非常に明快でした。事後分布の勾配である"重力"に対して直交する方向に運動量が存在すれば分布の極大値にとどまらずにその周囲を回るようにサンプリングがされます。ニュートン力学そのものです。 赤が勾配、青が運動量 最適化問題は山を登るか(下る)ような勾配系の問題としてイメージできますが、MCMCは分布を推定するので相空間を等エネルギー面に沿ってぐるぐる回るハミルトン系の

                                                                                    Tokyo.stanの感想 - xiangze's sparse blog