並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 900件

新着順 人気順

ベイズの検索結果161 - 200 件 / 900件

  • 新型コロナ第一波を総括する

    2月、新型コロナウイルス感染が発生した大型クルーズ船「ダイヤモンド・プリンセス号」に対応するため、派遣された自衛隊(GettyImages) 新型コロナウイルスの第一波は収束しつつある。政府は5月14日に39県、5月21日に近畿3府県、そして5月25日には残る5都道県についても緊急事態宣言の解除を発表した。日本政府の対応には色々な批判はあったが、死者数でみると日本の対応は明らかに他国よりも優れていたと言えるだろう。その成功の要因は何か、逆に日本の弱点は何だったかについて、記憶が風化しないうちに一度総括しておくことは重要であると思う。 社会の危機は、普段覆い隠されている物事の本質を曝け出す作用を持つ。そして、本当に必要なものと、実は不要なものが無慈悲に露呈する。これは東日本大震災のときも同じであった。東日本大震災において活躍したのは、原発作業員、消防士、自衛隊員、警察官、消防団員、地元自治体

      新型コロナ第一波を総括する
    • 「東京の感染者数を5週間ぶん予測した」に勝負を挑んだ:3日目

      anond:20210706090858 ★7月9日ほぼ的中★「東京の感染者数を5週間ぶん予測した」に勝負を挑んだ:4日目 → anond:20210709180450予測対決 結果発表(7/6 - 7/11)Knoa氏(王者)の予測 anond:20210705212509私(挑戦者)の予測 anond:20210705233157結果曜日Knoa氏予測私の予測実際の感染者数 勝敗コメント 7/6 (火) 705 642 593 1勝0敗 0分 楽勝っす。明日も楽しみっす。 7/7 (水) 1031 982 920 2勝0敗 0分 楽勝っす。明日も楽しみっす。 7/8 (木) 962 814 894 2勝1敗 0分 14人差でまさかの惜敗っす。明日こそ勝ち越しを決めるっす。 7/9 (金) 945 823 ? ?勝?敗 0分 7/10 (土) 967 967 ? ?勝?敗 1分 引き分

        「東京の感染者数を5週間ぶん予測した」に勝負を挑んだ:3日目
      • 統計初心者が統計モデリング力を鍛えるための勉強法 - Qiita

        以前、『結局、統計モデリングとは何なのか』という記事を書きました。 この記事は、その名の通り、「そもそも」何が統計モデリングで、何が統計モデリングではないのかということを扱った記事です。 今回は、「統計モデリングとは何か」を理解した方に向けて、実際に「統計モデリング力」を鍛えるためにはどうするかを書いていきたいと思います。 この記事の目的と対象者 上記でも述べたようにこの記事の目的は、どのように「統計モデリング力」を鍛えるかを書くことです。 統計学に入門するところから、高度な統計モデルを扱えるようになるまでの勉強法について書いています。 したがって、統計初心者からそれなりに理解している人までの幅広い層が想定読者となります。 ところどころで、プログラム言語で実際に手を動かしながら学ぶタイプの本を紹介することもありますので、そういった本を読むためにはPythonまたはRの知識が必要になります。

          統計初心者が統計モデリング力を鍛えるための勉強法 - Qiita
        • ベイズ最適化で最高のコークハイを作る - わたぼこり美味しそう

          はじめに コークハイとか酎ハイをお店で飲むと、割り方とかレモンが効いていたりとかでお店によって結構違いが出ますよね 自分好みの最高のコークハイの作り方を知ることは全人類の夢だと思います。 本記事は一足先にそんな夢に挑戦したという記事です。 手法としてはベイズ最適化を使用します。 実データで実験計画と絡めながらベイズ最適化を実際に行う記事はあまり見かけなかったので今回は、 最適化パラメータ 1. コーラとウイスキーの比 2. レモン汁の量 目的変数 コークハイの美味しさ という2次元入力、1次元出力で実際に実験とチューニングを並行しながら行ってみたいと思います。 目次 はじめに ベイズ最適化とは 実験系の説明 実験条件 実験で考慮しないこと(パラメータ) 実験材料 実験方法 スコアの付け方 実験をやりました(本題) 実装コード 実験開始 ARDありver. 反省点 さいごに ベイズ最適化とは

            ベイズ最適化で最高のコークハイを作る - わたぼこり美味しそう
          • 機械学習の手法13選 ー 初級者、中級者別に解説! | AI専門ニュースメディア AINOW

            こんにちは、AINOWインターンのゆかわです。 早速ですが、機械学習を勉強し始めたばかりの初級者の方は、機械学習に用いられている手法が多過ぎて、どれを知っておいた方がいいのかわからなくなっていませんか? また、ある程度勉強を進めてきた中級者の方の場合は、実際に機械学習を使うにあたって、どのようにして手法を選択すれば良いか困っていませんか? 今回はそのような初級者、中級者の方へ向けた記事となっています。 この記事の構成について ①チートシート この記事ではまず、チートシートと呼ばれる、解決したい課題ごとにどの手法を使えばいいかが一目でわかる表を用意しています。 この表は中級者の方の手法選択の手助けはもちろん、初級者の方にとっても機械学習の手法の概観を捉えるものとして役に立つはずですので、ぜひご活用ください。 ②手法選択のコツ 上で述べたチートシートを使って機械学習の手法を選ぶ際の、ポイントを

              機械学習の手法13選 ー 初級者、中級者別に解説! | AI専門ニュースメディア AINOW
            • 報酬確率分布の変化に応じたBandit Algorithm〜論文解説:A Linear Bandit for Seasonal Environments〜 - MonotaRO Tech Blog

              はじめに MonotaROとBandit Banditの着目理由 MonotaROにBanditを導入する際の課題 A Linear Bandit for Seasonal Environments 論文概要 背景と動機 提案手法 実験 まとめ おわりに はじめに はじめまして、データサイエンスグループの岡林です。普段はbanditなどの強化学習を用いてUIの最適化に取り組んでいます。 このブログでは最近MonotaROが注目しているbanditの概要を紹介しつつ、その中でも事業特性にあったbanditアルゴリズムにフォーカスし、論文を解説します。 MonotaROとBandit Banditの着目理由 MonotaROでは、商品単位レベルでのUI最適化に取り組んでいます。例えば、商品に応じて商品ページのコンテンツ文言などを変化させ、より適切なUIを提供することに取り組んでいます。具体的に

                報酬確率分布の変化に応じたBandit Algorithm〜論文解説:A Linear Bandit for Seasonal Environments〜 - MonotaRO Tech Blog
              • PFNが提供する教育コンテンツについて - Preferred Networks Research & Development

                PFNフェローの丸山(宏)です。2月にプログラミング教育についてのブログを書きました。またそれに合わせて制作した教材を利用して、6月に弊社カフェテリアで、小学生を対象にした体験教室を開催しました。この体験教室については、丸山(史郎)がロボットカーの体験教室について、西澤が火星語翻訳を題材にした教材について書いています。今回、山梨大学と共同で、高専・大学学部向けの教材 ロボットカーで学ぶ深層学習の基礎 を開発しました。このブログでは、これら一連の教育関連の活動について、その意義と全体像をもう一度整理してみたいと思います。 また、付録に、現在PFNが提供する教育用コンテンツのリストがありますので、そちらもご利用ください。 古典的プログラミング 2016年に文部科学省が主宰する「小学校段階における論理的思考力や創造性、問題解決能力等の育成とプログラミング教育に関する有識者会議」は、議論の取りまと

                  PFNが提供する教育コンテンツについて - Preferred Networks Research & Development
                • SLO サービスレベル目標

                  サービスレベル目標(SLO)とは、ユーザーの満足度に強い相関があるメトリクスを用いた、開発と運用の目安となるものです。SLOに基づいた運用は、ユーザー視点で高い信頼性を持つサービスを提供する上で最も重要なプラクティスであるとともに、ビジネス指標に紐づく運用方法でもあります。本書は、SLOを導入する際に必要となる基礎概念、実装、文化を解説します。 はじめに、SLOの概要、サービスレベル指標(SLI)の設定、エラーバジェットの使い方などSLOの基本について説明します。そしてSLIとSLOの計測、確率と統計を使ったSLOの活用法、SLOを組み込むアーキテクチャやシステムについて解説します。さらに、組織内での同意の獲得やSLOの提唱など、SLOに基づくアプローチをチームや会社全体に根付かせる効果的な方法を紹介します。 本書への推薦の言葉 序文 監訳者まえがき はじめに 第I部 SLOの開発 1章 

                    SLO サービスレベル目標
                  • 心理学は信頼できるのか? 再現性の問題【心理学】|手記千号

                    心理学は重要な学問だと思っている。 心理学上の研究成果は、法学、経済学、社会学、教育学、哲学、文学に至るまでさまざまな学問で援用されている。 重要かつ影響力のある学問だと思っているからこそ、最近は集中的に色々と読んでいるわけだが、同時に警戒感もあった。 先日、心理学の入門書の目次を眺めたところ、心理学研究手続上の諸問題について書かれた項目をみつけた。読んでみると、10年ほど前にショッキングな事実が続けざまに発覚し、心理学は危機を迎えたという。 内容が衝撃的であったので、素人ながら調べて考えてみた。そうとうな長文になってしまったが、それは驚きの反動である。 1 心理学における再現性の危機 2010年代、心理学研究の信頼性を揺るがせる大事件が立て続けに発生した。 2011年には、ダリル・ベムという社会心理学・パーソナリティ心理学分野における重鎮が、人間の予知能力を確認したとする研究論文を、世界

                      心理学は信頼できるのか? 再現性の問題【心理学】|手記千号
                    • なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録

                      前回「ベイズ統計学に関する議論を整理する」では、できるだけ中立的な視点で書くことに注力し、伊津野なりの結論については特に書かなかった。今回のエントリでは、様々な見解や調べた結果を元に私見を書く。 もちろん、伊津野は専門家ではなく、情報や理解が不足する部分については想像で補ったため「それはおかしい」と感じられる点もあるだろう。そのような記述を見つけたら、単に批判を書くのではなく、なぜ問題だと思うのか、自身のブログやTwitterなどで他の人間にも理解できるように論点を明確に書くようにしてほしい。うんこの投げ合いはうんざりだ。それに、コメント欄に批判や反論を書かれても、伊津野の理解力では適切な回答ができるとは思えない。広い範囲に意見を投げかけた方がより専門的な回答が得られ生産的だろう。*1 前置きが長くなったので本論に移ろう。 まず先に結論を述べる。現在、ベイズ統計学は「(頻度主義とは異なる)

                        なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録
                      • 強みは「モデルの柔軟性」「包括性」「プライバシー性」 バンダイナムコネクサスが実装したMMMの利点

                        バンダイナムコネクサスは、バンダイナムコグループの中でも最大規模のデータ分析チームを抱えている会社で、ゲーム分析を始めとしたバンダイナムコグループのエンタメ領域全般のデータ分析を幅広く手掛けています。ここでは、バンダイナムコネクサスの山田元太氏が、Marketing Mix Modelingの開発と実装について紹介しました。 バンダイナムコネクサスのデータストラテジーオフィス 山田元太氏(以下、山田):では最後の発表になります。長丁場でみなさんお疲れかと思いますが、最後もう少しだけお付き合いください。「アプリゲームにおけるMMM開発と実装」というテーマで発表を始めます。本日のアジェンダはこの4点で、まず自己紹介と会社紹介をいたします。 あらためまして、山田元太と申します。所属はバンダイナムコネクサスのデータ戦略部データストラテジーオフィスというところで、BNXと略される会社です。あと、兼務

                          強みは「モデルの柔軟性」「包括性」「プライバシー性」 バンダイナムコネクサスが実装したMMMの利点
                        • 数学の雑学・小ネタで打線組んだ : 哲学ニュースnwk

                          2021年02月05日08:00 数学の雑学・小ネタで打線組んだ Tweet 1: 名無しさん@おーぷん 20/10/23(金)19:15:24 ID:ToV ワイの独断と偏見で「面白い」「重要だ」「感動した」と思ったネタを選んだで 1(右) 四色定理 2(三) ハムサンドイッチの定理 3(二) 1+2+3+4+....=-1/12 4(一) モンティ・ホール問題 5(遊) 大数の法則 6(中) 巡回セールスマン問題 7(左) 二人零和有限確定完全情報ゲーム 8(指) ラムゼーの定理の系 9(捕) フェルマーの最終定理 先発 バナッハ・タルスキーのパラドックス 中継 ヒルベルトの無限ホテル 抑え ラッセルのパラドックス 監督 ゲーデルの不完全性定理 2: 名無しさん@おーぷん 20/10/23(金)19:16:10 ID:QcW エキゾチック球面 11: 名無しさん@おーぷん 20/10/

                            数学の雑学・小ネタで打線組んだ : 哲学ニュースnwk
                          • 機械学習モデルを組み込んだ Web アプリを Python 初心者が作ってみた - RAKUS Developers Blog | ラクス エンジニアブログ

                            こんにちは。開発エンジニアの amdaba_sk(ペンネーム未定)です。 前回は「機械学習をコモディティ化する AutoML ツールの評価」、だいぶ間が空きましたが前々回は「機械学習のライブラリ・プラットフォームをいくつか試した所感まとめ」と、続けて機械学習をテーマとした記事を書きました。 これらの記事では機械学習モデルを作るまでのことしか言及していませんが、機械学習モデルは作ってそれで終わりのものでもありません。使ってなんぼのものなんです。かみせんプロジェクトとしての調査範囲からは外れますが、せっかくモデルを作ったならそれを使ったアプリも簡単なものでいいので作ってみたい。そう思うのは開発者として自然な感情ではないでしょうか。 というわけで今回は、「機械学習モデルを組み込んだ Web アプリを Python 初心者が作ってみた」という個人的な興味からやってみた系記事でございます。 なお後に

                              機械学習モデルを組み込んだ Web アプリを Python 初心者が作ってみた - RAKUS Developers Blog | ラクス エンジニアブログ
                            • 『「数理科学を使えば統計の”主義”を争う必要ない」という主張について検討する』

                              ・はじめに 統計学の歴史では、頻度主義とベイズ主義という異なる立場の方法が存在し、違いに論争を繰り広げてきました。しかし、近年の統計学者の中には「現代の統計学は数理的な方法に基づいているから、主義の争いは解決した」と考える人もいるようです(この立場のことを、この記事では便宜的に「統計数理による主義不要論」と呼ぶことにします)。この記事では、「統計数理による主義不要論」に対して私なりの反論を考えてみることにします。論点は、以下の3つです。 1.     「“数理的な方法”を使っても、主義の争いが解決しない」ということを示唆する事実が存在する 2.     頻度主義とベイズ主義の論争を「どちらの方法が正しいか」という争いとして捉えると論争の全体像を見誤る 3.     WAICに代表される現代ベイズ法の意義は、「数理によって主義の争いを解決した」のではなく「仮にあなたが頻度主義的な価値観を重視

                                『「数理科学を使えば統計の”主義”を争う必要ない」という主張について検討する』
                              • ウェブ最適化ではじめる機械学習

                                ウェブサービスの開発に携わるかぎり、ユーザにより良い体験を提供することは無視できない命題です。本書は、ウェブサービスを成長させることを目的に、ユーザの行動を定量的に評価し、改善する手法を学ぶ書籍です。 シンプルなA/B テストを第一歩に、線形モデルの導入、メタヒューリスティクス、バンディットアルゴリズム、ベイズ最適化と、機械学習の知識を紹介しながら、ウェブサイトを最適化するという現実的な問題を解くための数理的な手法を解説します。 Pythonによるサンプルコードと、グラフィカルな図版で表現された数学的なモデルを組み合わせ、機械学習と統計学の基礎を丁寧に解説しています。ウェブ最適化の手法を学びたい、機械学習の基礎を知りたい読者に最適の1冊です。 内容見本 まえがき 2章の冒頭部分 関連ファイル 1章のサンプルコード 2章のサンプルコード 3章のサンプルコード 4章のサンプルコード 5章のサン

                                  ウェブ最適化ではじめる機械学習
                                • まえがき: 渡辺澄夫ベイズ理論の素晴らしさを多くの方に伝えたい | 機械学習の数理100問シリーズ

                                  渡辺澄夫先生と初めてお会いしたのは、私が産総研の麻生英樹先生が主催していた研究会に呼ばれて、90分程度のセミナーで話をしたときでした。大阪大学に(専任)講師として着任した1994年の初夏で、ベイジアンネットワークの構造学習に関する内容だったと思います。そのときに、2-3分に1回くらい、終わってみると全部で20-30回くらい私に質問をされた方がいました。その方が渡辺先生でした。 渡辺先生が、「学習理論の代数幾何的方法」というタイトルで、IBIS(情報論的学習理論ワークショップ)という機械学習の研究会で講演されたのは、それから5年ほど後のことでした。私自身も当時、代数曲線暗号や平面曲線に関する論文も書いていて(J. Silverman氏との共著論文は、100件以上引用されている)、ベイズ統計学と代数幾何学はともに自信がありました。しかし、渡辺先生のIBISの話は、オリジナリティに富みすぎていて

                                  • 尤度とはなんだったのか

                                    TL;DR Ubie という会社で働いていて尤度とかを改めて見直す機会があったのでブログにまとめておく 尤度主義のような、自然と使っていたが明示的には知覚できてなかったものの存在を知った 主義や哲学に関しても言及するが、それらの良し悪しについて述べるものではない 4/1 から Ubie という会社に入社して、データ分析的な仕事やコードを書いたり楽しく働いている。 保有するデータのそのものが面白くて、今のところ主にこれを改善していくところに関わっていて、機械学習的な内容はあまりやっていない。 仕事をしていると尤度とかよく使うが、使っているうちにこれまで雑に理解してた部分が散見されたので、そもそも尤度とはなんだったのかをちょっと復習している。 色々調べていくとだいぶ広くて深いところに入り込んでしまいそうになるので、現在の理解を一部ブログにて整理しておこうというのがこのエントリである。 技術的に

                                      尤度とはなんだったのか
                                    • 『ウェブ最適化ではじめる機械学習』を出版しました。 — Shuhei Iitsuka

                                      Tue Feb 09 2021 00:00:00 GMT+0000 (Coordinated Universal Time) 昨年の 11 月にオライリー・ジャパンから『ウェブ最適化ではじめる機械学習』という本を出版しました。大変ありがたいことに、いくかのブログで取り上げていただけているようです。 出版してから少し日が経ちますが、まだギリギリ新刊かなということで、書籍の紹介と舞台裏の話を書きたいと思います。 何の本? ひとことで言うと、ウェブエンジニア/ウェブマーケターこそ機械学習に入門するのに最適な役職なんだよ!という本です。 私は普段ウェブサイトのフロントエンドエンジニアとして仕事をしていますが、仕事の中で機械学習との接点はあまりないように感じます。ひとことでウェブエンジニアリングと言ってもその範囲は広いので一般化は難しいですが、基本的には HTML / CSS / JavaScrip

                                        『ウェブ最適化ではじめる機械学習』を出版しました。 — Shuhei Iitsuka
                                      • 『大塚(2020)「統計学を哲学する」を読む』

                                        光栄にも大塚淳先生より新著「統計学を哲学する」(名古屋大出版会: 以下「本書」)を御恵投いただきました。御礼に替えて、簡単に内容を紹介し議論をしていこうかと思います。特に本書が導入した「存在論」「意味論」「認識論」という三つの区別の意義を大久保の視点から論じます。最後に、私が関心を持った今後の展開について言及します。 ・はじめに 科学哲学とは、どのような分野なのだろうか。もちろん私が考えるにはあまりにも大きすぎる問だが、他の人に紹介するなら「科学における概念や論争を分析すること」あるいは「ある学術的主張の背後で暗黙的に措定されている前提を分析すること」と答えるかもしれない。本書の著者がTwitter述べた通り、 Jun Otsuka@junotk_jp あと哲学っていうと論理が及ばないところを棍棒で殴り合う、っていうイメージがあるみたいだけど、それは全くの誤解ですね。むしろ私のイメージする

                                          『大塚(2020)「統計学を哲学する」を読む』
                                        • Pythonで動かして学ぶ!あたらしい数学の教科書 機械学習・深層学習に必要な基礎知識 | 翔泳社

                                          AI開発に必要な数学の基礎知識がこれ1冊でわかる! 【本書の目的】 本書は以下のような対象読者に向けて、 線形代数、確率、統計/微分 といった数学の基礎知識をわかりやすく解説した書籍です。 【対象読者】 • 数学がAIや機械学習を勉強する際の障壁になっている方 • AIをビジネスで扱う必要に迫られた方 • 数学を改めて学び直したい方 • 文系の方、非エンジニアの方で数学の知識に自信のない方 • コードを書きながら数学を学びたい方 【目次】 序章 イントロダクション 第1章 学習の準備をしよう 第2章 Pythonの基礎 第3章 数学の基礎 第4章 線形代数 第5章 微分 第6章 確率・統計 第7章 数学を機械学習で実践 Appendix さらに学びたい方のために 序章 イントロダクション 0.1 本書の特徴 0.2 本書でできるようになること 0.3 本書の対象 0.4 人工知能(AI)と

                                            Pythonで動かして学ぶ!あたらしい数学の教科書 機械学習・深層学習に必要な基礎知識 | 翔泳社
                                          • MCMCをフルスクラッチで実装するトレーニング方法 - Qiita

                                            はじめに 東京大学・株式会社Nospareの菅澤です. 今回はベイズ統計を用いたデータ分析を実施する上で欠かせないマルコフ連鎖モンテカルロ法(いわゆるMCMC)をフルスクラッチで実装するためのトレーニング方法と,そのための参考書について紹介いたします. 最近ではstanのように,モデルと事前分布を記述するだけで汎用的にMCMCが実行できてしまう環境が整っていますが, そもそもMCMCがどういう流れで動いているのか理解する stanなどの汎用ツールがうまく使えない(orうまく動かない)場面に遭遇したときに自分の手で実装できるようにする ためには,標準的なモデルでMCMCをフルスクラッチで実際に組んだ経験が重要になってくると思います. 参考書について トレーニングのために私がオススメするのは以下の本です. J. Chan, G. Koop, D. J. Poirier, J. L. Tobia

                                              MCMCをフルスクラッチで実装するトレーニング方法 - Qiita
                                            • RecBole を用いてクックパッドマートのデータに対する50以上のレコメンドモデルの実験をしてみた - クックパッド開発者ブログ

                                              こんにちは。研究開発部の深澤(@fufufukakaka)です。 本記事では最近面白いなと思って watch しているレコメンド系のプロジェクト RecBole を紹介いたします。また、クックパッドが展開している事業の一つであるクックパッドマートのデータを使って数多くのレコメンドモデルを試す実験も行いました。その結果も合わせて紹介します。 TL;DR: レコメンドモデルは作者実装に安定性がなく、またモデルをどのように評価したかも基準がバラバラで、再現性が難しいとされている(from RecSys 2019 Best Paper) 再現性に取り組むプロジェクトとして 2020年12月に始まった RecBole がある。 RecBole を利用することでなんと 50個以上のレコメンドモデルを大体1コマンドで試せる クックパッドマートでユーザに対してアイテムをレコメンドするシチュエーションを想定

                                                RecBole を用いてクックパッドマートのデータに対する50以上のレコメンドモデルの実験をしてみた - クックパッド開発者ブログ
                                              • 中日スポーツ:当てることと勝つことの間

                                                競艇ほど当てることと勝つことの違いを教えてくれるギャンブルはない。1枠に賭ければ52%も当たるが、資金は着実に減っていく。勝つための戦略は存在しないのだろうか? 競艇は300メートル離れたブイ(ターンマーク)を左回りに3周するボートレースだ。スタートラインを時速80キロで通過した選手は、4秒後には第一ターンマークを旋回する行動に移らなければならない。レースを初めて見る人の目にも、一番内側を走る1枠(1コース)が有利だと分かる。 選手はスタート前の駆け引き(待機行動)で内側のコースを取ろうとするが、この経路も左回りなので1枠が主導権を握る。1枠の99%が一番内側の進入コースを取る。 2013年から22年末までの10年間、49万レースのデータによると、1枠の52.1%が1着になっている(進入順で内側を譲った場合を含む)。 ただし、この結果がすべて1枠の効果だと簡単には言えない。 選手は、モータ

                                                  中日スポーツ:当てることと勝つことの間
                                                • 結局、統計モデリングとは何なのか - Qiita

                                                  先日、つれづれなるままに 時系列分析の勉強法の記事『統計初心者が時系列分析を学ぶための勉強法』 を書き殴ってみたところ、反響の大きさに驚きました。 正直、時系列分析なんてかなりニッチな分野だ(3人ぐらいしか読まないだろう)と思ってたからです。 ステイホームしているみなさんが、暇だから時系列分析を使ってFXで一儲けしようとでも考えているんでしょうか。 時系列分析のトピックである、状態空間モデルも統計モデリングの一種なわけですが、本日は、「統計モデリングとは何なのか」について、あらためて考えてみたいと思います。 統計モデリングといえば、みんな大好き緑本『データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)』です。 緑本はたしかに素晴らしい本ですが、緑本を読んだだけでは、「何が統計モデリングで、何が統計モデリングではないのか」「統計学における

                                                    結局、統計モデリングとは何なのか - Qiita
                                                  • 【NeurIPS2022】過去17年間の機械学習・AI研究のトレンドを調査してみた - ENGINEERING BLOG ドコモ開発者ブログ

                                                    こんにちは。dcm_chidaです。 ドコモ開発者ブログ初投稿です。よろしくお願いします。 はじめに みなさん「NeurIPS」と言う国際会議名を聞いたことがあるでしょうか? 機械学習・データ分析の分野では毎年たくさんの国際会議が開催されていますが、NeurIPSはその中でも歴史あるトップカンファレンスの一つです。世界中の研究機関や企業から最先端の論文が投稿されます。 NTTドコモR&DではKDDやNeurIPSといった国際会議の論文読み会を不定期に開催しております。「今年もNeurIPSの論文読み会やるかー」と思って、会議そのもの概要や最新の研究動向などを調べてみたので、ブログ記事にまとめようと思います。 論文そのものの解説記事ではないのでご注意ください。 1分で分かるNeurIPS2022の概要まとめ 会議名称 The Conference and Workshop on Neural

                                                      【NeurIPS2022】過去17年間の機械学習・AI研究のトレンドを調査してみた - ENGINEERING BLOG ドコモ開発者ブログ
                                                    • Pythonで基礎から機械学習まとめ - karaage. [からあげ]

                                                      はじめに 「基礎から機械学習をちゃんと理解したいな」と思うことがあったので、学んだことを自分なりに整理してアウトプットしていきます。基本的には、自分の勉強のため(アウトプットが一番理解が深まると思っているので)ですが、私のような初学者のメモでも、同じような他の初学者の役に立つこともあるのではないかと期待しております。 記事やコードは、修正のリクエストを受けやすいようにQiitaとGitHubをメインにアップしていきます。私自身は、専門家でなく機械学習エンジョイ勢の一個人ですので、不足している点、分かりにくい点、間違いなどあるかと思います。過ちは真摯に受け止めたいと思いますので、是非知見者の方にコメント、編集リクエスト、Pull Requestをしていただけたらと思います。 現時点では、他のサイトに説明を丸投げしていたり、数式をきちんと記載できていないところ多々あるのですが、最終的には、この

                                                        Pythonで基礎から機械学習まとめ - karaage. [からあげ]
                                                      • トピックモデルを俯瞰して学ぶ - ひつじの〜と 備忘録

                                                        本記事は,自然言語処理 Advent Calendar 2019 - Qiita です. はじめに 本記事ではトピックモデルと呼ばれるモデル・分野の中で最も有名なLatent Dirchlet Allocation, 通称LDA*1 とその周りのトピックモデルに関して,どんな資料があるのか?,どういった研究があるのか? といったことに主眼をおいてトピックモデルの研究とかを昔していた私の独断と偏見によるリストアップを行いました. 私の頭は2017年くらいで止まっているので、間違っている点があったり、今の主流とは異なる可能性もありますが、 暖かくご指摘いただけると助かります. Latent Dirchlet Allocation[Blei+,03]を始めとするトピックモデルを学ぶに当たって 何が参考になるのか どういった研究があるのか? 実際にどうやって使うのか?(まだ出来てないよ・・・) と

                                                          トピックモデルを俯瞰して学ぶ - ひつじの〜と 備忘録
                                                        • 観測問題って何?

                                                          “観測問題”について 知っておかなくてもいい いくつかのこと 沙川 貴大(東大物工) 2021年4月23日 まず • 標準的な量子論の枠組みは、任意の実験状況において、操作的に、 曖昧さの余地なく、必要な計算が全て出来るように作られていま す[1,2]。 • これは量子測定のプロセスについても例外ではありません。射影仮説と呼ばれる ものは、仮説ではなく、確立した実験事実です。 • より一般に、誤差のある量子測定を扱う理論も確立しています [1,3]。このような 量子測定理論は、いわゆる”観測問題”とは異なり、最先端の量子技術を理解する うえでも欠かせない重要な物理の話です。 • すなわち、任意の実験状況を物理の問題として考えるうえで、”解 釈”や”観測問題”はirrelevantです。気にする必要はありません。 • それでいい、という人は、この先を読む必要はありません。 かわりにNiels

                                                          • 不動産価格データを使って相場を推測する|komeya

                                                            以前の記事で、せっかく日本全国の不動産取引価格データが取れたので、もう少し不動産価格モデルについて詳しくやってみる。また、ちょっと進んだ手法についても触れてみたい(これは別記事にしました。詳細はこちら。不動産価格データを使った相場分析ー世田谷区一棟マンション)。 価格データの加工と可視化以前紹介した通り、国土交通省の不動産価格取引情報検索からデータがダウンロードできる。これは全国をカバーしていて、2005年以降の20年近くのデータがある。サイトから一気に全国全期間のデータがダウンロードできる。 全国のデータは取れるが一気に全国データを扱うのは大変なので、簡単なモデルから徐々に複雑にしていく。こないだ世田谷のデータを使ったので、まずは世田谷区のデータを使う。こないだは過去1年に取引されたデータだけだったので、データが存在する10年以上前の取引データも全部使ってみる。前回説明した通り、築年が元

                                                              不動産価格データを使って相場を推測する|komeya
                                                            • あー、某大学教授(ただし専門は統計学でも疫学でもない)に感化されちゃ..

                                                              あー、某大学教授(ただし専門は統計学でも疫学でもない)に感化されちゃったのかPCR検査やれやれ派の増田か。ご愁傷様です。 偽陰性が招く問題があるということに対して、偽陽性の問題は取るに足らないんだという説明をして(それ自体は正しい。でも偽陰性についてはほっかむり)なぜか「論破」したような気になっていた悲しい人たちだよな。まあ確かに、大規模PCR反対派の医師がそれこそベイズの定理を使って説明したのが偽陽性の話だったこともあるが、これは正直どっちも的を外していただけで、ここを反駁しても意味がないのにさ。

                                                                あー、某大学教授(ただし専門は統計学でも疫学でもない)に感化されちゃ..
                                                              • Amazon SageMaker を使用したメジャーリーグベースボールでの新しいスタッツの計算 | Amazon Web Services

                                                                Amazon Web Services ブログ Amazon SageMaker を使用したメジャーリーグベースボールでの新しいスタッツの計算  ファンに沢山の新しい展開を見せてくれた爽快なレギュラーシーズンが終わり、2019 年のメジャーリーグベースボール (MLB) ポストシーズンがやってきました。MLB とアマゾン ウェブ サービス (AWS) は、MLB ゲームで盗塁成功確率、シフトの影響、およびピッチャーの類似点マッチアップ分析の 3 つの新しいリアルタイムの機械学習 (ML) スタッツを開発して実現するためにチームアップしました。これらの機能は、莫大な量の野球データを収集し、ファンが野球の試合を楽しむあらゆる面において、より多くの洞察、見解、および背景を提供するための MLB の最新鋭テクノロジー、Statcast Ai を通じて、ファンが野球をより深く理解できるようにしてく

                                                                  Amazon SageMaker を使用したメジャーリーグベースボールでの新しいスタッツの計算 | Amazon Web Services
                                                                • サイバーエージェントのデータマイニング本がデータサイエンティスト必読書だった件 - LABOT 機械学習ブログ

                                                                  堀田(@YoshiHotta)です。この記事はサイバーエージェントの秋葉原ラボの方が執筆された『データマイニングエンジニアの教科書』の書評です。 企業でデータマイニングをする人に必要な知識を俯瞰できる、しっかりしたデータマイニングの本だと思いました。データマイニングの初心者にも中級者にもぜひオススメしたい一冊だったので書評を書くことにしました。 また、データマイニングの独習に役に立つ書籍も多数紹介します。 データマイニングエンジニアの教科書 作者: 森下壮一郎,水上ひろき,高野雅典,數見拓朗,和田計也出版社/メーカー: シーアンドアール研究所発売日: 2019/06/27メディア: Kindle版この商品を含むブログを見る この本は(特に Web 系の) データ分析の実務者に必要な事柄が網羅的に取り上げられています。300ページという厚さからすると扱っているテーマはとても幅広いです。一つ一

                                                                    サイバーエージェントのデータマイニング本がデータサイエンティスト必読書だった件 - LABOT 機械学習ブログ
                                                                  • 機械学習におけるハイパーパラメータ最適化の理論と実践 Part.1

                                                                    2019年9月16、17日、日本最大のPythonの祭典である「PyCon JP 2019」が開催されました。「Python New Era」をキャッチコピーに、日本だけでなく世界各地からPythonエンジニアたちが一堂に会し、さまざまな知見を共有します。プレゼンテーション「機械学習におけるハイパーパラメータ最適化の理論と実践」に登壇したのは、株式会社サイバーエージェント/産総研特定集中研究専門員の野村将寛氏。講演資料はこちら ハイパーパラメータ最適化問題 野村将寛 氏(以下、野村):簡単に自己紹介をさせていただきます。僕は今、サイバーエージェントのAI Labという研究組織に所属していまして、ハイパーパラメータ最適化の研究をしています。先ほどの午前中のセッションで、AutoMLのセッションがあったと思うんですけど、そちらで発表していた芝田のチームメンバーになります。 産総研でもハイパーパ

                                                                      機械学習におけるハイパーパラメータ最適化の理論と実践 Part.1
                                                                    • 【論文を読む】ポケモンの名付けにおける母音と有声阻害音の効果 - 第一コラムラボ

                                                                      ゲームボーイ はじめに この連載では,広い学びへ興味をもつきっかけになればといいという目的で,第一学習社の編集者が見かけた興味深い論文や研究を不定期に紹介していきます。 論文というのは,学びの最先端がまとめられたとても面白いものです。しかし,大学の研究以外では,日常的に触れることは多くありません。また,内容も難解なものが多いです。しかしそのハードルを越えれば,自分の目で見る世界の解像度が,少し明瞭になっているはずです。 はじめに Pickup 用語解説 音象徴,有声阻害音 ブーバ・キキ効果 最大エントロピーモデル 読んでみよう。 まとめ 参考リンク Pickup 今回,紹介するのは音声学の分野からこちらの論文です。身近なテーマ,ポケモンに関する論文です。 www.jstage.jst.go.jp 音声学はその名の通り,「音と声にまつわる全て」を研究する学問となります。そのため言語や音楽と関

                                                                        【論文を読む】ポケモンの名付けにおける母音と有声阻害音の効果 - 第一コラムラボ
                                                                      • プログラミング問題を解けばエンジニアの戦闘力がわかる!?レーティング機能公開 - paiza times

                                                                        こんにちは、吉岡(@yoshiokatsuneo)です。 paizaでは、S・A・B・C・Dと5つのランクにわかれたプログラミングスキルチェック問題を公開しています。 スキルチェック問題を解いてこのランクを獲得することで、paizaでは、最初の書類選考なしで求人応募ができるようになっています。 paizaは、ユーザーのプログラミングスキルをより正確に評価できる方法を探し続けており、今回、「エンジニア戦闘力」「レーティング」という数字でスキルを可視化する方法を実験的に取り入れることになりましたので、どのようなものかご説明していきます。 ※記事公開時(2019/09/10)はβ版として「エンジニア戦闘力」という数値も用いていましたが、2019/11/21公開の正式版では「レーティング」に統一されました。 スキルランクの課題について 従来のスキルランクはわかりやすいのですが、場合によっては以下の

                                                                          プログラミング問題を解けばエンジニアの戦闘力がわかる!?レーティング機能公開 - paiza times
                                                                        • 【論文紹介】ベイズ分析のワークフローにおける視覚化について - Qiita

                                                                          こんにちは,株式会社Nospareリサーチャー・千葉大学の小林です. 今回はJournal of Royal Statistical Society Series Aにも掲載されたGabry et al. (2017)(arXiv版)の紹介をします.この論文では次の挙げられるベイズ分析のワークフロー 探索的データ分析 分析前のモデルチェック アルゴリズムの動作チェック モデル推定後のモデルチェック において視覚化をどのように使っていくかについて書かれており,実証分析や実務においてベイズ分析を行うにあたってとても有用な内容になっています.本記事で掲載する図などは著者がgithubにポストしてあるコードを使って作成しました. データ分析例の設定 この論文では終始PM2.5に関するデータ分析例を取り扱っており,この例では以下の設定があります. PM2.5は人体に対して影響があると考えられ,本当は

                                                                            【論文紹介】ベイズ分析のワークフローにおける視覚化について - Qiita
                                                                          • 「東京の感染者数を5週間ぶん予測した」に勝負を挑んだ:4日目

                                                                            anond:20210706090858 予測対決 結果発表(7/6 - 7/11)★勝ち越し確定。予測誤差の少なさも圧勝。 ★Knoa氏(王者)の予測 anond:20210705212509私(挑戦者)の予測 anond:20210705233157結果実際の感染者数=822人、私の予測=823人。ほぼ的中っす。惜しかったっす。評価期間 Knoa氏平均私の平均実際の平均 勝敗コメント 7/6-7/9 910.75 815.25 807.25 圧勝っす Knoa氏誤差=103.5人 vs. 私の誤差=8人 曜日Knoa氏予測私の予測実際の感染者数 勝敗コメント 7/6 (火) 705 642 593 1勝0敗 0分 楽勝っす。明日も楽しみっす。 7/7 (水) 1031 982 920 2勝0敗 0分 楽勝っす。明日も楽しみっす。 7/8 (木) 962 814 894 2勝1敗 0分

                                                                              「東京の感染者数を5週間ぶん予測した」に勝負を挑んだ:4日目
                                                                            • 評点の分布が滑らかでないのは不自然なのか - お勉強メモ

                                                                              話題の評点分布についての自分用まとめです。 特に統計的な議論においては各々想定している状況が違っているようなので整理してみました。 筆者は統計というよりは確率の人間なので、ベイズだとかには触らずに確率変数の演算ばかり使います。 大数の法則が使えるような状況 店 の真の評点 が宇宙のどこかに存在していて、レビュワー の 店 に対する評点 は平均 を持つ独立同分布な確率変数と考えます。 店 の評点 は 件のレビューが付いていたときに と書けます*1が、これはレビュワーが増えていくと に収束することが知られています。 確率変数である を仮に に置き換えて考えれば、もはや評点分布は何ら確率的な性質を持ちません。 宇宙のどこかに存在している の値は3.6が多いかもしれませんし3.8が多いかもしれませんし、そうでないかもしれません。 レビュワー数は実際には有限なので収束せず幾らかは確率的なところがある

                                                                                評点の分布が滑らかでないのは不自然なのか - お勉強メモ
                                                                              • コンピュータビジョン分野における世界最高峰の国際会議CVPR2022の論文紹介(後編) - NTT Communications Engineers' Blog

                                                                                目次 目次 はじめに 論文紹介 The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by Normalization OcclusionFusion: Occlusion-aware Motion Estimation for Real-time Dynamic 3D Reconstruction EPro-PnP: Generalized End-to-End Probabilistic Perspective-N-Points for Monocular Object Pose Estimation Cascade Transformers for End-to-End Person Search TrackFormer: Multi-Object Tracking With Transformers Global T

                                                                                  コンピュータビジョン分野における世界最高峰の国際会議CVPR2022の論文紹介(後編) - NTT Communications Engineers' Blog
                                                                                • 羅生門効果:マーケティングモデルを蝕む本質的な「曖昧さ」 - 渋谷駅前で働くデータサイエンティストのブログ

                                                                                  前回の記事でも触れましたが、ここ最近いわゆる需要予測系のマーケティングモデル(特にMedia Mix Modeling: MMM)を手掛けることが増えています。 この手の統計モデルは経済学で言うところの「実証分析」に当たると思われ、一般には「予測」よりも「説明」に用いられることが多いです。より具体的に言えば、回帰モデルを推定した上で個々の変数のパラメータを比較して、例えば「デジタル動画広告をもっと強化した方が良い」というようなマーケティング上の示唆を得る、というような目的で用いられます。 ところが、これまた前回の記事で触れた通りでそれらのモデルに基づく「説明」には、どうしても「羅生門効果」の問題が生じ得ます。即ち、同じデータセットに対して似たような性能を示す回帰モデルが複数並び立った場合、どのモデルの「説明」を優先すべきか?という問題です。これは純粋に統計的学習分野の問題として捉えればある

                                                                                    羅生門効果:マーケティングモデルを蝕む本質的な「曖昧さ」 - 渋谷駅前で働くデータサイエンティストのブログ