本文「bayes」を検索 - はてなブックマーク

1 - 40 件 / 128件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

bayesの検索結果1 - 40 件 / 128件

This is The Entire Computer Science Curriculum in 1000 YouTube Videos
- 456 users
- laconicml.com
- テクノロジー
- 2021/01/13
This is The Entire Computer Science Curriculum in 1000 YouTube Videos In this article, we are going to create an entire Computer Science curriculum using only YouTube videos. The Computer Science curriculum is going to cover every skill essential for a Computer Science Engineer that has expertise in Artificial Intelligence and its subfields, like: Machine Learning, Deep Learning, Computer Vision,
使える統計モデル10選（前編） | AIdrops
- 113 users
- www.bigdata-navi.com
- テクノロジー
- 2020/04/17
使える統計モデル10選（前編）統計モデリング（statistical modelling）はデータ解析の方法論の1つです。データ解析の目的は、通常はただの数値や記号の羅列であるデータから、人間が何かしらの判断を行うために有益な情報を引き出すことにあります。データ分析者は、そのままでは意味をなさないデータに対して、折れ線グラフやヒストグラムなどを用いて、人間が判断を行いやすいようにデータの可視化を行います。一方で、時にはニューラルネットワークのような複雑な計算モデルを使ってデータを解析し、まだ観測されていない将来の値を予測させたりします。このように、データから有益な情報を引き出すために、データに対して人為的な視点や事前知識、数学的な仮定などを設計する作業をモデリング（modeling）と呼びます。統計モデリングによるデータ解析では、データ自体や解析の目的に合わせて分析者が適切なモデルを設
Rustで扱える機械学習関連のクレート2021 - Stimulator
- 86 users
- vaaaaaanquish.hatenablog.com
- テクノロジー
- 2021/01/24
- はじめに - 本記事では、Rustで扱える機械学習関連クレートをまとめる。普段Pythonで機械学習プロジェクトを遂行する人がRustに移行する事を想定して書くメモ書きになるが、もしかすると長らくRustでMLをやっていた人と視点の違いがあるかもしれない。追記：2021/02/24 repositoryにしました。こちらを随時更新します github.com 追記；2021/07/26 GitHub Pagesでウェブサイトにしました vaaaaanquish.github.io - はじめに - - 全体感 - - 機械学習足回り関連のクレート - Jupyter Notebook Numpy/Scipy Pandas 画像処理形態素解析/tokenize - scikit-learn的なやつ - 各ライブラリと特徴比較 - Gradient Boosting - XGBoos
- Rust
- 機械学習
- Python
- あとで読む
- ml
- ライブラリ
- 勉強
【論文紹介】統計学の過去50年における最も重要なアイディアとは？ - Qiita
- 82 users
- qiita.com/gen_nospare
- テクノロジー
- 2021/09/24
こんにちは，株式会社Nospare・千葉大学の小林です．本記事ではGelman and Vehtari (2020)の`What are the most important statistical ideas of the past 50 years?'について紹介します．この論文は過去50年において最も重要だとされる次の8つのアイディアが取り上げられています． 8つのアイデア反事実（counterfactual）に基づく因果推論ブートストラップとシミュレーションに基づいた推論オーバーパラメータ（overparameterized）モデルと正則化（ガウス過程，Lasso, horseshoe, ベイズnonparametric priorなど）ベイズマルチレベル（階層）モデル汎用的な計算アルゴリズム（EM, MCMC, SMC, HMC, 変分法など）適応的決定分析（ベイズ最
ナイーブベイズを使って1日で100万件の投稿をジャンル分けした話 - AppBrew Tech Blog
- 80 users
- tech.appbrew.io
- テクノロジー
- 2019/09/16
こんにちは、AppBrewでアルバイトをしている@Leoです。自然言語処理の研究室に最近入った大学生で、趣味はKaggleと競技プログラミングです。 AppBrewでは、LIPSの投稿を使ったデータ分析をしています。今日の記事では、弊社のアプリLIPSにて投稿ジャンルを機械学習を使って自動推定した方法を紹介します。自然言語処理・確率関係全然わからない！という人でも読みやすい内容になっていると思うので、最後まで読んでいただけると幸いです！ LIPSにおけるジャンル教師データの作成ナイーブベイズ単語分割モデルの実装分類結果おわりに LIPSにおけるジャンル最近、LIPSにジャンル機能が追加されました。これは投稿されたクチコミにジャンルを設定できる機能です。適切にジャンルを設定すると、投稿を検索するときにジャンルを使って絞り込めるなどの利点があります。ジャンルは7種類（
ベイズ統計・ベイズ機械学習を始めよう | AIdrops
- 69 users
- www.bigdata-navi.com
- テクノロジー
- 2020/02/21
ベイズ統計・ベイズ機械学習を始めようコンピュータやネットワークの技術進化により，これまでにないほどの多種多様なデータを取り扱う環境が整ってきました．中でも統計学や機械学習は，限られたデータから将来を予測することや，データに潜む特徴的なパターンを抽出する技術として注目されています．これらのデータ解析を行うためのツールはオープンソースとして配布されていることが多いため，初学者でも手軽に手を出せるようになってきています．しかし，データ解析を目的に合わせて適切に使いこなすことは依然としてハードルが高いようです．この原因の一つが，統計学や機械学習が多種多様な設計思想から作られたアルゴリズムの集合体であることが挙げられます．毎年のように国際学会や産業界で新たな手法が考案・開発されており，一人のエンジニアがそれらの新技術を１つ１つキャッチアップしていくのは非常に困難になってきています．１つの解決策
ベイズの定理を悪用し、コロナウイルスPCR検査の有用性を否定する医師達｜臨床獣医師の立場から
- 66 users
- tatsuharug.com
- 世の中
- 2020/07/07
偽陽性者が1人出るかどうかという数字になります。「日本人全員を対象にした大規模PCR検査をしろ」なんてことを言ってる人は、ほとんどいないと思うのですが罹患率0.005%というおかしな仮定で計算しています。それにしてもこの人は凄い。「特異度は感度より高いが、特異度が100％の検査は理論上、存在しない。理由はこうだ。」の後に一切その理由を書いていません。誰かチェックしないのでしょうか？ EARLの医学ツイート　東北医科薬科大学病院感染症内科　福家良太氏罹患率0.5%、感度70％、特異度99.997%として計算すると陽性的中率は99.15%です。計算上ほぼ偽陽性は起こりません。普通は1度の検査で陽性確定とはしないと思います。患者への負担が大きい場合、再検査は必ず行うはずです。この医師はたった1回の検査で確認もせずに重要なことを決定するのでしょうか？感染症専門医　岩田健太郎
機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita
- 63 users
- qiita.com/sugulu
- テクノロジー
- 2020/04/29
scikit-learnライブラリを用いて、機械学習の実装とアルゴリズムをバランス良く学んでいただく書籍を執筆しました。 AIエンジニアを目指す人のための機械学習入門実装しながらアルゴリズムの流れを学ぶ（電通国際情報サービス清水琢也、小川雄太郎、技術評論社） https://www.amazon.co.jp/dp/4297112094/ 既に発売開始しています。機械学習の・各種アルゴリズムの実装・それぞれのアルゴリズムの動作の仕組みこれらを学んでみたい方に向けて執筆いたしました。ご活用いただければ幸いです。昨年書いた書籍つくりながら学ぶ! PyTorchによる発展ディープラーニング（小川雄太郎、マイナビ出版）の、機械学習版のような位置付けです。本記事では、・本書を書いたモチベーション・本書の概要・本書の目次を紹介いたします。本書を書いたモチベーション本書
- 機械学習
- アルゴリズム
- 機械学習系読物
- ML
- あとで読む
- AI
- python
- deeplearning
- qiita
- 学習
【徹底解説】変分ベイズをはじめからていねいに | Academaid
- 61 users
- academ-aid.com
- テクノロジー
- 2021/12/18
初学者の分かりやすさを優先するため，多少正確でない表現が混在することがあります。もし致命的な間違いがあればご指摘いただけると助かります。はじめに機械学習を勉強したことのある方であれば，変分ベイズ（VB：variational bayes）の難しさには辟易したことがあるでしょう。私自身，学部生時代に意気揚々と機械学習のバイブルと言われている「パターン認識と機械学習（通称PRML）」を手に取って中身をペラペラめくってみたのですが，あまりの難しさから途方に暮れてしまったことを覚えています。機械学習の登竜門は，変分ベイズ（変分推論）だと私は考えています。また，VAE（変分オートエンコーダ；variational autoencoder）に代表されるように，変分ベイズは最近の深層学習ブームにおいて理論面の立役者となっている側面もあります。一方で，多くの書籍やWeb上の資料では式変形の行間が詰ま
- 機械学習
- statistics
- あとで読む
- study
- data
- 勉強
- HotEntry
機械学習の歴史 - AI.doll
- 57 users
- doll.hatenadiary.com
- テクノロジー
- 2019/07/13
WikipediaのTimeline of machine learningというページに機械学習の歴史がまとめられた表があったので、あとから見返しやすいように全て日本語にしてみた。日本語訳はガバガバかもしれないので心配な人は元ページを見てね。ムムッってとこがあったらコメントで教えてほしい年表 1763 ベイズの定理のベーストマス・ベイズ(Thomas Bayes)の著書, "An Essay towards solving a Problem in Doctorine of Chances"がベイズが死んだ2年後, 彼の友人により修正・編集され出版された. 1805 最小二乗アドリアン=マリ・ルジャンドル(Adrien-Marie Legendre)が最小二乗(méthode des moindres carrés)について記述. 1812 ベイズの定理ピエール=シモン・ラプ
23/7/5 データサイエンスエキスパート合格　チートシートと攻略ガイド - LWのサイゼリヤ
- 56 users
- saize-lw.hatenablog.com
- テクノロジー
- 2023/07/05
データサイエンスエキスパート　ゲームクリア攻略チートシート配布攻略指針図書館を巡ってアイテム収集図書館の初見殺しトラップ攻略参考書籍統計基礎統計学（初歩）統計学（高度）ベイズ統計分散分析数学基礎線形代数微積分計算基礎情報全般データベースアルゴリズムモデリング・AIと評価歴史・応用分野・AIなど多変量解析時系列解析グラフィカルモデルテキスト分析因果推論機械学習・モデル評価・ニューラルネットワークデータサイエンスエキスパート　ゲームクリア日本統計学会が主催するデータサイエンスエキスパート試験に合格した。 www.toukei-kentei.jp データサイエンスエキスパートは、統計検定より実践寄りであるデータサイエンスシリーズの最上位資格という位置付け。下位資格には「データサイエンス基礎」や「データサイエンス発展」があるが簡単そうだったので
- 統計
- あとで読む
- 資格
- 本
- 数学
- データ
数学に強いエンジニアむけの機械学習勉強法
- 50 users
- hayato-iida-0213.medium.com
- テクノロジー
- 2020/04/06
今年の3月から機械学習の勉強を始めて9ヶ月たったのでその振り返りと今後機械学習に入門する人の参考になればという記事です。巷の記事だと「数学何もわからない人向けの機械学習~」みたいなものが多いので「数学チョットワカル人向け」に勉強方法をまとめてみようと思いました。前提として筆者は大学で数学を専攻しており、社会人になってからはプログラミングを生業としております。 # 前提知識のおさらいいきなり機械学習入門～のような書籍に入る前に、基礎知識としてこの辺を抑えておくと良いと思います。 ## 線形代数:大学1年レベル機械学習の説明はほとんど行列の計算として表現されますので大前提として。手を動かして計算問題を解くのもおすすめです。プログラミングのための線形代数 https://www.amazon.co.jp/dp/4274065782 ## 基礎統計(頻度主義):大学1年レベル正規分布や指数分
- 機械学習
- 統計
- あとで読む
- 数学
- 勉強
確率予測とCalibrationについて - 機械学習 Memo φ(・ω・ )
- 47 users
- yukoishizaki.hatenablog.com
- テクノロジー
- 2020/05/24
概要確率予測とCalibration(キャリブレーション)に関する勉強会に参加したので、学んだことの一部と、自分で調べてみたことについてまとめました。概要 Calibrationとは Calibration Curve Calibrationの方法 Sigmoid / Platt Scale Isotonic Regression 確率予測に使われる評価指標 Brier Score ECE コード不均衡データに対するCalibration LightGBMにCalibrationは不要か NNにCalibrationは不要か追記 : Calibrationの検討について追記 : 発表スライドについて終わり techplay.jp 勉強会で使われていた言葉を、自分なりの言い方に変えています。間違いがありましたら、コメントいただけたら嬉しいです。 Calibrationとは普通
機械学習モデルを組み込んだ Web アプリを Python 初心者が作ってみた - RAKUS Developers Blog | ラクスエンジニアブログ
- 45 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2020/12/09
こんにちは。開発エンジニアの amdaba_sk（ペンネーム未定）です。前回は「機械学習をコモディティ化する AutoML ツールの評価」、だいぶ間が空きましたが前々回は「機械学習のライブラリ・プラットフォームをいくつか試した所感まとめ」と、続けて機械学習をテーマとした記事を書きました。これらの記事では機械学習モデルを作るまでのことしか言及していませんが、機械学習モデルは作ってそれで終わりのものでもありません。使ってなんぼのものなんです。かみせんプロジェクトとしての調査範囲からは外れますが、せっかくモデルを作ったならそれを使ったアプリも簡単なものでいいので作ってみたい。そう思うのは開発者として自然な感情ではないでしょうか。というわけで今回は、「機械学習モデルを組み込んだ Web アプリを Python 初心者が作ってみた」という個人的な興味からやってみた系記事でございます。なお後に
- python
- 機械学習
- あとで読む
- 学習
- アプリ
- web
- HotEntry
- 開発
- プログラミング
『「数理科学を使えば統計の”主義”を争う必要ない」という主張について検討する』
- 45 users
- ameblo.jp/yusaku-ohkubo
- テクノロジー
- 2020/04/14
・はじめに統計学の歴史では、頻度主義とベイズ主義という異なる立場の方法が存在し、違いに論争を繰り広げてきました。しかし、近年の統計学者の中には「現代の統計学は数理的な方法に基づいているから、主義の争いは解決した」と考える人もいるようです（この立場のことを、この記事では便宜的に「統計数理による主義不要論」と呼ぶことにします）。この記事では、「統計数理による主義不要論」に対して私なりの反論を考えてみることにします。論点は、以下の3つです。 1. 「“数理的な方法”を使っても、主義の争いが解決しない」ということを示唆する事実が存在する 2. 頻度主義とベイズ主義の論争を「どちらの方法が正しいか」という争いとして捉えると論争の全体像を見誤る 3. WAICに代表される現代ベイズ法の意義は、「数理によって主義の争いを解決した」のではなく「仮にあなたが頻度主義的な価値観を重視
人工神経回路による脳の理解はどこまで進んだか - 知識のサラダボウル
- 43 users
- omedstu.jimdofree.com
- テクノロジー
- 2019/12/07
(著) 山拓神経科学 Advent Calendar 2019の2記事目です。人工神経回路 (Artificial neural network, ANN) を用いた研究により、脳の理解はどこまで進んだか、次に何が調べられるべきなのかということについて解説します。昨年の年末からhttps://github.com/takyamamoto/BNN-ANN-papersにANNと脳に関する論文リストを作成しており (これは先に研究が出てしまう悲劇が頻発したための措置ですが)、このリストがそのまま参考文献となっています。本記事は特に(B.A. Richards, T.P. Lillicrap, et al. Nat. Neurosci. 2019)での議論を参考にしています(翻訳ではないです)。この論文はANNと脳についての研究を先導してきた多くの研究者が共著者となっています（一体どうや
- 脳
- brain
- machinelearning
- biology
- 気になる
- research
機械学習と公平性
- 40 users
- ai-elsi.org
- テクノロジー
- 2020/01/23
1 2 3 4 The field of study that gives computers the ability to learn without being explicitly programmed. — A. L. Samuel ※ Programming computers to learn from experience should eventually eliminate the need for much of this detailed programming effort. — A. L. Samuel [Samuel 59] The field of machine learning is concerned with the question of how to construct computer programs that automatically im
『ディープラーニング学習する機械』は一人称で語られる壮大な物語にして、「AIの過去・現在・未来」の解説書 - 渋谷駅前で働くデータサイエンティストのブログ
- 34 users
- tjo.hatenablog.com
- テクノロジー
- 2021/12/14
ディープラーニング　学習する機械　ヤン・ルカン、人工知能を語る (ＫＳ科学一般書) 作者:ヤン・ルカン講談社Amazon 11月に入って勤務先のオフィスが本格的に再開されてから、久しぶりに会社のメールルームを覗きに行ったところ、届いていた（つまりご恵贈いただいていた）のがこちらの一冊です。Deep Learningの三開祖の一人にして2018年度のチューリング賞受賞者の一人でもある、ヤン・ルカン御大その人が著した『ディープラーニング学習する機械』です。本書は日本語版が出た直後から絶賛する声が聞こえてきていて、興味はあったのですが気を逸した感が否めなかったので、こうしてご恵贈いただけて有難い限りです。講談社サイエンティフィク様、まことに有難うございます。ということで、早速ですが簡単にレビューしていこうと思います。本書の内容特に個人的に印象に残った点全てのアルゴリズムに関する記述が
- アルゴリズム
- Python
- あとで読む
- HotEntry
- データ
- 学習
- 書評
100+ Best GitHub Repositories For Machine Learning
- 33 users
- www.theinsaneapp.com
- テクノロジー
- 2021/09/21
There are millions of github repos and filtering them is an insane amount of work. It takes huge time, efforts and a lot more. We have done this for you. In this article we’ll share a curated list of 100+ widely-known, recommended and most popular repositories and open source github projects for Machine Learning and Deep Learning. So without further ado, Let’s see all the hubs created by experts a
プログラミングのための確率統計-Ohmsha
- 32 users
- shop.ohmsha.co.jp
- テクノロジー
- 2021/10/06
第I部確率そのものの話第1章確率とは第2章複数の確率変数のからみあい第3章離散値の確率分布第4章連続値の確率分布第5章共分散行列と多次元正規分布と楕円第II部確率を役立てる話第6章推定と検定第7章擬似乱数第8章いろいろな応用付録付録A 本書で使う数学の基礎事項付録B 近似式と不等式付録C 確率論の補足第I部　確率そのものの話第1章確率とは 1.1 数学の立場 1.2 三つの扉（モンティホール問題） ――― 飛行船視点 1.2.1 モンティホール問題 1.2.2 正しい答とよくある勘違い 1.2.3 飛行船視点への翻訳 1.3 三つ組(Ω,F, P) ――― 神様視点 1.4 確率変数 1.5 確率分布 1.6 現場流の略記法 1.6.1 確率変数の記法 1.6.2 確率の記法 1.7は裏方 1.7.1の正体にはこだわらない 1.7.2のと
機械学習のライブラリ・プラットフォームをいくつか試した所感まとめ - RAKUS Developers Blog | ラクスエンジニアブログ
- 31 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2020/04/08
こんにちは、開発エンジニアの amdaba_sk（ペンネーム未定）です。ラクスの開発部ではこれまで社内で利用していなかった技術要素を自社の開発に適合するか検証し、ビジネス要求に対して迅速に応えられるようにそなえる「開（か）発の未（み）来に先（せん）手をうつプロジェクト（通称：かみせんプロジェクト）」というプロジェクトがあります。この記事はかみせんプロジェクト2019年度下期成果報告ブログの一つです。前回の成果報告では「機械学習プロジェクトの進め方」について検証した結果のまとめをしました。今回は「じゃあ実際に機械学習をやることになったら、どんなライブラリ、サービスを使えばいいの？」といったところの検証結果をまとめようと思います。対象読者は前回と違って、機械学習に興味のあるエンジニアの方です。なお今までの記事はかみせんカテゴリからどうぞ。 tech-blog.rakus.co.jp
「量子アニーリングの基礎」を読む第5日 https://qiita.com/kaizen_nagoya/items/116a5a6add72a5bf1630
- 27 users
- qiita.com/kaizen_nagoya
- テクノロジー
- 2019/11/15
「量子アニーリングの基礎」西森秀稔, 大関真之, 共立出版, 2018 を読む https://qiita.com/kaizen_nagoya/items/29580dc526e142cb64e9 『量子アニーリングの基礎』正誤表 (西森秀稔・大関真之著)　2019年6月20日更新 https://www.kyoritsu-pub.co.jp/app/file/goods_contents/3037.pdf 量子アニーリングの数理　東京工業大学大学院理工学研究科物性物理学専攻西森秀稔 https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/189516/1/bussei_el_033203.pdf 本は、１量子力学２　熱力学、統計力学がわかっている人にとっての丁寧ここでは、どちらもわかっていないことを前提
クロス表とベイズの公式に基づく新型コロナPCR検査抑制論の検討（授業用資料）Ver.2 (PDFはVer.4) - 朴勝俊　Park SeungJoonのブログ
- 27 users
- parkseungjoon.hatenadiary.com
- 世の中
- 2021/08/19
日本のPCR検査数(人口比)は先進国で最下位レベルです。ニュージーランドや台湾、韓国、中国などは少数でも感染者が見つかれば大量のPCR検査と隔離を行い、感染ゼロを目指していますが、日本は「専門家」たちがPCR検査の精度が低い、徹底的な検査を行うとニセ陽性が出るのでよくない、などと言う説を流布し、政府もそうした説明に影響されて住民に対する検査は徹底されていません。例えば、2021/7/1～8/16までの、東京都（人口1400万人の検査数は計54万2781件、陽性者数11万1699件、陽性率約20.6%です。他方で、東京オリンピックの選手・関係者の数万人には世界水準の徹底した検査と隔離が行われてきました（2021/7/1～8/16までの総計で73万0979件、陽性件数204件、陽性率約0.03%）[1]。今回はクロス表とベイズの公式に基づいて、PCR検査の精度についてやさしく学び、コロナ対策
生成 Deep Learning
- 26 users
- www.oreilly.co.jp
- テクノロジー
- 2020/09/16
以下、日本語版の動作確認で使用したコマンドラインの例です。 $ python 01_generate_data.py car_racing --total_episodes 200 --time_steps 300 $ python 02_train_vae.py --new_model $ python 03_generate_rnn_data.py $ python 04_train_rnn.py --new_model --batch_size 100 $ python 05_train_controller.py car_racing -n 4 -t 1 -e 4 --max_length 1000 賞賛の声訳者まえがきまえがき第I部　生成型ディープラーニング入門 1章　生成モデリング 1.1　生成モデリングとは何か？ 1.1.1　生成モデリングと識別モデリング 1.1.2　
【IQ1AdC】W理論こと特異学習理論の重要論文公式10本ノック【12/9】 - カイヤン雑記帳
- 25 users
- chijan.hatenablog.jp
- テクノロジー
- 2019/12/09
おはようございますまたはこんにちはまたはこんばんは，カイヤンです．本記事はIQ1 Advent Calendar 2019（主催者 id:chakku000 ）における12月9日の記事です．参考：IQ1 Advent Calendar 2018 2018/12/11の拙著記事「IQが1のデータ分析：respects いつも何度でも尋ねられること」おことわり今回は，ベイズ推論の特異学習理論（Watanabe理論，W理論）についての記事です．IQ1なので数学的に厳密な書き方でないどころか数式が登場しませんのでご了承ください．また，IQ1なために各論文を肯定的に読んでいます（理論が中心の紹介ですが一部の数値実験についても）．クリティカルリーディング要素はありません．申し訳ありません．よりおことわりらしいおことわりはIQ1AdCの雰囲気をぶち壊すので折り畳みます． IQ1AdCそのもの
- ベイズ推定
- 機械学習
- 論文
- HotEntry
- 数学
- 学習
100+ Best Free Data Science Books For Beginners And Experts
- 23 users
- www.theinsaneapp.com
- テクノロジー
- 2021/08/11
In the previous post we’ve covered 100+ Free Machine Learning and Artificial Intelligence Books. If you haven’t checked make sure you spend 2 minutes after checking this post. In this post, You’ll see 100+ free data science books for beginners, intermediate and experts. The eBooks are updated in 2023 and available in pdf or html format. Note: All the books listed below are open sourced and are in
Python: 広義の Target Encoding と Stacking は同じもの (と解釈できる) - CUBE SUGAR CONTAINER
- 20 users
- blog.amedama.jp
- テクノロジー
- 2019/11/07
おそらく、既に分かっている人には「知らなかったの？」とびっくりされる系の話なんだろうけど、今さら理解したので備忘録として残しておく。結論から書くと、目的変数を用いた特徴量生成を広義の Target Encoding と定義した場合、Target Encoding と Stacking は同じものと解釈できる。例えば、Target Mean Encoding は多項分布を仮定したナイーブベイズ分類器を用いた Stacking とやっていることは同じになる。また、Target Encoding と Stacking が同じものであると解釈することで、周辺の知識についても理解しやすくなる。 Target Encoding について Target Encoding は、データ分析コンペで用いられることがある特徴量生成 (Feature Extraction) の手法のこと。一般的にはカテゴ
A/Bテストの時間短縮に向けて〜ベイズ統計によるA/Bテスト入門〜 - Gunosyデータ分析ブログ
- 19 users
- data.gunosy.io
- テクノロジー
- 2019/12/05
はじめにこんにちは、19卒でGunosy Tech LabのBIチームの齊藤です。 data.gunosy.io この記事はGunosy Advent Calender 2019の4日目の記事です。昨日の記事は高橋さん(@tkhs0604)によるプロダクトマネージャーカンファレンス2019 参加レポートでした。はじめに背景ベイズ統計例: 継続率事後分布のプロット継続率以外の指標は？おわりに背景 GunosyではUI・ロジックの変更等を行う際にA/Bテストにより効果検証を行っています。 data.gunosy.io 上記のブログの通り、従来の（頻度論に基づく）仮説検定ではA/Bテストを開始する前に有意水準、検出力、効果量を定めてサンプルサイズを求めなければなりません。またサンプルサイズを定めても必要なサイズを満たすのに何日かかるかも不透明であり、施策の実行→A/Bテスト→
【入門】イメージ分類モデルから入門する機械学習の基本概念まとめ | DevelopersIO
- 19 users
- dev.classmethod.jp
- テクノロジー
- 2020/02/26
どうも、コンサル部のテウです。本記事は前回の記事の続きとなっており、「機械学習のチュートリアルコードは実行してみたんだけど、これだけで理解できるわけないじゃんー！」と思った方のための記事となります。目次始める前に機械学習を入門するための方法として紹介されてある記事は既に多く存在すると思います。なぜイメージ分類モデルから機械学習を入門するの？って聞かれたら、「僕のバックグラウンドとしてイメージ分類タスクをやってましたので、これを活かしたアプローチが説明しやすい」と答えられます。あと、個人的な感想ですが、画像は視覚的にすぐ分かりやすいので複雑な Vector Space (Feature Space) のことを理解するのにも効果的な分野だと思います。まぁ、しょうもない話より、早速ひとつづつ説明させていただきたいと思いますー！機械学習の一般的なプロセス機械学習の一般的なプロセスを見
- 機械学習
- あとで読む
Bayesian statistics
- 16 users
- watanabe-www.math.dis.titech.ac.jp
- テクノロジー
- 2019/12/04
統計学入門「主義」を心配するみなさまに東京工業大学渡辺澄夫このファイルの目的このファイルは統計学において「主義」を心配するみなさまのための解説です。１要約いつも何度でも尋ねられる質問頻度主義とベイズ主義はどちらが正しいですか。このファイルの回答１正しい主義は存在しません。好きな主義と好きな方法を使うことができます。推測が当たるかどうかが問題です。このファイルの回答２推測に「主義」は不要です。推測を当てるには数理科学が必要です。このファイルの回答３「主義」を争うことに意義はありません。論争をやめて数理科学へ進みましょう。時間がないかたにこのファイルを読むのがメンドウで結論だけを知りたいかたは最後のページをご覧ください。２統計的推測とは統計的推測とは未知である真の分布からデータが得られ
あの「モンティ・ホール問題」で当選率33％が66％になる理由が分かり、生き上手になれる「ベイズの定理」の基礎知識
- 14 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2020/12/25
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回は「確率・確率分布」について学びました。今回のテーマである「ベイズの定理」は、そのもう少し高度な内容といえます。ぜひ、前回記事も併せてお読みください。ベイズってどんな人？トーマス・ベイズ（Thomas Bayes）は1702～1761年に実在したイギリスの人物です。彼の肩書は異色で、牧師でありながら数学者でもあります。そんな彼は「神の存在を方程式で説明できる」と主張したそうです。ベイズは牧師として活動する傍ら研究を重ね、後に解説する「ベイズの定理」を含む「ベイズ理論」を考案したという偉業を成しています。ところが、その偉業はベイズの死後である1764年にRプライス（生命保険の創始者の一人）によって発見されました。その後、偉大な物理学者
- 数学
- ベイズ
- Python
- person
- HotEntry
- AI
機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた - Lean Baseball
- 14 users
- shinyorke.hatenablog.com
- エンタメ
- 2020/07/29
やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳（2020〜2024年）までの打撃成績を, 一般的な打撃成績データ（安打, 本塁打, 三振etc...）を使った機械学習でそれっぽく出してみました大谷翔平さんはやっぱ凄い（詳細はこの後で）まだまだ改良点や穴があるものの, 統計的にもアルゴリズム的にも十分に納得行くモノができたので一旦公開します. なお, どういったアプローチでやったか?特徴量はどうやって選んだか??については8/28, 29開催のPyCon JP 2020で発表します.*1 免責事項言うてもおもちゃですしちょっとしたお遊びです. そのつもりでご覧ください. 一部のサンプルコードを除きコードおよび特徴量は公開しません. データはMLBのPublicな公開データセットであるLahman’s Baseball Databaseおよび, RETROSHEETを使っ
深層生成モデルを巡る旅(2): VAE - Qiita
- 13 users
- qiita.com/shionhonda
- テクノロジー
- 2019/11/01
はじめに深層生成モデルを巡る旅をしています。前回はFlowについて理論と各種法の簡単な紹介をしました. 今回はまた別の深層生成モデルとして変分自己符号化器 (VAE; variational autoencoder) [1] を紹介します. VAEはGANに比べて安定した学習ができ, Flowと異なり潜在変数を低次元に落とすことができるので, その扱いやすさや解釈性から好まれることが多いように感じます. 一方で, 生成画像がぼやけがちである, 尤度の計算ができないといった欠点もあります. この1ヶ月くらいVAEについていろいろと調べてみましたが, GANやFlowのようなモデル乱立状態にはなっていなさそうだったので, 主要な手法を少し詳しめに紹介できればと思います. VAEの基本最初に, 本記事を読むのに必要な事項をまとめます. 全体像式での説明は少々長いので, 先にMNISTの
Deep Learning for AI – Communications of the ACM
- 12 users
- cacm.acm.org
- テクノロジー
- 2021/07/16
How can neural networks learn the rich internal representations required for difficult tasks such as recognizing objects or understanding language? Yoshua Bengio, Yann LeCun, and Geoffrey Hinton are recipients of the 2018 ACM A.M. Turing Award for breakthroughs that have made deep neural networks a critical component of computing. Research on artificial neural networks was motivated by the observa
- 機械学習
- HotEntry
- 論文
- AI
- book
- あとで読む
GitHub - ddbourgin/numpy-ml: Machine learning, in numpy
- 12 users
- github.com/ddbourgin
- テクノロジー
- 2019/07/09
Click to expand! Gaussian mixture model EM training Hidden Markov model Viterbi decoding Likelihood computation MLE parameter estimation via Baum-Welch/forward-backward algorithm Latent Dirichlet allocation (topic model) Standard model with MLE parameter estimation via variational EM Smoothed model with MAP parameter estimation via MCMC Neural networks Layers / Layer-wise ops Add Flatten Multiply
C# or Java? TypeScript or JavaScript? Machine learning based classification of programming languages
- 11 users
- github.blog
- テクノロジー
- 2019/07/08
EngineeringProductC# or Java? TypeScript or JavaScript? Machine learning based classification of programming languagesTo make language detection more robust and maintainable in the long run, we developed a machine learning classifier named OctoLingua based on an Artificial Neural Network (ANN) architecture which can handle language predictions in tricky scenarios. GitHub hosts over 300 programming
- Machine Learning
- GitHub
- git
- 人工知能
- Ruby
- Python
Python: アンサンブル学習の Voting を試す - CUBE SUGAR CONTAINER
- 10 users
- blog.amedama.jp
- テクノロジー
- 2019/08/21
今回は機械学習におけるアンサンブル学習の一種として Voting という手法を試してみる。これは、複数の学習済みモデルを用意して多数決などで推論の結果を決めるという手法。この手法を用いることで最終的なモデルの性能を上げられる可能性がある。実装については自分で書いても良いけど scikit-learn に使いやすいものがあったので、それを選んだ。 sklearn.ensemble.VotingClassifier — scikit-learn 0.20.2 documentation 使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.1 BuildVersion: 18B75 $ python -V Python 3.7.1 下準備まずは今回使うパッケージをインストールしておく。 $ pip insta
ベイズの定理を用いてPCR検査の有用性を考える際の注意点｜臨床獣医師の立場から
- 10 users
- tatsuharug.com
- 世の中
- 2020/05/26
コロナウイルスPCR検査を行う場合に事前確率が低いと考えられる場合には検査を行うべきではないと主張する人達がいます。その理由としてベイズの定理を用いた計算で事後確率が低くなるからとしています。本当なのでしょうか？動画を説明しますと有病率0.1％、精度(感度、特異度)99％、10万人に検査を行った場合本当に病気に罹患している人は100人、罹患していない人は99900人。本当に病気に罹患している人で陽性と判定される人は99人、陰性と判定される人は1人。罹患していない人で陽性と判定される人は999人、陰性と判定される人は98901人。陽性と判定された場合に本当に陽性の確率は99/99+999 = 11/122 = 約9%(事後確率) 従って事前確率が低い場合は検査を行ってはならない。岩田先生も数字は異なりますが同じようなことを言ってます。 PCR検査の特異度厚生労働省の資料に
- COVID-19
- あとで読む
A Sober Look at Bayesian Neural Networks
- 10 users
- jacobbuckman.com
- テクノロジー
- 2020/01/20
by Carles Gelada and Jacob Buckman WARNING: This is an old version of this blogpost, and if you are a Bayesian, it might make you angry. Click here for an updated post with the same content. Context: About a month ago Carles asserted on Twitter that Bayesian Neural Networks make no sense. This generated lots of good discussion, including a thorough response from Andrew Gordon Wilson defending BNNs
NumPyroによるベイズモデリング入門【線形回帰編】 - deepblue
- 8 users
- blog.deepblue-ts.co.jp
- テクノロジー
- 2020/09/30
はじめにこんにちは deepblue でインターン生として働いている渡邊です。最近、PyroやTensorflow Probabilityなどの深層学習ライブラリベースのGPU対応PPL（確率的プログラミング言語）が出てきていますが、なかなか知られていないNumPyroなるものがあるそうです。NumPyroはバックエンドがJaxでサポートされているPPLで、マルコフ連鎖モンテカルロ（MCMC）法によるサンプリングが高速らしいので、今回は線形回帰で使用感を試してみたいと思います。今回の内容は、ベイズモデリングの用語（事前分布、事後分布など）はご存知の方が対象ですので、そこも怪しいと思われる方はこの記事をさらっと見てから来てくださると理解しやすいと思います。参考サイト確率モデリングと事後分布、事前分布、超パラメータ【Jax, Numpyro】Regression Model pra