ZAORIKUのブックマーク - はてなブックマーク

強化学習の基本：マルコフ決定過程ってなんぞ？ - HELLO CYBERNETICS

はじめに環境とエージェント環境マルコフ過程本当のマルコフ過程マルコフ決定過程本当のマルコフ決定過程強化学習の話をちょっとだけ最後にはじめに強化学習を真面目に勉強し始めたので、ここまで学んだ知見を記事としてまとめます。線形代数の基本的な表記や確率統計で出てくる基本的な言葉を前提とし、理論的な証明などは割愛し結果だけを認める形で進めていきたいと思います。環境とエージェントまず最初に強化学習で現れる「環境とエージェントの相互作用」なるもの言葉について、実を言うと、目の前にある課題は環境とエージェントの相互作用というのは必ずしも必要がないかもしれません（そうであれば強化学習という手段を行使しないということ…）。強化学習を学び始めるとどうしてもこの相互作用なるものが前提で話が進んでしまうため、若干の分かりにくさが生まれてしまうように思います。ここでは思い切って、「環境」と

ZAORIKU 2022/02/22

リンク

状態空間モデルと推論アルゴリズムの概要 - HELLO CYBERNETICS

はじめに状態空間モデル状態空間モデル AR(1) モデル AR(p) モデル状態空間モデルに対する推論まとめはじめに今回は状態空間モデルと呼ばれる非常に広いクラスのモデルを扱います。状態空間モデルは、ARモデルを代表とする時系列モデルや空間的に隣接している局所構造を表すモデルを記述し、統一的に扱える非常に便利な表現を提供します。状態空間モデルでのとある設定が、わざわざ固有名詞を持って（別の表現で）モデリングされているケースも多々あることを考えると、状態空間モデルを勉強すれば固有名詞を与えられるほどの重要なモデルを包含した体系を学ぶことができるというわけで、これは抑えておくと非常に良いということです。まずはじめに状態空間モデルの一般的な表現を学び、それに対して具体的な設定を与えるとどのようなモデルになるのかを見ていくという形式にします。また、状態空間モデルに対する推論手法と

ZAORIKU 2020/09/19

リンク

確率モデリングのための確率分布の式変形基本【ベイズの定理/グラフィカルモデル】 - HELLO CYBERNETICS

はじめに確率モデリング確率変数間の関係性記述ベイズの定理と条件付き分布関係性の記述と事後分布の導出いろいろなパターンの練習パターン１パターン2 同時分布とグラフィカルモデル基本事項すべて互いに関連すべて互いに独立有向グラフ化関連を断ち切ることによるモデリング最後にはじめに確率モデリングでは、複数の確率変数間の関係性を記述するということが必要になります。そうして確率変数間の関係性を記述したら、あとは観測できているデータは確率変数を所与としてしまい、その観測データの条件付き分布により、他の確率変数の事後分布を表現するということを行います。この事後分布を求める部分をいわゆる学習と呼び、その後、事後分布を用いて予測したい変数の値を分布として（あるいは分布からのサンプリングとして）出力させることで予測を行います。しかし、多くの確率モデリングの初学者は、実は確率変数

ZAORIKU 2020/08/15

リンク

E資格で必須の特異値分解解説 - HELLO CYBERNETICS

はじめに特異値分解定義特異値分解の嬉しさ行列の低ランク近似主成分分析の解法行列による増幅率を定義特異値と特異ベクトルの実態最後にはじめに予め断っておきます。私はE資格を持っていませんし受けたこともありません。なんか特異値分解は知識として必須らしいという話だけ聞きました。なのでタイトルに入れました（完全に検索対策である）。タイトルは動機不純として…、特異値分解はデータ分析にしても信号解析にしても、線形代数での必須知識だと思われるのでここで解説しておきます。特異値分解定義特異値分解は定義だけ述べれば、行列 $\mathbf X \in \mathbb C ^ {m \times n}$ に対する下記で表される分解手法です。 $$ \bf X = U \Sigma V ^ * $$ ここで $\mathbf U \in \mathbb C ^ {m \times m

ZAORIKU 2020/02/13

リンク

確率的プログラミング言語 pyro 基本 - HELLO CYBERNETICS

はじめに Pyro primitives 確率変数の実現値 sample 条件付き独立のベクトル化 plate 階層モデル変分パラメータを扱う param poutine モデルの様子を把握する trace 条件付き分布の作成 condition まとめと変分推論の例はじめに本当はTensorFlow2が世の中で使われるようになって、情報も増えるのが一番嬉しいのですが、ちょっと周囲の状況も含めてPyTorch続投の兆しが強いため、確率的プログラミング言語としてPyroを選択する可能性も出てきました。というわけでPyroの記事です。 https://pyro.ai/ Pyro PyTorchをバックエンドとした確率的プログラミング言語（PPL）です。PPLの名に恥じないくらい、確率モデリングが容易に可能で、TensorFlow Probabilityほど剥き出しのTensorをアレコレ

ZAORIKU 2019/12/08

リンク

エントロピーからKLダイバージェンスまでの話 - HELLO CYBERNETICS

情報理論でエントロピーなる概念を導入し、情報量を定式化したことを前回の記事で紹介しました。 s0sem0y.hatena blog.com 機械学習ではパラメトリックな推定を行う際に真の確率分布p(x)をq(x|θ)で表現するために、KLダイバージェンスKL(p(x)||q(x|θ))を最小化する問題に帰着させます。 KLダイバージェンスの性質が確率分布の隔たりを表現できると考えられるため、このような学習則が用いられ、実際にKLダイバージェンスの最小化は、尤度の最大化と数学的に一致しますから尤もらしい推定を行っていると言えます。今回はこれを情報量なる観点から見なおして、元々の定義であるエントロピーの立場から、確率分布を近似する有効な手法であることを見ていきます。KLダイバージェンスは相対エントロピーと呼ばれる概念と同等のものであり、相対エントロピーの最小化が最尤推定に一致するわけですが、で

ZAORIKU 2018/12/01

リンク

【まとめ】Principal Component Analysis【PCA：主成分分析】 - HELLO CYBERNETICS

はじめにデータの前提分散最大化（KL展開）取り出したい成分について問題の定式化問題を解く元々の多次元信号次元削減後の信号寄与率各成分が無相関になるような射影先を選ぶ 5次元の観測データ無相関化したデータ確率的主成分分析（最尤推定）定式化解法ベイズ主成分分析（MAP推定）補足：事前分布は任意性を持つベイズ学習の基本 MAP推定主成分分析のMAP推定コード（TensorFlow Probability）インポートとデータの準備モデル最適化ループ学習されたモデルからのデータの生成はじめに PCAは色々と勉強になるので、今回ここでザッとまとめておこうと思います。実はこれまでにも何度も取り上げていて、 www.hellocybernetics.tech www.hellocybernetics.tech 等などあるのですが、その場でその場で場当たり的に比較

ZAORIKU 2018/11/29

リンク

TensorFlow Eager Execution + Keras API の基本 - HELLO CYBERNETICS

はじめに Eager Executionの書き方インポートデータの準備モデルの書き方学習コードモデルの評価補足 Google colabでのTensorBoard 最後にはじめに TensorFlow2.0から Eager Execution と Keras API が標準になる見込みです。すでにブログではこのことを何度か取り上げています。 www.hellocybernetics.tech www.hellocybernetics.tech 今回は、TF2.0から最も標準的になると思われるコードの書き方を見ておきましょうというテーマになります。特にディープラーニングのテクニックや手法の考察などは行わないので、あくまで書き方の参考という程度に御覧ください。コードはgoogle colabで書いていったので、基本的にはjupyter notebookなどで動作させることを想

ZAORIKU 2018/11/22

リンク

大幅に進化するらしいTensorFlow2.0について - HELLO CYBERNETICS

はじめに TensorFlow2.0がもうすぐ来るよ！ APIs High level APIs Eager Exexution Reference Models Contribの扱いプラットフォーム TensorFlow Lite TensorFlow.js TensorFlow with Swift パフォーマンス Distributed TensorFlow CPU、GPU、TPUの最適化関連その他のパッケージ TensorFlow Probability Tensor2Tensor End to End ML systems TensorFlow Hub TensorFlow Extended はじめに TensorFlow2.0ではこれまでのTensorFlowから大幅に変化するので、その変更点について記しておきます。基本的には公式のRoadmapの和訳と思って差し支えあり

ZAORIKU 2018/09/20

リンク

074452

はじめに量子アニーリングマシンの概要量子コンピュータ組み合わせ最適化問題問題の書き換え量子アニーリングマシンの動作巡回セールスマン問題を量子アニーリングマシンで解く量子アニーリングマシンの実態量子アニーリングマシンの応用に向けて実応用における課題：物理的な事情社会的応用における課題機械学習との関連はじめに今回は量子コンピュータとして応用が期待されている（既にされている？）量子アニーリングマシンについて、一般の人にも分かるように数学的な話を避けながら教養としてまとめておきたいと思います。実際のところは私自身も量子コンピュータについては初歩的な勉強を始めた段階であり、全くの初心者であることをご承知ください。量子アニーリングマシンの概要量子コンピュータ量子コンピュータとは量子力学的な振る舞いを計算に取り入れたコンピュータの総称です。なぜ「総称」なのかというと、今

ZAORIKU 2018/08/19

リンク

【機械学習を基本から丁寧に】TensorFlow Eager Executionで多項式回帰の実行 - HELLO CYBERNETICS

はじめに実行環境理屈編問題設定損失関数損失を小さくする勾配法実践編必要なライブラリの準備問題設定モデルの設計と損失関数 tf.keras.Modelクラスでモデルの雛形を作る損失関数勾配の計算パラメータの更新実験初期状態のモデル学習後のモデル本当に学習は上手く行ったのか補足コード全体関連記事前回記事続きの記事はじめに前回の記事では単回帰で直線をフィッティングする問題を、TensorFlow Eager Executionで実行しました。割と低レベルなTensorFlowの機能を使ったため、数式とほとんど直結した形で機械学習の動作を確認できたのではないかと思います。 www.hellocybernetics.tech 実は先のような単回帰をしっかりマスターすると、基本的にどんなモデルを仮定するのかというのがちょっと変わるだけで、いろいろな手法を

ZAORIKU 2018/06/28

tensorFlow

リンク

Deep Learning勉強のための書籍【2018年版】 - HELLO CYBERNETICS

はじめに初級編ゼロから作るDeep Learning 中級編 scikit-learnとTensorFlowによる実践機械学習 PythonとKerasによるディープラーニング上級編 Pro Deep Learning with TensorFlow Deep Learning はじめにディープラーニングに関する書籍は山ほど出てきています。その中でどれを読めば良いのか分からない、というのは初心者にとって最初の問題でもあるでしょう。まずはブログなどのネットの情報を参考に勉強をする人が多いかと思われますが、私のブログも含め、大抵は個人の興味に沿ってバラバラに話題が提供されるため、できれば1つ1つ順を追って解説してくれる物が欲しいと感じるのが本音と思われます。今回は、数ある書籍の中でも私自身が所持していておすすめできるディープラーニングの書籍を載せたいと思います。初級編ゼロから作

ZAORIKU 2018/05/21

リンク

線形層と比較した畳み込み層 - HELLO CYBERNETICS

はじめに全結合層全結合層の数式非全結合層畳み込み層入力成分のindexに着目した非全結合層非全結合・重み共有層 1D畳み込み層 2Dの畳み込み層最後にはじめに今回はニューラルネットワークの基本的な構成要素である線形（全結合）層と畳み込み層について簡単に説明します。これを説明するモチベーションは、「畳み込み層は線形層よりも優れた発展的手法、複雑な手法であるという勘違いが初学者の中であるのではないかと感じ、それの解消をするためです。以降、畳み込み層と線形層の最たる違いを主張するために、線形層のことを全結合層と呼ぶことにします。この呼び名は、TensorFlowやKerasなどのフレームワークで採用されています（layers.dense）。全結合層全結合層の数式まず全結合層について数式を以下に示します。入力ベクトル$x \in \mathbb R^{D}$に対し

ZAORIKU 2018/03/11

リンク

ディープラーニングのハイパーパラメータ自動調整の概要 - HELLO CYBERNETICS

はじめにハイパーパラメータ自動調整の概要学習という関数グリッドサーチ関数近似器（ガウス過程）による方法メタヒューリスティック最適化強化学習まとめライブラリはじめにディープラーニングのハイパーパラメータ調整がとんでもなく退屈なことは周知の事実（？）です。一度学習を回すとその経過が気になってログを眺めてしまう人も多いのではないでしょうか。どうも望みがなさそうならさっさと次の値を試したいという思いもあることでしょう。そして、なるべく数を打ちながら良さげなハイパーパラメータの範囲を早く絞り込みたいと思うのではないでしょうか。こういうこと自体を上手く自動化するような試みが欲しくなります。古典的な方法ではグリッドサーチで、とにかく考えうるパターン全部試してやれ！というものがあります。しかしこの方法はディープラーニングのように一回の学習に時間が掛かる場合には有効ではありません。今

ZAORIKU 2018/02/10

リンク

最適制御からの強化学習 - HELLO CYBERNETICS

はじめに最適制御そもそも制御問題とは？自動制御フィードバック制御制御問題の例最適制御問題最適制御のまとめ最適制御から強化学習へ最適制御の困難強化学習の形式と最適制御との比較環境の振る舞いを知る方法は無いのか強化学習の大まかな流れモンテカルロ法 TD法関数近似最後に制御の分野と強化学習基本的思想の違い実用的問題 PID制御という巨人はじめに強化学習といえば、最強の囲碁ソフトAlpha Go に搭載されているアルゴリズムで一躍有名となった分野です。今回は強化学習の特殊な問題設定がどういうものであるかを強調するため、最適制御としての立場から発展させた強化学習を見てみたいと思います。最適制御そもそも制御問題とは？例えば、自動車の速度を調整する場合、タイヤの回転を調整する必要がありますが、私達が実際にやっているのはアクセルやブレーキを踏み込むことだけです。

ZAORIKU 2017/10/30

強化学習

リンク

機械学習関連を取り扱うはてなブログを探してみた - HELLO CYBERNETICS

はじめに自然言語処理の深遠作って遊ぶ機械学習六本木で働くデータサイエンティストのブログ人工知能に関する断創録数学、ときどき統計、ところによりIT 空飛ぶロボットのつくりかたはじめにただの雑記。専門書的な内容ではなく、機械学習に取り組む実際の姿が見られるブログを取り集めました。例えばコードが載っているとか、分かりやすい解説があるとか、その手の記事が書かれているものに焦点を絞っています。自然言語処理の深遠非常に実践的。今のところは、あまり記事は多くありませんが、Kerasを使った機械学習による自然言語処理に関しての記事が積極的に書かれています。Kerasの実装に関して、コードで検証を行っていたり、実用面で参考になることが多いと思われます。 hironsan.hatena blog.com 特に自然言語処理だとChainerやPyTorchのようなDefine by Runの

ZAORIKU 2017/09/22

リンク

機械学習をこれから始める人の線形代数を学ぶモチベーション - HELLO CYBERNETICS

はじめに機械学習に使われる主要な数学線形代数最も重要な理由線形代数って何なんだ？線形代数を学ぶモチベーション線形代数を学んで、できるようになること補足微分積分学は？確率統計は？確率・統計を考えていくための初歩を確認したい人は以下の記事へはじめにこの記事は、私が機械学習を学んできて感じた、数学の役割をまとめたものです。記事を書く上で特に意識したのは、ある数学が機械学習においてどのように活躍し、どのような旨味をもたらしたのか、そして、そこから数学を学ぶ意義を改めて抑えることです。数学の解説をすることが目的ではないため、直接的に数学の疑問を晴らすということにはなりませんが、これから機械学習を学んで行こうという場合に、数学がどのように役立ちうるのか、その全体像を予め把握しておくことに使っていただけると幸いです。機械学習に使われる主要な数学多くの書籍、多くの記事が世の

ZAORIKU 2017/07/16

リンク

機械学習で抑えておくべき損失関数（回帰編） - HELLO CYBERNETICS

はじめにニューラルネットワーク損失関数を考えるモチベーション回帰の損失関数色々な損失関数二乗損失分位損失 Huber損失感度損失（ε-許容損失）損失関数の図示二乗損失分位損失 Huber損失 ε-感度損失（ε-許容損失）比較損失関数の使い分け１損失関数の使い分け２損失関数の使い分け3 最後に分類に関する損失関数はじめに機械学習における教師あり学習では、入力に対してパラメータを用いて関数を構築し、正解データに対して損失を定義し、これを最小化する手続きを取ります。損失を、色々なとの組に対して計算し、その総和が最小化されるようにを決めることを学習と呼びます。これにより未知のデータを入力した時に、それに対する正解をが出力してくれることを期待するのです。学習がの最小化という目標に従っている以上、このをどのような形にするのかが重要になるのは言うまでもありません。

ZAORIKU 2017/06/19

機械学習

リンク

今更聞けないLSTMの基本 - HELLO CYBERNETICS

ディープラーニングで畳込みニューラルネットに並ぶ重要な要素のであるLong Short-Term Memoryについて、その基本を解説します。 LSTMとはリカレントニューラルネットワーク LSTMの役割 LSTMの計算 Output Gate Input GateとForget Gate Forget Gate Input Gate LSTMの肝であるMemory Cell周辺 Forget Gate側の出来事 Input Gate側での出来事 Cellの手前での出来事出力付近の話 LSTMの役割セル付近の役割 Forget Gateが過去の情報をどれだけ保持するか決める全体を通しての役割最後に LSTMとは LSTMとはLong Short-Term Memoryの略です。 short-term memoryとは短期記憶のことであり、短期記憶を長期に渡って活用することを可能に

ZAORIKU 2017/05/07

リンク

時系列データ：隠れマルコフモデルの基礎と、リカレントネットの台等 - HELLO CYBERNETICS

はじめに隠れマルコフモデル確率分布として考える隠れていないマルコフモデル隠れマルコフモデル隠れマルコフモデルの学習隠れマルコフモデルでの予測隠れマルコフモデルで何ができるかリカレントネットリカレントネットの構造時間方向への展開深層学習について記事はじめに隠れマルコフモデルでは、時系列的に変動するデータを確率的なモデルで表現します。通常の機械学習手法（例えばサポートベクターマシン）などでは、データは各時刻毎に独立したデータであると仮定しており、そのデータの順番に意味がないという前提を持っています。（厳密には更に強く仮定をし、各データ点はある一つの確率分布から生起しているとし、各データ点同士は独立であるとする。これを独立同分布に従うデータと言う。）一方で隠れマルコフモデルでは、データの変動（隠れマルコフモデルでは遷移と呼ぶ）が確率的に起こっているとしてその部分を

ZAORIKU 2017/01/15

リンク

はてなブックマーク

タグ

ブックマーク / www.hellocybernetics.tech (22)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス