エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
PyTorchでDQNを実装した | moskomule log
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
PyTorchでDQNを実装した | moskomule log
はじめに DQN(Deep Q Network)は Minh et al. 20151(以下論文)で登場した深層強化学習の先駆けです.A... はじめに DQN(Deep Q Network)は Minh et al. 20151(以下論文)で登場した深層強化学習の先駆けです.Atariのゲームで非常に高い得点を修めるというパフォーマンスで有名になりました. 9月頃に強化学習の勉強をした際に実装してみたのですが,一向に学習が進まず放置していたのですが,最近Implementing the Deep Q-Network 2を読み再開してみたところ,動いてしまったので,この記事を書くことになりました. 今回の実装はこちらにあります. 強化学習とは David Silver先生に聞きましょう.ただしこの講義では深層強化学習は扱われていません. Deep Q-Networkとは 論文を読みましょう.Q-Learningの応用で,複雑ではありませんが,学習を安定させるための工夫が各所にあるので見逃すと動かないようです. DQNの学習アルゴリ