強化学習における好奇心

テクノロジーカテゴリーの変更を依頼記事元:

speakerdeck.com/learn_learning3

56 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

sh19910711 2019 / "報酬発見前のエージェント: ランダムな探索をしているに等しい > 最初の報酬発見が重要 / 報酬がスパースな環境で探索基準なしで報酬に到達することは難しい > エージェントに未知の部分に対する興味を与える"

2022/05/04 リンク

stealthinu 強化学習になぜ「好奇心」を導入するか「好奇心」をどう実現するかかわかりやすく解説されてる。学習後とのKLダイバージェンスが大きいほど新しい知見ありと考えるのね。

2019/05/24 リンク

mojimojikun ( ･∀･)つ〃∩ ﾍｪｰﾍｪｰﾍｪｰ

2019/05/03 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

強化学習における好奇心

【2020年アップデート版】強化学習では，環境で得られる報酬がスパースである場合，うまく学習すること... 【2020年アップデート版】強化学習では，環境で得られる報酬がスパースである場合，うまく学習することができない．この問題を解決するための手法として，強化学習のエージェントに「好奇心」を与える研究が注目されている．本スライドでは，深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた．特に主要ベンチマークであるMontezuma's Revengeで高いパフォーマンスを発揮したアルゴリズムについて詳しく解説する．また，「好奇心」による探索を報酬がスパースな場合以外の強化学習に適用した場合の最新研究についても紹介する．現在は，本資料の修正・アップデート版を以下で公開しています．【強化学習における好奇心】 https://www.slideshare.net/ShotaImai3/curiosity-reinforcement-learning-238344056

ブックマークしたユーザー

techtech05212024/03/05
sh199107112022/05/04
bando_alpha2020/01/11
mkusaka2019/12/31
wass802019/06/19
stealthinu2019/05/24
knok2019/05/21
misshiki2019/05/07
samurairodeo2019/05/05
l080842019/05/05
tkos-rg2019/05/04
endo_55012019/05/04
arpena1pay2019/05/04
yss442019/05/04
tuiterukun002019/05/04
p_tan2019/05/03
NATTI2019/05/03
sh052019/05/03

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx