[B! *event][rl] sh19910711のブックマーク

sh19910711 id:sh19910711

*eventとrlに関するsh19910711のブックマーク (2)

ICML'17における強化学習 - sotetsuk's tech blog
この記事は2017年に書きかけのままだったブログ記事の供養です。今2018年年始なので、NIPS参加報告も目立つ中、4ヶ月遅れくらいですが書きかけだったICML2017の参加録をひとまず投稿しておきます。ホットトピックモデルベース深層強化学習ソフト最適階層性（オプション）（報酬情報なしでの）系統立った探索一貫学習 (end-to-end learning) 学習時と異なる環境への汎化（transfer/zero-shot）実用的な探索（安全・公平）ヒトによる教示方策オフ型学習でのバイアス・バリアンス個人的に面白かった発表・トピック5選チュートリアルソフト最適カテゴリカルDQN ベータ方策 PVFによるオプションの発見総括 [PR] 速習強化学習 8月上旬にシドニーで行われたICML2017に参加してきました私自身は自然言語生成のワークショップで発表をしてき
sh19910711 2024/04/25
"モデルフリー: DQNやA3C + 環境のモデルをブラックボックス的に扱う / 強化学習の文脈では、より階層が上の方策（のようなもの）をオプションと呼ぶことがあり / 探索のアプローチは「不確かなときは楽観的に」の原則" 2018

*event

*algorithm

機械学習

rl
リンク
突撃KDD2018🎤！〜強化学習ハンズオンとKDD Cupを中心に〜 - Qiita
この記事は，ドコモSI部アドベントカレンダー10日目の記事になります。今回の記事では今年の夏に出張したKDD2018について，特に強化学習ハンズオンとKDD Cupを中心に書いていきたいと思います。 ※下記リンクから飛べば記事のつまみ食いができます🍔 - 強化学習ハンズオン - KDD Cup Workshopまとめ概要 KDDは今年で24回目を数える，データマイニング関連の学術会議です。今年は8/19〜8/23の期間で，イギリスのロンドンで開催されました。参加者，採択論文数ともに過去最大となり，一層の盛り上がりを見せています。会議は特定の分野の基本事項から最先端研究までを概観するチュートリアル，各分野の最先端な研究発表が行われる本会議，参加者が手を動かしながら基本事項を学ぶハンズオンから構成されています。またイベントとして，特に深層学習分野での各種基調講演が行われるDeep
sh19910711 2024/04/03
"ray: pythonで利用可能な分散処理を行うためのライブラリ + その中のRLlibは，先ほどのDQNの他にもPPO, A2Cなどの強化学習アルゴリズムが実装 / それらの学習を分散処理させながら実行できます" 2018

*event

*algorithm

機械学習

rl
リンク
1