タグ

*eventとrlに関するsh19910711のブックマーク (2)

  • ICML'17における強化学習 - sotetsuk's tech blog

    この記事は2017年に書きかけのままだったブログ記事の供養です。 今2018年年始なので、NIPS参加報告も目立つ中、4ヶ月遅れくらいですが書きかけだったICML2017の参加録をひとまず投稿しておきます。 ホットトピック モデルベース深層強化学習 ソフト最適 階層性(オプション) (報酬情報なしでの)系統立った探索 一貫学習 (end-to-end learning) 学習時と異なる環境への汎化(transfer/zero-shot) 実用的な探索(安全・公平) ヒトによる教示 方策オフ型学習でのバイアス・バリアンス 個人的に面白かった発表・トピック5選 チュートリアル ソフト最適 カテゴリカルDQN ベータ方策 PVFによるオプションの発見 総括 [PR] 速習 強化学習 8月上旬にシドニーで行われたICML2017に参加してきました 私自身は自然言語生成のワークショップで発表をしてき

    ICML'17における強化学習 - sotetsuk's tech blog
    sh19910711
    sh19910711 2024/04/25
    "モデルフリー: DQNやA3C + 環境のモデルをブラックボックス的に扱う / 強化学習の文脈では、より階層が上の方策(のようなもの)をオプションと呼ぶことがあり / 探索のアプローチは「不確かなときは楽観的に」の原則" 2018
  • 突撃KDD2018🎤!〜強化学習ハンズオンとKDD Cupを中心に〜 - Qiita

    この記事は,ドコモSI部 アドベントカレンダー10日目の記事になります。 今回の記事では今年の夏に出張したKDD2018について,特に強化学習ハンズオンとKDD Cupを中心に書いていきたいと思います。 ※下記リンクから飛べば記事のつまみいができます🍔 - 強化学習ハンズオン - KDD Cup Workshopまとめ 概要 KDDは今年で24回目を数える,データマイニング関連の学術会議です。今年は8/19〜8/23の期間で,イギリスのロンドンで開催されました。 参加者,採択論文数ともに過去最大となり,一層の盛り上がりを見せています。 会議は特定の分野の基事項から最先端研究までを概観するチュートリアル,各分野の最先端な研究発表が行われる会議,参加者が手を動かしながら基事項を学ぶハンズオンから構成されています。またイベントとして,特に深層学習分野での各種基調講演が行われるDeep

    突撃KDD2018🎤!〜強化学習ハンズオンとKDD Cupを中心に〜 - Qiita
    sh19910711
    sh19910711 2024/04/03
    "ray: pythonで利用可能な分散処理を行うためのライブラリ + その中のRLlibは,先ほどのDQNの他にもPPO, A2Cなどの強化学習アルゴリズムが実装 / それらの学習を分散処理させながら実行できます" 2018
  • 1