cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/Read less
東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
2. Copyright © 2017 TIS Inc. All rights reserved. 2 自己紹介 本日のテーマ 取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次 3. Copyright © 2017 TIS Inc. All rights reserved. 3 嘉村準弥 TIS株式会社 戦略技術センター 旅行会社Webアプリ開発の要件定義~開発~保守運用に従事 システム開発の現場をこれまで用いてこなかった技術によって改善し たいとの思いから戦略技術センターへ異動 現在は機械学習や自然言語処理についての研究を行いながら、プロト タイプの開発を行う 自己紹介 今一番気になってる書籍です→ kamujun @kamujun18 4. Copyri
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く