誰でもわかる強化学習

テクノロジーカテゴリーの変更を依頼記事元:

speakerdeck.com/imai_eruel

371 usersがブックマークコメント

コメント

12

記事へのコメント12件

注目コメント
新着コメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

誰でもわかる強化学習

本資料は，東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに，講演目的でより初学者... 本資料は，東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに，講演目的でより初学者向けに内容を調整したものです．特に強化学習で最も基本的かつ最重要手法であるQ学習や，それの深層強化学習版のDQN（Deep Q-Network）を中心に解説しています. 昨今，ChatGPT等の大規模言語モデル（LLM）の開発に強化学習が使用（RLHF等）され，さらに強化学習をLLMに本格的に組み込んだAI（ GoogleのGemini，OpenAIのQ*等）の出現が予想されることから，�強化学習の知識の普及のため公開しました.

ブックマークしたユーザー

minorusato2024/01/04
knj29182023/12/21
mgl2023/12/03
sskoji2023/11/30
yamada_k2023/11/29
ideahack2023/11/29
thaturn2023/11/29
ranto3811242023/11/29
okyawa2023/11/29
tasanobu2023/11/28
hate-uruma2023/11/28
kamiru782023/11/28
kat212023/11/28
yasu6912132023/11/27
hironobu-s2023/11/27
misshiki2023/11/27
kenkaton2023/11/26
tohtawa3302023/11/26

同じサイトの新着

ChatGPT�人間のフィードバックから強化学習した対話AI

321 usersspeakerdeck.com/imai_eruel

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx