speakerdeck.com[B!]新着記事・評価 - はてなブックマーク

『speakerdeck.com』

誰でもわかる強化学習
371 users
speakerdeck.com/imai_eruel

本資料は，東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに，講演目的でより初学者向けに内容を調整したものです．特に強化学習で最も基本的かつ最重要手法であるQ学習や，それの深層強化学習版のDQN（Deep Q-Network）を中心に解説しています. 昨今，ChatGPT等の大規模言語モデル（LLM）の開発に強化学習が使用（RLHF等）され，さらに強化学習をLLMに本格的に組み込んだAI（ GoogleのGemini，OpenAIのQ*等）の出現が予想されることから，�強化学習の知識の普及のため公開しました.
- テクノロジー
- 2023/11/24 22:03
- AI
- あとで読む
- 強化学習
- 機械学習
- 学習
- ChatGPT
- 勉強
- 資料
- 言語
- LLM

ChatGPT�人間のフィードバックから強化学習した対話AI
321 users
speakerdeck.com/imai_eruel

東京大学の研究室内で，今井がChatGPTの知見を共有するために使用したスライド資料です．特に以下のような話題，技術について解説しています．・ChatGPTの凄さ・ChatGPTの技術・言語モデル・プロンプト・GPTとは・InstructGPT ・言語モデルと強化学習・RLFH
- テクノロジー
- 2023/03/28 18:45
- ChatGPT
- AI
- あとで読む
- LLM
- 機械学習
- NLP
- 学習
- pdf
- 資料
- GPT

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx