エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント2件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Q* の勝手な予想メモ|深津 貴之 (fladdict)
OpenAIのQ*というモデルアプローチに関してメモ。この分野は素人なので、あくまで勝手な予想です。 Qラ... OpenAIのQ*というモデルアプローチに関してメモ。この分野は素人なので、あくまで勝手な予想です。 Qラーニングとは?Q学習(Q-learning)は、強化学習の一種で、エージェントが最適な行動を学習する方法です。このアプローチでは、エージェントは環境との相互作用を通じて、各状態でどの行動を選択することが最も報酬をもたらすかを学習します。 A*は?A*(エースター)アルゴリズムは、最短経路問題を解決するための効率的なグラフ探索アルゴリズムです。このアルゴリズムは、グラフの一部を探索し、目的地に最も近いと推定される経路を優先して探索します。Aの重要な特徴は、それが「最適」かつ「完全」であることです。つまり、解が存在すればAはその解を見つけ、その解は最適な解です。 この2つから素直に考えると、Q* とは 解決方法が不明のタスクAを、自律的なトライ&エラーのフィードバックループを用いて探索し、
2023/11/26 リンク