エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう:Counterfactual Regret Minimizationの解説 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう:Counterfactual Regret Minimizationの解説 - Qiita
【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう:Counterfactual Regret Minimizationの解説 は... 【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう:Counterfactual Regret Minimizationの解説 はじめに ボードゲームやカードゲームにおけるAIといえば囲碁やチェスなどの完全情報ゲームにおける成功が印象的ですが,ポーカーを中心とした不完全情報ゲームも着々と攻略されてきています. 不完全情報ゲームではナッシュ均衡戦略を最適戦略として求めるというアプローチがしばしば取られます.実際,2人プレイヤのポーカーでプロに匹敵する強さを見せたLibratus[1]でもナッシュ均衡戦略を求めることが行われています.このときにナッシュ均衡戦略を求めるためにしばしば用いられるのがCounterfactual Regret Minimization (CFR)[2]と呼ばれるアルゴリズムであり,Libratusや6人プレイヤのポーカーAIであるPluribus[3]もCFRを基