@bakanaoujiのマイページ[B!]新着記事・評価 - はてなブックマーク

『@bakanaoujiのマイページ - Qiita』

【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう：Counterfactual Regret Minimizationの解説 - Qiita
5 users
qiita.com/bakanaouji

【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう：Counterfactual Regret Minimizationの解説はじめにボードゲームやカードゲームにおけるAIといえば囲碁やチェスなどの完全情報ゲームにおける成功が印象的ですが，ポーカーを中心とした不完全情報ゲームも着々と攻略されてきています．不完全情報ゲームではナッシュ均衡戦略を最適戦略として求めるというアプローチがしばしば取られます．実際，2人プレイヤのポーカーでプロに匹敵する強さを見せたLibratus[1]でもナッシュ均衡戦略を求めることが行われています．このときにナッシュ均衡戦略を求めるためにしばしば用いられるのがCounterfactual Regret Minimization (CFR)[2]と呼ばれるアルゴリズムであり，Libratusや6人プレイヤのポーカーAIであるPluribus[3]もCFRを基
- テクノロジー
- 2020/01/24 23:04

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx