PolicyNetworkだけの将棋ソフトの強さは？ | やねうら王公式サイト

学びカテゴリーの変更を依頼記事元:

yaneuraou.yaneu.com

4 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

zu2 “この15bのDL水匠、floodgateでR2169であった。将棋ウォーズで言うと四、五段と言ったところのようである。(将棋ウォーズの段位は、世間のアマの段位より少し厳し目ではあるので、公平に見てもアマ五段ぐらいの棋力は) ”

2022/07/20 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

PolicyNetworkだけの将棋ソフトの強さは？ | やねうら王公式サイト

いまのDeep Learning系の上位の将棋ソフトは、AlphaZeroのアーキテクチャに倣っていて、局面を入力し、P... いまのDeep Learning系の上位の将棋ソフトは、AlphaZeroのアーキテクチャに倣っていて、局面を入力し、Policy(次のよさげな一手が最大値になる)とValue(期待勝率)を出力している。では、Policyだけで1手も先の局面を調べない場合、どれくらいの強さになるのだろうか？将棋ソフトPonanzaが2017年にAlpha Goを参考に、Deep Learning(以下DLと略す)を取り入れた時、「Policyだけでアマ初段か二段ぐらいある」と作者が言っていた。周りの開発者はほんまかいな…と半信半疑であった。Ponanzaはソースコードも実行ファイルも何も公開されておらず、追試もできない状況だったので、つい最近まで私も半信半疑であった。まず、当時のDLを取り入れたPonanzaについては、以下の資料でそのアーキテクチャについて触れられている。 https://www.sl

ブックマークしたユーザー

zu22022/07/20
urtz2022/07/19

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - 学び

いま人気の記事 - 学びをもっと読む

新着記事 - 学び

新着記事 - 学びをもっと読む

設定を変更しましたx