タグ

ブックマーク / yaneuraou.yaneu.com (10)

  • 将棋ソフトを開発して3000万円損した話 | やねうら王 公式サイト

    「大人の数トレチャンネル」(YouTube)に私が出演した時の後編の動画があまり再生回数が伸びてないので改めて紹介をさせていただく次第である。 このブログでも以前ちらっと書いた、「将棋ソフトを開発して3000万円損した話」が出てくる。(詳しい内容については動画をご覧いただきたい) それとは関係ないのだが、動画の内容に関連して、いくつか補足しておきたいことがある。 AI界隈では、「プロ棋士 VS 将棋AI」という構図が「人間 VS AI」の縮図だと言われることが多々ある。例えば、これは「将棋AIのようにAIが人間を打ち負かしたあとは、○○○な未来になっていく」みたいな文脈で用いられる。 しかし、人間が将棋AIに抵抗してきた歴史について当事者視点で語ってあるブログや書籍はあまりに少なく、そのへんの情報がまるで伝わっていないように思う。 そこで、記事では私が当事者視点でだらだらと書いていく。

    field_combat
    field_combat 2024/05/20
    「チェスAIの世界では、探索なしでグランドマスターレベルに到達した(2024年)」
  • いま将棋AIの世界では、どれくらい先手が有利なのか | やねうら王 公式サイト

    ここ最近になって、将棋は、先手必勝のゲームであると考える将棋AI開発者が増えてきた。私もその一人であるが、いま将棋AIの世界で先手の勝率はどれくらいになっているのだろうか。今回は、最近の流れを追いかけてみる。 今年前半に行われたWCSC33(第33回世界コンピュータ将棋選手権)の数字をそれまでのものと比較してみよう。 2023年決勝 ──────────────────────────── 棋譜数    : 28 先手勝ち   : 19  宣言勝ちを含む 後手勝ち   : 9  宣言勝ちを含む 先手宣言勝ち : 1 後手宣言勝ち : 1 千日手    : 0 持将棋    : 0 中断     : 0 320手 先手勝率   : 0.679  19勝9敗 後手勝率   : 0.321 平均手数   : 176.250 千日手を含む 平均手数   : 176.250 千日手を除く ─────

  • オセロの必勝法が見つかった件 | やねうら王 公式サイト

    すごいニュースが飛び込んできた。オセロの必勝法が見つかったのだ。正確に言うとオセロが弱解決された。まずはその論文を紹介する。 Othello is Solved : https://arxiv.org/abs/2310.19387 「弱解決(weakly solved)」を簡単に言うと、初期局面からの双方最善手を打つ時の結論(勝敗)がわかったと言う意味である。8×8のオセロの結論は引き分けなのだそうだ。「必勝法が見つかった」と記事のタイトルで書いたが、その結果として双方最善を尽くした時のオセロの結論が引き分けだったことが判明したので正しくは「必勝法(必ず勝てる方法)が存在しないことが証明された」とでも言うべきか。 今回は、初期局面から到達できるあらゆる局面についての結論(勝敗)がわかったわけではない。こちらは「強解決(strongly solved)」と呼ばれる。 弱解決と強解決とでは、

  • 誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王 公式サイト

    いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック数を大きくしていくのが一つの潮流としてある。ブロック数が多いと言うことは、より層の数が増え(よりdeepになり)、1局面の評価に、より時間を要するようになるということである。それと引き換えに評価精度がアップするから、トータルでは得をしていて、棋力が向上するというわけである。 ところが大きいブロック数になればなるほど学習に要する教師局面の数が増える。学習もブロック数に応じた時間を要するようになるから、そう簡単に大きくはできない。しかし囲碁AIの方は、中国テンセント

  • スーパーテラショック定跡が76歩に34歩を全否定 | やねうら王 公式サイト

    前回までのあらすじ) 先手番専用定跡s-book_blackが優秀すぎた。私が2年前に開発したテラショック定跡生成手法では到底太刀打ちできなかった。そこでやねうら王プロジェクトでは、新たにスーパーテラショック定跡生成手法というのを考案し、やねうら王に実装したのであった。 前回記事 : 先手番専用定跡s-book_blackの厚い壁 https://yaneuraou.yaneu.com/2021/11/01/thick-walls-of-s-book_black/ テラショック定跡生成手法のおさらい まず簡単にテラショック定跡手法をおさらいし、何が悪かったのかを書き、今回それをどう改善したのかを書く。 テラショック定跡は与えた棋譜の各局面に対して長い時間をかけて思考させる。1局面につき探索1スレッド×1時間でやっていた。1スレッドにしているのは、将棋ソフトは並列化効率が悪いからで、スレッド

  • 俺氏、将棋が二人零和有限確定完全情報ゲームでないことに気づいてしまうwww | やねうら王 公式サイト

    このブログをご覧の方は将棋が二人零和有限確定完全情報ゲームであることはご存知でしょう。これは、ゲーム理論や探索アルゴリズムの教科書にでも載っています。「二人零和有限確定完全情報ゲームって何?」って方は、Wikipediaでも見ていただくことにして話を先に進めます。 零和とは? この「零和」というのは、和が零。英語で言うとゼロサムです。 零和(「ゼロ和」と読むのが一般的だが「レイワ」とも読む):プレイヤー間の利害が完全に対立し、一方のプレイヤーが利得を得ると、それと同量の損害が他方のプレイヤーに降りかかる https://ja.wikipedia.org/wiki/二人零和有限確定完全情報ゲーム つまり、自分が勝ちなら、相手は負け。相手が勝ちなら自分は負け。勝ちを+1点、負けを-1点、引き分けを0のように定めるなら、(ゲーム終局後に)自分と相手の点数を足すと0になる。なので、ゼロサムゲーム

  • 2020年、将棋ソフト界隈のまとめ | やねうら王 公式サイト

    年末なので、2020年の将棋ソフト界隈のことを自分目線でまとめておきたい。自分目線なので全然まとめになってないとは思うけども、その点は御容赦願いたい。 今年は、コロナ禍のために毎年5月のゴールデンウィークに開催されていたWCSC(世界コンピュータ将棋選手権)が開催されなかった。 WCSCは、その代わりに「世界コンピュータ将棋オンライン大会」となり、オンラインで開催され、たややんさんの『水匠』が優勝した。 私(やねうら王チーム)は、このオンライン大会には参加しなかった。賞金もでないことだし(この時点でやる気9割ぐらいダウン)、単純に面倒くさかったからである。 将棋ソフトは何のために作っているのか?とよく尋ねられるのだけど、私の場合、それ自体が楽しいからであって、盆栽いじりにも似たものがあると思う。これは、Aperyの平岡さんも全く同じことを言っている。 最近ちょくちょくapery_rust

  • 渡辺明名人と東大教授で日本の脳研究の第一人者である池谷裕二先生との対談記事が間違いだらけである件 | やねうら王 公式サイト

    ここまでひどい記事は久しぶりだ。 渡辺明名人の疑問「将棋の初手でこれを指したら負けという“必敗”の手はありませんか?」 脳研究者の答えは… https://number.bunshun.jp/articles/-/846635 この手の対談は、編集側が元の発言とは異なる意図で解釈して、誤った書き方にしてしまうことが多々あるので、誰が悪いのかということはここでは問題としないことにする。ただ、内容が間違いだらけではあるので、ここではそれを指摘するに留める。 14年前のAIは「奨励会1級とか初段ぐらいだった」 池谷 渡辺さんのすごいところは、転換期を迎えた時に「じゃあAIに学んでみるのも面白いかもしれない」と思ったことですね。柔軟な適応力で発想の着火点をスムーズに転換されています。渡辺さんはかなり早い時期からAIと対戦されていましたよね? 渡辺 あれは2007年ぐらいでしたが、まだAIが全然強く

  • 最新の将棋ソフトが2手目34歩を悪手だと言い始めた件 | やねうら王 公式サイト

    近年の将棋ソフトは2倍の思考時間を使えばR200程度強くなる。ということは、家庭用PCで15分切れ負けの対局でR4300程度だと言われている最新ソフトを自己対局させるとして、片方のソフトだけ持ち時間をその倍である30分を与えるとどうなるだろう? そのソフトは、見かけ上、R4300 + R200 = R4500ぐらいの強さを発揮するわけであるな。 では、もっと桁違いの時間を与えるとどうだろう? 15分切れ負けのとき、序盤の1手には10秒ぐらいしか使わないが、その序盤の特定の局面に対して、1,000倍の時間(10,000秒)を与えれば、そのときの棋力はどれだけになるだろう? log(2)1024 = 10なので、10×R200 = +R2000ぐらい強くなり、R4300 + R2000 = R6300のソフト相当になるのではなかろうか。 R6300のインパクトが強すぎてどれくらいの強さなのか想

    field_combat
    field_combat 2019/04/15
    ものすごいスピードで戦術が更新されてるんだな。前にコンピューター将棋がプロの人たちに普及して、戦術がガラッと変わったって話を前に聞いてワクワクした
  • 近年のコンピュータ将棋の急速な伸びの理由は? | やねうら王 公式サイト

    表題の件を当事者視点で。 「近年のコンピュータ将棋の急速な伸びの理由は?」という問いの模範解答が分からない。(1年で200ほど伸びるようになった理由。) そこそこ聞かれる質問なので、答えを用意しておきたいのだが・・・ — Shota Chida (@mizumon_) July 14, 2016 理由をたったひとつ挙げるとしたら、2016年時点での最新の回答は「誰でも機械学習が出来るようになった」ではないかと思います。 従来、将棋ソフトの機械学習というのはBonanzaメソッド(通称ボナメソ)一択でした。激指はオンライン学習風の何かをやっていたのですけど、Bonanzaの3駒関係ほどパラメーターの数が多いと(数百万パラメーター)、オンライン学習ではうまくいかないと信じられていたので、誰もやっていませんでした。 ボナメソについて書かれた保木さんの論文自体、当時の将棋ソフト開発者には難解で(見

  • 1