field_combatのブックマーク - はてなブックマーク

将棋ソフトを開発して3000万円損した話 | やねうら王公式サイト

「大人の数トレチャンネル」(YouTube)に私が出演した時の後編の動画があまり再生回数が伸びてないので改めて紹介をさせていただく次第である。このブログでも以前ちらっと書いた、「将棋ソフトを開発して3000万円損した話」が出てくる。(詳しい内容については動画をご覧いただきたい) それとは関係ないのだが、動画の内容に関連して、いくつか補足しておきたいことがある。 AI界隈では、「プロ棋士 VS 将棋 AI」という構図が「人間 VS AI」の縮図だと言われることが多々ある。例えば、これは「将棋 AIのようにAIが人間を打ち負かしたあとは、○○○な未来になっていく」みたいな文脈で用いられる。しかし、人間が将棋 AIに抵抗してきた歴史について当事者視点で語ってあるブログや書籍はあまりに少なく、そのへんの情報がまるで伝わっていないように思う。そこで、本記事では私が当事者視点でだらだらと書いていく。

field_combat 2024/05/20

「チェスAIの世界では、探索なしでグランドマスターレベルに到達した(2024年)」

ai

リンク

いま将棋AIの世界では、どれくらい先手が有利なのか | やねうら王公式サイト

ここ最近になって、将棋は、先手必勝のゲームであると考える将棋 AI開発者が増えてきた。私もその一人であるが、いま将棋 AIの世界で先手の勝率はどれくらいになっているのだろうか。今回は、最近の流れを追いかけてみる。今年前半に行われたWCSC33(第33回世界コンピュータ将棋選手権)の数字をそれまでのものと比較してみよう。 2023年決勝 ──────────────────────────── 棋譜数　　　　： 28 先手勝ち　　　： 19　　宣言勝ちを含む後手勝ち　　　： 9　　宣言勝ちを含む先手宣言勝ち　： 1 後手宣言勝ち　： 1 千日手　　　　： 0 持将棋　　　　： 0 中断　　　　　： 0 320手先手勝率　　　： 0.679　　19勝9敗後手勝率　　　： 0.321 平均手数　　　： 176.250 千日手を含む平均手数　　　： 176.250 千日手を除く ─────

field_combat 2023/12/22

ai
将棋

リンク

オセロの必勝法が見つかった件 | やねうら王公式サイト

すごいニュースが飛び込んできた。オセロの必勝法が見つかったのだ。正確に言うとオセロが弱解決された。まずはその論文を紹介する。 Othello is Solved : https://arxiv.org/abs/2310.19387 「弱解決(weakly solved)」を簡単に言うと、初期局面からの双方最善手を打つ時の結論(勝敗)がわかったと言う意味である。8×8のオセロの結論は引き分けなのだそうだ。「必勝法が見つかった」と本記事のタイトルで書いたが、その結果として双方最善を尽くした時のオセロの結論が引き分けだったことが判明したので正しくは「必勝法(必ず勝てる方法)が存在しないことが証明された」とでも言うべきか。今回は、初期局面から到達できるあらゆる局面についての結論(勝敗)がわかったわけではない。こちらは「強解決(strongly solved)」と呼ばれる。弱解決と強解決とでは、

field_combat 2023/11/07

リンク

誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王公式サイト

いま大会上位に位置するDeep Learning系の将棋 AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック数を大きくしていくのが一つの潮流としてある。ブロック数が多いと言うことは、より層の数が増え(よりdeepになり)、1局面の評価に、より時間を要するようになるということである。それと引き換えに評価精度がアップするから、トータルでは得をしていて、棋力が向上するというわけである。ところが大きいブロック数になればなるほど学習に要する教師局面の数が増える。学習もブロック数に応じた時間を要するようになるから、そう簡単に大きくはできない。しかし囲碁AIの方は、中国テンセント

field_combat 2022/06/28

リンク

スーパーテラショック定跡が76歩に34歩を全否定 | やねうら王公式サイト

前回までのあらすじ) 先手番専用定跡s-book_blackが優秀すぎた。私が2年前に開発したテラショック定跡生成手法では到底太刀打ちできなかった。そこでやねうら王プロジェクトでは、新たにスーパーテラショック定跡生成手法というのを考案し、やねうら王に実装したのであった。前回記事 : 先手番専用定跡s-book_blackの厚い壁 https://yaneuraou.yaneu.com/2021/11/01/thick-walls-of-s-book_black/ テラショック定跡生成手法のおさらいまず簡単にテラショック定跡手法をおさらいし、何が悪かったのかを書き、今回それをどう改善したのかを書く。テラショック定跡は与えた棋譜の各局面に対して長い時間をかけて思考させる。1局面につき探索1スレッド×1時間でやっていた。1スレッドにしているのは、将棋ソフトは並列化効率が悪いからで、スレッド

field_combat 2021/11/08

将棋

リンク

俺氏、将棋が二人零和有限確定完全情報ゲームでないことに気づいてしまうｗｗｗ | やねうら王公式サイト

このブログをご覧の方は将棋が二人零和有限確定完全情報ゲームであることはご存知でしょう。これは、ゲーム理論や探索アルゴリズムの教科書にでも載っています。「二人零和有限確定完全情報ゲームって何？」って方は、Wikipediaでも見ていただくことにして話を先に進めます。零和とは？この「零和」というのは、和が零。英語で言うとゼロサムです。零和（「ゼロ和」と読むのが一般的だが「レイワ」とも読む）：プレイヤー間の利害が完全に対立し、一方のプレイヤーが利得を得ると、それと同量の損害が他方のプレイヤーに降りかかる https://ja.wikipedia.org/wiki/二人零和有限確定完全情報ゲームつまり、自分が勝ちなら、相手は負け。相手が勝ちなら自分は負け。勝ちを+1点、負けを-1点、引き分けを0のように定めるなら、(ゲーム終局後に)自分と相手の点数を足すと0になる。なので、ゼロサムゲームと

field_combat 2021/02/22

リンク

2020年、将棋ソフト界隈のまとめ | やねうら王公式サイト

年末なので、2020年の将棋ソフト界隈のことを自分目線でまとめておきたい。自分目線なので全然まとめになってないとは思うけども、その点は御容赦願いたい。今年は、コロナ禍のために毎年5月のゴールデンウィークに開催されていたWCSC(世界コンピュータ将棋選手権)が開催されなかった。 WCSCは、その代わりに「世界コンピュータ将棋オンライン大会」となり、オンラインで開催され、たややんさんの『水匠』が優勝した。私(やねうら王チーム)は、このオンライン大会には参加しなかった。賞金もでないことだし(この時点でやる気9割ぐらいダウン)、単純に面倒くさかったからである。将棋ソフトは何のために作っているのか？とよく尋ねられるのだけど、私の場合、それ自体が楽しいからであって、盆栽いじりにも似たものがあると思う。これは、Aperyの平岡さんも全く同じことを言っている。最近ちょくちょくapery_rustを

field_combat 2021/01/15

リンク

渡辺明名人と東大教授で日本の脳研究の第一人者である池谷裕二先生との対談記事が間違いだらけである件 | やねうら王公式サイト

ここまでひどい記事は久しぶりだ。渡辺明名人の疑問「将棋の初手でこれを指したら負けという“必敗”の手はありませんか？」　脳研究者の答えは… https://number.bunshun.jp/articles/-/846635 この手の対談は、編集側が元の発言とは異なる意図で解釈して、誤った書き方にしてしまうことが多々あるので、誰が悪いのかということはここでは問題としないことにする。ただ、内容が間違いだらけではあるので、ここではそれを指摘するに留める。 14年前のAIは「奨励会1級とか初段ぐらいだった」池谷　渡辺さんのすごいところは、転換期を迎えた時に「じゃあAIに学んでみるのも面白いかもしれない」と思ったことですね。柔軟な適応力で発想の着火点をスムーズに転換されています。渡辺さんはかなり早い時期からAIと対戦されていましたよね？渡辺　あれは2007年ぐらいでしたが、まだAIが全然強く

field_combat 2021/01/15

リンク

近年のコンピュータ将棋の急速な伸びの理由は？ | やねうら王公式サイト

表題の件を当事者視点で。「近年のコンピュータ将棋の急速な伸びの理由は？」という問いの模範解答が分からない。（１年で２００ほど伸びるようになった理由。）そこそこ聞かれる質問なので、答えを用意しておきたいのだが・・・ — Shota Chida (@mizumon_) July 14, 2016 理由をたったひとつ挙げるとしたら、2016年時点での最新の回答は「誰でも機械学習が出来るようになった」ではないかと思います。従来、将棋ソフトの機械学習というのはBonanzaメソッド(通称ボナメソ)一択でした。激指はオンライン学習風の何かをやっていたのですけど、Bonanzaの3駒関係ほどパラメーターの数が多いと(数百万パラメーター)、オンライン学習ではうまくいかないと信じられていたので、誰もやっていませんでした。ボナメソについて書かれた保木さんの論文自体、当時の将棋ソフト開発者には難解で(見

field_combat 2016/07/28

リンク

はてなブックマーク

タグ

ブックマーク / yaneuraou.yaneu.com (10)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス