タグ

ブックマーク / yaneuraou.yaneu.com (15)

  • 第4回世界将棋AI電竜戦本戦 優勝記 | やねうら王 公式サイト

    先週末に開催された電竜戦戦で、水匠チームが優勝した。私(やねうらお)も同チームのチームメンバーとして参加し、私は探索部の改良を行った。同チームのたややんさんは、定跡と評価関数(の機械学習)を担当した。 現代の将棋AIの大会で何が起きているのかについて手短に書く。 ■ 定跡 まず、大会の水匠チームの定跡部分に関しては、たややんさんの以下の配信に詳しい。 【#電竜戦 祝勝会】水匠電竜、連覇しました!!【将棋AI水匠/たややん】 https://www.youtube.com/watch?v=lsNoVMe_wdk 配信の内容で大事なところを簡単にまとめると、 ・角換わり(38手目基図)は定跡により先手優勢までは持っていける(これは1年ぐらい前からそう) ・相掛かりも定跡で先手有利 ・おそらく将棋は先手勝ちのゲーム ・大会では、「わからん殺し」するしかない とのこと。 結局、将棋は先手勝ち

  • 角換りは終わったのかについて1万文字程度で | やねうら王 公式サイト

    先月のゴールデンウィークに行われた第33回世界コンピュータ将棋選手権(WCSC33)で弊やねうら王チームが準優勝したあと(この準優勝は当に準優勝であって、ビールにおつまみで乾杯するという意味ではない)、角換りという戦型について以下のツイートをした。 角交換と言う戦型が終わった。 1886局面の指し手を覚えるだけで先手側は公開されてる水匠(探索局面数は1億までの任意)に対して評価値+300に出来ることが証明された。 大会で上位のソフトは+300から逆転は97%ぐらいありえないので(手数で引分はある)つまりは将棋AIの世界では角交換の後手は必敗。 — やねうら王 (@yaneuraou) May 8, 2023 この前者のツイートにはインプレッションが172万もあり、Yahooニュースや朝日新聞デジタルなど多くのメディアで取り上げられた。 AIで角換わりが終わった? 藤井聡太竜王「こちらの立

  • やねうら王公式による定跡掘削代行はじめました | やねうら王 公式サイト

    テラショック定跡の生成部を公開したので、一般ユーザーの皆さんがコマンドを叩けば自動的にかつ効率的に掘れるようになりました。 普通、人間が手動で定跡を検討する場合、将棋所などの検討モードを用いて1つの局面を複数スレッドで探索させるのが普通かと思います。しかし、探索はスレッド数の平方根ぐらいしか実効(実際の効率)がでないので、16スレッド用いても4スレッド分の働きしかしません。3/4の計算資源は無駄になってしまうということです。16スレッド用いるのならば16局面用意して、各スレッドがそれぞれの局面を探索するのが一番効率が良いわけです。これを行えるのが、やねうら王の定跡生成コマンドです。(“makebook think”コマンドなど) そんなわけで、やねうら王の定跡生成コマンドを使うだけで、手動で1局面ずつ検討させるより、はるかに高い効率で検討が行えます。しかしご家庭のPCでやる場合、例えば8ス

    hadakadenkyu
    hadakadenkyu 2019/05/30
    漫画「永遠の一手」の世界観だ
  • WCSC29、やねうら王優勝しました! | やねうら王 公式サイト

    第29回世界コンピュータ将棋選手権(WCSC29)で、『やねうら王 with お多福ラボ2019』は優勝しました。応援してくださった皆様、ありがとうございます。 手短にいくつか印象に残った試合と簡単な感想を書いておきます。 Qhapaq戦 Qhapaqはこちらが指し手を思考している最中に相手の指し手を別のPCで予測して、それに対するponderの指し手を探索する『Pre-ponder』という隠し球を実装しているそうでした。 QDMのクラスタはmultiponderベースだったのですが独自実装のpreponderを加えることで相手の持ち時間の120%を使えるという謎の効率化に成功しました。 — Ryoto_Sawada☀Qhapaq (@Qhapaq_49) May 5, 2019 そこで、Qhapaq戦については、SlowMover(序盤重視率)=67にして、序盤の思考時間を減らして終盤に

    hadakadenkyu
    hadakadenkyu 2019/05/06
    思考過程がメチャ面白い。推理小説に於ける解決編って感じで、頭のいい人の思考過程を開陳していただけるのは面白いし勉強になる
  • lambda混合絞りについて | やねうら王 公式サイト

    やねうら王に1ヶ月ほど前につけたlambda混合絞りについて、なんとかちゃんねるで盛り上がっているようなのでこの機能について簡単に解説しときます。 elmo式のlambdaは、評価関数の強さによって調整するほうが速くKPPTの限界に近づくことはわかっています。 例えば、評価関数をゼロから学習させる場合、最初のうちはゲームのプレイアウト時の勝敗のほうが、探索の結果より優れた教師であるため、lambdaを小さめ(勝敗項を勝率項より大きめ)にしたほうが速く強い評価関数となります。 ところがある強さぐらいになってくるとプレイアウトの質はさほど変わらず(まあ、depth 6や8程度では結構いい加減で)、その場合、lambdaを少し大きめにしたほうが教師として優れています。 逆に言うとelmo(WCSC27)の瀧澤さんが、WCSC27出場前にelmoより強く出来なかったのは、教師生成時のdepthを上

    hadakadenkyu
    hadakadenkyu 2017/08/21
    名前から溢れる螺旋解体絞り感w
  • 続) 人間の棋譜を用いずに評価関数の学習 | やねうら王 公式サイト

    前回の続き。今回はリゼロ評価関数epoch 5,6。やねうら王のGitHubのほうには、すでにアップロードしてある。興味のある人は、使ってみて欲しい。 epoch 5 Apery(WCSC26) vs epoch 5。1スレ2秒、4秒。 T1,b2000,491 – 13 – 496(49.75% R-1.76) win black : white = 52.18% : 47.82% T1,b4000,488 – 28 – 484(50.21% R1.43) win black : white = 50.51% : 49.49% 前回からあまり伸びていない。楽観的に見てR30程度だろうか。 あと、浮かむ瀬ともやらせてみる。言うまでもなく浮かむ瀬とは半年前のSDT4(第4回 将棋電王トーナメント)で2位のソフトである。 浮かむ瀬 vs epoch 5 T1,b2000,695 – 15 –

    hadakadenkyu
    hadakadenkyu 2017/06/14
    これで電王トーナメント優勝してほしい
  • 人間の棋譜を用いずに評価関数の学習に成功 | やねうら王 公式サイト

    今回、新たに評価関数をゼロベクトルから学習させた。elmo絞りを使うと意外と簡単にApery(WCSC26)相当の棋力を持つ評価関数にまで出来るようだ。追試できるように記事の前半に手順を記しておく。また、記事の後半には何回目のelmo絞りでどの程度の強さであったかも示す。 elmo絞りを知らない人のために簡単に説明すると、今回、将棋ソフトが人間の棋譜を用いずに勝率の高い形を強化学習でソフト自らが自動的に覚えたということである。今回、1回に生成している教師の数は5億局面。対局回数で言うと400万局程度であろうか。それだけの対局を終局までこなすことで、どういう駒の位置関係だと勝ちやすいのかを学習したということだ。 私は以前、elmo絞りを用いずにある程度の強さまでは到達出来たのだが、計算資源を湯水の如く消費するので途中で断念してしまった。今回はそのリベンジである。題して「Re : ゼロから始め

    hadakadenkyu
    hadakadenkyu 2017/06/12
    何年か前の電王戦の煽り文 http://ex.nicovideo.jp/img/denou/tournament2014/pc/PR_yaneuraou.pdf がとうとう完全に!
  • 囲碁ソフトのほうが将棋ソフトより急速に強くなっている件 | やねうら王 公式サイト

    ドワンゴが昨日、日最強の囲碁ソフト「DeepZenGO」が人間のプロ棋士と対局する「第2回囲碁電王戦」を19~23日に開催すると発表しました。 日最強の囲碁AI「DeepZenGO」、趙治勲名人と対局へ 「プロ棋士と戦えるレベルに達した」 http://www.itmedia.co.jp/news/articles/1611/09/news122.html DeepZenGoなのですが、8ヶ月でR600近く強くなっているようです! もはや「AlphaGo以外の囲碁ソフトは大したことないんでしょ」などと言ってられなくなってきましたね。 将棋ソフトも8ヶ月ではこんなに強くならないですし、将棋ソフトのほうはKPPTの表現の限界がもう迫っていて、雑巾絞りではほとんど伸びなくなってきていますし、それからすると、まだR1000ぐらいは余裕で伸びそうな囲碁の世界が羨ましく思えてきますね。

    囲碁ソフトのほうが将棋ソフトより急速に強くなっている件 | やねうら王 公式サイト
    hadakadenkyu
    hadakadenkyu 2016/11/10
    KPPTの表現限界に近いとのことだけどKKPPが実用的になるにはどのくらいハードウェアが進化すればよいのだろう。メモリ1TBくらいで済むかな?
  • ポストビッグデータとしての強化学習が将棋ソフトを変えた | やねうら王 公式サイト

    Bonanzaメソッドが公開されたとき(2006年〜)、棋譜さえあれば将棋ソフトは自動的に強くなるのではないかと人々は思った。 その考えは概ね正しかった。評価関数の表現の限界までは棋譜さえあれば、理論上は強くなる。 しかしその肝心の棋譜が圧倒的に足りていなかった。3駒関係(KPP)には1億次元以上のパラメーターがあったからだ。 1億の未知数を決定するためには、(N元一次連立方程式だとして)少なくとも1億個の方程式が必要だ。実際には、未知数の10〜100倍の方程式(≒教師局面)が必要だ。 オンラインで入手可能なプロの棋譜は3万棋譜ほどしかなかった。局面数で言っても300万局面程度。300万局面で1億個のパラメーターが調整できるのか?できない。全くと言っていいほど足りていない。 そして、我々は、全く足りていないことにもあまりに無自覚であった。当時は「入玉のときの評価値が少しおかしいな。入玉の棋

    hadakadenkyu
    hadakadenkyu 2016/11/05
    > だからビッグデータのブームは早々に終焉を迎え、強化学習全盛の時代が来るのはもはや必然なのである。
  • 電王トーナメント裏話その1 | やねうら王 公式サイト

    電王トーナメントの裏話をいくつか書いていきます。 電王トーナメント裏話 決勝のPonanza 対 真やねうら王でのこと。やねさんに差し入れを持って行ったら「お前、Calamityやろ!災難が降りかかるからあっち行け、しっしっ。差し入れならPonanzaに持って行け」というような扱いを受けたのだった…。 — かず@なのは (@kazu_nanoha) October 11, 2016 確かにCalamityは「洪水や地震、津波などの大惨事。災難。不幸。」といった意味だ。だからといってこの扱いはないだろう…。 とはいえ、やねさんにはいろいろお世話になっているので、指示に従い「不吉を届けに来たぜ」とばかりにPonanzaチームのいっせいさんに「一つどうですか?」 — かず@なのは (@kazu_nanoha) October 11, 2016 その後、山君もCalamity(災厄)を警戒して、

    hadakadenkyu
    hadakadenkyu 2016/10/11
    戦型選択に四柱推命や占星術を取り入れよう(提案
  • 将棋電王トーナメント2日目、実況スレッド | やねうら王 公式サイト

    今日も実況していきます。 やねうら王ライブラリ使用チーム 当初13チームかと思っていたのですが、PR文書に書いてないけど使っているよと教えていただいたチームが何チームかあり、また会場で、「学習部参考にさせていただいてます」と言っていただけたチームも何チームかあったので、2/3近くのチームがやねうら王を何らか参考にしているようです。バグ報告もいただけたりして助かります。 やねうら王の学習部で雑巾が絞りにくかった理由 理由がある程度わかったので、気が向いたら書きます。 真やねうら王、強くなったよ? とりあえず、なんやかんやして今日のやねうら王は昨日のやねうら王からR40程度上がりました。これで浮かむ瀬は超えた…はず。それでもponanzaとはR200程度の差がある計算になりますが。まあ、R200差ならponanzaと当たれば2割強ぐらいの確率で一発入るかもということで。 戦の組み合わせ 将棋

    hadakadenkyu
    hadakadenkyu 2016/10/09
    やねさんが書き下して頂ける他の開発者の方々との会話に知性を感じてとてもおもしろい
  • 将棋電王トーナメント1日目、実況スレッド | やねうら王 公式サイト

    この記事で実況していきます。 今回の技巧は? 公開している技巧から+R150ぐらいとのこと。 やね「電王トーナメントが終わったらまたソースコード公開するんですか?」 出村「する…かも…」 今回のApery(浮かむ瀬)は? 探索はStockfish7に合わせたとのこと。探索パラメーターの調整はあまりしてない様子。 会場の写真公開禁止の件 スタッフより、「放送が始まるまで、会場(の全体が写っているもの)の写真をSNS等にアップしてはいけません」とのこと。 ※ 放送が開始になったので写真を追加。 会場の写真解禁っ!!(>_<) #電王トーナメント pic.twitter.com/SH3oc8yYAe — 香上 智@Labyrinthus+# (@kagami_tomo) October 8, 2016 SkylakeのHTが遅い件 今回のPC、HT時のnpsがあまり出ないようです。並列化効率の良

  • 第26回世界コンピュータ将棋選手権はじまりました | やねうら王 公式サイト

    私のほう、このゴールデンウィーク期間中は、部屋の片付けとお絵かきに忙しい。コンピューター将棋どころではない。ざっと、WCSC26(第26回世界コンピュータ将棋選手権)の見どころを書いておく。 Apery、やねうら王チルドレン問題 ときどき、きふわらべの高橋君とskypeで話すのだけど、いまの彼の力では大樹の枝から有効な改造をするのは不可能で、彼が独自に改造すれば改造するほどソフトの棋力は下がる一方である。 というか、そもそも、それが来のきふわらべの健全な状態なのである。(つづく) — やねうら王 (@yaneuraou) April 30, 2016 (承前) もし今回の選手権できふわらべがもとの大樹の枝(無改造)ほど強かった場合は、 「おい、高橋君、まだ“独自性”が足りてないんじゃねーか?」 「もっともっと独自に改良しないと駄目だよw」 という話になる。 わかりやすく、きふわらべを例に

    hadakadenkyu
    hadakadenkyu 2016/05/03
    たこっと大活躍でByteBoardで全面書き直してやねうら王がさいつよになる展開希望
  • CODEVS 5.0 準優勝しました! | やねうら王 公式サイト

    いまソースコードを公開されている人のソースコードの解説は後日詳しく書きますが、まずは簡単にご報告だけ。 今日はCODEVS戦!俺様のAIはtakapt無双を阻止出来るのであろうか。(たぶん出来ない) なお、私は今日、早起きしすぎたので、現地では寝てると思います。zzz… — やねうら王 (@yaneuraou) March 25, 2016 戦では、リーグAとリーグBに分かれて、それぞれ4人で総当りだったのですが、リーグAではなんと私がtakaptさんにも勝って、私がリーグAで全勝。そのときのtakaptさんの悲壮なツイートがこちら。 やねうらおさんが上位互換AIっぽいのでダメみたいですね(落胆)#codevs — ぷち@ぷよぷよAIを作っています (@takapt0226) March 26, 2016 そのあと私は順当に決勝まで勝ち上がり、決勝で私はtakaptさんと当たって、4-

    hadakadenkyu
    hadakadenkyu 2016/03/27
    やっぱやねうらさんパないなー。
  • 連載やねうら王miniで遊ぼう!4日目 | やねうら王 公式サイト

    SilverBulletの作者も大絶賛のこの連載、今回は、指し手とその合成についての説明でございます。 色々わかりやすい。復習した気分になりました。 一度何でもいいので将棋ソフトのソースを流し見した人にとってはこの解説を読むと早く理解できそう。多分。 https://t.co/6TSeTnYoq7 — SilverBullet (@silverbullet_0) December 9, 2015 指し手のenum 指し手は、ソースコード上ではMoveとなっている。例によってStockfishに倣っている。 Moveもenumであり、前回説明したFile、Rank、Square同様に加減算のoperatorが定義されていたり、operator << ()で標準出力に表示させたり、pretty()で表示させたり出来る。 指し手の構造 指し手は次のように2バイトからなる。基的には移動元と移動先

    hadakadenkyu
    hadakadenkyu 2015/12/10
    いや面白い。将棋の雑誌かコンピュータ雑誌で金もらって連載されるべきレベルだ。感謝しか無い。
  • 1