タグ

ブックマーク / yaneuraou.yaneu.com (34)

  • 角換りは終わったのかについて1万文字程度で | やねうら王 公式サイト

    先月のゴールデンウィークに行われた第33回世界コンピュータ将棋選手権(WCSC33)で弊やねうら王チームが準優勝したあと(この準優勝は当に準優勝であって、ビールにおつまみで乾杯するという意味ではない)、角換りという戦型について以下のツイートをした。 角交換と言う戦型が終わった。 1886局面の指し手を覚えるだけで先手側は公開されてる水匠(探索局面数は1億までの任意)に対して評価値+300に出来ることが証明された。 大会で上位のソフトは+300から逆転は97%ぐらいありえないので(手数で引分はある)つまりは将棋AIの世界では角交換の後手は必敗。 — やねうら王 (@yaneuraou) May 8, 2023 この前者のツイートにはインプレッションが172万もあり、Yahooニュースや朝日新聞デジタルなど多くのメディアで取り上げられた。 AIで角換わりが終わった? 藤井聡太竜王「こちらの立

  • 将棋ソフトやねうら王の設計思想と何故やねうら王が世界最強になれたのか動画 | やねうら王 公式サイト

    まあ、標題の件については、動画を見ていだければ良いとして、この動画をどうやって作っているのかについてわりと質問をいただいたので解説します。 トラッキングについて まず、頭と手のトラッキングにはOculus Quest2を用いています。 Oculus Quest2でClusterというVR会議アプリにログインして、そこで撮影しています。 HaritoraXを買って、足のトラッキングもしたいのですが、現在売り切れ中なのでまだそこまで出来ていません。 LeapMotionという手の指のトラッキングを行うハードウェアがあるのですが、この上位機種であるUltraleap IR 170(36,000円程度)も購入したものの、思っていたようなトラッキング精度ではなかったので、これは速攻でやねうら王チームのMizarさんにプレゼントすることにしました。 Oculus Quest2は私は256GBモデルを買

  • 2020年、将棋ソフト界隈のまとめ | やねうら王 公式サイト

    年末なので、2020年の将棋ソフト界隈のことを自分目線でまとめておきたい。自分目線なので全然まとめになってないとは思うけども、その点は御容赦願いたい。 今年は、コロナ禍のために毎年5月のゴールデンウィークに開催されていたWCSC(世界コンピュータ将棋選手権)が開催されなかった。 WCSCは、その代わりに「世界コンピュータ将棋オンライン大会」となり、オンラインで開催され、たややんさんの『水匠』が優勝した。 私(やねうら王チーム)は、このオンライン大会には参加しなかった。賞金もでないことだし(この時点でやる気9割ぐらいダウン)、単純に面倒くさかったからである。 将棋ソフトは何のために作っているのか?とよく尋ねられるのだけど、私の場合、それ自体が楽しいからであって、盆栽いじりにも似たものがあると思う。これは、Aperyの平岡さんも全く同じことを言っている。 最近ちょくちょくapery_rust

    endo_5501
    endo_5501 2020/12/31
    “巨人だと思ってその肩に乗ったら、巨人がすっ転んで大怪我をすることも普通に起こりうるのである。開発者の皆さん、巨人の肩に乗るときは、くれぐれも気をつけていただきたい”
  • Deep Learning将棋は従来の将棋ソフトとここが違うぞ | やねうら王 公式サイト

    ふかうら王の製作のためにdlshogiのソースコードをくまなく読んだので、Deep Learning型の将棋についてつらつらと書いてみる。 dlshogiとは dlshogiは先月に開催された将棋ソフトの大会「電竜戦」で優勝したGCTのエンジン部分(探索部)でもある。つまりは、dlshogiは現在、世界最強の将棋ソフトと言っても過言ではないだろう。従来の将棋ソフトとはどこが異なるのだろうか。今後、Deep Learning系の将棋ソフトの導入を検討している人向けにざっと書いていく。 ※ 今回書くのは、現在のdlshogiの話である。将来的に改良される可能性は大いにあるが、2020年の電竜戦では、この仕様であったということである。 CPUを使うソフトとGPUを使うソフト、どちらがコスパがいいの? 今回、電竜戦で優勝したGCTをGeForce RTX 2080で動かすとfloodgateでR3

    endo_5501
    endo_5501 2020/12/21
    “つまり1秒間に4GBずつメモリを消費していく”
  • 電竜戦の戦犯が俺である可能性が浮上してきた | やねうら王 公式サイト

    mブランチ(やねうら王 V4.89m)とやねうら王最新版(V5.40)との棋力差の計測をRotaさんがされている。 やねうら王(YaneuraOu)5.40、 めちゃくちゃ強くなってる見通し @計測中 vs水匠2付属探索部 Win-Draw-Lose: 128-19-61 有効試合数: 189, 有効勝率: 67.72%, 有効ΔR: +128.75https://t.co/E5lDfAFJm3#RRate pic.twitter.com/q8AJk6ouei — ロタ (@Rota_JP) December 2, 2020 +R128.75の差だという。 MOVE_NULLのバグ修正したのと、LMRのreduction改善したのと、探索パラメーター、私の手元でチューニングしたのに全部置き換えたのと、Stockfishの更新を現在分まで全部ぶちこんだ結果だと思われる。 これで、+R130ぐ

    endo_5501
    endo_5501 2020/12/06
    “ソフトウェアとは一種の高層建築物なのである。基礎工事が手抜き状態で高層建築物を構築すると崩落してくるのである。だから2階建てぐらいならまだしも、高層建築物化するときには基礎工事を完璧に”
  • やねうら王、Large Page対応で10数%速くなった件 | やねうら王 公式サイト

    Windows上でメモリ確保にLarge Pageを使うとランダムアクセスが5%程度速くなるそうです。やねうら王の場合、ランダムアクセスはわりと支配的なのでTT(置換表)と、EvalHash(評価関数の値をcacheしておくメモリ領域)と評価関数テーブルをすべてLargePageに割り当てることで10数%高速化することがわかりました。 ここにきて、いまさら10数%も高速化するのか…と正直、驚いております。 Large Pageを使うC++のサンプルコード 置換表にLarge Pageを使うように変更。(やねうら王のGitHub) https://github.com/yaneurao/YaneuraOu/commit/f726457d03ccd3c51332b8cee8254a7d2a80dc69 Large Pageを使うC++のサンプルコードを探し求めてこのページに辿り着かれた方は、上

  • AWSに思考エンジンを配置してssh経由で使う方法 | やねうら王 公式サイト

    今回のWCSC29(第29回世界コンピュータ将棋選手権)では、AWSを利用するチームが目立った。ハイスペックなPCを持ち込んで戦うよりは、軽量なノートPCだけ持ち込んでAWSを使ったほうが機材の搬入が楽だし、スペックも悪くない。しかし、普段sshを使うこともないような人にとっては知らないことだらけでどうやって良いのか戸惑うことも多かった。かくいう私もその一人であった。そういう人の助けとなるように記事にまとめておく。 WCSC28でelmoが反則負けした件 まず、この原因を書いておくところから。この原因を知らないと怖くてsshが使えない。 elmoの瀧澤さんにWCSC29で尋ねたところ、「あれはMicrosoft製のsshを使っていて、1年以上更新していなかったもので、そのバージョンが古く、1行のバッファが1024文字までだったのが原因です。」とのことであった。 1行が1024文字までなので

    endo_5501
    endo_5501 2019/06/17
  • やねうら王公式による定跡掘削代行はじめました | やねうら王 公式サイト

    テラショック定跡の生成部を公開したので、一般ユーザーの皆さんがコマンドを叩けば自動的にかつ効率的に掘れるようになりました。 普通、人間が手動で定跡を検討する場合、将棋所などの検討モードを用いて1つの局面を複数スレッドで探索させるのが普通かと思います。しかし、探索はスレッド数の平方根ぐらいしか実効(実際の効率)がでないので、16スレッド用いても4スレッド分の働きしかしません。3/4の計算資源は無駄になってしまうということです。16スレッド用いるのならば16局面用意して、各スレッドがそれぞれの局面を探索するのが一番効率が良いわけです。これを行えるのが、やねうら王の定跡生成コマンドです。(“makebook think”コマンドなど) そんなわけで、やねうら王の定跡生成コマンドを使うだけで、手動で1局面ずつ検討させるより、はるかに高い効率で検討が行えます。しかしご家庭のPCでやる場合、例えば8ス

  • WCSC29でやねうら王が使用したテラショック定跡、公開しました | やねうら王 公式サイト

    約700T(700テラ=700兆)局面探索して生成した30数万局面分の定跡ファイルを公開しました。 100テラショック定跡(WCSC29時点 , 700T) https://github.com/yaneurao/YaneuraOu/releases/tag/BOOK-700T-Shock 当はテラショック定跡は年末に発売を予定している『将棋神やねうら王2』の目玉にしたかったため、公開する気はあまりなかったのですが、私の公開している「アマゾンの欲しいものリスト」から、砂が大量に届いたため、これは何かお返しせねばと急遽最新のテラショック定跡を公開することにしました。私の欲しいものリストからプレゼントを送ってくださった皆様、当にありがとうございます。 ちなみにWCSC29の上位ソフトはニコ生で使うらしいので、WCSC29で優勝したやねうら王もドワンゴさんにソフトを提供することになるのです

    endo_5501
    endo_5501 2019/05/13
    “4コアや8コア程度のPCで協力してもらっても焼け石に水ですし…。(電気代を考えると、その電気代分のお金もらってこちらで掘るほうが遥かに効率的)”
  • WCSC29、やねうら王優勝しました! | やねうら王 公式サイト

    第29回世界コンピュータ将棋選手権(WCSC29)で、『やねうら王 with お多福ラボ2019』は優勝しました。応援してくださった皆様、ありがとうございます。 手短にいくつか印象に残った試合と簡単な感想を書いておきます。 Qhapaq戦 Qhapaqはこちらが指し手を思考している最中に相手の指し手を別のPCで予測して、それに対するponderの指し手を探索する『Pre-ponder』という隠し球を実装しているそうでした。 QDMのクラスタはmultiponderベースだったのですが独自実装のpreponderを加えることで相手の持ち時間の120%を使えるという謎の効率化に成功しました。 — Ryoto_Sawada☀Qhapaq (@Qhapaq_49) May 5, 2019 そこで、Qhapaq戦については、SlowMover(序盤重視率)=67にして、序盤の思考時間を減らして終盤に

  • テラショック定跡の生成手法 | やねうら王 公式サイト

    先日100テラショック定跡を公開した。記事では、その生成手法について詳しく書く。 ※ 100テラショック定跡、公開しました ■ 従来手法 コンピュータ将棋の定跡生成手法として現在最先端の手法はshotgun方式と呼ばれるものである。 これはSDT5(第5回将棋電王トーナメント)で準優勝したshotgunおよび、WCSC28(第28回世界コンピュータ将棋選手権)で優勝したHefeweizenの用いていた定跡生成手法である。 ■ shotgun方式 shotgunの手法については次の論文に詳しい。 ※ コンピュータ将棋における定跡生成法の一提案 : https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=192055&file_id=1&file_no=1 ■ テラショック定跡とshotgun方式との比較 また、テラショック

  • フロッピーディスクに収まる評価関数バイナリ公開しました | やねうら王 公式サイト

    NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。 そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。 ※ 補足 : ニューラルネットの入力は、駒が存在するところを1、存在しないところを0とした1710次元のベクトル。 教師はdepth 8で生成した10億局面から学習させてみたところ、elmo – R30程度になった。 ファイルサイズは873KB。(zipで圧縮して400KB程度) 教師をもう少し深いdepthで生成すれば、まだ強くなるはず。 とりあえず公開しておいた。 https://github.com/yaneurao/Yan

    endo_5501
    endo_5501 2019/01/15
    “しかも、入力がKとPだけってなんですか。hidden層の1層目が256×2しかないので、3駒関係どころか、2駒関係すら表現できているか怪しいというのに…。”
  • 2倍の思考時間を使うと人間はR200上がるという根拠について | やねうら王 公式サイト

    2つ前の記事で、「将棋ソフトでは、2倍の思考時間を使うとR200程度上がります。R200は勝率で言うと約76%。」というのを人間にも当てはめたのですが、それは人間では成り立たないのでは?という意見が散見されるのでこれに対して私の考えを書いておきます。 まず、最初に一つだけお断りをしておくと、同じソフト同士の場合と異種ソフト同士の場合とでは読み筋が違うので、2倍の思考時間にしたときのレート(棋力)の向上度合いは異なります。前者はBonanza以降のソフトだとR200程度ですが、後者については実際のところよくわかっていません。そういうデータを事細かに計測した人もおそらくいません。また定跡との相性などもあって異種ソフトの棋力差を正確に計測すること自体が難しいです。R100程度上がることは間違いないですが、R200よりは低い値になると予想されます。まあそれに関してはR100以上、R200未満ぐらい

  • 【ポエム】人間の知性を推定するAIについて | やねうら王 公式サイト

    将棋ソフトで、対局後に自分の将棋の棋力を判定して表示してくれるものがある。あれは自分の弱点がわかってなかなか面白いと思うが、プレイヤーの棋力判定というのは、そういう自分が参考になるというだけではなく、オンラインゲームのマッチングにおいても重要である。 例えば、オンライン将棋サイトで、自分のレーティング(棋力を数値化したもの)が定まるまで数十局、弱い相手としか当たらなかったらどうだろうか?逆に、自分が級位者なのに、ノーレート(レートの値がつく前)のプレイヤーと当たって、それが桁違いに強いプレイヤーだったらどうだろうか?そんなオンライン将棋サイトは嫌ではないだろうか? このように(少ない棋譜からの)プレイヤーの棋力を推定するというのは、アカデミックな主題であると同時に、現実的な(将棋に限らない)オンライン対局のサーバーなどで必要とされている技術である。 やり方は、色々考えられるが、思考エンジン

    endo_5501
    endo_5501 2018/11/28
    “同様の手法で、(圧倒的に賢い人にとっては)相手の知性を少ない会話から推定することが出来る”
  • 【決定版】コンピュータ将棋のHASHの概念について詳しく | やねうら王 公式サイト

    いまどきの将棋ソフトを使っていると、「HASH 50%」などと表示されている。これはHASH利用率と呼ばれる。この数字が大きくなってくると探索の効率が悪くなる。要するに潤沢にメモリがある場合に比べると弱くなる。これは、どれくらいの値までであるなら適切なのか?HASH利用率が99%にならない限りHASHには余裕があるものなのか?HASHはどういう仕組みになっているのか?HASH利用率が50%の状況で、ハッシュ衝突はしているのか?など、わりとソフトを長年使っていても知らない人が多いのでここに原理から詳しく説明した決定版的な記事を書く。 ShogiGUI将棋神やねうら王に表示されている「HASH」とは何ですか? 一度探索した局面を保存しておく表です。 この表に登録するときにハッシュ(hash)という値を使って登録するため、ハッシュテーブル(hash table)と呼ばれます。これを略して(値と

  • ListViewが複数あるこの世界で世界最強 | やねうら王 公式サイト

    小説家になろう』でありそうなタイトル風にしてみました。 今回は、ListViewが複数あって、そのすべてがアクティブだとどうなるのか?という話を書いてみます。 まず、これが現バージョンの『将棋神やねうら王』の画面です。 ListViewが2つあることがわかりますね。ListViewに限らず、この手のControl(GUI部品の意味)には来、focusという概念があります。focusがあるControlに対してユーザーからの司令が行くという仕組みですね。 例えば、キーボード入力を考えてみます。何か文字をキーボードから入力したとき、現在focusのあるテキストボックスに入力されますね。これはごく自然なことです。 ListViewも同様で、普通はカーソルキーの矢印キー(↑とか↓のキー)を押したときに、現在のfocusのあるほうのListViewの選択行が移動します。 ところが、将棋ソフトで棋

    endo_5501
    endo_5501 2018/10/28
    “そうなってくると、必然的にControlに対するfocusという概念を取り払うしかないのです。ListViewは複数存在できて、そのいずれも等しく(同時に)アクティブであっていい”
  • AIから人間が学ぶ方法について考えてみた | やねうら王 公式サイト

    ゲームAIに関しては、オセロ、チェス、将棋、囲碁とすでにトッププロでも敵わないレベルに到達した。これらのゲームAIから人間が学ぶにはどうすれば良いのかということについて考えてみる。 まず最初に考えられるのは、コンピューターに最善手(あるいは、最善応手列)を示してもらうというものである。 ある程度棋力があれば、最善手だけもらえれば学べるかも知れないが、得られる情報量としては少ないので、少々物足りない意味はある。 そこで最善応手列とそのときの(局面の)評価値から学ぶという手法がある。(このブログの読者には説明するまでもないが)評価値は、形勢の良し悪しを数値化したものである。これを期待勝率(同じぐらいのプレイヤー同士がその局面から指し継いだ時の勝率)に変換したもののほうが人間的には嬉しいかも知れない。 将棋のプロ棋士である千田先生がこれに近い方法で、学ばれているのだと思う。自分の感性(直感)を、

    endo_5501
    endo_5501 2018/09/04
    “AIの指し手から人間が効率的に学ぼうとするとき、そのAIの導き出した答えをうまく視覚化出来るのかというのが一つのキーポイントとなる”
  • PC将棋ソフト「将棋神 やねうら王」に関してお答えします | やねうら王 公式サイト

    4gamerに「将棋神 やねうら王」の紹介記事が掲載されました。 プロ棋士をも凌駕する異次元の強さ! PC将棋ソフト「将棋神 やねうら王」8月10日発売予定 https://www.4gamer.net/games/423/G042341/20180613100/ 今回は、寄せられている質問に対して非公式にお答えします。 Q) CD-ROMなんですか? A) DVD-ROMです。激指のパッケージがCD-ROMらしく、それをベースにパッケージのデザインをされたようで、一部、CD-ROMと書かれたままになっているところがあったようですが、気付き次第修正してます。 Q) インストール容量10GBも必要なんですか? A) 実質的には4GB程度だと思うのですが、.NET Frameworkがどれくらい消費するのか予測できなくて、多めに書いています。 Q) 特定のエンジンだけインストールすることは出来

    endo_5501
    endo_5501 2018/06/16
    “Q) 売れると思わないのに、なぜ、商用版を出そうと思ったのですか?”
  • さくらインターネットの機械学習ナイトで発表してきました | やねうら王 公式サイト

    私のほう、発表資料の準備があまり出来てなくて、そして、こういう発表に不慣れで聞きづらかったと思う。聞きに来てくれた人たちには申し訳ない。 私としては、もっと経験を積みたいので、今後もこういう機会を大切にしていきたい。今回、会場を提供してくださった、さくらインターネット様、そして、発表の機会を与えてくれた有山さんに感謝いたします。 あと、おまけとして、以下に発表内容の一部を文章として丁寧に書き残しておく。(注 : 発表予定になかったことをその場の思いつきで延々と話したので、当日はこんなにうまくしゃべれてませんでした。) >>> 書き起こしここから やね「DeepMindがAlphaZeroと囲碁と将棋、チェスの3つのソフトを作ったよ、という論文を発表しました。3日前のことです。ご存知の方、挙手願いします。」 (場内の7割ぐらいの人が挙手) やね「DeepMindはAlphaGoという囲碁ソフ

  • 何故、SDT5までにやねうら王は強くならなかったのか | やねうら王 公式サイト

    今回、やねうら王は公開しているバージョンからほとんど強くすることが出来なかった。(KPP_KKPT型 評価関数でelmo+R170、探索部で+R20程度。elmo+rezero8 = relmo8がelmo+R120程度なので+R70ぐらいしか強くなっていない。) 私の業のほうが忙しかったこともあるが、それを差し引くとしても、課題に対する取り組み方とか、方針の立て方とか、色々反省すべき点は多い。他の開発者が同じ轍を踏まぬよう、その原因をざっと書いておきたいと思う。 1. 開発用のPCの問題 開発に使っているPCはXeon 2698のdual(40C80HT)が6台である。元は5台であったが、1台が故障して、修理している間にもう一台購入した。5月の段階では、メモリは32GBで頑張っていたが、結局1台は256GB、残り5台を96GBに増設した。ストレージは、サーバー機に1TBのSSD、3TB

    endo_5501
    endo_5501 2017/11/19
    やっぱAWS+linuxはさくっとできるようになっていないといかんな