タグ

ブックマーク / yaneuraou.yaneu.com (6)

  • オセロの必勝法が見つかった件 | やねうら王 公式サイト

    すごいニュースが飛び込んできた。オセロの必勝法が見つかったのだ。正確に言うとオセロが弱解決された。まずはその論文を紹介する。 Othello is Solved : https://arxiv.org/abs/2310.19387 「弱解決(weakly solved)」を簡単に言うと、初期局面からの双方最善手を打つ時の結論(勝敗)がわかったと言う意味である。8×8のオセロの結論は引き分けなのだそうだ。「必勝法が見つかった」と記事のタイトルで書いたが、その結果として双方最善を尽くした時のオセロの結論が引き分けだったことが判明したので正しくは「必勝法(必ず勝てる方法)が存在しないことが証明された」とでも言うべきか。 今回は、初期局面から到達できるあらゆる局面についての結論(勝敗)がわかったわけではない。こちらは「強解決(strongly solved)」と呼ばれる。 弱解決と強解決とでは、

    rti7743
    rti7743 2023/11/07
    最善手を両者が打ったとしたら引き分けなのか。後手が有利だとしても最善手を打ち続けられたら最悪でも引き分けになると。
  • 3年以上誰も発見できなかった探索部のbugがRustによって見つかったという話 | やねうら王 公式サイト

    だいたいにおいて、やねうら王ほどメジャーな将棋ソフトの探索部に大きなバグを埋め込むことは常識的に考えると不可能である。多くの人が改良に参加している&参考にしているので、誰かの目に止まるはずではある。ところが、公開後、数年も誰も気づかなかったbugがつい先日見つかった。Aperyの平岡さんが、AperyをRustで書き直している時にRustのコンパイラが警告を出したので気づいたと言うのだ。(WCSC29の会場で平岡さんから直接教えてもらった。) bugの詳しい内容 ここから少し専門的な話が出てくる。プログラマでない人は次の見出しまで読み飛ばすこと推奨。 – Position::move16_to_move()のbug fix。thx.平岡さん https://github.com/yaneurao/YaneuraOu/commit/9e6ba09029839838e10cd928456935

    rti7743
    rti7743 2019/05/24
    別の言語で再実装は究極のコードレビューだと思う。 ただ、そうしないとバグが発見できないというのは静的解析技術の限界でもあるなあ。
  • WCSC29、やねうら王優勝しました! | やねうら王 公式サイト

    第29回世界コンピュータ将棋選手権(WCSC29)で、『やねうら王 with お多福ラボ2019』は優勝しました。応援してくださった皆様、ありがとうございます。 手短にいくつか印象に残った試合と簡単な感想を書いておきます。 Qhapaq戦 Qhapaqはこちらが指し手を思考している最中に相手の指し手を別のPCで予測して、それに対するponderの指し手を探索する『Pre-ponder』という隠し球を実装しているそうでした。 QDMのクラスタはmultiponderベースだったのですが独自実装のpreponderを加えることで相手の持ち時間の120%を使えるという謎の効率化に成功しました。 — Ryoto_Sawada☀Qhapaq (@Qhapaq_49) May 5, 2019 そこで、Qhapaq戦については、SlowMover(序盤重視率)=67にして、序盤の思考時間を減らして終盤に

    rti7743
    rti7743 2019/05/06
    おめ
  • 将棋の結論は千日手の可能性が微レ存 | やねうら王 公式サイト

    WCSC29(第29回 世界コンピュータ将棋選手権)の出場チームに対する解説をsuimonさんが記事にされています。 はてなブログに投稿しました #はてなブログ 第29回世界コンピュータ将棋選手権(WCSC29)展望 – コンピュータ将棋研究Bloghttps://t.co/NEyT6cZTMF — suimon (@floodgate_fan) April 23, 2019 目を惹くのは、Qhapaqさんが先後、どちらの手番でも角換りを避けることを明言していることです。 角換わりに関して言えば、NNUEkaiのたややんさん(出場ソフト名は『水匠』)のソフトは、学習の結果、後手番の角換りを自然と指さなくなったそうです。 WCSC29参加予定の水匠は、現在、後手番で角換わりをほぼ指さず、他の有力戦法を学習した気がします。 番でどこまで通用するか、楽しみです! — たややん@水匠+NNUEk

    rti7743
    rti7743 2019/04/25
    チェスみたいになってきた。
  • フロッピーディスクに収まる評価関数バイナリ公開しました | やねうら王 公式サイト

    NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。 そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。 ※ 補足 : ニューラルネットの入力は、駒が存在するところを1、存在しないところを0とした1710次元のベクトル。 教師はdepth 8で生成した10億局面から学習させてみたところ、elmo – R30程度になった。 ファイルサイズは873KB。(zipで圧縮して400KB程度) 教師をもう少し深いdepthで生成すれば、まだ強くなるはず。 とりあえず公開しておいた。 https://github.com/yaneurao/Yan

    rti7743
    rti7743 2019/01/16
  • 将棋の探索空間の広さについて | やねうら王 公式サイト

    将棋の探索空間はどれくらいの広さなのでしょうか。 チェスの場合、1手から最終局面までの手順数(探索空間)は10の120乗程度と言われている。将棋の場合は、10の220乗。一度取った相手の駒を使うことができるため、とたんに増えてしまう。囲碁は盤面の広さもあって10の360乗である。 将棋対決・第1回  チェスコンピュータからの応用でもアマ20級 上の記事に見られるような「10の220乗」というのが定説になっています。 ところが、一定以上の棋力を持つプレイヤーに限定する場合、桁違いに狭いというのが私の考えです。10の220乗どころか、10の50乗すらいかないと私は思っています。 やねうら王では探索をしない場合、プロの棋譜との指し手一致率は、以下のようになっています。 Prediction(%) = 43.5828, 64.8331, 75.9408, 82.7774, 87.3075, 90.

    rti7743
    rti7743 2014/12/18
  • 1