タグ

数学とコンピュータ将棋に関するwrssのブックマーク (1)

  • 汎関数を用いた時間攻めの導出(の数学的解説) - コンピュータ将棋 Qhapaq

    前回の記事で紹介した汎関数を用いた時間攻めの導出について解説したのですが、読者の方から数式をもう少し解説して欲しいとのリクエストをいただきましたので、此方にて解説します。 数学マニアじゃない方にも雰囲気が伝わる用に善処はしますが、元が理系大学生が3−4年頃に習うものなので、それなりに高難易度な話です。 1.問題条件の定式化 ・・・x手目に使う持ち時間(単位は秒) ・・・x手目にt秒使った時に正しい手をさせる確率 ・・・今回最大化したいパラメタ。各々の局面において正しい手を指せる確率の和 ・・・持ち時間の総和はHとする 持ち時間を制御することで最大化したいのは、厳密には勝率であり、各々の局面において正しい手を指せる確率の和ではありません。しかし、この記事 で検証したように、この指標はそれなりの精度で勝率と対応してくれていると考えています。 なお、が所謂汎関数というやつです。 2.ラグランジュ

    wrss
    wrss 2017/01/31
    ラグランジュの未定乗数法とか懐かしい(すっかり忘れた)。後でじっくり読んでみます。
  • 1