タグ

将棋とゲーム理論に関するgokichanのブックマーク (2)

  • Bonanzaの学習法 - 小宮日記

    CSAの例会のコメントを見ると、柿木さんは「Bonanzaに習って私も学習してみました」と書かれてました、 このような集められる情報を、それこそ目を皿のようにして読みました。 TD法も勉強しました。最急降下法も勉強しました。ロジステロの学習法も学びました。 はじめは、ロジステロのように学習しようと思いましたが、 「正確な評価値?」分かりません_| ̄|○ 終盤ではなく、序盤・中盤で、正確な値は分からない。 Bonanzaがやっている学習は、正確な評価値を出すように評価関数を最適化しているのではなくて、 棋譜の手とよく一致するように評価関数を最適化しているのでした。 では、TD法とどう違うのか? TD法による学習は、棋譜ではなく、相手と対局して、状況の変化を利用していました。 オセロは将棋のように静止探索をしないでいいので、ある局面の評価=その局面の評価で済むのです。 将棋は違います。 それを

    Bonanzaの学習法 - 小宮日記
  • 「うさぴょん 〜将棋を革命する力を〜」

    うさぴょん Official HomePage 最終更新日 2006.1.9 「うさぴょん」は2000年3月の第10回コンピュータ将棋選手権に出場した、 鈴木将棋をベースに開発しているコンピュータ将棋プログラムです。 将棋フリーソフトとしては、最強クラスの実力(定跡を早々に外れなければ初段程度)があるものと思います。 その他詳しいことは、うさぴょんFAQにまとめました。 更新履歴 「開発日記」はそれなりの頻度で書いてます。 2008. 2.14 うさぴょん2007年版ソース/UIソース公開・バイナリ配布 ダウンロードから持っていってください。 2006. 1. 9 開発日記をココログに移動。 2004. 7.30 うさぴょん V1.2.4バイナリ公開 ダウンロードから持っていってください。 2004. 7.13 ごめんなさい、古いバイナリーを置いていました m(..)m うさぴょん V

  • 1