エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
dlshogiの評価値のスケール調整 - TadaoYamaokaの開発日記
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
dlshogiの評価値のスケール調整 - TadaoYamaokaの開発日記
dlshogiは、開始局面から170点という比較的大きな評価値を出力する。 これは適切でないため、今回調整を... dlshogiは、開始局面から170点という比較的大きな評価値を出力する。 これは適切でないため、今回調整を行うことにした。 勝率から評価値への変換 dlshogiの内部では、局面の価値は、評価値を使わず勝率で扱っているが、GUIソフトには評価値として返す必要があるため、勝率から評価値にシグモイドの逆関数で変換を行っている。 ここで、は勝率である。 係数aは、Aperyややねうら王では、Ponanza定数と呼ばれるa=600が使われている。 ただし、Aperyややねうら王でこの定数を使うのは、学習時だけである。 探索時は評価値そのものを使用している。 dlshogiの係数a dlshogiでは、以下の2か所で係数aを使用している。 教師ありで棋譜を学習する際に、棋譜に記録された評価値から、勝率に変換する場合 探索時に、GUIソフトに評価値を表示するため、勝率から評価値に変換する場合 かなり