前回に続いてAlphaGo Zeroの論文についてです。 ネットワーク構成 入力特徴 19×19の2値画像を17枚 8枚は現在のプレイヤーの石の座標を示す2値画像、8手分 8枚は相手のプレイヤーの石の座標を示す2値画像、8手分 1枚は現在のプレイヤーの石の色を示す全て0か1の画像 履歴を必要とするのは囲碁にはコウがあるため。 現在のプレイヤーの石の色が必要なのは囲碁にはコミがあるため。 以前(Fan Huiバージョン)のAlphaGoでは入力特徴に、呼吸点やシチョウなどの囲碁の知識を含む48の特徴を使用していましたが、石の座標情報のみになっています。 ニューラルネットワーク構成 入力層 1層の畳み込み層で以下の構成 畳み込み 3×3のフィルター、256 Batch Normalization 活性化関数 以前のAlphaGoは5×5のフィルター192でしたが、より数が増えています。 Bat