ブックマーク / tadaoyamaoka.hatenablog.com (1)

  • AlphaGo Zeroの論文を読む その2(ネットワーク構成) - TadaoYamaokaの開発日記

    前回に続いてAlphaGo Zeroの論文についてです。 ネットワーク構成 入力特徴 19×19の2値画像を17枚 8枚は現在のプレイヤーの石の座標を示す2値画像、8手分 8枚は相手のプレイヤーの石の座標を示す2値画像、8手分 1枚は現在のプレイヤーの石の色を示す全て0か1の画像 履歴を必要とするのは囲碁にはコウがあるため。 現在のプレイヤーの石の色が必要なのは囲碁にはコミがあるため。 以前(Fan Huiバージョン)のAlphaGoでは入力特徴に、呼吸点やシチョウなどの囲碁の知識を含む48の特徴を使用していましたが、石の座標情報のみになっています。 ニューラルネットワーク構成 入力層 1層の畳み込み層で以下の構成 畳み込み 3×3のフィルター、256 Batch Normalization 活性化関数 以前のAlphaGoは5×5のフィルター192でしたが、より数が増えています。 Bat

    AlphaGo Zeroの論文を読む その2(ネットワーク構成) - TadaoYamaokaの開発日記
    kaz_uki_1014
    kaz_uki_1014 2017/10/21
    AlphaGo Zeroの論文を読む その2(ネットワーク構成) - TadaoYamaokaの日記 2017 - 10 - 20AlphaGo Zeroの論文を読む その2(ネットワーク構成)AlphaGoAlphaGo Zeroコンピュータ囲碁コンピュータ将棋前回に続いてAlphaGo Zeroの論文についてです。ネッ
  • 1