AlphaGoは2つのディープラーニングネットワークを用意した。一つは「どこに石を置くか」を決めるポリシーネットワーク(出力は確率)、もう一つは「盤面の評価値」を決めるバリューネットワーク。

yasudayasuyasudayasu のブックマーク 2017/10/22 00:49

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

AlphaGo Zeroの論文の要約 : ブログ

    AlphaGo Zeroが自己学習のみで過去最強になったというニュースが出たのでその元論文を読み、要約をしました。 まず感想を述べると、過去数千年にわたって蓄積してきた知識をAIが数時間で発見することに対する気持...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう