記事へのコメント1

    • 注目コメント
    • 新着コメント
    sh19910711
    sh19910711 2020 / "強化学習のサンプル効率の低さ: 報酬がスパースなことが多い + 予測する対象(価値)はスカラーなので,エージェントが得られる情報のほとんどを捨ててしまっている"

    2022/09/09 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    深層強化学習入門 2020年度Deep Learning基礎講座「強化学習」

    深層強化学習入門.2020年6月実施の「Deep Learning基礎講座」強化学習の松嶋担当分の講義資料を再編集...

    ブックマークしたユーザー

    • sh199107112022/09/09 sh19910711
    • laughing2021/01/21 laughing
    • what_alnk2020/09/08 what_alnk
    • keno_ss2020/08/20 keno_ss
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事