これから強化学習を使いたい人向け、強化学習の基礎と論文紹介 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/dcm_hisao_katsumi

34 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

takuya0411 あとで読む

あとで読む

2019/12/13 リンク

takuya0411 あとで読む

あとで読む

2019/12/13 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

これから強化学習を使いたい人向け、強化学習の基礎と論文紹介 - Qiita

実務でモデルフリー強化学習を活用しようとして勉強したことを書きますドコモの先進技術研究所1年目の... 実務でモデルフリー強化学習を活用しようとして勉強したことを書きますドコモの先進技術研究所1年目の勝見と申します。今回は先輩から誘われて、アドベントカレンダーの記事の12日目を担当することになりました。本来は現在行っているデータ分析周りの業務になにか絡めて書けると良いのですが、残念ながらまだオープンにできるようなネタはありませんので、私が業務での実タスクに応用しようと検討を行っている強化学習（モデルフリー）の初学者向けの記事を自身のためのまとめも兼ねて、学習の過程で個人的に面白いなと感じたポイントを織り交ぜながら書こうと思います。マルコフ決定過程 (Markov decision process) このあたりは多くの記事でも取り上げられているため今更感がありますが、強化学習をタスクに適用するために必要となる定式化について説明しておきます。強化学習では取り扱う問題を、エージェントが起こし

ブックマークしたユーザー

techtech05212024/03/19
clavier2020/01/05
noritechi22019/12/18
tkos-rg2019/12/14
sakisakihatehate2019/12/14
demacs2019/12/14
sakito09022019/12/13
shigoto_pppp2019/12/13
binary-pi2019/12/13
jamalen2019/12/13
l080842019/12/13
bluescreen2019/12/13
tanority2019/12/13
amashio2019/12/13
marices1992019/12/13
koma_g2019/12/13
dhesusan46492019/12/13
Hiro_Matsuno2019/12/13

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx