強化学習に関するTawaraのブックマーク (3)

  • サッカーを強化学習する - 思考の本棚

    はじめに この記事は強化学習苦手の会Advent Calenderの12日目の記事です。 私は11月末までKaggle上で開催されていたGoogle Research Football with Manchester City F.C.に参加していました。このコンペはGoogle Researchが用意したサッカーゲーム上でサッカーエージェント(プレイヤー)を作成し、その強さを競うというものです。 私はhigeponさんとチームを組ませていただき、強化学習アプローチでコンペ開催から終了まで取り組みました。そこでサッカーエージェントを強化学習で育成する際に工夫した点や苦労した点を共有できればと思います。 kaggle: Google Research Football competition www.kaggle.com GitHub: Google Research Football gi

    サッカーを強化学習する - 思考の本棚
  • Kaggle Haliteを強化学習で解こうとした話 - threecourse’s blog

    記事は 強化学習苦手の会 Advent Calendar 2020 - Adventar 8日目の記事とするべく、コンペ終了後に書いた記事に追記しました。 7日目の記事(Kaggleの強化学習コンペがグダグダだった話 - Qiita)への返歌みたいなものになります。 雑感 強化学習でどこまで行けるんだろう、ということで勝敗に拘らず強化学習を試してみましたが、何も考えないと思っていたより厳しいなぁという印象でした。 「岩塩のあるところまで行く」→ まぁまぁ簡単にできる 「岩塩のあるところまで行って、スタート地点まで戻ってくる」→ 工夫しないと厳しい 「岩塩のあるところまで行って、スタート地点まで戻ってくるのを複数の船で協調する」→ さらに厳しい 結局、カリキュラムラーニングじみたことをやって、「岩塩のあるところまで行って、スタート地点まで戻ってくるのを複数の船で協調する」までは出来ました。

    Kaggle Haliteを強化学習で解こうとした話 - threecourse’s blog
  • OpenAIのかくれんぼ強化学習の論文を読んだ - 下町データサイエンティストの日常

    論文: Emergent Tool Use from Multi-Agent Interaction 昨年 2019/09/17にOprnAIが出したかくれんぼ(hide and seek)強化学習論文を読んだので、備忘がてらブログにメモ。 メモなので、正確に書いていないことだけはご了承ください。。。 タイトルは"Emergent Tool Use from Multi-Agent Interaction" という論文。 かわいいagent君達がかくれんぼを学習していく様子からは想像つかないタイトルですね(小並) arxiv.org openai.com www.youtube.com また、「そもそも強化学習とは?」といった基礎的な話題は割愛させていただくことをご了承ください。。。 (余談) 白金鉱業fmのコンンツのために読んだ 白金鉱業fm という有志メンバーでのpodcastを定期的

    OpenAIのかくれんぼ強化学習の論文を読んだ - 下町データサイエンティストの日常
  • 1