[B! OpenAI] tsu-neraのブックマーク

tsu-nera id:tsu-nera

OpenAIに関するtsu-neraのブックマーク (20)

Simple Reinforcement Learning with Tensorflow: Part 2 - Policy-based Agents
tsu-nera 2017/07/05
[

OpenAI

TensorFlow
リンク
https://github.com/krocki/gym-cartpole/blob/0788239f2c1be0b694a1b90a376780e1a8603bab/cartpole.py
tsu-nera 2017/07/05
cartpole

OpenAI

強化学習

numpy
リンク
Policy Gradient to solve CartPole-v0 in OpenAI gym
tsu-nera 2017/07/05
cartpole

OpenAI

強化学習

numpy
リンク
Home - Ike-ON
Unlock Your Potential: Top 10 Reasons to Learn Python Python is one of the most popular programming languages in the world. As techno logy advances and more companies use Python … Read More C# course from scratch for beginners If you have only a general idea of what programming is and have never been professionally engaged in it, we recommend that you start learning from the very basics. Read More
tsu-nera 2017/07/05
keras

DQN

OpenAI

強化学習
リンク
ChristianHerta
tsu-nera 2017/06/16
OpenAI

モンテカルロ
リンク
Simple Beginner's guide to Reinforcement Learning & its implementation
Simple Beginner’s guide to Reinforcement Learning & its implementation One of the most fundamental questions in the field of reinforcement learning for scientists across the globe has been – “How to learn a new skill?”. The desire to understand the answer is obvious – if we can understand this, we can enable human species to do things we might not have thought before. Alternately, we can train mac
tsu-nera 2017/06/15
keras

OpenAI
リンク
Deep Q-Learning with Neural Networks (on Cart-Pole)
tsu-nera 2017/06/15
OpenAI

keras

DQN
リンク
TensorFlowでTicTacToeに挑戦 - Qiita
概要 TnsorFlowでTicTacToeをやるために、OpenAiGymのTicTacToe環境作って見た。手で確認用のサンプルコード、載せる。誰かが、TensorFlowで負かせてくれる事を望む。写真環境 windows 7 sp1 64bit anaconda3 tensorflow 1.0 OpenAi Gym 0.5 TicTacToe環境の概要 observe: 3*3の盤面を0から9までの配列にして返す 0 1 2 3 4 5 6 7 8 0 なし 1　白 -1　黒 reward: 勝ったら1 何も0 負けたら-1 gameOver: 盤が埋まったか、3つ並んだか。 action: 0から8で指定。 -1なら相手。確認用のサンプルコード from __future__ import print_function import math import sys imp
tsu-nera 2017/06/11
tictactoe

OpenAI
リンク
GitHub - nczempin/gym-tic-tac-toe: A simple two-player environment for openai/gym
tsu-nera 2017/06/11
OpenAI

tictactoe
リンク
GitHub - dennybritz/reinforcement-learning: Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
tsu-nera 2017/06/10
強化学習

OpenAI
リンク
Simple reinforcement learning methods to learn CartPole
tsu-nera 2017/06/09
OpenAI
リンク
How can I use Docker without sudo?
On Docker's documentation pages, all example commands are shown without sudo, like this one: docker ps On Ubuntu, the binary is called docker.io. It also does not work without sudo: sudo docker.io ps How can I configure Docker so that I don't need to prefix every Docker command with sudo?
tsu-nera 2017/06/09
OpenAI

docker
リンク
keras-rl の example コードを実行するだけ - クッキーの日記
Keras を勉強します。 keras-rl でオリジナルの強化学習タスク・オリジナルのDQNモデルを学習したという記事が本日 Qiita に投稿されていましたが（参考記事）、まず keras-rl と gym がわからないので example コードを実行することにします。参考記事やること手順感想参考記事以下の記事を参考にさせていただきましたが、やったことは記事内容のトレースよりはるか低みです。 qiita.com やること強化学習で伝統的なポールバランシングタスクをエージェントに学習させます。小学生のとき掃除の時間に、手のひらに箒をのせて倒れないようにバランスを取るのをよくやったと思います。今回のタスクのポールの動く範囲は2次元平面内に制約されています。台車も直線上を動きます。 gym でのタスク設定は以下のページ参照。 OpenAI Gym CartPole-v0
tsu-nera 2017/06/09
OpenAI

DQN

keras
リンク
https://github.com/vmayoral/basic_reinforcement_learning/blob/master/tutorial3/README.md
tsu-nera 2017/06/09
OpenAI
リンク
OpenAI gym tutorial
tsu-nera 2017/06/09
OpenAI
リンク
Gym: A toolkit for developing and comparing reinforcement learning algorithms
tsu-nera 2017/06/09
[

OpenAI

ETロボコン
リンク
ライントレーサーの環境をOpenAI I/F的にした - Qiita
ライントレーサーをDeep Q Learningで教育する - Chainer - Qiitaで取り扱った環境をOpenAI gymライクに扱えるように環境とAIを分離・整備しました。分離したといっても、renderのところを当初wxPythonと描画・ロジック一体で作りこんでしまったので、おかしな状態になっていますが、動くので良しという段階です。この単眼ライントレーサはPOMDPの例ともいえますが、（最初にコース上に乗せる前提で）ロジックベースで動かしてみている人は少なからずいると思います。 POMDPってなんぞというかたは、@okdshinさんが最近親切な説明を書かれていたので、参考にするといいと思います。 ⇒ 外部メモリ（External Memory）を利用した強化学習 - Qiita 先述の以前のチャレンジでは、過去4ステップ分のステートを状態としてDQNにくれてやっていました
tsu-nera 2017/06/08
強化学習

DQN

OpenAI

ETロボコン
リンク
[Python] Keras-RLで簡単に強化学習(DQN)を試す - Qiita
はじめに強化学習を試してみたい題材はあるけど、自分でアルゴリズムを実装するのは・・・という方向けに、オリジナルの題材の環境を用意し、keras-rlで強化学習するまでの流れを説明します。実行時の環境 Python 3.5 keras 1.2.0 keras-rl 0.2.0rc1 Jupyter notebook 使用するライブラリ keras 簡単にネットワークが構築できると話題のディープラーニングのフレームワークです。 keras-rl kerasを利用して、DQNなどの深層強化学習のアルゴリズムを実装したライブラリです。対応しているアルゴリズムはこちらを参照。 gitのリポジトリをcloneしてインストールします。
tsu-nera 2017/06/08
強化学習

keras

DQN

OpenAI
リンク
OpenAI GymでQ学習してみた - The jonki
今更ながらOpenAI Gymに手を出してみました．OpenAI Gymは強化学習の検証プラットフォームです．色々なゲームがGymとしてあるので，自分のアルゴリズムを簡単に検証できます．以前最良経路をQ学習で求める記事を書きましたが，Gym向けに書けばGUIも付いてきて面白いですし，コードをGistで共有していろんな人が見れるのが素晴らしいですね．OpenAI GymについてはQiitaなどの日本語記事も多くありますが，公式ドキュメントをさらっとやるのが良いと思います．pipで簡単に入ります．また結果のアップロード法なども書いてあります． OpenAI Gym Q学習で最良経路をPythonで求めてみる - The jonki この記事は私がDQNを勉強するにあたっての勉強段階のメモになりますが，せっかくなので記事にしておきます．今回やろうとしたことは下記サイトさまの完全な２番煎じです．
tsu-nera 2017/06/08
強化学習

OpenAI
リンク
OpenAI Gym を触ってみる - 壁は通り抜けられませんよ
OpenAI Gymなる強化学習用プラットフォームを触ってみました(参考: PyConJPのプレゼンテーション)。インストール自体はpip install gymで一発です(Atariゲームなどを扱いたい場合はpip install gym[atari]のようにサブパッケージをインストールする必要があるようです)。一応ドキュメントで使い方は説明されていますが、若干戸惑う点があったので随時補足します。 Atariゲームなど色々面白そうな環境がありますが、とりあえずFrozenLake(4x4, 8x8)というのが初心者向けっぽいので、これを試してみました。ルールは非常に単純で、固定配置のマップ上でスタートから穴に落ちずにゴールに辿り着くだけです。成功時1点、失敗時0点の報酬が得られます。マップ上の記号の意味は以下の通り: 記号意味 S スタート F 床 H 穴 G ゴールただしスター
tsu-nera 2017/06/08
強化学習

OpenAI
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx