タグ

ゲームとAIに関するwrssのブックマーク (6)

  • どうぶつしょうぎ名人 - まめめも

    どうぶつしょうぎ AI を作りました。絶対に勝てません。無力感を味わってください。 ref: http://mame.github.io/dobutsu-shogi-master どうぶつしょうぎとは 3 マス x 4 マスの単純化された将棋です。ライオン(王相当)、ぞう(1 マスしか進めない角行)、キリン(1 マスしか進めない飛車)、ひよこ(歩相当、にわとりに成ったら金相当)の 4 種類の駒を動かして、相手のライオンを取るか、トライ(ライオンを一番奥の行まで運ぶ、ただし直後に取られる場合はだめ)に成功すれば勝ちです。詳しくは Wikipedia の記事を見てください。 どうぶつしょうぎは後手必勝であることが知られています(研究報告)。つまり、後手が正しくプレイする限り、先手は絶対に勝てません。どうぶつしょうぎ名人は常に正しくプレイするので、先手のあなたは絶対に勝てません。 なんで作ったの

    どうぶつしょうぎ名人 - まめめも
    wrss
    wrss 2017/02/12
    すごいなー!/どうぶつ将棋ウォーズで悪用する人も出そうだけど、この人には関係のない話ではある。
  • なぜ人間はポーカーでAIに負けたのか? 日本トッププロが解説する“違和感”

    初めまして、プロポーカープレイヤーの木原直哉と申します。「人工知能AI)がポーカーのトッププロ4人に勝った」というニュースが世間をにぎわせています。しかし、これらのニュースを読む中で、自分の認識と違うなと思うことがいくつかありました。 「なぜ、AIは人間に勝てたのか」を始め、このニュースについて自身が感じたことなどを、ポーカープロの立場から解説していきたいと思います。 (編集:ITmedia村上) 木原直哉さんプロフィール 1981年生まれの北海道出身で、2001年に東京大学理科一類に入学。在学中は将棋部に所属し、バックギャモンやポーカーなどの頭脳ゲームに熱中していく。10年かけて東京大学理学部地球惑星物理学科を卒業し、翌2012年の第42回世界ポーカー選手権大会 (2012 World Series of Poker) の「ポット・リミット・オマハ・シックス・ハンデッド」で日人初の世

    なぜ人間はポーカーでAIに負けたのか? 日本トッププロが解説する“違和感”
  • お手軽にゲームプレイAIを試してみる - ABAの日誌

    最近はゲームAIがプレイしてくれる時代だ。 ゲーム攻略で人間を超えた人工知能、その名は「DQN」 有名なDQN。フルネームはdeep Q-networkと呼ばれる強化学習の一種だ。こういう機械学習系の仕組みはマシンパワーでもって学習をぶん回して動かさないといけないので、それなりの準備が必要なのが普通だ。だけど最近はこの手の物をブラウザ上で簡単に試せるようになっている。 REINFORCEjs 例えばREINFORCEjs。これはDQNをJavaScriptで実装したもの。使い方もえらく簡単。 // DQNエージェントにゲームの状態を与えると var action = agent.act(state); // アクションとしてどう行動すればよいかが帰ってくるので // それに従って行動して // その行動が正しかったどうかを示す報酬をDQNエージェントに教える agent.learn(re

    お手軽にゲームプレイAIを試してみる - ABAの日誌
  • AlphaGo - Aestetica

  • 作っているもの - Aestetica

    最近作ったもの、作っているもの一覧。 Selene 読み方はセレネ。コンピュータ将棋のエンジン部分。 たくさん種類があり、もはやどういうバージョンだかわからないものもある。 Learn_TD コンピュータ将棋用のTD+TDleaf(λ)による機械学習プログラム。 なんだかんだでこれを一番使用しています。そろそろお役ごめんか。 Learn_TD2 コンピュータ将棋用のTD+TDleaf(λ)による機械学習プログラム。 なんだけど、こちらは新しい戦型を模索する誘導アルゴリズム入りのもの。2回目の選手権はこれ。 新しい戦型とか夢見すぎ。 Learn_AP コンピュータ将棋用のAveragedPerceptronによる機械学習プログラム。 激烈に早く学習可能だが、なんかノイズに弱いです・・。どっか間違えているのか。 Learn_PGleaf コンピュータ将棋用のPGleafによる機械学習プログラム

    作っているもの - Aestetica
  • AlphaGoが誇大広告ぎみな件 - A級リーグ指し手1号

    Googleが開発した囲碁ソフトのAlphaGoが、世界で初めてプロ棋士に勝ったコンピュータとして大きなニュースになっています。Nature誌に論文が掲載されたのですが、仔細に読むといくつか不可解な点がありましたので、調査・考察してみました。 AlphaGoの論文はこちらから見えます。プロ棋士に勝ったこともありますが、何よりコンピュータ囲碁開発者(及び隣の分野のコンピュータ将棋開発者)を驚かせたのは、「既存の他の囲碁プログラムと対戦させた結果、495戦494勝だった」との報告でした。この報告は衝撃的で、これを読んだ他のコンピュータ囲碁開発者たちからは「俺の今までの努力が否定された」「目標を見失ってしまった」などの悲嘆の発言が相次ぐ始末でした。 論文から、AlphaGo、対戦相手のプロ棋士、及び他のソフトのレーティングを示したグラフを引用します。 CrazyStoneとZenはこれまでは最強

    AlphaGoが誇大広告ぎみな件 - A級リーグ指し手1号
    wrss
    wrss 2016/02/01
    論文で誇張してるところを見つけること自体すごいし、専門外ながら考察もしっかりされててスゴい!
  • 1