タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

囲碁と学習に関するtimetrainのブックマーク (1)

  • Ponanza開発者、山本一成氏が語る強化学習とA/Bテスト運用の舞台裏

    Ponanzaにおける強化学習とA/Bテスト運用 山一成氏(以下、山):山一成と申します。よろしくお願いします。 ありがとうございます。ここからはややガチめなエンジニアの話です。まず確認したいんですが、エンジニアとかプログラマーって人はどれくらいいるんですかね? (会場挙手) あ、けっこういるのか! 安心した(笑)。 私、10年くらい将棋のプログラムを作ってきて、最初はまったくのど素人から始めたんですけど、いろいろやっていく中で、現代にも通じるようなさまざまな運用とかが出てきたんですね。そのへんをみなさんと共有できればと思っています。 まず最初のスライド、さっそく手書きでやる気がない感じですが(笑)。将棋のプログラムってどんなもの? という話です。将棋も囲碁も、大雑把にいうと、2つの要素があります。1つは探索です。つまり、先を読むということですね。 先を読むと強いです。みなさんもそん

    Ponanza開発者、山本一成氏が語る強化学習とA/Bテスト運用の舞台裏
    timetrain
    timetrain 2019/04/24
    悔しくもあるけど、物量と新しい技術が正義、ということも知った気がする
  • 1