タグ

ブックマーク / mosko.tokyo (3)

  • 研究に便利なツールまとめ - …

    情報系の博士学生をしていて使っているツールなどをまとめてみました.しばらく自宅待機で研究室に行けない研究室入りたての人,などの役に立てば幸いです. 筆者の環境 ラップトップとしてMacBook Pro,タブレット端末としてiPad Pro+Apple Pencilを使っています.また,実験の際にはUbuntuの外部サーバーにアクセスすることを前提としています. 論文を読む 論文を読む際にはGoodNotesを使って,研究テーマやプロジェクトごとに論文をまとめた上で書き込んでいます.iPadMacで同期して使うと端末の特徴に合わせた使い方ができます.例えば,論文に書き込みながら読むのにはiPadの方が向いていますし,複数の論文をテーマに応じてまとめるのはMacのほうが楽な気がします. 文献の管理は紆余曲折ありましたが,GoodNotesにまとめるにとどまっています.bibファイル生成のため

    研究に便利なツールまとめ - …
    ZAORIKU
    ZAORIKU 2020/08/25
  • PyTorchでDQNを実装した | moskomule log

    はじめに DQN(Deep Q Network)は Minh et al. 20151(以下論文)で登場した深層強化学習の先駆けです.Atariのゲームで非常に高い得点を修めるというパフォーマンスで有名になりました. 9月頃に強化学習の勉強をした際に実装してみたのですが,一向に学習が進まず放置していたのですが,最近Implementing the Deep Q-Network 2を読み再開してみたところ,動いてしまったので,この記事を書くことになりました. 今回の実装はこちらにあります. 強化学習とは David Silver先生に聞きましょう.ただしこの講義では深層強化学習は扱われていません. Deep Q-Networkとは 論文を読みましょう.Q-Learningの応用で,複雑ではありませんが,学習を安定させるための工夫が各所にあるので見逃すと動かないようです. DQNの学習アルゴリ

    ZAORIKU
    ZAORIKU 2017/12/01
  • Double Backpropagationについて | moskomule log

    はじめに PyTorch v0.2では"Higher order gradients” (double backpropagation)がサポートされました.Chainerもv3においてこれがサポートされます.今回Chainer Meetupの資料を読んで雰囲気が分かったのでまとめました. Comparison of deep learning frameworks from a viewpoint of double backpropagation Chainer v3 筆者は長くdouble backpropagationという名称から \[\mathrm{loss}\longrightarrow \frac{\partial^2 \mathrm{loss}}{\partial x_i \partial x_j} \] と思い込んでいました.そう思っているのでdocumentを読んでも

    ZAORIKU
    ZAORIKU 2017/10/03
  • 1