AdaGradが12倍速くなる魔法

テクノロジーカテゴリーの変更を依頼記事元:

blog.unnono.net

55 usersがブックマークコメント

コメント

5

記事へのコメント5件

注目コメント
新着コメント

userhiro adamoptimizerで十分なんかな。とはいえ考え方だけは理解しておくか

機械学習

2016/06/28 リンク

rishida コンパイラのオプション強い

ツール

2014/12/08 リンク

o_mega “sqrt 命令が8〜105サイクルなのに rsqrt 命令が驚きの1サイクルと書かれています”

2014/08/07 リンク

TOKOROTEN 「もはやsqrtがボトルネックになる時代ではない」　これは激しい

2014/08/07 リンク

mooz -Ofast によるベクトル化。面白いなー。

2014/08/07 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

AdaGradが12倍速くなる魔法

AdaGradは学習率を自動調整してくれる勾配法の亜種で、いろんな人が絶賛しています。勾配を足し込む時... AdaGradは学習率を自動調整してくれる勾配法の亜種で、いろんな人が絶賛しています。勾配を足し込む時に、各次元ごとに今までの勾配の2乗和をとっておいて、その平方根で割ってあげるだけと、恐ろしくシンプルです。 Adaptive Subgradient Methods for Online Learning and Stochastic Optimization John Duchi, Elad Hazan, Yoram Singer. JMLR 2011. 丁度、 @echizen_tm さんがブログを書いてました。 AdaGrad+RDAを実装しました。通常のSGDなどは学習率をだんだん減衰させながら勾配を足していくわけですが、どの様に減衰させるかという問題にいつも頭を悩ませます。 AdaGradでは最初の学習率こそ外から与えますが、減衰のさせ方や減衰率といったハイパーパラメータから

ブックマークしたユーザー

nisimur2017/08/15
userhiro2016/06/28
takuti2016/06/23
yukimori_7262016/02/19
jp-myk2015/07/02
petite_blue2015/01/08
rishida2014/12/08
xiangze2014/12/08
masakano62014/10/21
hirokist2014/10/08
akikan9312014/09/05
hiroyukim2014/08/19
lEDfm4UE2014/08/10
xef2014/08/08
tnal2014/08/08
fuba2014/08/08
yingfeng2014/08/08
m0t0m0t02014/08/08

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx