論文解説 Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer (MoE) - ディープラーニングブログ

テクノロジーカテゴリーの変更を依頼記事元:

deeplearning.hatenablog.com

4 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

sh19910711 "MoE: 複雑な問題を分解して簡単なサブ問題を解決する戦略を志向したモデル + 起源は Geoffrey Hinton の研究グループが提案した混合エキスパート [Jacobs, 1991] / 各エキスパートは特定の構文や意味を処理する" / 2017

2024/02/17 リンク

mooz 13万個のエキスパートからなる MoE まさに outrageously large だ

deep_learning

2017/12/19 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

論文解説 Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer (MoE) - ディープラーニングブログ

こんにちは Ryobot (りょぼっと) です．本紙は ICLR 2017 のポスターセッションでもっとも注目を集めた... こんにちは Ryobot (りょぼっと) です．本紙は ICLR 2017 のポスターセッションでもっとも注目を集めた論文である．写真の右側の Google Tシャツの男性が第一著者の Noam Shazeer，左側の女性が第二著者の Azalia Mirhoseini (ソース)．この論文では傍若無人なほど巨大な (Outrageously Large) 混合エキスパートと少数のエキスパートを選択するゲーティングネットワークを用意し，ゲーティングで選択した少数のエキスパートのみ順/逆伝播を実行することで巨大なモデルであっても少ない時間で訓練できる．機械翻訳と言語モデルの SOTA を達成した．著者に猫の概念で注目を集めた Quoc Le，深層学習のゴッドファーザー Geoffrey Hinton，分散システムの大御所 Jeffrey Dean が会している点でも注目を集めた． WM

ブックマークしたユーザー

sh199107112024/02/17
manjirou992023/12/30
mooz2017/12/19

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx