[論文要約] DeiT: 知識蒸留による効率的なViTの学習手法

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/bilzard

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

[論文要約] DeiT: 知識蒸留による効率的なViTの学習手法

論文 Training data-efficient image transf ormers & distillation through attention 概要 ViTの学習に... 論文 Training data-efficient image transf ormers & distillation through attention 概要 ViTの学習には300M枚の画像からなる膨大なデータセットが必要だった。これに対し、提案手法はViTと同じアーキテクチャを使い、学習方法の改善と新たに提案した知識蒸留手法を適用することで、imagenetのみを使って最新のConvNetと同等以上の性能を達成した。提案手法の特徴 Transf ormerに特化した注意ベースの知識蒸留[1]手法を新たに提案上記知識蒸留手法と重いデータ拡張などによる一連の学習手法の改善により、一般的に使われているimagenetのみによって最新のConvNetの同等以上の精度を達成（図1）図1: 最新モデルとの精度-スループットの比較注意による知識蒸留 Soft distillation: 教

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx