Transformerの構造をほぼそのまま使って画像認識。Transformerには画像の位置情報を有効利用するような構造が埋め込まれてない分不利だと思うのにSOTAになってる。

stealthinustealthinu のブックマーク 2020/10/12 16:39

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

    0. 忙しい方へ 完全に畳み込みとさようならしてSoTA達成したよ Vision Transformerの重要なことは次の3つだよ 画像パッチを単語のように扱うよ アーキテクチャはTransformerのエンコーダー部分だよ 巨大なデータ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう