“Transformerモデルの最初の層は単語埋め込み -> 文脈のような複雑な情報 -> 最終層に近づくにつれ、「MLMl」や「NSP」などの事前学習に特化した情報を学習していると言われています。”

somemo のブックマーク 2022/05/31 20:14

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4707948347638669122/comment/somemo" data-user-id="somemo" data-entry-url="https://b.hatena.ne.jp/entry/s/www.ai-shift.co.jp/techblog/2145" data-original-href="https://www.ai-shift.co.jp/techblog/2145" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fwww.ai-shift.co.jp%2Ftechblog%2F2145" data-user-icon="/users/somemo/profile.png">Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 | 株式会社AI Shift</a><br><p style="clear: left">“Transformerモデルの最初の層は単語埋め込み -&gt; 文脈のような複雑な情報 -&gt; 最終層に近づくにつれ、「MLMl」や「NSP」などの事前学習に特化した情報を学習していると言われています。”</p><a class="datetime" href="https://b.hatena.ne.jp/somemo/20220531#bookmark-4707948347638669122"><span class="datetime-body">2022/05/31 20:14</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！

Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 | 株式会社AI Shift

www.ai-shift.co.jp2021/09/06

こんにちは AIチームの戸田です本記事では前回に引き続き、私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます前回は学習の効...

45 人がブックマーク・2 件のコメント

他のコメントを読む

＼コメントがサクサク読めるアプリです／

はてなブックマーク

Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 | 株式会社AI Shift

はてなブックマーク

公式Twitter

はてなのサービス