記事へのコメント2

    • 注目コメント
    • 新着コメント
    sh19910711
    sh19910711 "μTransfer: 学習したい大規模モデル(ターゲットモデル)と同じアーキテクチャの次元や層数のより小さいモデルを用意 + μP と呼ばれる方法でパラメータ付け / 学習率を任意に大きなモデルにそのまま使い回せる"

    2024/05/23 リンク

    その他
    stealthinu
    stealthinu 小さいモデルで探索したハイパーパラメータをそのまま大きなモデルに転用できるという手法。そのための条件を数学的に決めれると。すごい頭の良さ。

    2024/04/08 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    μTransfer: 小規模モデルでのハイパラ探索を大規模モデルに転移し学習を効率化する|Tatsuya Shirakawa

    最近、友人から大規模モデルの学習を劇的に効率化しそうな下記の事実(μTransfer)を教えてもらい、こん...

    ブックマークしたユーザー

    • sh199107112024/05/23 sh19910711
    • tomo314159265632024/04/09 tomo31415926563
    • tsintermax2024/04/08 tsintermax
    • stealthinu2024/04/08 stealthinu
    • ttsurumi2024/04/08 ttsurumi
    • yojik2024/02/29 yojik
    • Gln2024/02/29 Gln
    • jmako2024/02/27 jmako
    • ZAORIKU2024/02/26 ZAORIKU
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事