なんで小数かというと逆伝播のために微分可能な計算でなければならなかったからだが、1、0、-1からの逆変換ってどうやってやるのだろう。

rryurryu のブックマーク 2024/03/02 20:22

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ

    Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。 [2402.17764] The Era of 1-bit LLMs: All Larg...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう