タグ

ブックマーク / zenn.dev/minux302 (2)

  • BitNetから始める量子化入門

    はじめに BitNet、最近話題になっていますね。 そもそも量子化って何?という方もいると思うので、この記事は DeepLearning の量子化から入り、その上で BitNet の触りについて見ていこうと思います。色々とわかってないことがあり、誤読してそうなところはそう書いてるのでご了承ください。 図を作るのは面倒だったので、様々な偉大な先人様方の図やスライドを引用させていただきます。 量子化 DeepLearning における量子化 DeepLearning の学習・推論は基 float32 で行います。これを int8 や Nbit に離散化することを量子化といいます。 計算に使う値は、モデルの重み、アクティベーション(ReLUとか通した後)、重みの勾配等があります。 学習時については一旦置いておいて、この記事では推論における量子化について焦点をあてます。推論時に量子化の対象となる

    BitNetから始める量子化入門
    misshiki
    misshiki 2024/03/04
    “DeepLearning の量子化から入り、その上で BitNet の触りについて見ていこうと思います。”
  • 新時代の pix2pix? ControlNet 解説

    入力に対して画像で条件づけする Diffusion モデルである ControlNet の解説をします。 paper: https://t.co/hIkh8qgjcL github: https://github.com/lllyasviel/ControlNet ([1] の Fig1 より引用) 論文は Style2Paints 開発者の lllyasviel(@lvminzhang) が出されていることから、高精度に入力線画に着彩する Styl2Paints V5 (のDorothyモデル?)に使用されているモデルである可能性が高いです。 Diffusion Model (特に Latent Diffusion)では入力の条件付けを忠実には考慮できていないモデルが多いため、論文の結果はなかなかにインパクトがあります。個人的には GAN 時代の pix2pix がそのまま Diff

    新時代の pix2pix? ControlNet 解説
    misshiki
    misshiki 2023/02/13
    “入力に対して画像で条件づけする Diffusion モデルである ControlNet の解説”
  • 1