[B! llm] lasherplusのブックマーク

lasherplus id:lasherplus

llmに関するlasherplusのブックマーク (1)

日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita
TL;DR 量子化しても成績が下がりにくいモデルと、大きく下がるモデルがある一部のモデルは量子化すると回答が極端に短くなる量子化によって回答が短くなる度合いは、量子化前モデルの回答の長さと相関がある可能性があるはじめに皆さんは量子化したLLMを使っていますか？深層学習における量子化（quantization）とは、モデルのパラメータを少ないビット数で表現することです。通常のモデルは float32 などの高精度なデータ型を使ってパラメータを表現しますが、この精度を float16 や int8 に下げることを量子化といいます。量子化による最大のメリットは、モデルのメモリ使用量を削減できることです。メモリの大きなモデルを動かすためには、大容量のメモリを搭載したGPUが必要ですが、量子化によってモデルのメモリ使用量を削減することで、より多くのGPUでモデルを動かすことができます
lasherplus 2024/04/11
llm
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx