yowaのブックマーク - はてなブックマーク

日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita
TL;DR 量子化しても成績が下がりにくいモデルと、大きく下がるモデルがある一部のモデルは量子化すると回答が極端に短くなる量子化によって回答が短くなる度合いは、量子化前モデルの回答の長さと相関がある可能性があるはじめに皆さんは量子化したLLMを使っていますか？深層学習における量子化（quantization）とは、モデルのパラメータを少ないビット数で表現することです。通常のモデルは float32 などの高精度なデータ型を使ってパラメータを表現しますが、この精度を float16 や int8 に下げることを量子化といいます。量子化による最大のメリットは、モデルのメモリ使用量を削減できることです。メモリの大きなモデルを動かすためには、大容量のメモリを搭載したGPUが必要ですが、量子化によってモデルのメモリ使用量を削減することで、より多くのGPUでモデルを動かすことができます
yowa 2024/04/11
リンク
ELYZA-tasks-100 でLLM14個の日本語性能を横断評価してみた - Qiita
TL;DR 14個の「日本語が話せるLLM」（日本製・外国製問わず）の性能を、日本語データセット ELYZA-tasks-100 で横断評価しました海外勢70Bモデルの性能が高いことがわかりました。7Bでは ELYZA-japanese-llama-2 や CALM2 の成績がよかったですモデルの回答・スクリプトへのリンクは記事内に貼っています JGLUE などのベンチマークは、モデルの性能を反映しているのか？ 2023年は、かつてないほど多くの LLM が（クローズド・パブリック問わず）公開され、まさに LLM フィーバーの年でした。一方で、どのモデルが高性能なのか、自分の利用用途に合ったモデルはどれなのか、とお悩みの方も多いのではないでしょうか。 LLM の性能を比較するときに役立つのが、ベンチマークです。英語圏の LLM に関していえば、MMLU や HellaSwag、Wi
yowa 2023/12/22
リンク
1

はてなブックマーク

タグ

ブックマーク / qiita.com/wayama_ryousuke (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / qiita.com/wayama_ryousuke (2)

日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita

ELYZA-tasks-100 でLLM14個の日本語性能を横断評価してみた - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス