「Google Colab」で「LLM-jp 13B v1.1」を試したので、まとめました。 【注意】Google Colab Pro/Pro+ のA100で動作確認しています。 1. LLM-jp 13B v1.1「LLM-jp 13B v1.1」は、「LLM-jp 13B」の最新版です。日英両データセットによるSFT、ichikaraデータセットの追加+DPOで対話応答性能が向上しています。 学習詳細も公開されており参考になります。 2. LLM-jp 13B v1.1 のモデル「LLM-jp 13B v1.1」は、3つのモデルが提供されています。 ・llm-jp/llm-jp-13b-dpo-lora-hh_rlhf_ja-v1.1 ・llm-jp/llm-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en