ブックマーク / eetimes.itmedia.co.jp (1)

  • 1つのGPU/CPUで推論可能な超軽量LLM「tsuzumi」を24年3月から提供へ

    NTT2023年11月、同社が独自開発した大規模言語モデル(LLM)「tsuzumi」を2024年3月から提供開始すると発表した。 tsuzumiのコンセプトについて、NTT 執行役員 研究企画部門長の木下真吾氏は「専門知識を持った、パラメーターサイズの小さなLLMの実現だ。tsuzumiは、パラメーターサイズを抑えつつ、言語学習データの質と量を向上させることで、軽量化と専門性を両立した」と語った。 専門知識を持った軽量LLM「tsuzumi」 tsuzumiは、パラメーターサイズが6億または70億と軽量でありながら、「世界トップクラス」(同社)の日語処理性能を持つLLMだ。軽量なため、1つのGPUCPUで推論動作が可能で、学習やチューニングに必要な時間やコストを軽減できるという。日語/英語に対応する他、表が含まれる誓約書や契約書といった図表文書の視覚読解など、さまざまな形式にも対

    1つのGPU/CPUで推論可能な超軽量LLM「tsuzumi」を24年3月から提供へ
  • 1