2023年8月にリリースされたばかりの、元 Google の AI エンジニアが創業した LLM プラットフォーム「Fireworks.ai」に、日本語のオープンソース LLM モデル「ELYZA-japanese-Llama-2-7b-fast-instruct」が追加されました。 これが滅茶苦茶速くて、なんと現在はプロモーション期間で無料で使えます。急げ。 1. 高速&格安で生成できる API エンドポイントFireworks.ai は、大規模言語モデル (LLM) のサービスに活用できる、超高速推論プラットフォームです。 以下はオリジナルの Llama2-7b と Fine-tuner Llama2-7b の推論にかかる料金を、Fireworks / Mosaic / Replicate / OpenAI それぞれのプラットフォームで比較したものですが、最大 120 分の 1 の料金