AWS Neuron が予測デコーディングと vLLM サポートを導入

テクノロジーカテゴリーの変更を依頼記事元:

aws.amazon.com

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

AWS Neuron が予測デコーディングと vLLM サポートを導入

本日、AWS は Neuron 2.18 のリリースを発表しました。これにより、PyTorch 2.1 の安定したサポートが導... 本日、AWS は Neuron 2.18 のリリースを発表しました。これにより、PyTorch 2.1 の安定したサポートが導入され (ベータ終了)、vLLM サポートによる連続バッチ処理が追加され、Transf ormers NeuronX ライブラリの Llama-2-70B サンプルを使用した予測デコードのサポートが追加されました。 AWS Neuron は、生成 AI 向けに構築された Amazon EC2 Inferentia および Trainium ベースのインスタンス用の SDK です。Neuron は PyTorch や TensorFlow などの一般的な ML フレームワークと統合されます。Neuron には、Trn1 インスタンスおよび Inf2 インスタンスでの生成 AI モデルの高性能トレーニングと推論をサポートするコンパイラ、ランタイム、ツール、ライブラリが含ま

あとで読む

ブックマークしたユーザー

CLSmooth2024/04/27

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx