NVIDIA Triton Inference Server の性能検証 - LayerX エンジニアブログ

テクノロジーカテゴリーの変更を依頼記事元:

tech.layerx.co.jp

9 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

onesplat 意味がわからん。比較するなら条件揃えろや。

2024/04/01 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

NVIDIA Triton Inference Server の性能検証 - LayerX エンジニアブログ

機械学習エンジニアの吉田です。今回は機械学習モデルの推論サーバとして NVIDIA Triton Inference Serv... 機械学習エンジニアの吉田です。今回は機械学習モデルの推論サーバとして NVIDIA Triton Inference Server の性能を検証した話です。背景バクラクでは請求書OCRをはじめとした機械学習モデルを開発していますが、これらの機械学習モデルは基本的にリアルタイムで推論結果を返す必要があります。請求書OCRを例にとると、お客様が請求書をアップロードした際にその内容を解析し、請求書の金額や日付などを抽出します。このような推論用のAPIサーバはNginx, Gunicorn/Uvicorn, FastAPIで実装し、PyTorchモデルをGPUで推論する構成となっており、SageMaker Endpointを使ってサービングしています。バクラクの推論APIはこのような構成でリリース以降特に問題なく稼働してきていますが、ご利用いただくお客様が増えるにつれてリクエストも増加し

ブックマークしたユーザー

imyutaro2024/04/02
onesplat2024/04/01
yossylx2024/04/01
toshikish2024/04/01
triceratoppo2024/04/01
kiyohero2024/04/01
nekoruri2024/04/01
yu-ya42024/03/31

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx