BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ

テクノロジーカテゴリーの変更を依頼記事元:

tech.jxpress.net

71 usersがブックマークコメント

コメント

4

記事へのコメント4件

注目コメント
新着コメント

misshiki “大きなNLPモデルの代表格であるBERTを利用して各高速化手法を検証”

2021/08/27 リンク

vaaaaaanquish 比較スクリプトの公開まで期待

2021/08/27 リンク

suica_j 通信社でさえ推論用ASICとかFPGAとか使ってないところを見るとこの手のチップが普及するのはまだまだ先なんやろうなって

2021/08/26 リンク

shinyorke プロダクト実装での課題まで考えてくれたストーリーで検証してくれるインターンがいるってホント強い。中の人ながら内容見てオッてなった。

2021/08/26 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ

背景はじめまして、JX通信社でインターンをしている原田です。近年深層学習ではモデルが肥大化する傾... 背景はじめまして、JX通信社でインターンをしている原田です。近年深層学習ではモデルが肥大化する傾向にあります。2020年にopen aiが示したScaling Laws（[2001.08361] Scaling Laws for Neural Language Models）の衝撃は記憶に新しく、MLP-Mixerが示したように、モデルを大きくすればAttention構造やCNNでさえも不必要という説もあります。（[2105.01601] MLP-Mixer: An all-MLP Architecture for Vision）しかし大きな深層学習モデルを利用しようとすると、しばしば以下のような問題に悩まされます。推論速度が問題でプロダクトに実装不可能 GPU/TPUはコスト上厳しいプロダクトの性質上バッチ処理が不可能（効率的にGPU/TPUが利用できない）例えばJX通信社

ブックマークしたユーザー

techtech05212024/04/28
roogh5eeSha62023/09/15
nyaocat2023/03/16
satojkovic2022/06/20
jp-myk2021/10/10
masadream2021/09/19
sacchin132021/09/07
skypenguins2021/09/01
muddydixon2021/08/31
MichaeL2021/08/30
miguchi2021/08/27
misshiki2021/08/27
fumirui2021/08/27
rgfx2021/08/27
jazzsasori2021/08/27
vaaaaaanquish2021/08/27
takutaku90902021/08/27
clavier2021/08/27

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx