GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録

テクノロジーカテゴリーの変更を依頼記事元:

nmoriyama.hatenablog.com

99 usersがブックマークコメント

コメント

6

記事へのコメント6件

注目コメント
新着コメント

kei_1010 学習にかかったコストが5億円と聞くと高いようにも思うけど5億円出せばこのレベルのAIが手に入ると考えると非常に安いようにも思える。手法が公開されたら5億でクラウドを回す企業がじゃんじゃん出てくるだろうな。

2020/10/09 リンク

kazuph1986 ５億円かけて作られたモデル…。

2020/10/10 リンク

knok GPT-2はもっと質を担保するために手が込んでいたようなんだけど、結局数を増やすにはCommon Crawlベースにどうにかするしかないのかな

2020/10/10 リンク

Keisuke69 “学習にかかったコストはクラウドで日本円で約5億円” 😳

2020/10/09 リンク

kei_1010 学習にかかったコストが5億円と聞くと高いようにも思うけど5億円出せばこのレベルのAIが手に入ると考えると非常に安いようにも思える。手法が公開されたら5億でクラウドを回す企業がじゃんじゃん出てくるだろうな。

2020/10/09 リンク

YaSuYuKi 低品質データの除外を機械学習で行っているのは効果的そうに見える(専門家ではないのでコスト以外の点にどう作用するかはわからないが)

machineLearning

2020/10/09 リンク

misshiki “T5及びGPT-3で使用されるデータの構築方法についてまとめ”られている。「学習済みモデルが商品化するのはAIビジネスの一つの転換期」との指摘は興味深い。

2020/10/09 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録

OpenAIが発表した言語モデルGPT-3はパフォーマンスの高さから各方面で注目されており、ついにはMicrosof... OpenAIが発表した言語モデルGPT-3はパフォーマンスの高さから各方面で注目されており、ついにはMicrosoftが学習済みモデルの利用を独占化しました。私個人の所感としてこれまで学習済みモデルは無料公開するという流れを無視し、（アーキテクチャではなく）学習済みモデルが商品化するのはAIビジネスの一つの転換期と感じています。深層学習による自然言語処理分野で巨大化していくモデルを十分に学習させるためにはWebデータの活用が大きな役割を果たしています。一方、その量に関する話題はあるものの、利用にあたっての細かな前処理に関する議論はあまりなされていない印象です。そこで本記事は学習データの構築にフォーカスします。 GPT-3の論文でも言及されている通り、学習データはGoogle Researchが発表したT5のデータを踏襲したと書かれていますので、まずはT5のデータから見て行きましょう。

ブックマークしたユーザー

techtech05212023/08/25
ssmtkmt2023/03/29
mitukiii2023/03/16
non_1172023/03/15
tkeisuke32020/11/16
samurairodeo2020/10/19
togusa52020/10/12
kazuph19862020/10/10
jkltf2020/10/10
omega3142020/10/10
ohtaman2020/10/10
yuiseki2020/10/10
knok2020/10/10
kiichi692512020/10/10
nitamago_monster2020/10/10
bongkura2020/10/10
kita1232020/10/10
morioka2020/10/10

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx