13億のパラメータを持つ日本語GPTでFew-shot推論を試してみる - OPTiM TECH BLOG

テクノロジーカテゴリーの変更を依頼記事元:

tech-blog.optim.co.jp

3 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

13億のパラメータを持つ日本語GPTでFew-shot推論を試してみる - OPTiM TECH BLOG

こんにちは、R&Dの伊藤です。「〇〇 is all you need」系の論文が多すぎて何が本当に必要なのか悩みなが... こんにちは、R&Dの伊藤です。「〇〇 is all you need」系の論文が多すぎて何が本当に必要なのか悩みながら機械学習タスクに取り組んだりしています。今回は先日公開されたrinna社の日本語GPTモデルを使って遊んでみた記事になります。はじめに日本語GPTモデルを動かしてみる Few-shotで推論を試す感情分析計算おわりにはじめに GPTは簡単に言えば「超高性能な言語モデル」であり、主に文章生成に利用されることが多いです。過去にGPT-2がフェイクニュース等を簡単に生成できることによる危険性から小規模モデルしか公開されなかったり、GPT-3が複数の自然言語処理タスクでSOTAに近い記録を出すなど、自然言語処理の分野で期待されているモデルの1つとなります。今回公開された日本語GPTモデルはなんとパラメータ数が13億にもなるとのことで、GPT-2の最大モデル(15億

ブックマークしたユーザー

roogh5eeSha62023/06/07

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx