GPT-3の人気記事 7件 - はてなブックマーク

1 - 7 件 / 7件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

GPT-3の検索結果1 - 7 件 / 7件

GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ
- 163 users
- tech.drobe.co.jp
- テクノロジー
- 2023/09/19
はじめに結論背景課題 Fine-tuning とは？ Data の準備 Fine-tuning を実施結果おわりに参考はじめにこんにちは、DROBE の都筑です。みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する事で、特定のタスクに関しては GPT-4 相当の性能が出る事が確認できた GPT-4 利用時点で使っていたプロンプトをそのまま使った場合の性能が一番高く、token 節約のためにプロンプトの省略をすると性能が劣化した背景 LLM を利用したサービスの開発において、OpenAI を利用する場合にはモデルの選択肢がいくつかあります。2023年9月現在では、GPT-4 と GPT-3.5-
- ChatGPT
- あとで読む
- openai
- LLM
- AI
- 文章生成AI
- gpt
- 人工知能
- techfeed
- プロダクト
ChatGPT の仕組みを理解する（前編） - ABEJA Tech Blog
- 148 users
- tech-blog.abeja.asia
- テクノロジー
- 2023/07/27
こんにちは！株式会社 ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。世間では ChatGPT などの大規模言語モデル（LLM）による対話型 AI が盛り上がってますね。クオリティーも凄いし AI 業界以外でも盛り上がってると嬉しいですよね。この数年で一段と AI の社会実装が業界以外の人にも目に見える形で進んできたなあと実感しております。自分は普段業務では ABEJA Platform という AI プロダクトやその周辺プロダクトのバックエンド開発とフロントエンド開発をやっているのですが、AI 業界所属していながら ChatGPT などの LLM 全然追いかけれていない状態になっちゃてて自責の念にかられているので、このブログ執筆という良い機会に ChatGPT の仕組みについて調べてみました。本記事の対象読者としては、以下のようになりま
- ChatGPT
- LLM
- あとで読む
- AI
- 機械学習
- 人工知能
- 文章生成AI
- techfeed
- 勉強
GPT-3.5 Turbo fine-tuning and API updates
- 98 users
- openai.com
- テクノロジー
- 2023/08/23
Developers can now bring their own data to customize GPT-3.5 Turbo for their use cases. Fine-tuning for GPT-3.5 Turbo is now available, with fine-tuning for GPT-4 coming this fall. This update gives developers the ability to customize models that perform better for their use cases and run these custom models at scale. Early tests have shown a fine-tuned version of GPT-3.5 Turbo can match, or even
- AI
- あとで読む
- ChatGPT
- openai
- techfeed
- API
ChatGPT の仕組みを理解する（後編） - ABEJA Tech Blog
- 46 users
- tech-blog.abeja.asia
- テクノロジー
- 2023/07/27
こちらは「ChatGPT の仕組みを理解する」の後編記事になります。前編は以下の記事をご参照ください。 tech-blog.abeja.asia 前半記事では、自然言語の基礎的な部分から GPT-3.5 まで説明していきました。GPT-3.5 の次としては、ChatGPT の元になっている InstructGPT を説明したいところなんですが、InstructGPT では強化学習の手法を使用しているので、後半記事では一旦自然言語から離れて強化学習の基礎から PPO までを説明し、最後にメインコンテンツである InstructGPT → ChatGPT を説明します。強化学習の基礎事項強化学習のモデル化環境のマルコフ性とマルコフ決定過程（MDP）価値関数強化学習手法の分類価値ベースの強化学習手法方策ベースの強化学習手法と方策勾配法アクター・クリティック手法 TRPO [Tr
- ChatGPT
- AI
- 文章生成AI
- あとで読む
- 人工知能
- techfeed
- 勉強
OpenAI DevDayで発表された様々な機能について、公式ドキュメントを見ながら少しだけ詳細を確認してみた | DevelopersIO
- 32 users
- dev.classmethod.jp
- テクノロジー
- 2023/11/07
コンテキスト長が長くなり、学習データも最新化、さらに価格も下がっていますので、Previewではなくなるのが待ち遠しいですね。詳細は以下も参照ください。 Models / GPT-4 and GPT-4 Turbo - OpenAI API 試してみた少しだけPythonで試してみようと思います。実行前にopenaiモジュールも本日1.0.0がリリースされているようですので、事前にアップデートしてください。 openai · PyPI 簡単なクエリを試してみます。 from openai import OpenAI # APIキーの発行方法は以下を参照 # https://dev.classmethod.jp/articles/openai-api-quickstart-tutorial/ client = OpenAI( api_key = "ここにOpenAI APIキーを記載"
- ChatGPT
- AI
- あとで読む
- OpenAI
- API
GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに | AIDB
- 31 users
- ai-data-base.com
- テクノロジー
- 2023/08/29
GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに 2023/8/29 LLM プロンプト論文 AIDB Research 今回紹介する研究は、大規模言語モデル（LLM）であるGPT-4が、多肢選択問題（MCQ）において選択肢の順序に敏感であるという事実を明らかにしています。この研究は、リクルートのAI研究所であるMegagon Labsのグループによって発表されました。研究者たちは、GPT-4とInstructGPTの2種類のモデルを用いて、5つの異なるMCQベンチマークで実験を行いました。その結果、選択肢の順序を単純に入れ替えるだけで、モデルの性能に13%から75%もの大きな変動が生じることが確認されました。この記事では、この研究の詳細とその意義、そして今後どのような対策が考えられるのかについて、深く掘り下げていきます。参照論文情報タイ
GPT-3は傾向や類似点を見いだして問題を解決する「類推」のテストで大学生を上回る能力を発揮できる
- 16 users
- gigazine.net
- テクノロジー
- 2023/08/02
膨大なデータでトレーニングしたGPT-3やBERTなどの大規模言語モデルは、基本的には「文章の並び方に確率を割り当て、次に来るのが自然な語を予測する」というモデルです。ところが、大規模言語モデルはまるで人間のように自然な文章を生成できるほか、画像の生成やタンパク質の立体構造の予測など、さまざまなタスクにも応用することが知られています。新たにカリフォルニア大学ロサンゼルス校の研究チームが、GPT-3は特定の情報を別のものに適用して答えを推測する「類推」のタスクにおいて、大学生を上回るスコアを記録したという研究結果を発表しました。 Emergent analogical reasoning in large language models | Nature Human Behaviour http://dx.doi.org/10.1038/s41562-023-01659-w GPT-3 ca