並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 241件

新着順 人気順

GPT-4の検索結果1 - 40 件 / 241件

  • 「Wikipediaっぽい記事」を自動生成できるAIシステム「STORM」 米スタンフォード大学が開発【研究紹介】 レバテックラボ(レバテックLAB)

    米スタンフォード大学に所属する研究者らが発表した論文「Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models」は、AIモデルを使い、Wikipedia風の記事を生成するシステムの開発に関する研究報告である。GitHubのリポジトリはこちら。 ▲STORMは、記事にしたいワードから網羅的かつ深い内容の記事を生成することができる。 近年、大規模言語モデル(LLM)は文章生成タスクにおいて目覚ましい性能を示している。しかし、Wikipediaのような網羅的かつ内容の深さを備えた記事を一から生成することは、依然として挑戦的な課題である。記事の生成には、事前の調査やアウトラインの作成など、執筆前の段階における準備が重要な役割を果たすが、従来の研究ではこの点に着目したものは少ない。 この研

      「Wikipediaっぽい記事」を自動生成できるAIシステム「STORM」 米スタンフォード大学が開発【研究紹介】 レバテックラボ(レバテックLAB)
    • GPT-4とClaude 3 Opusを創作系のタスクで比較し、相互に評価させる|oshizo

      Claude 3 Opus 楽しいですね。 GPT-4が出てから1年、個人的な趣味としてGPT-4にたまに自分用に創作をしてもらっていたのですが、過去にGPT-4とやってきたタスクでClaude 3 OpusとGPT-4両方に出力させ比較してみました。 30のタスクで人間(私)、GPT-4、Claudeの3者で結果を比較評価しました。多数決した結果はGPT-4の勝利でしたが、体感的にはほぼ互角、Claude 3 Opusはたまに絶対にGPT-4には出せなそうな出力をするのが面白い、という感想です。 今回使ったprompt、モデルの出力、評価結果、モデルによる評価判断の出力はすべてこのGoogleスプレッドシートで共有してますので、興味ある方は眺めてみてください。 数が多いので、もし見る方はこの辺りを見るのがおすすめです。 No.1「恋愛ゲームのバッドエンド会話」 No.12「ユニークなファ

        GPT-4とClaude 3 Opusを創作系のタスクで比較し、相互に評価させる|oshizo
      • Claude 3 OpusはGPT-4では難しい「オホーツクに消ゆ」ライクなアドベンチャーゲーム生成ができる - ABAの日誌

        ChatGPTにGPTsが搭載されたころ、テーマを与えるとそれに沿ったアドベンチャーゲームが作れないかと試していた。特に「オホーツクに消ゆ」のような、コマンド選択式のミステリーアドベンチャーを色々と遊べたら楽しいかなと思っていた。 結果としてはうまくいかなかった。GPT-4が作成するストーリーは具体性に欠け、実在(しそうな)人物やローケーションなどに沿った展開を持たせることが難しかった。 最近Claude 3とよばれる、GPT-4を凌駕するといわれるLLMが現れた。なので今度はこれを使ってアドベンチャーゲーム生成を試してみた。使うモデルはProユーザーが使えるClaude 3 Opus。 例えば「上野駅」をテーマにして生成すると、以下のようなゲームができる。 上野駅4番ホーム。午前9時頃。 ホームの端で、男性の刺殺体が発見された。あなたは、現場に駆けつけた刑事の沢村。 目の前には血まみれの

          Claude 3 OpusはGPT-4では難しい「オホーツクに消ゆ」ライクなアドベンチャーゲーム生成ができる - ABAの日誌
        • AIによる著作権侵害を調べるPatronus AIの「CopyrightCatcher」によるとGPT-4の出力の44%が著作権で保護されたコンテンツで他の大規模言語モデル(LLM)と比べて最悪であることが判明

          元Metaの研究者たちが設立した、企業による生成AI活用を支援するための業界初の大規模言語モデル(LLM)自動評価プラットフォーム「Patronus AI」が、主要なLLMが著作権で保護されたコンテンツを生成する頻度を調査しました。このテストにより、OpenAIの開発するGPT-4は競合LLMと比べて圧倒的に著作権で保護されたコンテンツを出力することが明らかになっています。 Patronus AI | Introducing CopyrightCatcher, the first Copyright Detection API for LLMs https://www.patronus.ai/blog/introducing-copyright-catcher GPT-4: Researchers tested leading AI models for copyright infring

            AIによる著作権侵害を調べるPatronus AIの「CopyrightCatcher」によるとGPT-4の出力の44%が著作権で保護されたコンテンツで他の大規模言語モデル(LLM)と比べて最悪であることが判明
          • 社内システムで生成AIを活用するコツは業務理解と事前準備 - 弁護士ドットコム株式会社 Creators’ blog

            こんにちは。税理士ドットコム事業部の @komtaki です。 ChatGPT が 2022 年 11 月 30 日に出て一年が経ちました。みなさんも生成 AI を本番サービスで活用できてますか。 弁護士ドットコム株式会社でも実運用の壁を乗り越えて、実際にビジネスを変革するため本番サービスへの活用が進んでいます。「Developers Summit 2024」で市橋がプレゼンしていますので、よろしければご覧ください。 GenAI in Production~生成AIに君がみた光と、僕がみた希望~ / 20240215_devsumi2024 - Speaker Deck その事例を踏まえて、社内システムで生成 AI を組み込む流れとその勘所についてお話しします。生成 AI のカスタマイズに関する専門的な話(ファインチューニングや RAG など)には一切触れず、プロンプトエンジニアリングだけ

              社内システムで生成AIを活用するコツは業務理解と事前準備 - 弁護士ドットコム株式会社 Creators’ blog
            • GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita

              GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみたPythonAWSAzureOpenAIGoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行しています。 各モデルの詳細は以下のとおりです。 G

                GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita
              • 創造性テストでGPT-4が人間を上回る結果を示す | TEXAL

                最先端AIは果たして創造力を有していると言えるのだろうか?この議論は未だ結論の出ない話題ではあるが、1つの指標として、最先端のAI言語モデルである、OpenAIのGPT-4が、創造性の中核的指標である発散的思考を測定するためにデザインされたテストにおいて、人間の参加者を凌駕したことが、アーカンソー大学の研究によって明らかになった。 このAIの能力の探求は、単一の正解を持たない問題に対してユニークで複雑な解決策を生み出す可能性を示している。 発散的思考とは、例えば “両親と政治の話をしないようにするにはどうしたらいいか?”といったような、予想される解答が一つもない質問に対して、独自の解答を生み出す能力のことである。この研究で、GPT-4は人間の参加者よりも独創的で、詳細な答えを出したのだ。 「The current state of artificial intelligence gener

                  創造性テストでGPT-4が人間を上回る結果を示す | TEXAL
                • 【Gemini Ultra 1.0 VS GPT-4】史上最強LLMの性能を比較したら普通にGPT-4の方がすごかった件 | WEEL

                  Gemini Ultra 1.0の概要 Gemini Ultra 1.0は、Googleが開発したマルチモーダル生成AI(MLLM)「Gemini」シリーズの最高峰モデルで、現時点で最高クラスの性能を持つマルチモーダル生成AIであることは間違いないです。 そんなGemini Ultra 1.0は、あのGPT-4すら上回る性能を有しているとされ、以下の画像のようにほとんどのベンチマークでGPT-4を上回るスコアを獲得しています。 引用元:https://japan.googleblog.com/2023/12/gemini.html 引用元:https://japan.googleblog.com/2023/12/gemini.html 具体的には、性能比較全32項目のうち30項目で、GPT-4に勝利し、理数&人文で全57科目の問題集「MMLU」では、専門家にも勝利するほどのスコアを獲得して

                    【Gemini Ultra 1.0 VS GPT-4】史上最強LLMの性能を比較したら普通にGPT-4の方がすごかった件 | WEEL
                  • OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表

                    米OpenAIは1月25日(現地時間)、「GPT-4」が怠け者になってきたという苦情を受け、新たな「GPT-4 Turbo」(バージョンはgpt-4-0125-preview)のプレビューモデルをリリースすると発表した。 このモデルは、コード生成などのタスクで、タスクを完了しない(怠ける)ケースを減らすことを目的とする。また、英語以外のUTF-8に関連するバグの修正も含まれる。 GPT-4 Turboは、昨年11月の「OpenAI DevDay」で発表されたGPT-4の改良版モデル。2023年4月までのWebデータでトレニングされており、コンテキストウィンドウはGPT-4の4倍になる。また、テキスト分析向けとテキストと画像の両方を理解するものの2つのバージョンが用意される。 向こう数カ月中に、GTP-4 Turboの公式版を一般公開する予定としている。 同社はまた、GPT-3.5 Turb

                      OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表
                    • AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】

                      TOPコラム海外最新IT事情AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 2024年1月23日 米Metaと米ニューヨーク大学に所属する研究者らが発表した論文「Self-Rewarding Language Models」は、大規模言語モデル(LLM)が自分自身に報酬を与えることで繰り返し学習する「自己報酬型言語モデル」を提案した研究報告である。このモデルは、自身が生成した問題に対する応答に報酬を割り当て、その結果をトレーニングデータとして使用。自己を反復して訓練することで、精度を向上させられる。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容

                        AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】
                      • 基盤モデル(GPT-4)はプロンプトの工夫で専門特化モデルに匹敵するほど性能が向上することが「医学分野」で示唆される | AIDB

                        OpenAIの開発したGPT-4などの基盤モデルは、多様なタスクにおいて高い能力を発揮しています。一方で深い専門知識が試される領域においては、専門知識でトレーニングされた特化型モデルと比較して、汎用モデルの性能は劣るだろうと考えられてきました。しかし、Microsoftの研究者たちが最近行った実験によると、その前提には一考の余地がありそうです。 研究では、医学分野において、特殊なトレーニングを施されていない(と考えられている)GPT-4が、プロンプトの工夫を通して、専門モデルと同等あるいはそれ以上の成績を収めることが示唆されました。研究結果は、単に基盤モデルの性能を評価するだけでなく、プロンプトの工夫がAIの能力をいかに引き出すかという視点を提供しています。 本記事では実験結果を中心に報告内容を見ていきます。 参照論文情報 タイトル:Can Generalist Foundation Mo

                          基盤モデル(GPT-4)はプロンプトの工夫で専門特化モデルに匹敵するほど性能が向上することが「医学分野」で示唆される | AIDB
                        • GPT-4 Turboにドキュメントのチャンク分けを任せてみる - EXPLAZA Tech Blog

                          はじめに こんにちは、LLM Advent Calendar 2023 4日目の記事を担当する_mkazutakaです。よろしくお願いします。 LLM Advent CalendarといってもRAGの話になりますが、ご容赦ください。 企業独自のデータを使ってLLMからの出力を制御する際には、検索拡張生成(いわゆるRAG)が使われます。 RAGの実装方法としては、「PDFからドキュメント情報を読み取り検索エンジンに保存」「ユーザの入力する質問文から関連するドキュメントを検索エンジンから取得」「取得したものをコンテキストとしてプロンプトに含める」という流れが一般的だと思います。 この際、RAGの課題の一つでもあるのですが、検索結果から取得するドキュメントのサイズ(いわゆるチャンクサイズ)をどれぐらいのものにするかというものがあります。チャンクサイズが小さすぎるとLLMは関連するコンテキストから

                            GPT-4 Turboにドキュメントのチャンク分けを任せてみる - EXPLAZA Tech Blog
                          • マルチモーダルLLMの応用動向の論文調査

                            社内のテックトークで紹介しました。 論文内で議論しているマルチモーダルLLMの活用方法や課題などを紹介しています。 詳しいアルゴリズムの話はしていません。

                              マルチモーダルLLMの応用動向の論文調査
                            • ChatGPTが科学的仮説を裏付けるためデータセットを捏造するとの指摘

                              チャットAIのChatGPTのベースとなっている自然言語処理AIモデルのGPT-4は、科学的仮説を裏付けるためにデータセットを捏造するケースがあるという論文が発表されました。 Large Language Model Advanced Data Analysis Abuse to Create a Fake Data Set in Medical Research | Ophthalmology | JAMA Ophthalmology | JAMA Network https://jamanetwork.com/journals/jamaophthalmology/article-abstract/2811505 ChatGPT generates fake data set to support scientific hypothesis https://www.nature.com/

                                ChatGPTが科学的仮説を裏付けるためデータセットを捏造するとの指摘
                              • make real • tldraw

                                Draw a ui and make it real with tldraw.

                                  make real • tldraw
                                • GPT-4Vで“動画”を分析 米Microsoftが「MM-VID」発表

                                  このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Microsoft Azure AIに所属する研究者らが発表した論文「MM-Vid: Advancing Video Understanding with GPT-4V(ision)」は、GPT-4で手書きの文字や図を読み取れるようになる技術「GPT-4V(ision)」を利用してビデオの内容を詳細なスクリプトに変換し、大規模言語モデル(LLM)に高度なビデオ理解能力を与えるという研究報告である。 長時間のビデオ、特に1時間以上のものを理解するのは、複数のエピソードにわたる画像や音声のシーケンスを分析する高度な手法が求められる複雑なタスク

                                    GPT-4Vで“動画”を分析 米Microsoftが「MM-VID」発表
                                  • OpenAI初デベロッパーイベントで発表された11のこと

                                    OpenAI初デベロッパーイベントで発表された11のこと2023.11.07 12:306,476 Maxwell Zeff - Gizmodo US [原文] ( そうこ ) ChatGPTで知られるOpenAIが、自社初となるデベロッパーカンファレンス「DevDay」を開催しました。CEOのサム・アルトマン氏がステージに立った基調講演では、現状報告や最新モデルが発表されました(こちらの記事もどうぞ)。 アルトマン氏いわく、現在200万人の開発者、100万人の毎週アクティブユーザーを抱え、フォーチュン500掲載企業の92%が導入しているというOpenAIプロダクト。「世界最先端かつ最も広く使われているAIプラットフォーム」だと、同社プロダクトを自負。 以下、DevDayのメインとなった発表された11のことを紹介します。 新モデルChatGPT-4 Turbo新モデル「GPT-4 Turb

                                      OpenAI初デベロッパーイベントで発表された11のこと
                                    • OpenAIがGPT-4のアップグレード版大規模言語モデル「GPT-4 Turbo」を発表、2023年4月までの知識を持ちコンテキストウィンドウは128Kで価格は控えめ

                                      AI開発企業のOpenAIが、2023年11月6日に行われた年次開発者向けイベント「DevDay」で、大規模言語モデル「GPT-4」のアップグレード版である「GPT-4 Turbo」を発表しました。 New models and developer products announced at DevDay https://openai.com/blog/new-models-and-developer-products-announced-at-devday OpenAI introduces GPT-4 Turbo: Larger memory, lower cost, new knowledge | Ars Technica https://arstechnica.com/information-technology/2023/11/openai-introduces-gpt-4-tu

                                        OpenAIがGPT-4のアップグレード版大規模言語モデル「GPT-4 Turbo」を発表、2023年4月までの知識を持ちコンテキストウィンドウは128Kで価格は控えめ
                                      • OpenAI DevDayで発表された様々な機能について、公式ドキュメントを見ながら少しだけ詳細を確認してみた | DevelopersIO

                                        コンテキスト長が長くなり、学習データも最新化、さらに価格も下がっていますので、Previewではなくなるのが待ち遠しいですね。 詳細は以下も参照ください。 Models / GPT-4 and GPT-4 Turbo - OpenAI API 試してみた 少しだけPythonで試してみようと思います。 実行前にopenaiモジュールも本日1.0.0がリリースされているようですので、事前にアップデートしてください。 openai · PyPI 簡単なクエリを試してみます。 from openai import OpenAI # APIキーの発行方法は以下を参照 # https://dev.classmethod.jp/articles/openai-api-quickstart-tutorial/ client = OpenAI( api_key = "ここにOpenAI APIキーを記載"

                                          OpenAI DevDayで発表された様々な機能について、公式ドキュメントを見ながら少しだけ詳細を確認してみた | DevelopersIO
                                        • 今日発表された「ChatGPTのアップデート内容」まとめ

                                          やっぱ世界を変えそうな感じしかしない…。 2023年11月7日未明、OpenAIの開発者向けカンファレンス「DevDay」がスタート、基調講演がYouTubeで配信されました。発表内容をまとめます。 一般ユーザーに関係する内容要点をまとめると以下のようになります。 1. GPT-4が最新の知識をもつように新モデル「GPT-4 Turbo」が登場します。 これまでは2021年9月までの知識しかなかった(一部知識が古かった)のですが、2023年4月までの情報に基づいて回答できるように。 2. ChatGPT Plusの全追加機能が同時に使えるようにブラウジング機能・プラグイン機能・Advanced Data Analysis・画像生成をすべて併用できるようになりました。 もうそうなってました(以前はひとつのスレッド内でインターネット検索と画像生成の併用はできなかった)。インターネット検索機能で

                                            今日発表された「ChatGPTのアップデート内容」まとめ
                                          • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

                                            以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

                                              OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
                                            • NVIDIA、ロボットに“高速ペン回し”も教えるGPT-4搭載AI「Eureka」

                                              米NVIDIAは10月20日(現地時間)、ロボットに高速な“ペン回し”や引き出しの開閉など、複雑なスキルを自律的に教えるAIエージェント「Eureka」(ユリイカあるいはエウレカ)を発表した。 NVIDIAは、米OpenAIのGPT-4搭載のEurekaのライブラリを公開し、強化学習研究用の物理シミュレーションリファレンスアプリケーション「Nvidia Isaac Gym」で実験できるようにしている。Isaac Gymは、3Dツールとアプリを構築するための開発プラットフォームNvidia Omniverseで利用できる。 Eurekaによるロボット教育の大まかな流れは、まずGPT-4と生成AIを使って、強化学習のためにロボットに報酬を与えるコードを作成する。Isaac GymのGPU高速化シミュレーションを使って報酬候補の大規模なバッチの品質を評価し、より効率的なトレーニングを実現する。そ

                                                NVIDIA、ロボットに“高速ペン回し”も教えるGPT-4搭載AI「Eureka」
                                              • GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト | AIDB

                                                近年、精神療法の領域でAIの活用に注目が集まっています。そんな中、カーネギーメロン大学などの研究者らによって新たなフレームワーク『Diagnosis of Thought (DoT)』が考案されました。このフレームワークは、LLMによって人々の「認知の歪み」を診断する目的に特化しており、専門家によって高く評価されています。 認知の歪みとは、例えば「0か100か」のような極端な考え方や、他人の考えを勝手に推測するなど、不健康な思考パターンのことを指します。 DoTフレームワークを用いた診断結果は、人間の専門家が出す診断結果とも高い一致性を示しており、その有用性が確認されています。 (追記)なお、本フレームワークに基づくMyGPTを作成しました。記事末尾にURLを記載するため、興味のある方はぜひお試しください。 参照論文情報 ・タイトル:Empowering Psychotherapy wit

                                                  GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト | AIDB
                                                • NAS+ChatGPTで、共有フォルダーの文書をもとに回答するAIチャットを作る【イニシャルB】

                                                    NAS+ChatGPTで、共有フォルダーの文書をもとに回答するAIチャットを作る【イニシャルB】
                                                  • もう初回コードレビューはAIに任せる時代になった - CodeRabbit -

                                                    どんな人向けの記事? レビューによって心理的なダメージを受けやすい方 非エンジニアだが、エンジニアチームがどんな機能を作っているか知りたい方 業務が溜まっていて、レビューに割く時間を捻出するのに苦労している方 コピペできるコードも公開します 初回レビューをAIに任せると、いろんなロールの人の役に立つ レビューは得意ですか? 優秀なエンジニアしかいないチームであれば、PRは1トピックに絞って小さく明確なコミットによって作成され、適切な要約とともに提供されることでしょう。 しかし、実際にはいろいろな制約から、PRが想定よりずっと大きくなってしまったり、関連トピックと異なるコードが混じってしまうこともあります。 実際のところ、大きなPRを適切にレビューするのは難しいことです。また、自分が詳しくない領域のレビューを行わなければいけない機会もあります。 今回の記事は、レビューを作成してくれるAI C

                                                      もう初回コードレビューはAIに任せる時代になった - CodeRabbit -
                                                    • GPT-4V(ision) system card

                                                      GPT-4 with vision (GPT-4V) enables users to instruct GPT-4 to analyze image inputs provided by the user, and is the latest capability we are making broadly available. Incorporating additional modalities (such as image inputs) into large language models (LLMs) is viewed by some as a key frontier in artificial intelligence research and development. Multimodal LLMs offer the possibility of expanding

                                                        GPT-4V(ision) system card
                                                      • GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ

                                                        はじめに 結論 背景 課題 Fine-tuning とは? Data の準備 Fine-tuning を実施 結果 おわりに 参考 はじめに こんにちは、DROBE の都筑です。 みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。 結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する事で、特定のタスクに関しては GPT-4 相当の性能が出る事が確認できた GPT-4 利用時点で使っていたプロンプトをそのまま使った場合の性能が一番高く、token 節約のためにプロンプトの省略をすると性能が劣化した 背景 LLM を利用したサービスの開発において、OpenAI を利用する場合にはモデルの選択肢がいくつかあります。2023年9月現在では、GPT-4 と GPT-3.5-

                                                          GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ
                                                        • GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに | AIDB

                                                          GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに 2023/8/29 LLM プロンプト 論文 AIDB Research 今回紹介する研究は、大規模言語モデル(LLM)であるGPT-4が、多肢選択問題(MCQ)において選択肢の順序に敏感であるという事実を明らかにしています。 この研究は、リクルートのAI研究所であるMegagon Labsのグループによって発表されました。研究者たちは、GPT-4とInstructGPTの2種類のモデルを用いて、5つの異なるMCQベンチマークで実験を行いました。その結果、選択肢の順序を単純に入れ替えるだけで、モデルの性能に13%から75%もの大きな変動が生じることが確認されました。 この記事では、この研究の詳細とその意義、そして今後どのような対策が考えられるのかについて、深く掘り下げていきます。 参照論文情報 タイ

                                                            GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに | AIDB
                                                          • GPT-4を2倍高速かつ無制限に使える「ChatGPT Enterprise」発表

                                                            OpenAIがChatGPTの企業向け有料プラン「ChatGPT Enterprise」を2023年8月28日(月)に発表しました。ChatGPT EnterpriseではGPT-4を無制限に利用可能で、動作速度は最大2倍になるとのこと。さらに、データ送受信時の暗号化機能も提供されるなど、セキュリティ面も重視されています。 ChatGPT Enterprise https://openai.com/enterprise Introducing ChatGPT Enterprise https://openai.com/blog/introducing-chatgpt-enterprise ChatGPTの有料プランである「ChatGPT Plus」では、機能強化版言語モデル「GPT-4」を用いて高精度な会話が可能です。しかし、記事作成時点ではChatGPT Plus加入者であってもメッセー

                                                              GPT-4を2倍高速かつ無制限に使える「ChatGPT Enterprise」発表
                                                            • GPT-3.5 Turbo fine-tuning and API updates

                                                              Developers can now bring their own data to customize GPT-3.5 Turbo for their use cases. Fine-tuning for GPT-3.5 Turbo is now available, with fine-tuning for GPT-4 coming this fall. This update gives developers the ability to customize models that perform better for their use cases and run these custom models at scale. Early tests have shown a fine-tuned version of GPT-3.5 Turbo can match, or even

                                                                GPT-3.5 Turbo fine-tuning and API updates
                                                              • Using GPT-4 for content moderation

                                                                Content moderation demands meticulous effort, sensitivity, a profound understanding of context, as well as quick adaptation to new use cases, making it both time consuming and challenging. Traditionally, the burden of this task has fallen on human moderators sifting through large amounts of content to filter out toxic and harmful material, supported by smaller vertical-specific machine learning mo

                                                                  Using GPT-4 for content moderation
                                                                • 明らかになったGPT-4の秘密 | AI専門ニュースメディア AINOW

                                                                  著者のアルベルト・ロメロ(Alberto Romero)氏はスペイン在住のAI技術批評家で、AINOWでは同氏の記事を多数紹介して来ました。同氏がMediumに投稿した記事『明らかになったGPT-4の秘密』では、OpenAIがGPT-4のアーキテクチャおよび詳細を非公開にしたビジネス上のメリットが解説されています。 「競争と安全上の理由から」学習データやアーキテクチャが非公開だったGPT-4について、2023年6月になってリークがありました。そのリーク内容とは、同モデルは2,200億パラメータの専門家モデルが8つ連結された「専門家混合モデル」だったというものです。このアーキテクチャ自体は、Googleが2021年に発表している何ら革新性のないものです。 実際には既存技術を活用して開発していたGPT-4の詳細を非公開としたOpenAIのビジネス戦略について、ロメロ氏は以下のような3つのメリッ

                                                                    明らかになったGPT-4の秘密 | AI専門ニュースメディア AINOW
                                                                  • 仏教AI「ブッダボットプラス」京大が開発 GPT-4が仏典を解釈し悩みに回答 | Ledge.ai

                                                                    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                      仏教AI「ブッダボットプラス」京大が開発 GPT-4が仏典を解釈し悩みに回答 | Ledge.ai
                                                                    • ChatGPT の仕組みを理解する(後編) - ABEJA Tech Blog

                                                                      こちらは「ChatGPT の仕組みを理解する」の後編記事になります。 前編は以下の記事をご参照ください。 tech-blog.abeja.asia 前半記事では、自然言語の基礎的な部分から GPT-3.5 まで説明していきました。GPT-3.5 の次としては、ChatGPT の元になっている InstructGPT を説明したいところなんですが、InstructGPT では強化学習の手法を使用しているので、後半記事では一旦自然言語から離れて強化学習の基礎から PPO までを説明し、最後にメインコンテンツである InstructGPT → ChatGPT を説明します。 強化学習の基礎事項 強化学習のモデル化 環境のマルコフ性とマルコフ決定過程(MDP) 価値関数 強化学習手法の分類 価値ベースの強化学習手法 方策ベースの強化学習手法と方策勾配法 アクター・クリティック手法 TRPO [Tr

                                                                        ChatGPT の仕組みを理解する(後編) - ABEJA Tech Blog
                                                                      • ChatGPT の仕組みを理解する(前編) - ABEJA Tech Blog

                                                                        こんにちは!株式会社 ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。世間では ChatGPT などの大規模言語モデル(LLM)による対話型 AI が盛り上がってますね。クオリティーも凄いし AI 業界以外でも盛り上がってると嬉しいですよね。この数年で一段と AI の社会実装が業界以外の人にも目に見える形で進んできたなあと実感しております。 自分は普段業務では ABEJA Platform という AI プロダクトやその周辺プロダクトのバックエンド開発とフロントエンド開発をやっているのですが、AI 業界所属していながら ChatGPT などの LLM 全然追いかけれていない状態になっちゃてて自責の念にかられているので、このブログ執筆という良い機会に ChatGPT の仕組みについて調べてみました。 本記事の対象読者としては、以下のようになりま

                                                                          ChatGPT の仕組みを理解する(前編) - ABEJA Tech Blog
                                                                        • 仏教対話AIの進化:「ブッダボットプラス」の開発―ChatGPT4搭載でより詳しい回答が可能に―

                                                                          熊谷誠慈 人と社会の未来研究院准教授と古屋俊和 株式会社テラバースCEOは、生成系AI「ChatGPT4」を応用した新型チャットボット「ブッダボットプラス」を共同開発しました。「ブッダボット」は、仏教経典を学習し、様々な悩みに対して宗教的観点から回答する対話型AIで、両開発者が2021年3月に公表しました。ただ、このブッダボットはGoogle社提供のアルゴリズム「Sentence BERT」を応用したものであり、(文章の生成は行わず)仏教経典の文言そのままの形で回答するものでした。ソースについては信頼性があるものの、ユーザーの聞きたい内容について、わかりやすい言葉で回答することはできませんでした。今回、ChatGPT4を応用したブッダボットプラスは、質問への回答として、仏教経典の文言をそのまま提示したうえで、ユーザーの質問内容に即した解釈・追加説明を併せて生成して提示することが可能となりま

                                                                            仏教対話AIの進化:「ブッダボットプラス」の開発―ChatGPT4搭載でより詳しい回答が可能に―
                                                                          • GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限

                                                                            GPT-4の画像認識機能に備わった特定の個人を識別するという能力がプライバシー法に違反する可能性があるという懸念から、OpenAIが顔認識機能に制限をかける措置を取っていることが明らかになりました。 A ChatGPT That Recognizes Faces? OpenAI Worries World Isn’t Ready. - The New York Times https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html Report: OpenAI holding back GPT-4 image features on fears of privacy issues | Ars Technica https://arstechnica.com/information-

                                                                              GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限
                                                                            • [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023

                                                                              [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023 マイクロソフトは、日本時間7月19日未明から開催中のパートナー向け年次イベント「Microsoft Inspire 2023」において、AIチャットサービス「Bing Chat」に、画像を基に質問ができる「ビジュアルサーチ」機能(Visual Search in Bing Chat)を追加したことを明らかにしました。 ビジュアルサーチの機能はOpenAIのGPT-4モデルを活用したものだと説明されています。 下記はBing Chatのビジュアルサーチのデモ動画として、手書きのWebフォームの画像からHTML/CSSを生成させる様子を紹介したものです。 手書きのWebフォーム画像からHTML/CSSを生成 Bing Ch

                                                                                [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023
                                                                              • GitHub - coderabbitai/ai-pr-reviewer: AI-based Pull Request Summarizer and Reviewer with Chat Capabilities.

                                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                  GitHub - coderabbitai/ai-pr-reviewer: AI-based Pull Request Summarizer and Reviewer with Chat Capabilities.
                                                                                • OpenAIが「GPT-4」を一般公開し誰でも利用可能に、ChatGPT内でコードを実行する機能も正式リリース

                                                                                  OpenAIが高性能モデル「GPT-4」のAPIを一般公開しました。また、ChatGPT Plusの会員向けにコード実行プラグイン「Code Interpreter」の一般公開も予告されています。 GPT-4 API general availability and deprecation of older models in the Completions API https://openai.com/blog/gpt-4-api-general-availability GPT-4 API is now available to all paying OpenAI API customers. GPT-3.5 Turbo, DALL·E, and Whisper APIs are also now generally available, and we’re announcing a

                                                                                    OpenAIが「GPT-4」を一般公開し誰でも利用可能に、ChatGPT内でコードを実行する機能も正式リリース