並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 1970件

新着順 人気順

GPTの検索結果1 - 40 件 / 1970件

  • GPT-4oを使って2Dの図面から3DのCADモデルを作る

    はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

      GPT-4oを使って2Dの図面から3DのCADモデルを作る
    • IT記者が心底驚いた「GPT-4o」本当の目玉機能

      滑らかで魅力的な声を持ち、あたかも生きているかのような人工知能(AI)が、人間のユーザーを魅了する。ふざけ合ったりしてユーザーの欲求を満たし、最終的には人間を虜にする。 これは、2013年の映画『her/世界でひとつの彼女』のあらすじだ。映画では、ホアキン・フェニックス演じる孤独で内向的なセオドアが、スカーレット・ヨハンソンが声を担当するサマンサという仮想アシスタントに心を奪われる。 しかし私はむしろ、「ChatGPT」をつくり出したOpenAIがサンフランシスコのイベントでAI音声アシスタントの最新バージョンを披露した、5月13日の光景を描写しているのかもしれない。 CEOアルトマンも認める「公式」の関係 同社の最新モデル「GPT-4o」(「o」は「オムニ」の略)」では、ChatGPTがユーザーの声から感情を検出し、表情を分析して、ユーザーの望みに応じて口調と抑揚を変えるなど、よりリアル

        IT記者が心底驚いた「GPT-4o」本当の目玉機能
      • Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita

        GPT-4o凄すぎる!! 出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。 先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました! あらためて記事を出してくださったことに感謝いたします! まずは初弾!ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法 を書いていきます! まずは見た目(Power Apps)から! まずはPower Appsでサクっと画面を作ります! PowerPoint感覚で作れることが強みですからね! 最低限のもので構成しています。 画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo

          Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita
        • 【AI】ChatGPTとAPIを使って網羅的なPubMed検索できるGPT「PubMed Searcher」 | EARLの医学ノート

          ■論文検索が可能なAIには,Consensus,Elicit,Perplexityなどがあり便利ではあるが,当然ながら完璧ではなく(漏れがでる),手動でのPubMed検索が一番網羅的で精度が高いことは変わらない.そこでPubMedというデータベースとその検索機能をChatGPTがダイレクトに操作してくれれば手動の精度を維持したまま網羅的検索を簡便に行える上に,その検索結果のファイル化,論文抽出,解説までChatGPTのユーザーインターフェース上で行うことができる. ■ChatGPTにはBingを用いたウェブアクセス機能が備わっているが,ChatGPTで論文検索を行う上では特定の論文検索エンジンを使用することをプロンプトで指示した方がよい.しかしながら,ChatGPTはPubMedのサイトをうまく読み込めず,以下のようなトラブルが発生しやすい.・PubMed検索結果を読み込めずハルシネーショ

            【AI】ChatGPTとAPIを使って網羅的なPubMed検索できるGPT「PubMed Searcher」 | EARLの医学ノート
          • 噂の「GPT-4o」の応答速度をガチ測定してみた、どこが特に速くなったのか?/【レビュー】

              噂の「GPT-4o」の応答速度をガチ測定してみた、どこが特に速くなったのか?/【レビュー】
            • Legal AI 「AI法律相談(AI弁護士ツール)」をOpen AIの「GPT-4o」にアップデート AI法律相談の会話スピードを高速化 - ロボスタ ロボスタ - ロボット情報WEBマガジン

              シェア 3 ツイート 0 はてブ 2 生成AIを開発するジークラウド社とAIリーガルテック企業 Legal AIは「AI法律相談(AI弁護士ツール)」で使用しているOpen AIのGPTを、「GPT-4o」にアップデートしたことを発表した。これにより会話の返答速度が高速化した。弁護士の法律相談業務にかかる貴重な時間とコストを削減、AI技術を活用した新しい形を提供していくとしている。 ユースケース事例 「AI法律相談(AI弁護士ツール)」は、法律業務に携わる弁護士、会計士、税理士、司法書士、行政書士等(事務所)向けに、自分にそっくりなAIアシスタントを提供する。 法律に精通したAI法律家(AI弁護士ツール)が「あなたの便利な法律顧問」になるとしている。所属AI法律家は理上 愛子(リガル アイコ)と理上 正義(リガル マサヨシ)がキャラクターとなっている。 速報(2024年5月17日11時時点

                Legal AI 「AI法律相談(AI弁護士ツール)」をOpen AIの「GPT-4o」にアップデート AI法律相談の会話スピードを高速化 - ロボスタ ロボスタ - ロボット情報WEBマガジン
              • 教育AI最新事例:GPT-4oなどを使った個別最適な学びの最新デモ集、自動採点やフィードバック生成、非認知能力の見取りなど|遠藤太一郎

                5/13、 14と連続してOpenAIとGoogleの発表ラッシュがありました。 教育に関するものも複数あったのですが、なかなか刺激的で面白い内容だったので、そのあらましをまとめてみました。 ざっくりとお伝えすると、「AIを活用した個別最適な学び」に該当するかなと思います。 また後半では、私が東京学芸大学と取り組んだ、文科省のプロジェクトに関しても簡単にまとめました。 こちらはAIによる自動採点やフィードバック生成、非認知能力の見取りなどに関する内容になっています。 では早速見ていきたいと思います。 リアルタイムに会話しながら、図形の問題を教える こちらはGPT-4oのデモです。リアルタイムに会話しながら、図形の問題の解き方を、子どもに寄り添って教えています。 以下、動画の内容です。 ********** まずはじめに親が、「数学の問題を教えてほしい。答えは教えずに、質問をしたりしながら導

                  教育AI最新事例:GPT-4oなどを使った個別最適な学びの最新デモ集、自動採点やフィードバック生成、非認知能力の見取りなど|遠藤太一郎
                • GPT-4o モデルに curl コマンドで画像をプロンプトとして送信する方法 - Qiita

                  OPENAI_API_KEY=sk-proj-xxxxxxx FILENAME=001.jpg DATA_URI='data:image/jpeg;base64,'$(base64 -w0 ${FILENAME}) SYSTEM_PROMPT='このシステムは画像の内容を分析して、その説明を生成します。分析結果を日本語で回答します。' USER_PROMPT='画像の中には何が映っていますか?' RESULT=$(curl https://api.openai.com/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $OPENAI_API_KEY" -d @- << _EOJ_ { "model": "gpt-4o", "messages": [ { "role":

                    GPT-4o モデルに curl コマンドで画像をプロンプトとして送信する方法 - Qiita
                  • 最新の生成AIを使いこなす、「チャットGPTー4o」の驚くべき実力 圧倒的な反応スピードはまるで友人が隣にいるかのよう | JBpress (ジェイビープレス)

                    チャットGPTの最新版がリリース オープンAIが新しいプロダクトを発表するということで、ジェネレーティブAI(生成AI)界隈は数日前からざわついていました。 「チャットGPT-5」が出るのではないかとか、はたまたハードウエアを発表するのではないかとの噂まで広まっていたのです。 結果は「GPT-4」の改良版である「GPT-4o」ということになりました。この「o」は「オムニ(Omni)=すべての」の略です。 しかしGPT-4oはあくまでも、AGI(Artificial General Intelligence=汎用人工知能)の呼び声も高いGPT-5ではなく、GPT-4のサブセットになります。ですので、基本的にGPT-4以上のことはできません。 しかし、画像のやり取りや音声のやり取りがスムーズになりました。 そして、今回の発表で無料ユーザーにも回数制限はありますが、GPT-4が提供されることにな

                      最新の生成AIを使いこなす、「チャットGPTー4o」の驚くべき実力 圧倒的な反応スピードはまるで友人が隣にいるかのよう | JBpress (ジェイビープレス)
                    • さっそくGradioでGPT-4oのAPIを使って画像を説明させるアプリを作ってみた - Qiita

                      2024/5/14 画像の処理に問題があり、色情報が正しくgpt-4oに伝わってなかったのでコードを修正 はじめに もうすでにたくさんの人が使っているようですが、本日公開されたGPT-4oのAPI(OpenAI)を使って画像を説明させるアプリを作ってみました。 料金 APIにかかる料金はこんな感じです。(2024/5/14現在) GPT-4Turboより安価で高速、2023年10月までの知識を持っているようです。 準備 opencv-python, gradio, openaiあたりをpipでinstallしておいてください。 ソースコード ソースコードは以下になります。secret.jsonに取得したAPIキーを入れてください。OSの環境変数から読み込みたい人は適宜ソースコードを修正してください。 # gradioでChatGPTを使って画像を文章で説明するプログラム import ba

                        さっそくGradioでGPT-4oのAPIを使って画像を説明させるアプリを作ってみた - Qiita
                      • ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)

                        5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

                          ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)
                        • GPT-4o API:料金、利用方法などを完全解説

                          GPT-4oを自分のプロジェクトに導入したり、それを使って新しいプロジェクトを開発したりしたい場合、Apidogという完璧なAPI管理ツールを使うことがおすすめです。ApidogではOpenAI APIプロジェクトを便利にアクセスして、GPT-4o APIを直ちに利用したり、テストしたり、自分のプロジェクトに導入したりすることができます。 また、完全に無料なツールなので、下記のボタンから無料でApidogを利用し始めましょう👇👇👇 buttonGPT-4oとは?GPT-4oとは、米国時間5月13日にOpenAI社がによって発表された最新のAIモデルになります。4oのoはomniの略で、「すべてを包括」という意味合いがあり、これまでのテキストと画像か、音声でChatGPTとやりとりする利用方式とは違い、テキスト、音声、画像やビデオを組み合わせて、GPT-4oとやりとりすることができるよ

                            GPT-4o API:料金、利用方法などを完全解説
                          • GPT-4o と GPT-4 について数学的能力を Azure OpenAI Playground 上で検証してみた - Qiita

                            回答の詳細は以下です。 GPT-4o 1回目 ハッピー数とは、各桁の数を2乗してその和を求めることを繰り返し、その結果が最終的に1になるような数のことを指します。それ以外はアンハッピー数と呼ばれます。 3904から3912までの数を順に調べていきましょう。 3904 3² + 9² + 0² + 4² = 9 + 81 + 0 + 16 = 106 1² + 0² + 6² = 1 + 0 + 36 = 37 3² + 7² = 9 + 49 = 58 5² + 8² = 25 + 64 = 89 8² + 9² = 64 + 81 = 145 1² + 4² + 5² = 1 + 16 + 25 = 42 4² + 2² = 16 + 4 = 20 2² + 0² = 4 + 0 = 4 4² = 16 1² + 6² = 1 + 36 = 37 (以下ループ) 3904はハッピー数では

                              GPT-4o と GPT-4 について数学的能力を Azure OpenAI Playground 上で検証してみた - Qiita
                            • GPT-4o ( omni ) が出たので、経済的自由の探求ブログの紹介記事の要約をGPT-3.5, GPT-4と比較してみました - Be financial freedom. 経済的自由の探求

                              こんにちは、株もっちーです。 火曜日は、身近なネタの日です。 OpenAIからGPT-4oがリリースされました GPT-3.5 GPT-4 GPT-4o まとめ ランキング・宣伝など OpenAIからGPT-4oがリリースされました というわけでなんか早速使ってみたいなと思いまして、以下のなつかしい記事の要約を比較してみたいとおもいます。 kabu-motty.hatenablog.com 全然マルチモーダル機能(テキストのみではなく、音声や、画像などを一緒に扱える機能)を活用できていませんが、その辺はご容赦ください。 GPT-3.5 この記事は、経済的自由についての考察と、その実現方法に焦点を当てています。著者は、経済的自由を「お金に束縛されない状態」と捉え、これを実現するためには資金が必要であると述べています。具体的には、投資による資産形成や収入の確保が重要であり、FIRE(Finan

                                GPT-4o ( omni ) が出たので、経済的自由の探求ブログの紹介記事の要約をGPT-3.5, GPT-4と比較してみました - Be financial freedom. 経済的自由の探求
                              • 【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート

                                ■2024年5月14日にOpenAI社からGPT-4o(oはomni「全て」の略)がリリースされた.この日はGoogleが大規模アップデートを発表する日でもあったが,GPT-4oのその性能と無料開放されたことから完全に霞んでしまったようである(Googleアップデートもかなりのものなので後日別の記事でまとめる).OpenAIは1ヵ月前にGPT-4-turbo-2024-04-09をリリースしてかなり精度アップしていたが,今回はそれを大きく上回るマルチモーダルな大幅アップデートである.Hello, GPT-4o. OpenAI 2024 May 13 https://openai.com/index/hello-gpt-4o/ ■実は,このGPT-4oは事前公開されていた.多数のAIチャットボットを比較できるChatBot Arenaに,4月30日に突然GPT2-chatbotなるものが1日

                                  【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート
                                • 【風吹けば名無し】GPT-4o が獲得した日本語の語彙を調べる

                                  昨日公開された GPT-4o は性能だけでなく処理速度の点からも注目を集めています。その速度に寄与しているのは、モデルの処理速度の改善だけでなく、日本語処理の改善も大きく関わっていると考えられます。 実際、OpenAIのサイトによれば、日本語は平均して 1.4 倍の効率で(1.4倍少ないトークンで)表せるようになったとされています。 これは、GPT-4o が GPT-4 に比べて日本語をより 語彙 (vocabulary) に含むようになったからです。語彙とは LLM における自然言語の処理の最小単位で、1つの語彙が1つの数値トークンに変換され、それがモデルに突っ込まれるという仕組みです。 ところで、GPT-4o では 『風吹けば名無し』 という文字列を 1 つの語彙として扱うのをご存知でしょうか。 このツイートで紹介されているように、GPT-4o では、ネットで多数出現するこういったフレ

                                    【風吹けば名無し】GPT-4o が獲得した日本語の語彙を調べる
                                  • GPT-4oを使って手書きの図からHTMLを出してもらった件

                                    驚異のGPT-4o はじめにこんにちは。ネクストビートでエンジニアをしている水島です。 今回は、5月14日(火)にOpenAI社によって発表された、新しいモデルGPT-4oについての紹介記事となります。 既にXなどをはじめ多方面でその驚くべき能力が知られ始めているGPT-4oですが、筆者も昨日に試してあまりの凄さに驚いてばかりです。ちなみに昨日意図せずバズったポストの著者でもあります。 GPT-4oはOpenAIが従来から提供してきたGPT-4-Turboの後継とも言えるモデルです。5月14日(火)のデモで発表された内容ではリアルタイムでの音声認識・応答などが目玉になっていましたが、こちらはまだ未公開です(数週間以内には提供されるようですが)。ですので、今回は即日リリースされたチャットボットとしてのGPT-4oの話になります。 GPT-4oについてはこの記事を読まれている皆さんも色々試され

                                      GPT-4oを使って手書きの図からHTMLを出してもらった件
                                    • Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応。

                                      Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応しています。詳細は以下から。 OpenAIは現地時間2024年05月13日、反応速度を向上させ、より人間らしい対話が可能にな最新のAIモデル「GPT-4o」を発表しましたが、Mac用ChatGPTクライアント「MacGPT」が最新のバージョン3.21でGPT-4oに対応しています。 Added support for the new GPT-4o model which is twice as fast and two times cheaper! リリースノートより MacGPTはNaviでApple Design Awards 2022 ファイナリストに選出されたオランダのJordi Bruinさんが開発しているChatGPTクライアントで、ChatGPTのWebベースに加え、OpenAIのAPIを利用することでネイ

                                        Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応。
                                      • “そこそこオープン”なAI「Llama 3」がビジネスに与える影響は? GPT-4を超える性能が手に入る世界に

                                        この連載について AIやデータ分析の分野では、毎日のように新しい技術やサービスが登場している。その中にはビジネスに役立つものも、根底からひっくり返すほどのものも存在する。本連載では、ITサービス企業・日本TCSの「AIラボ」で所長を務める三澤瑠花氏が、データ分析や生成AIの分野で注目されている最新論文や企業発表をビジネス視点から紹介する。 Metaがオープンソース生成AIモデル「Llama 3」を公開し、生成AIビジネスの世界に衝撃を与えています。同AIモデルは研究促進の目的で公開されており、OpenAIの「GPT-4」をしのぐ性能を持つモデルを、制限付きながら商用利用できるのが特徴です。 Llama 3のリリース後には世界中の開発者がこぞってLlama 3のファインチューニングに取り組み、独自モデルの拡張開発を始めています。日本語特化も含め、さまざまな業界特化型モデルが登場し、活用シーン

                                          “そこそこオープン”なAI「Llama 3」がビジネスに与える影響は? GPT-4を超える性能が手に入る世界に
                                        • Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表

                                          Googleが現地時間の2024年5月14日に開催した開発者向けイベントの「Google I/O」で、映像や音声を理解してリアルタイムで質問に答えてくれるAIエージェント「Project Astra(Astra)」を発表しました。実際に、ユーザーがスマートフォンとスマートグラスのカメラで撮影した物事について、Astraにあれこれ質問しているデモ動画も公開されています。 Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/ Google strikes back at OpenAI with “Project Astra” AI agent prototype |

                                            Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
                                          • 【コラム】GPT-4oはセクシーな声で誘惑、ユーザーに覚悟は-オルソン

                                            【コラム】GPT-4oはセクシーな声で誘惑、ユーザーに覚悟は-オルソン コラムニスト:Parmy Olson 「her」-サム・アルトマン氏がソーシャルメディアの「X(旧ツイッター)に投稿したのは、この一語だった。対話型人工知能(AI)「ChatGPT」を開発した米オープンAIが13日、GPT-4モデルをアップデートした「GPT-4o(フォーオー)」を発表した時、オンラインイベントのデモで披露されたのはアルトマン氏の投稿が示唆するように、映画『her/世界でひとつの彼女』の女優スカーレット・ヨハンソンを思わせる誘惑的な声だった。 GPT-4oで最も強く印象に残るのが、AIがスマートフォンのカメラを通して「見た」ことについて、ユーザーとリアルタイムで話せるようになったことだ。このスキルはグーグルが昨年12月のデモで主張したが実現できていなかったものだ。GPT-4oに関してさらに驚異的なのは、

                                              【コラム】GPT-4oはセクシーな声で誘惑、ユーザーに覚悟は-オルソン
                                            • OpenAIのAIモデル「GPT-4o」がチェスパズルで従来モデルの2倍以上の好成績をたたき出しランキングトップに

                                              OpenAIは日本時間の2024年5月14日、新たなAIモデルである「GPT-4o」を発表しました。テキストや音声、視覚情報を高速で処理してリアルタイムな応答が可能で、一般的なチャットAIが苦手とする計算問題にも優れた性能を発揮するGPT-4oが、チェスパズルでも「GPT-4」の倍以上の好成績をたたき出したことが明らかになりました。 GitHub - kagisearch/llm-chess-puzzles: Benchmark LLM reasoning capability by solving chess puzzles. https://github.com/kagisearch/llm-chess-puzzles 2024年4月、チャットボットの能力をバトル形式で比較評価する「Chatbot Arena」というウェブサイトに、「gpt2-chatbot」というモデルが突如として追

                                                OpenAIのAIモデル「GPT-4o」がチェスパズルで従来モデルの2倍以上の好成績をたたき出しランキングトップに
                                              • Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も

                                                基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。 生成AI搭載検索エンジン「AI Overview」(旧SGE) 「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」(SGE)を改称し、改善したもの。 詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。 マルチステップリーゾニング(多段階推論)で、1つの質問で複数ステップの結果を提示する。 例として、ピラティスにつ

                                                  Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も
                                                • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

                                                  OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

                                                    新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
                                                  • gpt-4oを試す

                                                    GPT-4o テキスト、オーディオ、ビデオの入力を扱い、テキスト、オーディオ、イメージの出力が可能。 GPT-4o以前では、ChatGPTのボイスモードが3つの異なるモデルを使用していた。 GPT-4oはこれらの機能を一つのモデルに統合し、テキスト、ビジュアル、オーディオの各入力を同一のニューラルネットワークで処理する。 現在のAPIの能力 現在のAPIは、テキスト、イメージの入力とテキストの出力をサポート 追加のモダリティ(例えばオーディオ)は現時点(2024/5/14)では使えない。近日導入される予定 Colaboratoryで動かしてみる インストール

                                                      gpt-4oを試す
                                                    • 人間に近づいた「GPT-4o」3つの進化のポイント

                                                      「私にとって魔法のようだ」ーー。サム・アルトマンCEOがそう予告していた新たなサービスがベールを脱いだ。 アメリカのOpenAIは5月13日、ChatGPTから使える新たな生成AIモデル「GPT-4o(フォー・オー)」を発表した。このAIの「知能」はこれまでのGPT-4と基本的に同じだが、応答時間を大幅に短縮するなど「使い易さ」で進化したという。 有料のGPT-4とは対照的にGPT-4oは無料ユーザーでも利用できるが、時間当たりの利用回数などが有料ユーザーに比べて制限される。無料化によってなるべく多数の利用者に使ってもらうことでChatGPTのユーザーベースを拡大し、飛躍的な進化が期待される次世代モデル「GPT-5」(まず間違いなく有料化される)のリリースに向けて足場を固めようとしている意図がうかがえる。 本稿では3つの「進化のポイント」に解説したい。 従来より「自然な会話」ができるように

                                                        人間に近づいた「GPT-4o」3つの進化のポイント
                                                      • GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」 (2ページ目)

                                                        kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

                                                          GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」 (2ページ目)
                                                        • GPT-4oの多彩な活用事例:わかりやすく簡単にまとめてみた - smileブログ

                                                          こんにちはantakaです。最新のAIモデルGPT-4oは、さまざまな分野で革新的な利用がされています。ここでは、特に注目すべき14の活用事例を簡単にわかりやすく紹介します。 脳波データの解析 用途: 医療や心理学の研究に利用。 方法: 脳波データを収集・前処理し、GPT-4oで解析。脳の働きや感情状態を評価します。 難解な数学の問題を瞬時に解答 用途: 学習支援。 方法: 難解な数学問題を即座に解答し、正確な計算と解説を提供します。 漫画の魅力を解説 用途: ファン同士の交流促進。 方法: 漫画のストーリーやキャラクターの魅力を分析・解説。印象的なシーンを詳しく説明します。 手描きのUIデザインをコード化 用途: デザインから開発への迅速な移行。 方法: 手描きのUIデザインをそのままコードに変換し、開発時間を短縮します。 AIキャラクターがリアルタイムで会話 用途: 視聴者との双方向コ

                                                            GPT-4oの多彩な活用事例:わかりやすく簡単にまとめてみた - smileブログ
                                                          • GPT-4o発表!課金すべきかVS無料でいくか - paiza times

                                                            <この記事の著者> 大谷大 - Tech Team Journal ウェブデザイナー/映像クリエイター/作曲家/ギタリスト/ブロガー/YouTuber BGMや効果音を無料でダウンロードできるサービス「タダオト」を運営し、自らが作曲した楽曲を掲載。2023年に生成AIにハマり、さまざまな仕事でフル活用しながらそのノウハウをYouTubeやブログで情報発信している。 2024年5月14日に行われたOpenAIのイベントで、新しいモデル「GPT-4o」が発表されました。 新しい機能のワクワク感もありつつ、無料ユーザーにさまざまな機能が開放されたことのインパクトも強かったです。 無料開放された機能を見ると、課金しないでもいいっていうユーザーは増えそうな気がしているので、今回はChatGPTを無料で使った方がいいか課金した方がいいかを考察してみます。 【目次】 今回のイベントで発表されたことざっく

                                                              GPT-4o発表!課金すべきかVS無料でいくか - paiza times
                                                            • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

                                                              今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の

                                                                GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
                                                              • HomeMadeGarbage on X: "おいおい GPT-4o STLファイル生成するぞ https://t.co/HXrk5k1AKw"

                                                                • GPT‑4oで面白かった・気になった事例まとめ - Qiita

                                                                  はじめに GPT‑4oが来ましたね!! 早速色々な使い方をされている方を見つけたのでまとめてみました。 公式ではリアルタイム翻訳や歌っている動画がありましたが、まだ試せないので、以下の事例には書いていません。 GPT-4o GPT-4o日本語まとめ 処方箋読み込み(OCR機能) 漫画を読解(OCR機能) GPT-4oに一瞬騙されかけた話(OCR機能…じゃなかった!) ペーパープロトタイピングから最初のHTML書き起こし 簡単なゲームを作成 カロリー推定アプリを作ってみる 終わりに まだ公開されて1日も経っていないので数は少ないのですが、これから続々と皆さんの試した結果が出てくると思います…! また思い立ったら更新しに来ます。 今後が色々楽しみですね!

                                                                    GPT‑4oで面白かった・気になった事例まとめ - Qiita
                                                                  • GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」

                                                                    kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

                                                                      GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」
                                                                    • GPT-4o、Azureの生成AIサービスでも体験可能に

                                                                      5月13日(米国時間)に米OpenAIが発表した、生成AI「GPT」シリーズの新たなモデル「GPT-4o」。クラウドサービス「Microsoft Azure」を使い、API経由でGPTシリーズにアクセスできる「Azure OpenAI Service」でも、すでに試用可能となっている。 Azure OpenAI Serviceでは、プレビュー版として米国リージョンの一部でGPT-4oを提供。Web開発環境「Azure OpenAI Studio」で機能を試すことができ、現時点でテキスト・画像の入力に対応。動画や音声の入力機能は今後追加するという。 関連記事 マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応 米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenAI Se

                                                                        GPT-4o、Azureの生成AIサービスでも体験可能に
                                                                      • OpenAI「GPT-4o」が変えるビジネス・暮らし 音声AIに飛躍 - 日本経済新聞

                                                                        米オープンAIが13日に発表した最新の生成AI(人工知能)「GPT-4o(フォーオー)」は、ヒトと機械が音声で自然に対話する時代の到来を印象づけた。オープンAIの発表からは、3つの技術進化が読み取れる。GPT-4oはヒトとコンピューターの接点を「文字」から「音声」に変える潜在力を秘める。暮らしやビジネスの現場でのAI利用にも大きな変化をもたらしそうだ。①豊かな感情表現「少し緊張しているんだ。

                                                                          OpenAI「GPT-4o」が変えるビジネス・暮らし 音声AIに飛躍 - 日本経済新聞
                                                                        • OpenAIの「GPT-4o」はまるで「目を手に入れたAI」。ChatGPT無料版でも利用可能に

                                                                          小林 優多郎 [Tech Insider 編集チーフ] May. 14, 2024, 08:30 AM テックニュース 17,073 OpenAIは5月13日(現地時間)、新しい対話型生成AIサービス「GPT-4o」を発表した。 GPT-4oは有料版「ChatGPT Plus」や「ChatGPT Team」のユーザー向けに展開を開始しており、今後エンタープライズ向けにも提供予定。 無料版ChatGPTユーザーに対しても、1日で利用できるメッセージの数に制限をつけつつも展開する(OpenAIによるとPlusユーザーのメッセージ送信可能数は無料版の5倍でTeamsやエンタープライズ版はそれ以上)。 GPT-4oとは何なのか。また、そのGPT-4oの上で走らせたOpenAIの驚きのデモの様子を振り返りつつ解説しよう。

                                                                            OpenAIの「GPT-4o」はまるで「目を手に入れたAI」。ChatGPT無料版でも利用可能に
                                                                          • OpenAIが新AIモデル「GPT-4o」を発表

                                                                            OpenAIはこのほど、同社製AIモデルの最新版となる「GPT-4o」の発表を行った。 テキストや音声、画像などの入力に対応した生成AIモデルで、英語のテキスト/コードを用いた場合には GPT-4 Turboに匹敵するパフォーマンスを実現した他、英語以外の言語テキストの大幅な改善も行われている。 既存のモデルと比較して視覚/音声の理解に優れているのも特徴で、APIベースではGPT-4 Turbo比で2倍高速で50%安価に利用可能だとしている。 関連記事 OpenAI、画像生成AI「DALL-E」に部分編集機能を追加 OpenAIは、同社提供の画像生成AI「DALL-E」に部分編集機能を追加した。 ChatGPTがログインなしで利用可能に OpenAIは、同社提供AIチャットサービス「ChatGPT」をアカウントなしでも利用できるよう変更を行った。 OpenAI、カスタム版ChatGPTを公

                                                                              OpenAIが新AIモデル「GPT-4o」を発表
                                                                            • 画像生成AIとしても超進化したChatGPT「GPT-4o」

                                                                              OpenAIは5月13日(現地時間)、「Spring Update」と題したオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」がお披露目された。 プレゼンテーションではまるで人間と話しているような音声会話機能が話題になっているが、実はウェブサイトに掲載された記事を見ると画像生成機能も大幅に性能アップしていたことがわかった。 一貫性の保持。AIコミックが描けるぞ! 今回のプレゼンテーションではなぜかまったくと言っていいほど触れられていなかったが、画像生成AI「DALL-E 3」(おそらく)を使用した画像生成能力も大幅に進化しているようだ。 まず、いちばん驚いたのは画像の一貫性の保持だ。なぜなら、DALL-E 3やStable Diffusionなどの画像生成AIにとって「同じキャラクター」を生成するのは最も苦手な仕事だからだ。

                                                                                画像生成AIとしても超進化したChatGPT「GPT-4o」
                                                                              • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                                                                昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                                                                  OpenAIのGPT-4oを日本語OCRとして使ってみる
                                                                                • Kenn Ejima @kenn 今回のGPT-4oの発表、自分の1か月前の予想が正解だった部分と、想定の斜め上に来たなぁという部分があるので整理したい。 まず、馬力を積んでモデルを大きく賢くする方向性ではなく、「モデルはもっと小さくても良いから速度を重視するフェーズに入った」というトレンド・シフトは予想通り。 軽量化して安価に動かせるようになったことで、無料ユーザーにも開放できるようになった。 いずれはグーグルのように誰もが使う文明の礎のような存在になることを考えると、どこかのタイミングでフロ