並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 16 件 / 16件

新着順 人気順

生成AIの検索結果1 - 16 件 / 16件

  • 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

    米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

      「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
    • GPT-4o の概要|npaka

      以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

        GPT-4o の概要|npaka
      • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

        画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

          画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
        • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

          昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

            GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
          • 「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】

            主催の清風明育社は、コンピュータ専門学校「清風情報工科学院」を運営する学校法人。他ににじジャーニーの提供元や大阪府教育委員会などが協賛しているという。また、公式サイトには協力先として日本マイクロソフトの名前を記載している。当初は協賛にワコムも記載していたが、5月13日にネット上で批判の声が大きくなった後、同日中に記載がなくなった。 清風明育社は、コンテスト開催の背景について「(生成AIは)有料利用が前提とされることが多いため、若年層は手が出しにくい」「無料で利用できる高品質な生成AIアートのツールに触れることが、進路選択・職業選択において価値ある体験になる」と説明していた。 一方コンテストに対してはいくつかの批判も。まず「入賞作品の著作権は主催者に帰属する」点については「成果物を奪うつもりか」という批判が見られた。また、協賛社一覧にワコムの名前があったことから、同社に対し「クリエイター向け

              「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】
            • 実務で生成AIサービスを開発してわかったこと

              生成AIを使ったサービスを開発してわかったことをメモしておきます。 開発したもの 業種 SaaS 課題 提供サービス内でユーザーがアイディアを考えることが難しかった。様々なデータを人力で集めてくる必要があった 解決策 アイディア起案に繋がりそうなデータを自動で集めてきて提示する。手法はベクトル検索、AIによる要約生成。 その他 チャットUIは作っていない。ユーザーの入力は最初の検索テキスト入力文のみ。 開発前の検証・プロトタイピング 開発する前に生成AIの出力を検証することが必要 生成AIの出力の質はサービスの肝だから 生成AIの出力は事前の予想と違うこともあり早い段階で出力を確認しておかないと後々の仕様変更があったときにキツイから AIに渡すデータの中身を確認しておく 例えばRAGを使って社内ドキュメントやDBを検索する場合、それらのデータの中身を吟味する必要がある 必要なデータと不要な

                実務で生成AIサービスを開発してわかったこと
              • 【無料】ChatGPTもClaudeもStableDiffusionも…生成AIをタダで使える「リートン」が太っ腹すぎる

                テクノロジーライター、Gマーク・パートナーショップ「AssistOn」取締役。 スティーブ・ジョブズ、ビル・ ゲイツ、スティーブ・ウォズニアックのインタビュー記事をはじめ、IT、カメラ、写真、デザイン、自転車など様々な分野の文筆活動や、製品開発のアドバイスを行う。 主な著書・共著書に『成功する会社はなぜ「写真」を大事にするのか』(講談社現代ビジネスブック)、『インテル中興の祖 アンディ・グローブの世界』(同文舘出版)、『ICTことば辞典』(三省堂)など。主な訳書に『Apple Design 日本語版』(アクシスパブリッシング)、『スティーブ・ジョブズの再臨』(毎日コミュニケーションズ)など。 最新刊として、『ルンバをつくった男 コリン・アングル「共創力」』(小学館)。 AssistOnホームページ:https://www.assiston.co.jp ビジネスを変革するテクノロジー 今やテ

                  【無料】ChatGPTもClaudeもStableDiffusionも…生成AIをタダで使える「リートン」が太っ腹すぎる
                • 「子どもの裸、サイトに掲載しないで」 国が全国の保育園などに通知 | 毎日新聞

                  インターネット上で画像が拡散すると、第三者による転載・複製が繰り返され、削除しても追いつかない=ゲッティ(写真はイメージ) 保育園などがウェブサイトに園児が裸で写る画像を掲載し、第三者に悪用されるケースが相次いでいる問題で、こども家庭庁と文部科学省は7日、全国の保育園や幼稚園などに対し、こうした画像を掲載しないよう注意喚起する通知を出した。既に掲載している場合は至急、削除するよう求めた。 この問題を巡っては、保育園や幼稚園など少なくとも135園が、ブログなどに園児が裸で写る画像を掲載していたことが毎日新聞の調査で判明している。撮影時の状況はプールでの水遊びや乾布摩擦、内科検診など。胸や性器など性的部位が露出している上、園児の顔が判別できる画像が大半だった。 このうち12園の画像は海外のポルノサイトなどに転載され、80園の画像はページごと外部のサイトに複製・保存されていた。さらに、少なくとも

                    「子どもの裸、サイトに掲載しないで」 国が全国の保育園などに通知 | 毎日新聞
                  • AIからクリエイターを守るSNS「Oneup」 オタク文化愛が生む、無断学習させない仕組み

                    イラストレーターをはじめとするクリエイターが、SNSやプラットフォームで作品を発表する──今まで当たり前のように行われていたことが、揺らぎはじめている。 生成AI(ジェネレーティブAI)の登場により、インターネット上にアップロードした作品が、権利者に無断(※)で学習データに利用されてしまうケースが頻発。 それに対抗し、SNSではクリエイター側が自分の作品について「無断学習禁止」を宣言したり、過去に投稿した作品をインターネット上から削除したりするなどの動きも増えてきた。 (※)なお現在、日本の著作権法では、AIの学習を目的とした著作物の利用は「その著作物に表現された思想または感情の享受を目的としない」かつ「著作者の利益を不当に害さない」場合、原則として権利者の許諾なく利用できるとされている(KAI-YOU.net調べ) そうした現状を受けて、クリエイターを守る新たなサービス「Oneup」が2

                      AIからクリエイターを守るSNS「Oneup」 オタク文化愛が生む、無断学習させない仕組み
                    • Stack OverflowとOpenAIの提携に反発し回答を削除したユーザーがBANされる

                      コンピューターやプログラミングに関するナレッジコミュニティのStack OverflowがChatGPTを開発するOpenAIと提携し、ChatGPTが回答にStack Overflowに投稿された検証済みの技術的知識を利用できるようにすることを発表しました。この決定を受けて一部のユーザーが、自身の回答がスクレイピングされないように内容を削除した結果、Stack Overflowからアクセス禁止処分を受けたことが報じられています。 Stack Overflow and OpenAI Partner to Strengthen the World’s Most Popular Large Language Models - Press release - Stack Overflow https://stackoverflow.co/company/press/archive/openai-

                        Stack OverflowとOpenAIの提携に反発し回答を削除したユーザーがBANされる
                      • Copilot for Microsoft 365、その入力指示自体をAIが補助可能に

                          Copilot for Microsoft 365、その入力指示自体をAIが補助可能に
                        • 願書のAI使用に判定システム 大学入試の総合型選抜などで | 共同通信

                          Published 2024/05/09 08:27 (JST) Updated 2024/05/09 12:47 (JST) 大手予備校河合塾が、各大学の総合型選抜(旧AO入試)などで、高校生が提出した願書や志望理由書に生成人工知能(AI)を使用していないか判定するシステムを開発した。学力試験を課さない入試が増える中で、受験生による不適切なAI利用の恐れも指摘されており、対策として効果を上げるのか注目されそうだ。 河合塾によると、米グーグルが開発した生成AIについて公開されている判定プログラムを新システムの開発に活用した。高校生が記入した志望理由や、長所・短所といった記入欄ごとに範囲を指定し、生成AIを使った文章ならではの「癖」に反応できるようにした。総合型選抜用の既存システムで提携している大学向けに提供する。 500~千字以上の文章ならかなり高い精度で判断できる。だが、AIを使っていな

                            願書のAI使用に判定システム 大学入試の総合型選抜などで | 共同通信
                          • Microsoftがインターネット接続不可でハッキングリスクを軽減できるスパイ向けの生成AIをリリース

                            OpenAIのチャットAI「ChatGPT」をはじめとする多くの生成AIは、データからパターンを学習して推論するためにクラウドサービスを使用しています。そのため、既存の生成AIは常にデータの漏えいやハッキングなどの危険にさらされています。2024年5月2日にMicrosoftはアメリカの諜報機関向けにインターネットから完全に切り離された生成AIをリリースしました。 Microsoft Creates Top Secret Generative AI Service for US Spies - Bloomberg https://www.bloomberg.com/news/articles/2024-05-07/microsoft-creates-top-secret-generative-ai-service-for-us-spies Microsoft launches AI cha

                              Microsoftがインターネット接続不可でハッキングリスクを軽減できるスパイ向けの生成AIをリリース
                            • OpenAIが「AI生成画像かどうかを見分けるツール」を開発中

                              OpenAIが2024年5月7日に、デジタルコンテンツの来歴を追跡する技術の標準化団体「Coalition for Content Provenance and Authenticity(C2PA)」に参加したことを発表しました。Adobe、Microsoft、Google、ソニーなどの後に続いてC2PAの運営に加わったOpenAIは今後、電子透かしやAI画像検知ツールなどの技術の実装に取り組んでいくと表明しています。 OpenAI Joins C2PA Steering Committee - C2PA https://c2pa.org/post/openai_pr/ Understanding the source of what we see and hear online | OpenAI https://openai.com/index/understanding-the-sou

                                OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
                              • 翻訳者じゃない人にAI翻訳の修正がいかに苦痛か説明するよっ!|翻訳ジャーニー、英日翻訳者・翻訳講師、マーケティング、セキュリティ(物理&サイバー)など

                                関連記事: 漫画のAI翻訳に29億円について 翻訳者じゃない人に向けて、翻訳発注の側面から、人力翻訳、AI翻訳のみ、AI翻訳+人力修正の違いについて話すよっ! こんにちは。翻訳ジャーニーです。猫も杓子も口を開けば「エーアイ、エーアイ」と言うようになった感のある昨今ですが、翻訳業界でもそのトレンドは変わりません。 ここでは、AI翻訳(ニューラル機械翻訳)の結果を人間が修正するポスト・エディティング(PE)についてお話しします。とりわけ、多くの翻訳者がPE作業を苦痛に感じる理由を書いてみたいと思います。この記事を書くに当たって前提としたことを以下にまとめておきます。 この記事は、AI翻訳(以下「MT」と書きます)が成功していると言われているメディカル系の一部の分野と特許系の一部の分野には該当しません。MTとPEが商用レベルに達していない(前述の一部ジャンルを除く)産業翻訳・実務翻訳の全般と、文

                                  翻訳者じゃない人にAI翻訳の修正がいかに苦痛か説明するよっ!|翻訳ジャーニー、英日翻訳者・翻訳講師、マーケティング、セキュリティ(物理&サイバー)など
                                • オープンAI、新AIモデル「GPT-4o」発表-低価格で高速(Bloomberg) - Yahoo!ニュース

                                  (ブルームバーグ): 対話型人工知能(AI)「ChatGPT」を開発した米オープンAIは、GPT-4モデルをアップデートした「GPT-4o(オー、omniの略)」を発表した。スピードアップと低価格を実現したという。 13日のライブ配信イベントで披露された新しい大規模言語モデル(LLM)、GTPー4oは膨大な量のデータをインターネットから取り入れて学習し、リアルタイムでの文字情報や音声、画像の扱いが優れている。数週間内にリリースされる見通し。

                                    オープンAI、新AIモデル「GPT-4o」発表-低価格で高速(Bloomberg) - Yahoo!ニュース
                                  1