(ブルームバーグ): 対話型人工知能(AI)「ChatGPT」を開発した米オープンAIは、GPT-4モデルをアップデートした「GPT-4o(オー、omniの略)」を発表した。スピードアップと低価格を実現したという。 13日のライブ配信イベントで披露された新しい大規模言語モデル(LLM)、GTPー4oは膨大な量のデータをインターネットから取り入れて学習し、リアルタイムでの文字情報や音声、画像の扱いが優れている。数週間内にリリースされる見通し。
以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5
米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す
イラストレーターをはじめとするクリエイターが、SNSやプラットフォームで作品を発表する──今まで当たり前のように行われていたことが、揺らぎはじめている。 生成AI(ジェネレーティブAI)の登場により、インターネット上にアップロードした作品が、権利者に無断(※)で学習データに利用されてしまうケースが頻発。 それに対抗し、SNSではクリエイター側が自分の作品について「無断学習禁止」を宣言したり、過去に投稿した作品をインターネット上から削除したりするなどの動きも増えてきた。 (※)なお現在、日本の著作権法では、AIの学習を目的とした著作物の利用は「その著作物に表現された思想または感情の享受を目的としない」かつ「著作者の利益を不当に害さない」場合、原則として権利者の許諾なく利用できるとされている(KAI-YOU.net調べ) そうした現状を受けて、クリエイターを守る新たなサービス「Oneup」が2
Published 2024/05/09 08:27 (JST) Updated 2024/05/09 12:47 (JST) 大手予備校河合塾が、各大学の総合型選抜(旧AO入試)などで、高校生が提出した願書や志望理由書に生成人工知能(AI)を使用していないか判定するシステムを開発した。学力試験を課さない入試が増える中で、受験生による不適切なAI利用の恐れも指摘されており、対策として効果を上げるのか注目されそうだ。 河合塾によると、米グーグルが開発した生成AIについて公開されている判定プログラムを新システムの開発に活用した。高校生が記入した志望理由や、長所・短所といった記入欄ごとに範囲を指定し、生成AIを使った文章ならではの「癖」に反応できるようにした。総合型選抜用の既存システムで提携している大学向けに提供する。 500~千字以上の文章ならかなり高い精度で判断できる。だが、AIを使っていな
生成AIを使ったサービスを開発してわかったことをメモしておきます。 開発したもの 業種 SaaS 課題 提供サービス内でユーザーがアイディアを考えることが難しかった。様々なデータを人力で集めてくる必要があった 解決策 アイディア起案に繋がりそうなデータを自動で集めてきて提示する。手法はベクトル検索、AIによる要約生成。 その他 チャットUIは作っていない。ユーザーの入力は最初の検索テキスト入力文のみ。 開発前の検証・プロトタイピング 開発する前に生成AIの出力を検証することが必要 生成AIの出力の質はサービスの肝だから 生成AIの出力は事前の予想と違うこともあり早い段階で出力を確認しておかないと後々の仕様変更があったときにキツイから AIに渡すデータの中身を確認しておく 例えばRAGを使って社内ドキュメントやDBを検索する場合、それらのデータの中身を吟味する必要がある 必要なデータと不要な
テクノロジーライター、Gマーク・パートナーショップ「AssistOn」取締役。 スティーブ・ジョブズ、ビル・ ゲイツ、スティーブ・ウォズニアックのインタビュー記事をはじめ、IT、カメラ、写真、デザイン、自転車など様々な分野の文筆活動や、製品開発のアドバイスを行う。 主な著書・共著書に『成功する会社はなぜ「写真」を大事にするのか』(講談社現代ビジネスブック)、『インテル中興の祖 アンディ・グローブの世界』(同文舘出版)、『ICTことば辞典』(三省堂)など。主な訳書に『Apple Design 日本語版』(アクシスパブリッシング)、『スティーブ・ジョブズの再臨』(毎日コミュニケーションズ)など。 最新刊として、『ルンバをつくった男 コリン・アングル「共創力」』(小学館)。 AssistOnホームページ:https://www.assiston.co.jp ビジネスを変革するテクノロジー 今やテ
コンピューターやプログラミングに関するナレッジコミュニティのStack OverflowがChatGPTを開発するOpenAIと提携し、ChatGPTが回答にStack Overflowに投稿された検証済みの技術的知識を利用できるようにすることを発表しました。この決定を受けて一部のユーザーが、自身の回答がスクレイピングされないように内容を削除した結果、Stack Overflowからアクセス禁止処分を受けたことが報じられています。 Stack Overflow and OpenAI Partner to Strengthen the World’s Most Popular Large Language Models - Press release - Stack Overflow https://stackoverflow.co/company/press/archive/openai-
画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ
関連記事: 漫画のAI翻訳に29億円について 翻訳者じゃない人に向けて、翻訳発注の側面から、人力翻訳、AI翻訳のみ、AI翻訳+人力修正の違いについて話すよっ! こんにちは。翻訳ジャーニーです。猫も杓子も口を開けば「エーアイ、エーアイ」と言うようになった感のある昨今ですが、翻訳業界でもそのトレンドは変わりません。 ここでは、AI翻訳(ニューラル機械翻訳)の結果を人間が修正するポスト・エディティング(PE)についてお話しします。とりわけ、多くの翻訳者がPE作業を苦痛に感じる理由を書いてみたいと思います。この記事を書くに当たって前提としたことを以下にまとめておきます。 この記事は、AI翻訳(以下「MT」と書きます)が成功していると言われているメディカル系の一部の分野と特許系の一部の分野には該当しません。MTとPEが商用レベルに達していない(前述の一部ジャンルを除く)産業翻訳・実務翻訳の全般と、文
OpenAIが2024年5月7日に、デジタルコンテンツの来歴を追跡する技術の標準化団体「Coalition for Content Provenance and Authenticity(C2PA)」に参加したことを発表しました。Adobe、Microsoft、Google、ソニーなどの後に続いてC2PAの運営に加わったOpenAIは今後、電子透かしやAI画像検知ツールなどの技術の実装に取り組んでいくと表明しています。 OpenAI Joins C2PA Steering Committee - C2PA https://c2pa.org/post/openai_pr/ Understanding the source of what we see and hear online | OpenAI https://openai.com/index/understanding-the-sou
OpenAIのチャットAI「ChatGPT」をはじめとする多くの生成AIは、データからパターンを学習して推論するためにクラウドサービスを使用しています。そのため、既存の生成AIは常にデータの漏えいやハッキングなどの危険にさらされています。2024年5月2日にMicrosoftはアメリカの諜報機関向けにインターネットから完全に切り離された生成AIをリリースしました。 Microsoft Creates Top Secret Generative AI Service for US Spies - Bloomberg https://www.bloomberg.com/news/articles/2024-05-07/microsoft-creates-top-secret-generative-ai-service-for-us-spies Microsoft launches AI cha
インターネット上で画像が拡散すると、第三者による転載・複製が繰り返され、削除しても追いつかない=ゲッティ(写真はイメージ) 保育園などがウェブサイトに園児が裸で写る画像を掲載し、第三者に悪用されるケースが相次いでいる問題で、こども家庭庁と文部科学省は7日、全国の保育園や幼稚園などに対し、こうした画像を掲載しないよう注意喚起する通知を出した。既に掲載している場合は至急、削除するよう求めた。 この問題を巡っては、保育園や幼稚園など少なくとも135園が、ブログなどに園児が裸で写る画像を掲載していたことが毎日新聞の調査で判明している。撮影時の状況はプールでの水遊びや乾布摩擦、内科検診など。胸や性器など性的部位が露出している上、園児の顔が判別できる画像が大半だった。 このうち12園の画像は海外のポルノサイトなどに転載され、80園の画像はページごと外部のサイトに複製・保存されていた。さらに、少なくとも
皆さんこんにちは 機械学習チームYAMALEXの@tereka114です。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 日々、LLMが進化していて、画像が本職(のはず)の私ですら、ここ数年LLMの勉強をはじめています。 学習してモデル公開しましたといった記事はよく見ますが、今回は今、非常に注目されている日本に拠点があるAIスタートアップである「Sakana.ai」が公開した「Evolutionary Model Merge」を使う話をします。 Evolutionary Model Merge 「Evolutionary Model Merge」は「Sakana.ai」から発表された進化的モデルマージと呼ばれる技術です。 端的に言ってしまえば、複数のモデルを利用して新し
大学のとき固体地球物理学をやってたんだけど、研究をするにあたって観測・測定データがとても大事。 それで、たとえば大地震が起きたとき、地元の大学がデータを収集して、全世界に公開するかというと、それはしてなかった。 火山噴火のときも、それまで集めた平常時のデータと噴火時のデータを全世界に公開すれば研究は進むけど、それも直ちにはしてなかった。 なにをするかというと、そのデータを用いて、それを収集した人が論文を書く。 それで、論文を書き尽くして「もう、このデータから書ける論文はないかな」となったところで公開する。 最初から公開した方が研究は進むけど、それだとデータを収集した普通の学者が食べていけなくなる。 だから、しょうがないんだと言ってた。 指導教官に「データを公開した方が良いと思うんだけど、しょうがないですかね」と言ったら 「公開した方がいいね。データの下処理を色んな人がやってくれるんなら、そ
すがやみつる @msugaya 私も試してみました。プロンプトは、以下のとおりです。 ***** 『ゲームセンターあらし』というタイトルのマンガがありますが、このマンガに関係なく、タイトルだけのイメージから、美少女がゲームセンターで激しくゲームをプレイする絵を、マンガタッチで描いてください。 ***** こちらの方が年齢が高そうですね(^_^)。 ChatGPT経由でDALL-E3に描いてもらいました。 2024-04-30 22:26:48 ジロー @i9r82k こんこんばんばん 本日夜便は、ゲームセンターあらしより「ゲームセンターあらし」です ゲーセンというか、カラオケじゃないか? 黒髪ショートカットって意外に珍しい気がする なんか悪友というか、腹を割って話せる関係っぽい感じがします #画像生成AI #美少女 pic.twitter.com/8SF9NJb1QR 2024-04-30
クリエイターは生成AIとどう向き合うべきか?(unsplash) 生成AIに関する話題は、連日のようにSNS上で“推進派”と“規制派”が激しい論争を繰り広げている。なかでも、イラストなどのクリエイティブな分野では、特に議論が紛糾している状態にある。SNSで目にするのは生成AIを規制したほうがいいとする意見であるが、推進したほうがいいという意見も多い。現在進行形で進化している生成AIの扱いをどのようにすべきか、結論が出るには至っていないのが現状だ。 そんななか、生成AIに自身の絵柄を学習され、無断で絵柄LoRA(注:生成AIの絵柄学習モデル)を作成された漫画家がいる。『疫神のカルテ』などの作品がある樋口紀信である。樋口は生成AIを悪用され、実際に被害を受けた経験から、積極的にSNSで発信を行っている。いったいその被害の実態はどのようなものなのか。そして、生成AIと我々はどう向き合うべきなのか
4月26日、米グーグルが画像生成AI「Imagen」の学習に作品を無断で使用したとして、写真家や漫画家が、損害賠償を求めてカリフォルニア州の連邦裁判所に集団提訴した。写真は同社のロゴ。米カリフォルニア州マウンテンビューで2018年11月撮影(2024年 ロイター/Stephen Lam) [29日 ロイター] - 米グーグル(GOOGL.O), opens new tabが画像生成AI(人工知能)「Imagen」の学習に作品を無断で使用したとして、写真家や漫画家が26日、損害賠償を求めてカリフォルニア州の連邦裁判所に集団提訴した。 提訴したのは、写真家のジンナ・チャン氏や、漫画家のサラ・アンダーソン氏、ホープ・ラーソン氏、ジェシカ・フィンク氏。4人は、生成AIの学習に著作権で保護された大量の画像を無断使用していることに、グーグルは責任を負うべきだと主張。損害賠償のほか、作品のデータを破棄す
今年4月、英国の裁判所が児童のわいせつ画像を保有していた男に生成AIツールの使用やアクセスを禁じる判決を言い渡した。 その背景には、画像AIで児童ポルノを生成する小児性愛者の存在がある。ダークウェブでは、小児性愛者に対して犯罪を指南するマニュアルまでやり取りされている。 性犯罪や選挙妨害など悪質性の高い用途で生成AIを活用することについては、技術の開発者と利用者の両面から厳しく制限されることになるだろう。 (小林 啓倫:経営コンサルタント) 英国の裁判所が下した画期的な判断 今年4月、英国のプール治安判事裁判所が、同国のアンソニー・ドーヴァーという48歳の男に画期的な判決を言い渡した。それは今後5年間、警察の事前の許可を得ることなく、生成AIツールを「使用したり、アクセスしたりしないこと」というものだった。 なぜ生成AIの使用を裁判所が禁止するに至ったのか、その理由は、彼が犯した犯罪を知れ
はじめにこんにちは、AI Picasso社の開発チームです。ふたたび、皆様に重要なお知らせがあります。高品質AIアート用画像生成AI、Emi 2 を商用利用可能で無償公開します。この画像生成AIは商用利用が可能であり、追加学習において無断転載画像を学習していません。 Emi 2 は以下のURLにて無料で利用することができます。 Emi 2の特徴1.AIアートへさらに特化このモデルは、イラストやアニメ、マンガのようなAIアート生成に特化しています。GMOインターネットグループが提供する「ConoHa byGMO」のトライアル版の採用により最先端の開発機材NVIDIA H100によって作られた画像生成Emi、モデルマージやフルファインチューニングといったAI Picasso社のノウハウを用いて高品質な画像が生成されるように尽力しました。参考として簡単な生成例を以下に紹介します。 比較のために、
米スタンフォード大学に所属する研究者らが発表した論文「Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models」は、AIモデルを使い、Wikipedia風の記事を生成するシステムの開発に関する研究報告である。GitHubのリポジトリはこちら。 ▲STORMは、記事にしたいワードから網羅的かつ深い内容の記事を生成することができる。 近年、大規模言語モデル(LLM)は文章生成タスクにおいて目覚ましい性能を示している。しかし、Wikipediaのような網羅的かつ内容の深さを備えた記事を一から生成することは、依然として挑戦的な課題である。記事の生成には、事前の調査やアウトラインの作成など、執筆前の段階における準備が重要な役割を果たすが、従来の研究ではこの点に着目したものは少ない。 この研
AIベンチャーのSakana AI(東京都港区)は4月22日、画像生成AI「EvoSDXL-JP」を公開した。同社が提案する生成AIの開発手法「進化的モデルマージ」によって構築したAIモデルで、従来の日本語AIモデルと比べて10倍速く画像を生成できるという。研究や教育目的のみで利用可能であり、HuggingFace上で公開中。 進化的モデルマージとは、複数の基盤モデル(生成AIを含む、大規模なデータセットによる事前学習で各種タスクに対応できるモデルのこと)を組み合わせて新たなモデルを作る「マージ」に、進化的アルゴリズムを適用したもの。この技術によって、比較的少ない計算資源とデータで、指定した能力に長けた新しい基盤モデルを自動作成できるという。 今回公開したEvoSDXL-JPでは、画像生成AIでよく使われている学習モデルである「拡散モデル」に対して、進化的モデルマージを適用。同社はこれまで
概要ローカル LLM 初めましての方でも動かせるチュートリアル 最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル(LLM)の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。 現状、様々な評価指標により LLM の性能が測定されていますが、
ファミリーマートは、生成AIの導入により、一部業務で作業時間を約50%削減できたと発表した。2023年12月から3カ月間にわたる実証実験を行い削減できる業務を特定したことで、新たに創出した時間をメディア事業など高付加価値の業務に活用する。 作業時間の削減効果があった業務は、各種アンケートの集計作業や、社内文書および社員教育資料の作成、店舗経営を支援するスーパーバイザー(SV)から本部担当社員への問い合わせ対応。今後はSVの店舗コンサルティング業務領域で検証を継続し、加盟店に対してより効果的なコンサルティング業務の実現を目指す。導入した生成AIは、人型AIアシスタントの「レイチェル/アキラ」にも搭載し、効果的な店長業務の支援にもつなげていくという。 ファミリーマートでは、生成AI活用の推進にあたり、全社横断の「生成AIプロジェクト」を立ち上げている。50人のプロジェクトメンバーが「セキュリテ
森川ジョージ @WANPOWANWAN 文化庁から 「AIと著作権に関する考え方について」が発表されました。 カギカッコ内の言葉で検索するとすぐ辿り着きます。 興味のある方は目を通しておくといいと思います。 2024-04-19 17:22:58 ○ この資料は、文化審議会著作権分科会法制度小委員会で取りまとめられた「AIと著作権に関する考え方について」(以下「考え方」)の概要をまとめたものです。正確な記載内容は「考え方」本体をご確認ください。 ○ 「考え方」は、現行の著作権法の解釈について、公表時点における、小委員会としての一定の考え方を示すものです。「考え方」それ自体は法的な拘束力を有するものではなく、また現時点で存在する特定の生成.. 🪐真冬🪐 @wcolor3242 うぇい、文化庁の「考え方」来たで〜関心ある人は一読しとき〜 言ってることはずっと概ね同じなんだけど、だんだんはっ
文化庁は2024年4月18日、文化審議会著作権分科会法制度小委員会が3月15日付けで取りまとめた、「AIと著作権に関する考え方について」(以下、「考え方」)の概要を公表しています。 2017年に早稲田大学法学部教授の上野達弘氏は「日本は機械学習パラダイスだ」と提言し、実際のところ近年の急速な生成AIの発展・普及にAIと著作権の関係を直接的に取り扱った判例や裁判例がいまだ乏しい状態です。「考え方」は、懸念解消を求める声に応えるべく“現行の著作権法がAIとの関係でどのように適用されるか”有識者からなる審議会で検討した内容をまとめたものとなっています。 「考え方」概要ではAIと著作権についての基本的な考え方を
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く