並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 12719件

新着順 人気順

人工知能の検索結果41 - 80 件 / 12719件

  • オープンAIのサツケバー氏が退社へ、共同創業者

    5月14日、オープンAIの共同創業者でチーフサイエンティストのイリヤ・サツケバー氏が退社を発表した。写真は2023年6月、テルアビブで撮影(2024年 ロイター/Amir Cohen)

      オープンAIのサツケバー氏が退社へ、共同創業者
    • Deep Paint v1.0 - GAKU氏によるGrease Pencilを活用した3Dイラスト・立体絵画制作支援ツールセットBlenderアドオンが遂にリリース!

      Blender アドオン プラグイン&アドオン-Plugin&Addon Easy Shaders - 汚れや劣化表現などを手軽にパラメータ制御可能な15... 2024-05-18 Weybec Studioによる汚れや劣化表現などを手軽にパラメータ制御可能な15のシェーダーが付属したBlenderアドオン『Easy Shaders』がリリースされました! 続きを読む Unreal Engine アセット アセット-Asset Korea Dance Challenge Mocap Pack 5 - Tik... 2024-05-16 数多くのモーションアセットパックを販売している韓国のACHID EMOTE STOREによるTikTokなどのショート動画界隈で有名な動きをプロのダンサーによりキャプチャした19個のダンスモーションパック『Korea Dance Challenge Moc

      • Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗

        マスク編集機能もあり、動画とテキストプロンプトにマスク領域を追加し、動画の特定の領域を変更することができる。 また、テキストではなく画像を入力して動画を生成することもできるマルチモーダルだ。画像をテキストと組み合わせてプロンプトに入力することで、Veoは画像のスタイルを参照した動画を生成する。 Googleは、将来的にはVeoの機能の一部をYouTubeショートなどにも導入する計画だ。 関連記事 Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など 米Googleが、Android向けに搭載するAI関連の新機能を発表した。特定の部分を丸で囲って検索ができる「かこって検索」を、学習に活用できるようにする。Androidに生成AIモデルの「Gemini」を統合し、アプリ上のオーバーレイ表示から、より簡単にGeminiを利用可能になる。

          Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗
        • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

          1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

            大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
          • OpenAIのAIモデル「GPT-4o」がチェスパズルで従来モデルの2倍以上の好成績をたたき出しランキングトップに

            OpenAIは日本時間の2024年5月14日、新たなAIモデルである「GPT-4o」を発表しました。テキストや音声、視覚情報を高速で処理してリアルタイムな応答が可能で、一般的なチャットAIが苦手とする計算問題にも優れた性能を発揮するGPT-4oが、チェスパズルでも「GPT-4」の倍以上の好成績をたたき出したことが明らかになりました。 GitHub - kagisearch/llm-chess-puzzles: Benchmark LLM reasoning capability by solving chess puzzles. https://github.com/kagisearch/llm-chess-puzzles 2024年4月、チャットボットの能力をバトル形式で比較評価する「Chatbot Arena」というウェブサイトに、「gpt2-chatbot」というモデルが突如として追

              OpenAIのAIモデル「GPT-4o」がチェスパズルで従来モデルの2倍以上の好成績をたたき出しランキングトップに
            • スタンフォード大学の研究グループがGPUを高速に動作させるAI用のドメイン固有言語「ThunderKittens」をリリース

              スタンフォード大学のクリストファー・レ教授率いる研究チームがGPUを最大限に活用して一定時間当たりの演算量を最大化するためのドメイン固有言語(DSL)「ThunderKittens」をリリースしました。 ThunderKittens: A Simple Embedded DSL for AI kernels · Hazy Research https://hazyresearch.stanford.edu/blog/2024-05-12-quick-tk GPUs Go Brrr · Hazy Research https://hazyresearch.stanford.edu/blog/2024-05-12-tk 研究チームはNVIDIA H100を使用し、GPU使用率の最大化に取り組みました。H100はTensorコアを使用する半精度行列乗算計算の性能が989TFLOPSであり、その他

                スタンフォード大学の研究グループがGPUを高速に動作させるAI用のドメイン固有言語「ThunderKittens」をリリース
              • Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も

                基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。 生成AI搭載検索エンジン「AI Overview」(旧SGE) 「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」(SGE)を改称し、改善したもの。 詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。 マルチステップリーゾニング(多段階推論)で、1つの質問で複数ステップの結果を提示する。 例として、ピラティスにつ

                  Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も
                • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

                  OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

                    新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
                  • AndroidはAIで進化する。「かこって検索」で数式解説

                      AndroidはAIで進化する。「かこって検索」で数式解説
                    • パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現

                        パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現
                      • グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

                          グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
                        • [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

                          [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。 これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

                            [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開
                          • dbt Cloud での開発を自動化する強力な人工知能(AI)コパイロット機能『dbt Assist』がアナウンスされました。 #dbt | DevelopersIO

                            日本時間2024年05月15日 午前1時から開催されていたdbt Cloudのウェビナーイベント『dbt Cloud Launch Showcase』。こちらのイベントで数多くの新機能、GAリリースの情報がアナウンスされていたのですが、その中でかなりインパクトの大きい新機能がアナウンスされていました。 当エントリではその中から『dbt Assist』という機能についてその概要を紹介したいと思います。 目次 前置き 『dbt Assist』の紹介 まとめ 前置き 冒頭紹介したイベント自体は日本時間2024年05月15日午前01:00〜02:30の90分の枠で行われていました。前半では近年どのサービスでも言及されているように、サービスxAIが如何に重要であるかをデータを元に解説。 分析用のデータを準備するときに最も困難だと思うことは何ですか? - 10年前の最も困難な問題は、少なくともdbtユ

                              dbt Cloud での開発を自動化する強力な人工知能(AI)コパイロット機能『dbt Assist』がアナウンスされました。 #dbt | DevelopersIO
                            • Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など

                              特定の部分を丸で囲って検索ができる「かこって検索」は、GalaxyやPixelの一部機種で利用できるが、この機能を拡張する。同日から、学生が問題を解くのを支援する機能を追加。問題文に丸を付けると、物理学や数学を説くための指示が表示される。2024年後半からは、かこって検索が記号式、図、グラフなどを含むさらに複雑な問題の解決に役立てるようになる予定とのこと。 かこって検索はより多くの端末に導入する予定で、2024年末までに対応機種を2倍に増やす予定だとしている。 Androidに生成AIモデルの「Gemini」を統合し、アプリ上のオーバーレイ表示から、より簡単にGeminiを利用可能になる。例えば、生成された画像をGmailやGoogle メッセージなどにドラッグ&ドロップしたり、「このビデオに質問」からYouTube動画内の情報を検索したりできる。Gemini Advancedのユーザーは

                                Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など
                              • Google検索にAI新機能導入へ――動画検索や「AIによる検索結果まとめ」など

                                  Google検索にAI新機能導入へ――動画検索や「AIによる検索結果まとめ」など
                                • Adobeのシャンタヌ・ナラヤン会長兼CEOはAIをどう捉えているのか?

                                  Adobeに1998年から勤務し、2007年からCEOを務めているシャンタヌ・ナラヤン会長兼CEOがAIなどについて語るインタビューが、ニュースサイト・The Vergeで公開されています。 Why Adobe CEO Shantanu Narayen thinks AI is the future - The Verge https://www.theverge.com/24153956/adobe-shantanu-narayen-ai-firefly-premiere-photoshop-pdf-creativity-commerce インタビューを行ったのは編集長のニライ・パテル氏です。 配信されている音声によれば、インタビューは1時間近くにわたって行われたようで、ナラヤン氏はいろいろな質問に答えています。その中で、AIについても言及しています。 業界歴が長いナラヤン氏は、これまで

                                    Adobeのシャンタヌ・ナラヤン会長兼CEOはAIをどう捉えているのか?
                                  • 人間に近づいた「GPT-4o」3つの進化のポイント

                                    「私にとって魔法のようだ」ーー。サム・アルトマンCEOがそう予告していた新たなサービスがベールを脱いだ。 アメリカのOpenAIは5月13日、ChatGPTから使える新たな生成AIモデル「GPT-4o(フォー・オー)」を発表した。このAIの「知能」はこれまでのGPT-4と基本的に同じだが、応答時間を大幅に短縮するなど「使い易さ」で進化したという。 有料のGPT-4とは対照的にGPT-4oは無料ユーザーでも利用できるが、時間当たりの利用回数などが有料ユーザーに比べて制限される。無料化によってなるべく多数の利用者に使ってもらうことでChatGPTのユーザーベースを拡大し、飛躍的な進化が期待される次世代モデル「GPT-5」(まず間違いなく有料化される)のリリースに向けて足場を固めようとしている意図がうかがえる。 本稿では3つの「進化のポイント」に解説したい。 従来より「自然な会話」ができるように

                                      人間に近づいた「GPT-4o」3つの進化のポイント
                                    • グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供

                                      【読売新聞】 【ニューヨーク=小林泰裕】米IT大手グーグルは14日、動画生成AI(人工知能)「Veo(ベオ)」を発表した。1分超の長さの動画を高解像度で生成できる。14日から一部の映画関係者らに提供を開始する。 ベオでは入力した文章

                                        グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供
                                      • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) | テクノエッジ TechnoEdge

                                        lllyasviel氏復活第一弾のIC-Light前回(第23回)にControlNetやFooocus、stable diffusion webui forgeを作ったlllyasviel氏、ここ数ヶ月Xなどに書き込みが無いと書いたが、いきなり驚くべき仕掛けを提げての復活。その名もIC-Light(Imposing Consistent Light)。Stable Diffusionの技術を使って、照明を自由にコントロールできる仕掛けだ。 これまでStable Diffusionでは、SD 1.5、SDXLに関わらず、Promptで光や照明などの指示はできたのだが、どのように反映されるかは、Modelやその他の設定しだい。例えば backlight, soft bounced lighting, soft natural lighting, candolelight, neon ligh

                                          生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) | テクノエッジ TechnoEdge
                                        • AIはすでに「人を騙す能力」を身につけている? 新たな論文発表 | Gadget Gate

                                          サイエンス テクノロジー いったん嘘をつくようになるとやめられないとも AIはすでに「人を騙す能力」を身につけている? 新たな論文発表 Iamge:Stokkete/Shutterstock.com ここ数年、AIの発展は著しい。文章を書き、膨大な量のデータを処理し、プログラムコードを書くことも可能になった。完璧とまではいかないまでも、一部の人々にとっては作業の生産性向上に大きく役立っていることだろう。 しかし、そのAIはいつまでも人に従順ではないかもしれない、と不安になる報告も出てきている。新しい研究論文によれば、様々なAIシステムが、「真実以外の結果を達成するために、他者に偽の信念を抱かせる」技術を体系的に学習していると報告されている。 この論文では、外交をモチーフとするボードゲーム『Diplomacy』で生身のプレイヤーを凌ぐほどの実力を示すMetaのCICEROのような、特殊な用途

                                            AIはすでに「人を騙す能力」を身につけている? 新たな論文発表 | Gadget Gate
                                          • GoogleのAIに匹敵するオープンソースのAIモデル「Falcon 2」をUAEがリリース

                                            アラブ首長国連邦の政府系研究機関であるテクノロジーイノベーション研究所(TII)が2024年5月13日に、MetaのLlama 3 8Bを上回り、GoogleのGemma 7Bと同等のパフォーマンスを持つオープンソースの大規模言語モデル(LLM)の「Falcon 2」を発表しました。 Falcon 2: UAE’s Technology Innovation Institute Releases New AI Model Series, Outperforming Meta’s New Llama 3 | Technology Innovation Institute https://www.tii.ae/news/falcon-2-uaes-technology-innovation-institute-releases-new-ai-model-series-outperforming

                                              GoogleのAIに匹敵するオープンソースのAIモデル「Falcon 2」をUAEがリリース
                                            • GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」

                                              kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

                                                GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」
                                              • OpenAIの「GPT-4o」はまるで「目を手に入れたAI」。ChatGPT無料版でも利用可能に

                                                小林 優多郎 [Tech Insider 編集チーフ] May. 14, 2024, 08:30 AM テックニュース 16,692 OpenAIは5月13日(現地時間)、新しい対話型生成AIサービス「GPT-4o」を発表した。 GPT-4oは有料版「ChatGPT Plus」や「ChatGPT Team」のユーザー向けに展開を開始しており、今後エンタープライズ向けにも提供予定。 無料版ChatGPTユーザーに対しても、1日で利用できるメッセージの数に制限をつけつつも展開する(OpenAIによるとPlusユーザーのメッセージ送信可能数は無料版の5倍でTeamsやエンタープライズ版はそれ以上)。 GPT-4oとは何なのか。また、そのGPT-4oの上で走らせたOpenAIの驚きのデモの様子を振り返りつつ解説しよう。

                                                  OpenAIの「GPT-4o」はまるで「目を手に入れたAI」。ChatGPT無料版でも利用可能に
                                                • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                                  昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                                    OpenAIのGPT-4oを日本語OCRとして使ってみる
                                                  • 「AIずんだもん」3Dモデルが使用中止に 制作者が「不快な内容」と抗議

                                                    YouTubeチャンネル「AIずんだもん」を運営するきらっちさんがXで、東北ずん子・ずんだもんプロジェクトのキャラクター・ずんだもんの3Dモデルの使用を中止すると発表した。 3Dモデルの制作者から「不快な内容に利用されているため、利用をやめてほしい」と抗議を受けたという。併せて、きらっちさんは運営に不備があったとして謝罪した。 なお、5月13日に事情を説明するために行われた配信では、3Dモデルを無断で使用していたと発言している。 事情を説明するために行った配信 チャット欄のコメントに反応するAIずんだもんYouTubeチャンネル「AIずんだもん」では、チャット欄のコメントにAIVTuber・AIずんだもんが応答する配信を行っていた。 AITuberとは、視聴者のコメントに反応して応答を行うキャラクターコンテンツのこと。AI技術を用いることで、まるでVTuberのようなやり取りが疑似的に行わ

                                                      「AIずんだもん」3Dモデルが使用中止に 制作者が「不快な内容」と抗議
                                                    • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                                                      昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                                                        GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                                                      • OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能

                                                        OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。 Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ Introducing GPT-4o and more tools to ChatGPT free users | OpenAI https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/ GPT-4oはテキスト、音声、視覚入力を高速処理できるマルチモーダルなAIモデルです。GPT-4oの応答時間は平均320ミリ秒で、

                                                          OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
                                                        • メタ、カメラ付きAIイヤホン製造検討 翻訳機能など搭載=報道

                                                          米メタ・プラットフォームズがAIを搭載したカメラ付きイヤホンの製造を検討していることが分かった。米IT関連ニュースサイト「ジ・インフォメーション」が13日、事情に詳しい従業員の話として報じた。写真は米カリフォルニア州マウンテンビューにあるメタ本社で2022年11月撮影(2024年 ロイター/Peter DaSilva) [13日 ロイター] - 米メタ・プラットフォームズ(META.O), opens new tabが人工知能(AI)を搭載したカメラ付きイヤホンの製造を検討していることが分かった。米IT(情報技術)関連ニュースサイト「ジ・インフォメーション」が13日、事情に詳しい従業員の話として報じた。

                                                            メタ、カメラ付きAIイヤホン製造検討 翻訳機能など搭載=報道
                                                          • 「人とAIの“模倣”は本質的に同じ」Rubyの父・まつもとゆきひろに聞く、技術の進化と“模倣”の関係 レバテックラボ(レバテックLAB)

                                                            「人とAIの“模倣”は本質的に同じ」Rubyの父・まつもとゆきひろに聞く、技術の進化と“模倣”の関係 2024年5月14日 一般財団法人Rubyアソシエーション 理事長/Ruby開発者 まつもと ゆきひろ(松本行弘) プログラミング言語Rubyの生みの親。株式会社ネットワーク応用通信研究所フェロー、一般財団法人Rubyアソシエーション理事長、NPO団体軽量Rubyフォーラム理事長などを務める。島根県松江市名誉市民。 近年、大量のデータから文章や画像を生み出す生成AIに注目が集まる中、改めて「模倣」が果たす役割を問い直そうという動きが広がっているように見受けられます。実際に、人間はこれまで、既存の技術を「模倣」しながら新しい技術をつくりだし、その繰り返しによって発展を遂げてきました。 世界中のプログラマーから支持を集める「Ruby」も、他のプログラミング言語のさまざまな要素を採り入れて誕生し

                                                              「人とAIの“模倣”は本質的に同じ」Rubyの父・まつもとゆきひろに聞く、技術の進化と“模倣”の関係 レバテックラボ(レバテックLAB)
                                                            • 忙しい方向け OpenAI 発表まとめ|ぬこぬこ

                                                              tl;drGPT-4o:モデルの性能↑速度↑価格↓(o は omni の頭文字) 文章、音声、画像すべての能力がアプデ 入力:文章、音声、画像、動画(フレーム) 出力:文章、音声、画像、3D モデル 音声対話中に割り込み可、応答速度↑(話す速度も変更可) MacOS デスクトップアプリが登場(Windows は今年後半) ショートカットキー(Option + Space)より呼び出して質問 音声で対話できるように(将来的には音声・動画入力可能に) MacOS アプリは Plus ユーザのみ本日以降順に使えるようになる(使う方法が出回っていますが、プロキシいじったりするので個人的には非推奨。待ちましょう。) 課金ユーザが今まで使えていた機能の一部が無料で使えるように GPTs(作成はできない)、検索を踏まえた回答、データ分析やグラフの作成、画像の入力に対して会話、ファイルのアップロードなど

                                                                忙しい方向け OpenAI 発表まとめ|ぬこぬこ
                                                              • 無料のAI講座・Python・ITパスポート・AWS・品質管理・英文メールなど今後に役立つスキルが身に付く「Udemy」初夏のビッグセールおすすめ講座レビュー

                                                                4月は就職や転職、異動などで仕事内容が変わった人も多いはず。新たな仕事をこなしていくうちに、「どんな知識やスキルがこの先必要になってくるのか」や「どんな資格が効果的なのか」がだんだん見えてくるわけですが、動画形式で学べるオンライン学習プラットフォームのUdemyが初夏のビッグセールを行っており、スキルや資格の取得に役立つ対象講座が1講座1300円~という本1冊程度の手ごろな価格で受講できるようになっています。今回は新たな知識をスムーズに吸収できる講座を6つピックアップしてみました。 オンラインコース - いろんなことを、あなたのペースで | Udemy https://www.udemy.com/ ・目次 ◆1:GoogleのGeminiを使ってAIの使い方をマスターできる無料講座 ◆2:IT専門職ではない人にもおすすめな「ITパスポート」資格取得を目指す講座 ◆3:プログラミング言語「P

                                                                  無料のAI講座・Python・ITパスポート・AWS・品質管理・英文メールなど今後に役立つスキルが身に付く「Udemy」初夏のビッグセールおすすめ講座レビュー
                                                                • GPT-4o の画像認識能力がすごい!カロリー推定アプリを作ってみる - Qiita

                                                                  概要 食事のカロリー推定は非常に困難なタスクでした。 一般的なアプローチとしては、物体検知modelをfine-tuningし、料理画像から個々の料理の領域を判定することでカロリーを推定してきました。 GPT-4oを利用するとそのへんを飛ばして、いきなりカロリーが推定できます。精度の面では劣ると考えられますが、実装の容易さと未知のクラス (学習データセット内に含まれない料理) への対応を考えると、十分に利用価値があると思われます。 今回の記事では、実際のデモも紹介しているのですぐ利用することができます。 早速結果を見てみよう デモ 実装 カロリー推定 json-mode で処理をさせます。step-by-stepに推論を処理させるために、最初に雑な推論を記述させてから、各食品のカロリー量を推定させています。 # GPT-4にカロリーを推定させる (JSON-MODE) response =

                                                                    GPT-4o の画像認識能力がすごい!カロリー推定アプリを作ってみる - Qiita
                                                                  • NTT、機械学習で画像から鋼材の腐食を推定

                                                                      NTT、機械学習で画像から鋼材の腐食を推定
                                                                    • オープンAI 最新モデル「GPT-4o」発表 音声の反応速度向上 | NHK

                                                                      生成AIのChatGPTを手がけるアメリカのベンチャー企業「オープンAI」は処理スピードを速めて質問するとすぐに反応し、自然に会話ができる最新モデルを発表しました。IT各社も性能を高めた生成AIを次々と発表しており、開発競争が激しくなっています。 「オープンAI」が13日、発表したのは最新モデル「GPT-4o」です。 処理スピードを速めて文字と画像、それに音声による認識能力を大幅に向上させました。 大きな特徴は音声の反応速度です。 これまでのモデルでは反応の遅延がありましたが、このモデルでは質問すると人と同じように自然に会話ができるとしています。 発表会では研究チームの担当者が「少し緊張しています。落ち着かせるのを手伝ってもらえますか」と尋ねると生成AIが「深呼吸して、あなたが専門家であることを思い出して下さい」と自然に回答する様子が紹介されました。 また、通訳として2人の会話の間に入り英

                                                                        オープンAI 最新モデル「GPT-4o」発表 音声の反応速度向上 | NHK
                                                                      • マイクロソフト、諜報機関向けのAIを極秘に開発していた

                                                                        チャペルは、GTP-4をベースにしたそのモデルが現在稼働しており、質問に答えることができて、コードも書けると語った。ファイルを読み込んで分析可能だが、機密情報がプラットフォーム上に出ないように学習することはできないという。そして、諜報機関による試験も認定もまだ受けていない。 2023年12月のCIAの発表では、前戦略部長のデニス・J・グリーソン(Dennis J. Gleeson)は次のように記述している。 「現在のチャットボットには知性がないがそれらは革新的でエキサイティングで、(インテリジェンスコミュニティの)グローバルのミッションをサポートするために、情報を収集して処理し、評価し、使用する情報の量や種類に可能性が感じられる」 彼は、AIは「大量のデータの相互作用をどのように考えるかについての戦略的転換」だと付け加えた。また、CIAのトランスナショナル・テクノロジー・ミッションセンター

                                                                          マイクロソフト、諜報機関向けのAIを極秘に開発していた
                                                                        • OpenAI が新たな無料モデル GPT-4o とデスクトップ版 ChatGPT を発表ーーアプリはまるで人間と会話するような反応速度に - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                                          本日、OpenAIの最高技術責任者(CTO)であるMira Murati(ミラ・ムラティ)氏は、Spring Updatesイベントで、新しい強力なマルチモーダル基礎大規模言語モデル(LLM)であるGPT-4o(GPT-4 Omniの略)を発表した。これは今後数週間で全ての無料ChatGPTユーザーに提供され、MacOS用のChatGPTデスクトップアプリ(後にWindows向けも)も発表された。これにより、ユーザーはウェブやモバイルアプリ外でもアクセス可能になる。 「GPT-4oは音声、テキスト、ビジョンを統合して推論する」とMurati氏は述べた。これは、ChatGPTスマートフォンアプリでユーザーが撮影したリアルタイム動画を受け入れ分析する機能も含まれるが、この機能はまだ一般公開されていない。 「まるで魔法のよう。素晴らしいことですが、私たちはその神秘性を取り除き、みなさんにそれを試

                                                                            OpenAI が新たな無料モデル GPT-4o とデスクトップ版 ChatGPT を発表ーーアプリはまるで人間と会話するような反応速度に - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                                          • 「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?

                                                                            米OpenAIは5月13日(現地時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。このモデルの詳細は別記事にゆずり、本稿ではモデル名の読み方とその由来、「声」についてのうわさを紹介しよう。 oはomniのo GPT-4oは「ジーピーティーフォーオー」と読む。oは「omni」のo。omni(オムニ)は「オムニバス」「オムニチャンネル」などの日本語にもなっているように、すべて、全体、全方位などを表す言葉だ。 GPT-4oが、テキスト、音声、画像の任意の組み合わせを入力として受け入れ、テキスト、音声、画像の任意の組み合わせの出力を生成するマルチモーダルなAIであることを表している。 女性の声は映画「Her」に似ている? GPT-4o発表のライブストリームデモでは、OpenAIのミラ・ムラティCTO(最高技術責任者)とエンジニアがiPhoneに搭載されたGPT-4oと会話する形で

                                                                              「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?
                                                                            • 「GPT-4o」発表 人のように音声・画像・テキストで高速応答

                                                                                「GPT-4o」発表 人のように音声・画像・テキストで高速応答
                                                                              • GitHub Copilot ChatがGitHub Mobileでも正式に利用可能に。どこでも自然言語でコーディングに関する質問をAIが答えてくれる

                                                                                GitHubは、自然言語でコーディングに関する質問をAIに問い合わせ、回答してもらえる「GitHub Copilot Chat」が、モバイルアプリケーションのGitHub Mobileでも正式に利用可能になったことを明らかにしました。 GitHub MobileでGitHub Copilot Chatが利用可能になったことで、開発者はどこにいてもモバイルデバイスを使って自然言語でAIにコーディングに関するさまざまな質問を投げかけ、答えを得ることができると、次のように説明されています。 With GitHub Copilot Chat natively integrated with GitHub Mobile, developers can access their AI coding assistant to get answers for all their coding questi

                                                                                  GitHub Copilot ChatがGitHub Mobileでも正式に利用可能に。どこでも自然言語でコーディングに関する質問をAIが答えてくれる
                                                                                • AI、世界の雇用に影響 「津波」のよう=IMF専務理事

                                                                                  国際通貨基金(IMF)のゲオルギエワ専務理事は13日、人工知能(AI)が「津波」のように世界の労働市場を襲っているという認識を示した。2023年12月撮影(2024年 ロイター/Dado Ruvic) [チューリヒ 13日 ロイター] - 国際通貨基金(IMF)のゲオルギエワ専務理事は13日、人工知能(AI)が「津波」のように世界の労働市場を襲っているという認識を示した。 ゲオルギエワ氏はチューリヒで開催されたイベントで、AIが今後2年間で先進国の雇用の60%、世界の雇用の40%に影響を与える公算が大きいと指摘。「人々や企業が備える時間はほとんど残されていない」とし、「うまく管理できれば生産性は飛躍的に向上する可能性がある。しかし、誤情報の増幅に加え、社会の不平等が拡大する恐れもある」と述べた。 世界の経済情勢については、コロナ禍やウクライナでの戦争に言及し、衝撃を受けやすい状況になってい

                                                                                    AI、世界の雇用に影響 「津波」のよう=IMF専務理事