並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 21744件

新着順 人気順

AIの検索結果41 - 80 件 / 21744件

  • GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?

    GoogleのAI研究部門であるGoogle DeepMindが現地時間の2024年5月14日に、AI生成コンテンツにウォーターマーク(電子透かし)を入れてフェイク画像の拡散を防止するツール「SynthID」を、従来の画像だけでなくテキストと動画にも拡張することを発表しました。 More ways Google is delivering on its responsible AI commitment https://blog.google/technology/ai/google-responsible-ai-commitment-update/ Watermarking AI-generated text and video with SynthID - Google DeepMind https://deepmind.google/discover/blog/watermarkin

      GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
    • 多すぎて悩む生成AI、最新注目ツールはこの3つ!

      コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕

        多すぎて悩む生成AI、最新注目ツールはこの3つ!
      • 怒る客の声、AIで穏やかに ソフトバンクがカスハラ対策 - 日本経済新聞

        ソフトバンクは15日、人工知能(AI)で客の通話音声を穏やかなトーンに変換する技術の事業化を目指すと発表した。顧客による迷惑行為「カスタマーハラスメント(カスハラ)」に対する取り組みの一環で、コールセンターの電話対応業務に利用する。2025年度中の事業化に向けて、東京大学と研究開発や検証を進める。ソフトバンクの新規事業提案制度「ソフトバンクイノベンチャー」から生まれた。電話口で怒鳴るなどの迷惑

          怒る客の声、AIで穏やかに ソフトバンクがカスハラ対策 - 日本経済新聞
        • 「Git」に深刻度「Critical」の脆弱性 ~「Git for Windows 2.45.1」などが公開/リモートコード実行などにつながるおそれ

            「Git」に深刻度「Critical」の脆弱性 ~「Git for Windows 2.45.1」などが公開/リモートコード実行などにつながるおそれ
          • もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用

            生成AI(人工知能)の活用で、どうやら日本は欧米などの海外から後れを取っているわけではなさそうだ。「むしろ私の感触では、日本の方が進んでいるかもしれない」――。2024年3月、生成AIに関するイベントでそう話した講演者の発言に、招聘(しょうへい)した筆者自身が少し驚いた。デジタル活用の不十分さがよく指摘される日本にあって、こと生成AI活用に関しては先進的だというのだ。 たしかに日本の積極的な取り組みを示す資料がある。PwC Japanグループは2024年3月19日、「第27回CEO意識調査」に基づく生成AI活用の現状と日本の状況分析を公表した。その関連資料には、「日本は生成AIの業務活用において主要各国に先行。背景にあるのは事業継続への危機感、サイロ化文化と生成AIとの親和性の高さ」と記されている。 毎年恒例のCEO(最高経営責任者)調査の中で、自社の業務に生成AIがどれだけ受け入れられて

              もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用
            • OpenAIでアルトマンCEO解任騒動の首謀者の1人で共同創業者のサツケバー氏が退社へ

              米OpenAIは5月14日(現地時間)、共同創業者でチーフサイエンティストを務めるイリヤ・サツケバー氏(38)が退社すると発表した。後任は、主任研究員のヤクブ・パチョッキ氏。 サツケバー氏は、米Googleのリサーチサイエンティストを約3年務めた後、2015年にサム・アルトマン氏、イーロン・マスク氏らとともにOpenAIの立ち上げに参加し、2018年からチーフサイエンティストを務めてきた。 グレッグ・ブロックマン社長によると、サツケバー氏は昨年11月に突如発生したアルトマンCEOの解任騒動の中心的人物の1人。アルトマンCEOの復帰後もチールサイエンティストとして在任していたが、表立った発表などには参加していなかった。13日の「GPT-4o」の発表イベントにも登壇していない。 アルトマン氏は公式ブログで「イリヤ(サツケバー氏)は間違いなく私たちの世代で最も偉大な頭脳の1人であり、私たちの分野

                OpenAIでアルトマンCEO解任騒動の首謀者の1人で共同創業者のサツケバー氏が退社へ
              • Google検索にも生成AIを導入 計画やブレストの手助けに 動画撮影しながら質問も

                米Googleが5月14日(現地時間)、Google検索に生成AIを導入することを発表した。AIを活用することで、単に調べるだけでなく、計画やブレインストーミングなどに関する質問もできるようになる。Google検索用にカスタマイズしたGeminiモデルを導入することで可能になった。 質問を入力して検索すると、「AI Overview」の中にトピックの概要や詳細についてのリンクが表示される。Google検索のテストプログラム「Search Labs」での実験で、ここで表示されるリンクは、従来の検索で表示されるものよりも多くクリックされたことが分かったという。なお、広告は引き続き表示されるが、オーガニックな検索結果とスポンサー付き検索結果は区別して表示される。 AI Overviewは、同日から米国で展開し、他の国でも拡大する予定。2024年末までに10億人を超えるユーザーがAI Overvi

                  Google検索にも生成AIを導入 計画やブレストの手助けに 動画撮影しながら質問も
                • Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応。

                  Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応しています。詳細は以下から。 OpenAIは現地時間2024年05月13日、反応速度を向上させ、より人間らしい対話が可能にな最新のAIモデル「GPT-4o」を発表しましたが、Mac用ChatGPTクライアント「MacGPT」が最新のバージョン3.21でGPT-4oに対応しています。 Added support for the new GPT-4o model which is twice as fast and two times cheaper! リリースノートより MacGPTはNaviでApple Design Awards 2022 ファイナリストに選出されたオランダのJordi Bruinさんが開発しているChatGPTクライアントで、ChatGPTのWebベースに加え、OpenAIのAPIを利用することでネイ

                    Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応。
                  • この「なんでわかるの?」系の質問は初めてやってみたのだけど、なかなか。こう答えられるのは「本当に賢い」証拠だと言ってもいいと思う。

                    kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io

                      この「なんでわかるの?」系の質問は初めてやってみたのだけど、なかなか。こう答えられるのは「本当に賢い」証拠だと言ってもいいと思う。
                    • Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」? | テクノエッジ TechnoEdge

                      問題の部分は、動画開始後1分を過ぎたあたり。レトロなフィルムカメラを手に持つ青年が、「なんでレバーが最後まで動かないの?」と質問したところ、GoogleのAIは即座にいくつかの回答を提示し、最後に最も最適と思われる答えを強調表示しました。 ところが、その強調された答えは「裏蓋を開けて、そっとフィルムを取り出す」というものでした。もし、フィルムカメラ世代の人々やカメラ好きな人々がこの答えを示されたなら、きっと慌てることでしょう。 (▲画像:「裏蓋を開けてそっとフィルムを取り出す」回答をハイライト。) 手巻き式のカメラでフィルム巻き上げレバーが途中で止まるようになったら、それはいま使っているフィルムカートリッジの撮影可能枚数が終了したことを意味します。 そうなった場合は、カメラ内にあるフィルムをカートリッジ内に完全に巻き戻してから取り出し、現像にまわすというのが正しい手順です。 ところがGoo

                        Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」? | テクノエッジ TechnoEdge
                      • 自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表

                        入力してテキストに応じて高解像度の動画を出力する生成AI「Veo」を、Googleが「Google I/O 2024」で発表しました。 Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/ 発表があったのは基調講演の33分53秒あたりから。Google DeepMindのデミス・ハサビス氏が解説しています。 Google Keynote (Google I/O ‘24) - YouTube Googleによれば、Veoは自然言語と視覚的な意味情報を深く理解することにより、たとえば「タイムラプス」や「空撮映像」といったプロンプトを入力すれば、それぞれ意図したような映像を作成してく

                          自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表
                        • Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表

                          Googleが2024年5月15日にビジュアル言語モデル(VLM)の「PaliGemma」と、大規模言語モデル(LLM)の「Gemma 2」を発表しました。PaliGemmaはすでにリリースされており、簡単に試せるデモも公開されています。 Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI Toolkit - Google Developers Blog https://developers.googleblog.com/en/gemma-family-and-toolkit-expansion-io-2024/ PaliGemma – Google's Cutting-Edge Open Vision Language Model https://huggingface.co/blog/paligemma ◆ビジュ

                            Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
                          • 米の銘柄をAIで判定する「RiceTag」 検査員の精度を実現する試行錯誤とは?

                            青森県三沢市で米の卸売りを手がけるKAWACHO RICE(カワチョウライス)と地元のクラウドインテグレーターのヘプタゴンは、AIで米の銘柄を判定する「RiceTag」で特許を取得した。RiceTag実現までの流れと検査員の精度を実現するための試行錯誤について、KAWACHO RICEの川村航人氏と共同開発したヘプタゴンの立花拓也氏、外舘大輔氏に話を聞いた。 実際に米の銘柄判定をやってみた KAWACHO RICEは、青森、秋田、岩手などの米の卸売りを手がける。別会社でペットボトルライス「PeboRa」や直営店なども手がけているが、事業の基本は小売店やメーカー、商店、飲食店などへの米の卸売りだ。まずは今回KAWACHO RICEとヘプタゴンがチャレンジした米の銘柄判定について見ていこう。 米の銘柄判定は納品された米をランダムに抜き出し、専門の農業検査員が品質と銘柄をチェックしていく検査工程

                              米の銘柄をAIで判定する「RiceTag」 検査員の精度を実現する試行錯誤とは?
                            • グーグル 検索サービスに生成AI 文章入力で調べられる機能発表 | NHK

                              アメリカのIT大手グーグルは検索サービスに生成AIを本格的に導入し、文章で質問を入力すると生成AIが知りたいことを調べて回答をまとめる機能を盛り込むと発表しました。IT各社による生成AIの開発競争が一段と激しくなっています。 この中でピチャイCEOは自社が開発する生成AI「Gemini」について、処理できる情報量を従来の技術よりおよそ30倍増やして反応する速度を高めた最新モデルを発表しました。 そのうえで、主力事業である検索サービスに生成AIを本格的に導入すると明らかにしました。 文章で質問を入力すると生成AIが知りたいことを調べて、回答をまとめる機能を盛り込むということです。 まず、アメリカで無料で提供を始めるということです。 また、壊れた家電の動画を入力すれば修理方法を示すなど動画検索の機能を強化することを目指します。 このほか、生成AIがスマートフォンのカメラで周囲の状況を把握し、例

                                グーグル 検索サービスに生成AI 文章入力で調べられる機能発表 | NHK
                              • Google、従来比性能4.7倍のTPU。HBMの速度/容量も2倍に

                                  Google、従来比性能4.7倍のTPU。HBMの速度/容量も2倍に
                                • Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表

                                  Googleが現地時間の2024年5月14日に開催した開発者向けイベントの「Google I/O」で、映像や音声を理解してリアルタイムで質問に答えてくれるAIエージェント「Project Astra(Astra)」を発表しました。実際に、ユーザーがスマートフォンとスマートグラスのカメラで撮影した物事について、Astraにあれこれ質問しているデモ動画も公開されています。 Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/ Google strikes back at OpenAI with “Project Astra” AI agent prototype |

                                    Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
                                  • Deep Paint v1.0 - GAKU氏によるGrease Pencilを活用した3Dイラスト・立体絵画制作支援ツールセットBlenderアドオンが遂にリリース!

                                    Blender アドオン プラグイン&アドオン-Plugin&Addon Easy Shaders - 汚れや劣化表現などを手軽にパラメータ制御可能な15... 2024-05-18 Weybec Studioによる汚れや劣化表現などを手軽にパラメータ制御可能な15のシェーダーが付属したBlenderアドオン『Easy Shaders』がリリースされました! 続きを読む Unreal Engine アセット アセット-Asset Korea Dance Challenge Mocap Pack 5 - Tik... 2024-05-16 数多くのモーションアセットパックを販売している韓国のACHID EMOTE STOREによるTikTokなどのショート動画界隈で有名な動きをプロのダンサーによりキャプチャした19個のダンスモーションパック『Korea Dance Challenge Moc

                                    • Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗

                                      マスク編集機能もあり、動画とテキストプロンプトにマスク領域を追加し、動画の特定の領域を変更することができる。 また、テキストではなく画像を入力して動画を生成することもできるマルチモーダルだ。画像をテキストと組み合わせてプロンプトに入力することで、Veoは画像のスタイルを参照した動画を生成する。 Googleは、将来的にはVeoの機能の一部をYouTubeショートなどにも導入する計画だ。 関連記事 Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など 米Googleが、Android向けに搭載するAI関連の新機能を発表した。特定の部分を丸で囲って検索ができる「かこって検索」を、学習に活用できるようにする。Androidに生成AIモデルの「Gemini」を統合し、アプリ上のオーバーレイ表示から、より簡単にGeminiを利用可能になる。

                                        Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗
                                      • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

                                        1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

                                          大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
                                        • 米Google、「プロジェクトアストラ」を発表 スマホに映したモノをAIが“即解説” ユーザーからは「超クール」と期待の声

                                          米Google傘下のGoogle DeepMindと米Googleは5月14日(現地時間)、AIアシスタントに関するプロジェクト「Project Astra」を発表した。「日常生活で本当に役立つ未来のAIアシスタントの構築を目指したプロジェクト」と紹介し、デモ動画を公開。スマートフォンでリアルタイムに撮影した物体について説明を求めると、AIがスムーズに回答する様子が映っている。 動画内では「Tell me when you see sometihng that makes sound.」(音が出るものを見たら教えて)と人が指示し、周りをスマホで撮影すると、米Googleの生成AI「Gemini」が「I see a speaker , which makes sound.」(音が出るスピーカーが見える)と答え、スピーカーがあることを説明する様子が確認できる。 その後、スマホに映ったスピーカー

                                            米Google、「プロジェクトアストラ」を発表 スマホに映したモノをAIが“即解説” ユーザーからは「超クール」と期待の声
                                          • GitHub、生成AIソリューション「GitHub Copilot」と、その社会への影響に関してCOOらが説明

                                              GitHub、生成AIソリューション「GitHub Copilot」と、その社会への影響に関してCOOらが説明
                                            • Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も

                                              基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。 生成AI搭載検索エンジン「AI Overview」(旧SGE) 「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」(SGE)を改称し、改善したもの。 詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。 マルチステップリーゾニング(多段階推論)で、1つの質問で複数ステップの結果を提示する。 例として、ピラティスにつ

                                                Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も
                                              • Gemini 1.5 Pro のアップデート ・ Gemini 1.5 Flash ・ PaliGemma ・ Gemma 2|npaka

                                                Gemini 1.5 Pro のアップデート ・ Gemini 1.5 Flash ・ PaliGemma ・ Gemma 2 以下の記事が面白かったので、簡単にまとめました。 ・Gemini 1.5 Pro updates, 1.5 Flash debut and 2 new Gemma models 1. はじめに昨年12月、「Gemini 1.0」をリリースし、「Gemini API」を「Google AI Studio」および「Vertex AI」で利用できるようにしました。2月に、100万トークンのコンテキストウィンドウを備えた最初のモデルである「Gemini 1.5 Pro」をリリースしました。先月、ネイティブ音声理解、システム指示、JSON モードなどの機能を追加しました。 並行して、「Gemma」を立ち上げました。これは、「Gemini」と同じ研究とテクノロジーに基づいて構

                                                  Gemini 1.5 Pro のアップデート ・ Gemini 1.5 Flash ・ PaliGemma ・ Gemma 2|npaka
                                                • パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現

                                                    パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現
                                                  • gpt-4oを試す

                                                    GPT-4o テキスト、オーディオ、ビデオの入力を扱い、テキスト、オーディオ、イメージの出力が可能。 GPT-4o以前では、ChatGPTのボイスモードが3つの異なるモデルを使用していた。 GPT-4oはこれらの機能を一つのモデルに統合し、テキスト、ビジュアル、オーディオの各入力を同一のニューラルネットワークで処理する。 現在のAPIの能力 現在のAPIは、テキスト、イメージの入力とテキストの出力をサポート 追加のモダリティ(例えばオーディオ)は現時点(2024/5/14)では使えない。近日導入される予定 Colaboratoryで動かしてみる インストール

                                                      gpt-4oを試す
                                                    • グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

                                                        グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
                                                      • [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

                                                        [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。 これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

                                                          [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開
                                                        • 【Google I/O2024】Google、AI検索を一般に提供 欲しい情報を瞬時に - 日本経済新聞

                                                          【シリコンバレー=渡辺直樹】米グーグルは14日、生成AI(人工知能)を使ったネット検索サービスを始めると発表した。一度に処理できる情報量を30倍に増やした生成AI「Gemini(ジェミニ)」の最新版の提供も開始する。AIの性能を高めながら、あらゆる自社サービスと組み合わせていく戦略で、もう一段の成長を目指す。最新の技術を披露する開発者向け年次イベント「グーグルI/O(アイオー)」を米カリフォ

                                                            【Google I/O2024】Google、AI検索を一般に提供 欲しい情報を瞬時に - 日本経済新聞
                                                          • AIで「先生」を生成しました。YouTubeすら教材になる「LearnLM」 #GoogleIO

                                                            AIで「先生」を生成しました。YouTubeすら教材になる「LearnLM」 #GoogleIO2024.05.15 06:308,040 小暮ひさのり 真に求められていた、学習xAIの姿かも。 本日開催されたGoogle(グーグル)のデベロッパー向けカンファレンス「Google I/O 2024」。 メインはハードウェアじゃなくて、AIの話…。というか徹頭徹尾AIの話だけだったんですが、個人的にグッときたのが、Googleの大規模言語モデル「 Gemini(ジェミニ)」を学習用にチューニングしたAIモデル「LearnLM」。 「LearnLM」はGoogle検索や、AIチャットボットサービスGeminiとの会話などが、ユーザーに「解答」を与えるだけでなく「理解」を与えられる体験になるようにカスタムされたAIモデルです。 Image: Google/YouTubeデモではAndroidスマ

                                                              AIで「先生」を生成しました。YouTubeすら教材になる「LearnLM」 #GoogleIO
                                                            • Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など

                                                              特定の部分を丸で囲って検索ができる「かこって検索」は、GalaxyやPixelの一部機種で利用できるが、この機能を拡張する。同日から、学生が問題を解くのを支援する機能を追加。問題文に丸を付けると、物理学や数学を説くための指示が表示される。2024年後半からは、かこって検索が記号式、図、グラフなどを含むさらに複雑な問題の解決に役立てるようになる予定とのこと。 かこって検索はより多くの端末に導入する予定で、2024年末までに対応機種を2倍に増やす予定だとしている。 Androidに生成AIモデルの「Gemini」を統合し、アプリ上のオーバーレイ表示から、より簡単にGeminiを利用可能になる。例えば、生成された画像をGmailやGoogle メッセージなどにドラッグ&ドロップしたり、「このビデオに質問」からYouTube動画内の情報を検索したりできる。Gemini Advancedのユーザーは

                                                                Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など
                                                              • グーグル、独自生成AI「Gemini 1.5 Pro」新機能と高速版「Gemini 1.5 Flash」を発表

                                                                  グーグル、独自生成AI「Gemini 1.5 Pro」新機能と高速版「Gemini 1.5 Flash」を発表
                                                                • Google検索にAI新機能導入へ――動画検索や「AIによる検索結果まとめ」など

                                                                    Google検索にAI新機能導入へ――動画検索や「AIによる検索結果まとめ」など
                                                                  • 米Google、大規模言語モデル「Gemini 1.5 Flash」発表 1.5 Proの軽量版 きょうから利用可能

                                                                    米Googleは5月14日(現地時間)、大規模言語モデル(LLM)「Gemini 1.5 Flash」を発表した。「Gemini 1.5 Pro」を改良した軽量モデルで、低レイテンシとコストが最も重要なタスク向けに調整されているという。同日からGoogleが提供する開発者向け環境I「Google AI Studio」と「Vertex AI」で最大100万トークンを利用できる。 関連記事 米Google、動画生成AI「Veo」発表 テキストから60秒超え動画を作成 サンプルも多数公開 米Googleは、動画生成AI「Veo」を発表した。 Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM 米Googleは、大規模言語モデル(LLM)「Gemma」を公開した。同社が開発するLLM「Gemini」に使ったのと同じ技術を活用して開発した軽量版

                                                                      米Google、大規模言語モデル「Gemini 1.5 Flash」発表 1.5 Proの軽量版 きょうから利用可能
                                                                    • AIチャット「Gemini Advanced」に「Gemini 1.5 Pro」実装 日本語にも対応開始&スプレッドシードの分析なども可能に

                                                                      米Googleは5月14日(現地時間)、大規模言語モデル「Gemini 1.5 Pro」をAIチャット「Gemini Advanced」に導入すると発表した。1.5 Proは100万トークン(おおむね単語数の意味)のコンテキストウィンドウ(AIモデルが応答を生成できるテキストの量)を持つAIモデル。最大1500ページの文書を読み解いたり、100件の電子メールを要約できたりするという。 コンテキストウィンドウを活用するために、Googleドライブ経由でGemini Advancedへファイルを直接アップロードできる機能も追加した。同社は「間もなく、1時間のビデオコンテンツや、3万行を超えるコードベースを処理できるようになる」とアピールしている。なお、Gemini 1.5 ProとGemini Advancedの両方で日本語に対応している。 これにより、GoogleドキュメントやPDF、スプレ

                                                                        AIチャット「Gemini Advanced」に「Gemini 1.5 Pro」実装 日本語にも対応開始&スプレッドシードの分析なども可能に
                                                                      • 米Google、オープンな視覚言語モデル「PaliGemma」公開 「Gemma 2」の登場も予告

                                                                        米Googleは5月14日、視覚言語モデル(VLM)「PaliGemma」を公開した。VLMとは視覚的な入力に言語を対応させる言語モデルのことで、画像や動画を入力すると自然言語を出力できる。同社はこれを「オープンなVLM」と位置付けており、Hugging FaceやGitHubなど複数のプラットフォームで公開している。

                                                                          米Google、オープンな視覚言語モデル「PaliGemma」公開 「Gemma 2」の登場も予告
                                                                        • 人間に近づいた「GPT-4o」3つの進化のポイント

                                                                          「私にとって魔法のようだ」ーー。サム・アルトマンCEOがそう予告していた新たなサービスがベールを脱いだ。 アメリカのOpenAIは5月13日、ChatGPTから使える新たな生成AIモデル「GPT-4o(フォー・オー)」を発表した。このAIの「知能」はこれまでのGPT-4と基本的に同じだが、応答時間を大幅に短縮するなど「使い易さ」で進化したという。 有料のGPT-4とは対照的にGPT-4oは無料ユーザーでも利用できるが、時間当たりの利用回数などが有料ユーザーに比べて制限される。無料化によってなるべく多数の利用者に使ってもらうことでChatGPTのユーザーベースを拡大し、飛躍的な進化が期待される次世代モデル「GPT-5」(まず間違いなく有料化される)のリリースに向けて足場を固めようとしている意図がうかがえる。 本稿では3つの「進化のポイント」に解説したい。 従来より「自然な会話」ができるように

                                                                            人間に近づいた「GPT-4o」3つの進化のポイント
                                                                          • グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供

                                                                            【読売新聞】 【ニューヨーク=小林泰裕】米IT大手グーグルは14日、動画生成AI(人工知能)「Veo(ベオ)」を発表した。1分超の長さの動画を高解像度で生成できる。14日から一部の映画関係者らに提供を開始する。 ベオでは入力した文章

                                                                              グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供
                                                                            • 米Google、動画生成AI「Veo」発表 テキストから60秒超え動画を作成 サンプルも多数公開

                                                                              米Googleは5月14日(現地時間)、動画生成AI「Veo」を発表した。プロンプトを入力するだけで解像度1920×1080ピクセルで、60秒超えの動画を作成できるという。動画の種類は、フォトリアリズムやシュールレアリスム、アニメーションなどさまざまなスタイルに対応できるとしている。 関連記事 Google、Gemini採用の動画生成ツール「Vids」を6月にWorkspace Labsで Googleは、生成AI「Gemini」採用の“仕事用”動画生成アプリ「Google Vids」を発表した。Workspaceに追加の見込みで、6月にWorkspace Labsでリリースする計画だ。 OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO YouTubeのニール・モーハンCEOはBloombergとのインタビューで、OpenAIが「S

                                                                                米Google、動画生成AI「Veo」発表 テキストから60秒超え動画を作成 サンプルも多数公開
                                                                              • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) | テクノエッジ TechnoEdge

                                                                                lllyasviel氏復活第一弾のIC-Light前回(第23回)にControlNetやFooocus、stable diffusion webui forgeを作ったlllyasviel氏、ここ数ヶ月Xなどに書き込みが無いと書いたが、いきなり驚くべき仕掛けを提げての復活。その名もIC-Light(Imposing Consistent Light)。Stable Diffusionの技術を使って、照明を自由にコントロールできる仕掛けだ。 これまでStable Diffusionでは、SD 1.5、SDXLに関わらず、Promptで光や照明などの指示はできたのだが、どのように反映されるかは、Modelやその他の設定しだい。例えば backlight, soft bounced lighting, soft natural lighting, candolelight, neon ligh

                                                                                  生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) | テクノエッジ TechnoEdge
                                                                                • 中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!

                                                                                  インターネット上である投稿が話題だ。それは特定の中国メーカーのスマートフォンでかつ、特定の場面で「消しゴムマジック」に準ずる機能を利用しようとすると「利用できない」というものだ。 その場面とは、北京にある天安門広場だ。北京の有名な観光地であるとともに、中国の歴史的な行事などで幾度も舞台になった場所だ。過去に天安門事件が起こった場所でもあることから、反政府的なデモを防ぐ目的で多くの警備兵が配置されていることでも知られる。 前述の反政府的なデモ防ぐ目的から、インターネット上でも、検閲が厳しい場所としても知られている。中国のネットユーザが天安門広場に飾られる毛沢東氏の肖像画を消した画像でも投稿してしまえば、そのアカウントはあっという間に凍結されてしまう。 今回フォロワーのなしみるく様よりこの2枚の写真を提供いただきました。 @Hayaponlog お疲れ様です🙏 Huawei機で天安門の写真で

                                                                                    中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!