並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 331件

新着順 人気順

DeepMindの検索結果1 - 40 件 / 331件

  • pythonは_(アンダースコア)の使い方を理解するだけでプロフェッショナルになれる - Qiita

    1. 第3次AIブームの到来 米Google DeepMindが開発した人工知能(AI)の囲碁プログラム「AlphaGo」が世界トップレベルの実力を持つ韓国のプロ棋士、李世ドル(イ・セドル)九段に4勝1敗と大きく勝ち越したことが着火剤となり、2015年より第3次AIブームへと突入した。(ちなみにAIが誕生したのは1950~1960年代で第1次AIブームの到来) 1.1 余談になるがAlphaGo(4億円の知能)はなぜすごいのか? AlphaGoがそれ以前のチェスや将棋のAIと異なるのは、 畳み込みニューラルネットワーク(CNN) を応用している点だ。このCNNはさらに強化学習を行い、自分自身と対局を数千万回も繰り返した。 間違っていたらすみません、、、、 1.2 ChatGPTによる生成AIのブーム ChatGPTに代表されるLLMは以前から開発競争が繰り広げられていた。 GPT1は201

      pythonは_(アンダースコア)の使い方を理解するだけでプロフェッショナルになれる - Qiita
    • 「昔のインターネット」の精神を取り戻す、HTMLエネルギー運動

      今日のWebは商取引などの目的に最適化され、少数の企業によって所有されている。個人に力を与え、自己表現を促すかつてのWebの魅力を取り戻す「HTMLエネルギー(HTMLエナジー)」というムーブメントが密かに盛り上がりつつある。 by Tiffany Ng2024.01.08 363 9 Webサイトは、常に洗練されたデジタル体験だったわけではない。 かつて、ネットサーフィンをするには、自分の意に反して音楽が再生されるタブを開いたり、色つきの背景にタイムズ・ニュー・ローマン書体の文字がびっしり詰まったページを読んだりする必要があった。スクエアスペース(Squarespace、Webページ作成サービス)やソーシャルメディアが登場する以前の2000年代、Webサイトは個性を表現するものであり、コードの知識とインターネット上に存在したいという願望を持ったユーザーが、HTMLを使ってゼロから作るもの

        「昔のインターネット」の精神を取り戻す、HTMLエネルギー運動
      • そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス

        ライブラリのアプリ化 現代のニュースをくずし字で読んでみませんか?内容がわかるテキストをくずし字で読んでみると、くずし字に対する印象が変わるかもしれません。 edomi ニュース その他の事例については、活用事例を参照してください。 構成 古活字とくずし字 そあん(soan)で用いる「古活字」とは、今から400年ほど前に使われた印刷技術に由来する言葉です。一方「くずし字」とは、くずして書かれた文字を指す言葉です。くずし字は、印刷では古活字版だけでなく整版印刷にも使われましたし、写本などの手書きの文字(草書体)も、その多くはくずし字です。一方、古活字の中には、文字を崩していないものもあります。このように、古活字は印刷技術を指す言葉、くずし字は文字の形を指す言葉、という違いがあります。 そあん(soan)は、テキストをくずし字画像に変換する方法として、古活字画像を組み合わせる方法を用いるサービ

          そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス
        • グーグル元CEO特別寄稿: AIは科学をこう変える

          Eric Schmidt: This is how AI will transform how science gets done グーグル元CEO特別寄稿: AIは科学をこう変える 「クラウド」という言葉を提唱したグーグル元CEOのエリック・シュミットは今、人工知能(AI)は科学を再構築し、すべての人々に影響を及ぼすだろうと主張する。 by Eric Schmidt2023.07.10 238 35 今年も異常気象の夏が到来した。前例のない熱波、山火事、洪水が世界各国を襲っている。このような異常気象を正確に予測するという課題に対応するため、半導体大手のエヌビディア(Nvidia)は、人工知能(AI)を搭載した地球全体の「デジタルツイン」を構築している。 「アース2(Earth-2)」と呼ばれるこのデジタルツインは、数十テラバイトの地球システムデータを使用するAIモデル「フォーキャストネッ

            グーグル元CEO特別寄稿: AIは科学をこう変える
          • 米OpenAI「公表しないで……」 ブラックボックスであるLLMの中身を“盗む”攻撃 米Googleらが発表

            このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Google DeepMindなどに所属する研究者らが発表した論文「Stealing Part of a Production Language Model」は、米OpenAIのGPT-4や米GoogleのPaLM-2などのクローズドな大規模言語モデル(LLM)から、モデルの一部を盗み出す攻撃を提案した研究報告である。言語モデルのAPIへのクエリを通じて、低コストでモデルの内部構造に関する情報を抽出することに成功した。 GPT-4やPaLM-2などの最先端AIモデルは、APIを通じて一般ユーザーに提供されているが、内部構造や学習に使用され

              米OpenAI「公表しないで……」 ブラックボックスであるLLMの中身を“盗む”攻撃 米Googleらが発表
            • Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM

              また、Gemmaの事前トレーニング済みモデルでは、学習データから特定の個人情報やその他の機密データを除外していると安全性もアピール。開発者や研究者向けに、安全で責任あるAIアプリケーションを構築できるというツールキット「Responsible Generative AI Toolkit」も併せて公開している。 関連記事 Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新 米Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスを提供開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 Google、「Gemini 1.5 Pro」限定リリース コンテキストウィンドウは100万トークン Googleは、生成AIの次世代モデル「Gemini

                Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM
              • グーグルの新たな画像生成AIツール「ImageFX」の使い方

                印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleが人工知能(AI)に多額の投資を行ってきたことを考えれば、同社が先頃、独自の画像生成AIツール「ImageFX」を公開したのは、意外なことではない。ImageFXは、OpenAIの「DALL-E 3」や「Midjourney」「Image Creator from Microsoft Designer」といった多くの画像生成AIツールの強力なライバルになるはずだ。 ImageFXは、テキストから画像を生成するGoogleのテクノロジー「Imagen」の最新世代である「Imagen 2」を利用する。ImageFXで作成されるすべての画像には、DeepMindの「SynthID」が埋め込まれる。SynthIDは、肉眼では見えない

                  グーグルの新たな画像生成AIツール「ImageFX」の使い方
                • LLM時代のX情報収集術|べいえりあ

                  AI for Everyoneについては日本語版もあるのと、どちらのコースも日本語字幕付きで見られる(多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない)ので、英語分からなくてある程度何とかなるんじゃないかと思います。 あと、余力のある人、最新のNLP研究を理解したい人はこちらの本を読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話(task-oriented dialogue)」と「雑談(chit-chat dialogue)」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ

                    LLM時代のX情報収集術|べいえりあ
                  • プロンプト不要、生成AIで誰でも物語からマンガが作れる

                    テキスト-画像生成AIは物語性のある複数の画像を生成するのが苦手だ。複数の画像で、設定に一貫性を持たせるのが難しいからだ。だが最近、物語を一度入力すると、それに合った一連の画像を生成するサービスが登場した。 by Will Douglas Heaven2024.03.07 177 10 13年前、ジャーナリズムの授業の宿題で、私は高級キャットフードを食べる男に関する馬鹿げた短い物語を書いた。今朝、私は「ロア・マシーン(Lore Machine)」という生成(ジェネレーティブ)AIプラットフォームが、自分の書いたおかしな話に命を吹き込むのを座って眺めていた。 自作の物語をテキストボックスに入れると、次のようなメッセージが出た。「シーン、ロケーション、キャラクターと、雰囲気を特定しています。このプロセスには最長2分かかる場合があります」。ロア・マシーンは、テキストを分析し、キャラクター描写と言

                      プロンプト不要、生成AIで誰でも物語からマンガが作れる
                    • AIの登場で人間の囲碁のレベルが劇的に向上していることが明らかに、囲碁以外の分野でもAIが頭打ちになった分野に成長をもたらす可能性

                      by hiroaki maeda Googleの人工知能(AI)研究所であるGoogle DeepMindが開発した囲碁AIの「AlphaGo」は、当時世界トップ棋士のイ・セドル九段を打ち負かすなど、目覚ましい成果を挙げました。そんな囲碁特化のAIの誕生により、人間の棋士のレベルも向上していることが報告されています。 After AI beat them, professional go players got better and more creative https://www.henrikkarlsson.xyz/p/go スウェーデンの作家であるヘンリック・カールソン氏によると、AIが登場する以前の1950年代から2010年代半ばまで、囲碁のプロ棋士の棋力は頭打ちで、上達の限界に達していたとのこと。以下のグラフは当時のプロ棋士が対局中に差す手の質を示したものです。 しかし、Alp

                        AIの登場で人間の囲碁のレベルが劇的に向上していることが明らかに、囲碁以外の分野でもAIが頭打ちになった分野に成長をもたらす可能性
                      • Gemini - Google DeepMind

                        The Gemini ecosystem represents Google's most capable AI.Our Gemini models are built from the ground up for multimodality — reasoning seamlessly across text, images, audio, video, and code.Latest updates

                          Gemini - Google DeepMind
                        • LLMにまず前提から尋ることで出力精度を向上させる『ステップバック・プロンプティング』と実行プロンプト | AIDB

                          ステップバック・プロンプティングは極めてシンプルで具体的なテクニックながら、CoT(Chain-of-Thought prompting)やTake a Deep Breatheといった既存の手法を凌駕する性能を発揮しています。 参照論文情報 ・タイトル:Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models ・著者:Huaixiu Steven Zheng, Swaroop Mishra, Xinyun Chen, Heng-Tze Cheng, Ed H. Chi, Quoc V Le, Denny Zhou ・所属:Google DeepMind ・URL:https://doi.org/10.48550/arXiv.2310.06117 従来の課題 LLMはSTEM(科学、技術、工学、

                            LLMにまず前提から尋ることで出力精度を向上させる『ステップバック・プロンプティング』と実行プロンプト | AIDB
                          • LLM時代の強化学習 - どこから見てもメンダコ

                            強化学習におけるLLMの活用パターン調査 はじめに:実世界における強化学習の課題 LLM×強化学習 人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例 さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル 外部知識にもとづく報酬モデル設計 2. 計画モデルとしてのLLM LLMによるセマンティック計画 LLMによる構造的な探索計画 3. 方策モデルとしてのLLM LLM as 確率方策 マルチモーダルLLM as 確率方策 参考:GPTアーキテクチャの転用 4. 世界モデルとしてのLLM Language Models Meet World Models (あとで書く) おわりに:VLM as 確率方策に期待 はじめに:実世界における強化学習の課題 レトロゲームで人間並みのパ

                              LLM時代の強化学習 - どこから見てもメンダコ
                            • 最近の話題にも詳しい14億パラメータの日本語LLMの公開

                              Research部門の近江崇宏です。 今回、ストックマークは最近の話題にも詳しいGPT-NeoXをベースとした14億パラメータの日本語のLLM(大規模言語モデル)をオープンソースとして公開します。モデルはHugging Face Hubからダウンロードいただけます。 https://huggingface.co/stockmark/gpt-neox-japanese-1.4b 当社はビジネスにおける情報収集・分析をサポートするサービスを運営しており、そのために最新のWebデータの収集を日々行なっております。今回の事前学習では、一般にLLMの事前学習によく使われるCommon Crawl由来のデータだけでなく、当社が所有している独自のWebデータ(2023年6月まで)も含めて事前学習を行うことで、最近の話題にも詳しいモデルを開発しました。具体的には、事前学習に用いたデータセットはCC100の

                                最近の話題にも詳しい14億パラメータの日本語LLMの公開
                              • Googleの新AI、日本では「ジェミニ」「ジェミナイ」どっち? 公式見解は

                                米Googleが12月7日に発表した新しいAIモデル「Gemini」。日本では、いすゞ車のイメージもあって「ジェミニ」と表記するのが一般的だが、X(旧Twitter)では「ジェミナイが正しいようだ」という話も広がっている。 確かにGoogleの発表動画を見返すと、Google DeepMindのデミス・ハサビスCEOや、同社チーフ・サイエンティストのジェフ・ディーンさんは「ジェミナイ」と発音しているようだ。また米国のDJ機器メーカー・GEMINIのように、日本では「ジェミナイ」で通っているブランドもある。

                                  Googleの新AI、日本では「ジェミニ」「ジェミナイ」どっち? 公式見解は
                                • マスク氏、xAI紹介スペースで「TwitterのデータをLLMトレーニングに使う」などの発言

                                  イーロン・マスク氏は7月14日(米国時間)、12日に予告した新企業xAIに関するスペースを予定より少し遅れて開催した。4万人以上がリアルタイムで参加し、マスク氏の伝記を執筆中のウォルター・アイザックソン氏やキム・ドットコム氏なども質問した。 マスク氏は、xAIの目標は複雑な科学や数学の問題を解明し、宇宙を理解するのに役立つ“スーパーインテリジェントAI”を構築することだと語った。そうしたAIは2029年までに登場すると予想するのが現実的だという。xAI立ち上げメンバーらは、社会に利益をもたらす「人間より賢いAI」を構築したいと語った。 マスク氏はまた、将来的にはOpenAIやGoogleなどに代わるAI企業になるが、xAIはまだ初期段階であり、競合に追いつくには時間が必要だとも語った。 途中、異星人が見つからないのはなぜかについての「フェルミのパラドックス」について熱く語る場面もあった。ま

                                    マスク氏、xAI紹介スペースで「TwitterのデータをLLMトレーニングに使う」などの発言
                                  • Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB

                                    Googleは、人間の専門家のパフォーマンスを上回る最初の大規模言語モデル(LLM)として「Gemini」を発表しました。LLMの主要なベンチマークの一つであるMMLU(多領域の学術ベンチマーク)をはじめとするほとんどのベンチマークでGPT-4を凌駕しています。 Geminiは、画像、音声、動画の理解を含むマルチモーダルタスクでも最先端の性能を示しています。テストに使用された20のマルチモーダルベンチマーク全てで最高の水準を達成しています。 また、複数のソースからの情報を統合して、より正確で詳細に理解する能力に優れているとのことです。 なお、Ultra、Pro、Nanoの3つのサイズがあり、それぞれ異なる計算要件に特化して設計されています(例えばモバイル向けにはNanoなど)。Ultraは最も高度に複雑なタスクをこなし、研究報告では主にUltraの性能が他モデルと比較されています。 本記事

                                      Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB
                                    • X(旧Twitter)、ユーザーの公開データをAIトレーニングに使うと改定ポリシーに明記

                                      米X(旧Twitter)が9月29日に発効させするプライバシーポリシーの改定で、公開データをAIのトレーニングに使うことを新たに追加していたことが明らかになった。米IT系ブログStackdiaryが9月1日に指摘した。 日本語版では、「本ポリシーで概説されている目的のため、当社が収集した情報や一般公開された情報を、機械学習または人工知能モデルのトレーニングに使用することがあります。」となっている。 この件について、XのオーナーでCTO(最高技術責任者)のイーロン・マスク氏は「(トレーニングに使うのは)公開データだけで、DMやプライベートなものは対象外だ」とポストした。 マスク氏は7月、“スーパーインテリジェントAI”構築を目指して立ち上げる新企業xAIで、xAIのAIモデルのトレーニングに、Twitterの公開データを利用すると明言している。xAIのWebサイトには、「当社はX Corpと

                                        X(旧Twitter)、ユーザーの公開データをAIトレーニングに使うと改定ポリシーに明記
                                      • 「生成AIは著作権保護の検討が不十分」新聞協会など声明 「著作権法30条の4は大きな課題」

                                        日本新聞協会など4団体は8月17日、生成AIにまつわる著作権保護策の再検討を求める共同声明を発表した。日本の著作権法第30条の4が「諸外国に比べ、AI学習に極めて有利に作られていることは大きな課題」と指摘。AIに学習させる著作物データの保護をめぐり、権利者団体と関係当局の意見交換を求めている。 声明を出したのは、新聞協会と日本雑誌協会、日本写真著作権協会、日本書籍出版協会。 生成AIは、ネット上の大量のデータを、著作者の同意なく学習して開発されているケースが多い。日本では、著作権法第30条の4により、このデータ収集は、「著作権者の利益を不当に害する」場合はを除き、著作権を侵害しないとされている。 声明では「学習利用の価値が著作権者に還元されないまま大量のコンテンツが生成されることで、創作機会が失われ、経済的にも著作活動が困難になる」「海賊版をはじめとする違法コンテンツを利用した、非倫理的な

                                          「生成AIは著作権保護の検討が不十分」新聞協会など声明 「著作権法30条の4は大きな課題」
                                        • LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK

                                          LINEは8月14日、日本語に特化した大規模言語モデル(LLM)「japanese-large-lm」を発表した。オープンソース(OSS)として公開し、商用利用も可能(Apache License 2.0)としている。 公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大規模かつ高品質なデータ構築を行うため、OSSライブラリ「HojiChar」を使ったフィルタリング処理を実施。モデルの訓練には、LINE独自の大規模日本語Webコーパス(最終学習は約650GBのコーパスで実施)を利用したという。 LINEは独自LLM「HyperCLOVA」の開発を長年手掛けているが、今回のモデルは別の開発ライン(LINEのMassive LM開発ユニット)にて構築したもの。同チームでは、指示文に対して適切な出

                                            LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK
                                          • 東京発・AIドリームチーム「Sakana.ai」が45億円調達 元Googleトップ研究者らが設立 AI業界の著名人や日本の大手IT企業も出資

                                            元米Googleの著名な研究者、リオン・ジョーンズ氏とデビッド・ハー氏が東京で立ち上げたAI企業Sakana.ai(東京都港区)は1月16日、シリコンバレーのベンチャーキャピタルやNTTグループ、KDDI、ソニーグループなどから45億円の資金を調達したと発表した。 調達元はシリコンバレーのベンチャーキャピタル米Lux Capitalや米Khosla Venturesに加え、日本ではNTTグループ、KDDI、ソニーグループ、ベンチャーキャピタルのみやこキャピタルやジャフコグループなども出資した。Googleで最高AI責任者を務めるジェフ・ディーン氏や、米Hugging Face創業者CEOのクレム・デラング氏、米Scale AI創業者CEOのアレックス・ワン氏といった個人からも出資を受けた。 調達した資金は人材採用に充てる。国内外から優秀なITエンジニア人材を集め、日本に招致するという。さら

                                              東京発・AIドリームチーム「Sakana.ai」が45億円調達 元Googleトップ研究者らが設立 AI業界の著名人や日本の大手IT企業も出資
                                            • OpenAI and Elon Musk

                                              The mission of OpenAI is to ensure AGI benefits all of humanity, which means both building safe and beneficial AGI and helping create broadly distributed benefits. We are now sharing what we've learned about achieving our mission, and some facts about our relationship with Elon. We intend to move to dismiss all of Elon’s claims. Elon said we should announce an initial $1B funding commitment to Ope

                                                OpenAI and Elon Musk
                                              • OpenAIの現・元従業員ら、AIシステム構築の無謀さと秘密主義を告発

                                                米OpenAIの現従業員、元従業員のグループは6月4日(現地時間)、Google DeepMindの2人の従業員とともに、OpenAIを含むAI企業に対し、AIに関する安全性対策の改善と、危険性を報告した従業員の保護を求める書簡を公開した。 署名した13人中4人はOpenAIの現従業員として匿名で記載されている。 研究者が報復を恐れることなくAIの危険性について「警告する権利」を持てるよう、AI関連企業に強力な内部告発者保護を確立するよう求めている。 「私たちは最先端のAI企業の現従業員および元従業員であり、AIが人類に前例のない利益をもたらす可能性を信じている」が、「AI企業には効果的な監督を回避する強い経済的インセンティブがあり、企業統治の特注構造ではこれを変えるのに十分ではないと考えている」という。 グループは、「AI企業はAIの危険に関する膨大な非公開情報を保有しているが、こうした

                                                  OpenAIの現・元従業員ら、AIシステム構築の無謀さと秘密主義を告発
                                                • 「公開するApple vs. 隠すOpenAI」アップルが300億パラメータのマルチモーダルAI「MM1」発表。重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                  2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第38回目は、生成AI最新論文の概要5つを紹介します。 Appleが最大300億パラメータを持つマルチモーダル大規模言語モデル「MM1」を開発 OpenAIなどのクローズド大規模言語モデルの一部を許可なく取得する攻撃、Googleなどが開発 GPT-3.5の隠れ層のサイズを約4096と推定。非公開LLMの中身を抽出する手法 WebページのスクリーンショットからHTMLコードを生成するAIモデル「Sightseer」をHugging Faceが開発 実世界に強いマルチモーダル大規模言語モデル「DeepSeek-VL」 Appleが最大300億パラメータを持つマルチモーダ

                                                    「公開するApple vs. 隠すOpenAI」アップルが300億パラメータのマルチモーダルAI「MM1」発表。重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                                  • わずか1分で10日間の天気を予測可能なAI「GraphCast」をGoogle DeepMindが発表、スパコンで数時間かけた予測より高精度

                                                    Google DeepMindが気象予測AI「GraphCast」を発表しました。10日間の天気を予測する場合、従来の気象予測システムではスーパーコンピューターを数時間稼働させる必要がありましたが、GraphCastでは1台のマシンを1分稼働させるだけで従来の予測システムを超える精度での予測が可能とアピールされています。 Learning skillful medium-range global weather forecasting | Science https://www.science.org/doi/10.1126/science.adi2336 GraphCast: AI model for faster and more accurate global weather forecasting - Google DeepMind https://deepmind.google/

                                                      わずか1分で10日間の天気を予測可能なAI「GraphCast」をGoogle DeepMindが発表、スパコンで数時間かけた予測より高精度
                                                    • AIに「深呼吸しよう」といった人間っぽい言葉をかけると問題の正答率が上昇するという研究結果

                                                      AIは入力されたプロンプトに従ってさまざまな問題を解決したり、自然な応答を生成したりすることができますが、その精度はプロンプトの書き方に影響されることがわかっています。新たに、「AIに『深呼吸をして』といった人間に送るようなアドバイスを与えると問題の正答率が上昇する」ということが、Google DeepMindの研究チームによって報告されました。 [2309.03409] Large Language Models as Optimizers https://arxiv.org/abs/2309.03409 Uh oh, now AI is better than you at prompt engineering | ZDNET https://www.zdnet.com/article/uh-oh-now-ai-is-better-than-you-at-prompt-engineer

                                                        AIに「深呼吸しよう」といった人間っぽい言葉をかけると問題の正答率が上昇するという研究結果
                                                      • マルチモーダルAI「Gemini」の性能をアピールするGoogleの公式ムービーはフェイクだったという指摘

                                                        Googleが2023年12月6日に発表した大規模言語モデル(LLM)の「Gemini」は、文字だけではなく画像や映像なども理解してユーザーとやり取りができるマルチモーダリティが大きな特徴で、Googleが公開したGeminiの性能を示すデモムービーは大きな話題となりました。しかし、このムービーで示されたGeminiのデモはフェイクではないかと指摘されています。 Google’s best Gemini demo was faked | TechCrunch https://techcrunch.com/2023/12/07/googles-best-gemini-demo-was-faked/ フェイクだと指摘されたデモムービーが以下。 Hands-on with Gemini: Interacting with multimodal AI - YouTube Bloombergの記者で

                                                          マルチモーダルAI「Gemini」の性能をアピールするGoogleの公式ムービーはフェイクだったという指摘
                                                        • xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表

                                                          イーロン・マスク氏が7月に立ち上げたAI企業xAIは、同社初のAIモデル「Grok」を発表した。まだ初期β段階だが、ベンチマークでは「ChatGPT-3.5」や「Inflection-1」を上回るとしている。 イーロン・マスク氏率いる米AI企業xAIは11月4日(現地時間)、同社初のAIモデル「Grok」を発表した。マスク氏はそれに先立ち、GrokをXのハイエンドサブスクプランユーザーに提供する計画だとポスト済みだ。 xAIは企業サイトのトップページで「Grokは、『銀河ヒッチハイク・ガイド』をモデルにしたAIで、ほぼすべてのことに答えることを目的としており、質問すべきことを提案することさえできる」「ウィットに富んだ質問に答えるよう設計されており、反抗的な性格でもあるので、ユーモアが嫌いであれば使わないように」と説明している。 xAIは、全人類に利益をもたらすAIツールを構築するためにフィ

                                                            xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表
                                                          • Google Colab で Gemini API を試す|npaka

                                                            「Google Colab」で「Gemini API」を試したので、まとめました。 1. Gemini API「Gemini API」は、「Google DeepMind」が開発したマルチモーダル大規模言語モデル「Gemini」を利用するためのAPIです。 3. Gemini API の準備Colabでの「Gemini API」の準備手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install -q -U google-generativeai(2) 「Google AI Studio」からAPIキーを取得し、Colabのシークレットマネージャーに登録。 キーは「GOOGLE_API_KEY」とします。 import google.generativeai as genai from google.colab import userd

                                                              Google Colab で Gemini API を試す|npaka
                                                            • AIが生成する画像を「ネコ」にするサイバー攻撃 絵師らを守る技術「Nightshade」 米シカゴ大が開発

                                                              このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 米シカゴ大学に所属する研究者らが発表した論文「Nightshade: Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models」は、生成AIモデルの無断学習を抑止するために、学習されても予期せぬ動作をAIモデルに生成させる毒入りデータに画像を変換するツールを提案した研究報告である。 この攻撃は「Nightshade」と名付けられ、約200枚の細工画像をモデルの学習データに紛れ込ませるだけで、特定の単語に関連する画像生成を高確率で操作できてしまう。 攻撃者は特定の単

                                                                AIが生成する画像を「ネコ」にするサイバー攻撃 絵師らを守る技術「Nightshade」 米シカゴ大が開発
                                                              • Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果

                                                                Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果 Google DeepMindは、「Graph Neural Network」(GNN)採用の気象AIモデル「GraphCast」をオープンソースで公開した。欧州中期天気予報センターのデータでトレーニングされており、向こう10日間の気象予測を約1分で生成する。 米Google DeepMindは11月14日(現地時間)、「前例のない精度で中期天気予報を行うことができる」と謳う気象AIモデル「GraphCast」を発表した。 同日に科学雑誌「Science」に掲載された論文によると、世界の気象状況を最大10日前まで予測する場合、GraphCastは気象シミュレーションシステム「欧州中期天気予報センター」(ECMWF)の「高解像度予報」(HRES)より正確かつ迅速だったという。 異

                                                                  Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果
                                                                • Introducing Gemini: our largest and most capable AI model

                                                                  A note from Google and Alphabet CEO Sundar Pichai: Every technology shift is an opportunity to advance scientific discovery, accelerate human progress, and improve lives. I believe the transition we are seeing right now with AI will be the most profound in our lifetimes, far bigger than the shift to mobile or to the web before it. AI has the potential to create opportunities — from the everyday to

                                                                    Introducing Gemini: our largest and most capable AI model
                                                                  • 最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに

                                                                    Google / Alphabet CEO Sundar Pichaiからのメッセージ すべてのテクノロジーの変化は、科学的探求を前進させ、人類の進歩を加速し、生活をより良くする機会となります。いま目の当たりにしている AI による変化は、私たちの人生で最も意味深いものになると確信しています。これは、これまでのモバイルやウェブへの移行よりも、はるかに大きなものになるでしょう。AI は、日常から非日常に至るまで、あらゆる場所の人々に機会を生み出す可能性を秘めています。AI は、イノベーションと経済発展の新たな波をもたらし、これまでにない規模で知識、学習、創造性、生産性を高めます。 世界中のあらゆる場所で、あらゆる人に AI を役立てられることが、私がとてもワクワクしている理由です。 私たちが AI ファーストを掲げ取り組みを開始してから 8 年近くが経ちますが、進化の速度はより一層早くなって

                                                                      最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに
                                                                    • 画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場

                                                                      画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場2023.10.26 21:0081,577 Kyle Barr - Gizmodo US [原文] ( 岩田リョウコ ) AIに毒を盛る秘策。 アーティストが自分の作品をAIトレーニングに使用されることと戦う手段ってあるのでしょうか。それを研究している人たちがいます。 シカゴ大学のコンピュータサイエンスの教授Ben Zhao氏は、彼のチームが「Nightshade」という名前のツールを開発したとMIT Technology Reviewに語っています。 毒を盛った画像でトレーニングさせる作戦今のところ、アーティストがAI企業に対抗する唯一の選択肢は、訴訟を起こすこと。もしくは、開発者がアーティストが許諾しない意思に従ってくれることを願うことくらいしかできない状況です。 しかしこのツールは戦う姿勢を見せまくりです。なんとア

                                                                        画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場
                                                                      • Google's best Gemini demo was faked | TechCrunch

                                                                        Google’s new Gemini AI model is getting a mixed reception after its big debut yesterday, but users may have less confidence in the company’s tech or integrity after finding out that the most impressive demo of Gemini was pretty much faked. A video called “Hands-on with Gemini: Interacting with multimodal AI” hit a million views over the last day, and it’s not hard to see why. The impressive demo “

                                                                          Google's best Gemini demo was faked | TechCrunch
                                                                        • Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ

                                                                          Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ2023.11.16 08:00150,044 Thomas Germain -Gizmodo US- [原文] ( R.Mitsubori ) 明日天気になあれ。 ついに、「今日どんな服装で出かけたらいいか」ロボットが教えてくれる時代が来ましたよ。GoogleのAI部門であるGoogle DeepMindは、従来のシステムを90%以上上回る最新の天気予報モデルを発表しました。その名も「GraphCast」という機械学習モデルで、天気予報アプリよりも早く正確に、しかも効率的にこの先10日間のお天気を教えてくれます。 現地時間の14日、Googleの研究チームは論文を発表。そのなかで「我々はこれが、天気予報の転換点になると確信しています」と記しています。 大量の過去気象データから未来を予測現在の天気予報は一般的に「数値天気予報(N

                                                                            Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ
                                                                          • Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) | テクノエッジ TechnoEdge

                                                                            Googleさん、5月のGoogle I/Oで予告していた新生成AIモデル「Gemini」のバージョン1.0をぎりぎり年内にリリースしましたね。問題が多いから年内リリースは無理そうという噂もありましたが、とりあえずちっさいモデル(ProとNano)だけぎりぎり年内に出して面目を保った感じです。 本命でマルチモーダルな最大サイズの「Gemini Ultra」は来年に持ち越し。安全性のチェックと強化学習に時間をかけているそうです。 このUltraのデモ動画がすごすぎて話題になっていますが、動画の概要説明に「For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity」(このデモでは、簡潔にするためにレイテンシが短縮され、Geminiの出力が短縮

                                                                              Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) | テクノエッジ TechnoEdge
                                                                            • 大規模言語モデルを使って自動車走行時の状況説明をさせてみる? -社内LLMハッカソン記-

                                                                              Turing株式会社の自動運転MLチームでエンジニアをしている岩政です。 Turingの自動運転MLチームでは、完全自動運転の開発に向けて、走行データから自動走行が可能な深層学習モデルの作成およびデータ基盤の整備、視覚情報以外にも言語を活用したマルチモーダルな基盤モデルの作成に取り組んでいます。 本記事では、視覚情報を認識するモデルと大規模言語モデルを組み合わせて、「自動車走行時の特に危険な状況を説明することができないか?」という観点から、社内ハッカソンで取り組んだことを紹介します。 社内LLMハッカソン 事の発端は、4月のある1日に急遽開催された大規模言語モデル(以下LLM)を活用した社内ハッカソンでした。高度な自動運転の実現において、一般的な社会常識のもと複雑な状況を理解して適切に行動するための「知能」は必要不可欠です。現在、Turingでは、LLMはその知能として高いポテンシャルがあ

                                                                                大規模言語モデルを使って自動車走行時の状況説明をさせてみる? -社内LLMハッカソン記-
                                                                              • KDDIが「Google メッセージ」をAndroid端末に採用 「RCSの普及とユーザー体験向上を目指す」

                                                                                KDDIが5月16日、Googleが提供するメッセージサービス「Google メッセージ」を、Android端末の標準アプリとして追加採用することを発表した。Googleが表明しているグローバル標準のRCSの取り組みに賛同し、AI技術なども活用しながらユーザー体験向上を目指すとしている。Android端末への採用時期は、あらためて告知する。 Google メッセージは、従来のSMSを拡張したRCS(Rich Communication Services)に準じており、電話番号ベースで写真や動画を送受信できる。RCSはGSMAで標準化されており、全世界で採用キャリアや対応機種が拡大している。 KDDIは、国内では同じくRCSに準拠したメッセージサービス「+メッセージ」を提供しているが、ここにGoogle メッセージが加わることになる。同社は、これまでのメッセージサービスで培ってきたアセットや

                                                                                  KDDIが「Google メッセージ」をAndroid端末に採用 「RCSの普及とユーザー体験向上を目指す」
                                                                                • Google I/Oで発表されたこと総まとめ

                                                                                  Google I/Oで発表されたこと総まとめ2024.05.15 19:0069,495 Kyle Barr - Gizmodo US [原文] ( そうこ ) 日本時間の5月15日未明に開催されたGoogle(グーグル)の開発者向けカンファレンスGoogle I/O 2024の基調講演。今年の発表はアルファベット2つにまとめることができます。AI。 新たにGoogleのエコシステムに追加されていくAI機能が続々と発表されました。去年のGoogle I/Oで発表されたAI「Gemini」、今年はさらなら飛躍をとげます。 AI OverviewScreenshot: Google / Gizmodo US基調講演は、Googleらしく検索機能からスタート。去年まで「Search Generative Experience」ベータプログラムでのみ試せたAIによる検索が一般機能になります。 サン

                                                                                    Google I/Oで発表されたこと総まとめ