並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 832件

新着順 人気順

DeepMindの検索結果81 - 120 件 / 832件

  • PyCon JP 2019で見たセッションの聴講記録20個分 / 資料・動画・関連リンクなど - フリーランチ食べたい

    2019年9月16日/17日に開催されたPyCon JP 2019で自分が直接/YouTubeで聴講したセッションについてのまとめです。主に下記の内容を書いています。 スピーカーURL 配信動画 スライド 発表内で出てきたライブラリなどのURL 自分の感想 「あのセッションで話していたライブラリなんだっけ」と思い出したい方やざっくり内容が知りたい方に読んでいただければ幸いです。PyCon JPに自分も発表者としても参加し、スタッフとして参加し、Webサイトの開発もしたので、それについては改めて書きたいと思います。 pycon.jp PythonとAutoML / 芝田 将 スピーカー: https://twitter.com/c_bata_ 動画: https://www.youtube.com/watch?v=Whkwu46DgBs スライド: https://www.slideshar

      PyCon JP 2019で見たセッションの聴講記録20個分 / 資料・動画・関連リンクなど - フリーランチ食べたい
    • 平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital

      月間10万人が読んでいるCoral Insightsのニュースレターにご登録いただくと、Coral Capitalメンバーによる国内外のスタートアップ業界の最新動向に関するブログや、特別イベントの情報等について、定期的にお送りさせていただきます。ぜひ、ご登録ください! Coral Capitalのポッドキャストでは、かなりAIに編集作業を頼っています。英語でインタビューしていることから、日本語では未実現の最新技術を使ったサービスに触れる機会があるのですが、ここ1、2年は、その進化には目を見張るものがあります。 収録した音声を文字(テキスト)に変換する「文字起こし」の精度が上がった結果、もはや人間に依頼する意味はなくなりましたし、音声編集についても画期的な機能が登場しています。それは音声から文字起こしされたテキストを編集することで、それに対応する元の音声データも同時に編集可能である、という機

        平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital
      • ツイッター社消滅に、8割のリストラ。見えてきたツイッター買収、マスク氏の本音(徳力基彦) - エキスパート - Yahoo!ニュース

        イーロン・マスク氏がツイッターを買収してからもうすぐ半年になろうとしていますが、ツイッターをめぐる混乱は収まりを見せるどころか、ここに来てさらに激しくなっている印象すらあります。 直近で、最も大きな騒動と言えるのが、APIの有料化でしょう。 もともとツイッターは、個人開発者でも手軽に無料のAPIを活用してアプリケーションを開発できることが、ツイッターの人気の拡がりを支える要因の1つだと言われてきました。 しかし、イーロン・マスク体制になり、その姿勢は明確に反転。 長く人気を博していた様々なツイッター関連サービスが、次々に終了や休止を宣言するという展開になっています。 参考:「Twilog」「feather」、機能停止に Twitter API有料化の波紋広がる さらに、最近では会社としてのTwitter社が3月の段階で、X社と合併する形で消滅していたことが判明し、「Twitter消滅」がト

          ツイッター社消滅に、8割のリストラ。見えてきたツイッター買収、マスク氏の本音(徳力基彦) - エキスパート - Yahoo!ニュース
        • ChatGPTを使って、スタートアップの日常業務の生産性を劇的に向上させる|サトウレイジ

          どうも、プライバシーテックの民主化を目指している、Acompanyの佐藤です。 ChatGPT、話題になっていますね。 https://chat.openai.com/ 最近、仕事の場面でもChatGPTを色々触っています。とりあえず思いついたことを適当に投げてみると、そこそこ役立つなと感じて始めています。これが無料なんて信じられない。 自分がいろんな場面でChatGPTを使ってみて、これは日頃の仕事でも使い方によっては恐ろしいほどに便利なのでは?と思った使い方を書いておきます。 市場規模の把握スタートアップや新規事業だと、どれぐらいのマーケットサイズがあるのか?を聞かれたりすることが多いと思います。ただ、マーケットサイズって、定義が抽象的で、自分がイメージする数字を示すのが難しい場合がありますよね。 そんなものも、ChatGPTに投げると、答えてくれます。 こんな感じでWeb3などまだ新

            ChatGPTを使って、スタートアップの日常業務の生産性を劇的に向上させる|サトウレイジ
          • Kaggleランカーの7人に聞いた、2021年面白かったコンペ7選と論文7選 | 宙畑

            7名のKagglerの方にアンケートにご協力いただき、2021年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 2022年8月31日以降、Tellus OSでのデータの閲覧方法など使い方が一部変更になっております。新しいTellus OSの基本操作は以下のリンクをご参照ください。 https://www.tellusxdp.com/ja/howtouse/tellus_os/start_tellus_os.html 2021年も数多くのデータ解析コンペが開催され、興味深い論文が多く発表されました。 毎年Kaggle等のデータサイエンスコンペティションに取り組んでおられる人達にアンケートを実施し、その年の記事をまとめてきました。 そして本年も7名のKagglerの方にアンケートにご協力いただき、2021年に面白かったコンペと論文を教えていただきましたのでその結果を紹

              Kaggleランカーの7人に聞いた、2021年面白かったコンペ7選と論文7選 | 宙畑
            • 「公開するApple vs. 隠すOpenAI」アップルが300億パラメータのマルチモーダルAI「MM1」発表。重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

              2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第38回目は、生成AI最新論文の概要5つを紹介します。 Appleが最大300億パラメータを持つマルチモーダル大規模言語モデル「MM1」を開発 OpenAIなどのクローズド大規模言語モデルの一部を許可なく取得する攻撃、Googleなどが開発 GPT-3.5の隠れ層のサイズを約4096と推定。非公開LLMの中身を抽出する手法 WebページのスクリーンショットからHTMLコードを生成するAIモデル「Sightseer」をHugging Faceが開発 実世界に強いマルチモーダル大規模言語モデル「DeepSeek-VL」 Appleが最大300億パラメータを持つマルチモーダ

                「公開するApple vs. 隠すOpenAI」アップルが300億パラメータのマルチモーダルAI「MM1」発表。重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
              • 脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント?|「こころ」のための専門メディア 金子書房

                脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント? 私が学生だった1990年代前半、脳と心の科学の未来は輝いて見えた。80年代末から続いていた(第2次)ニューラルネットワークブームや、当時NatureやScienceに頻繁に掲載されていたサルの電気生理学研究の印象は強烈だった。「認知科学」や「認知心理学」の「認知」という言葉に、旧来の「心理学」や「生理学」にはない軽やかな響きを感じた。当時は、行動主義から認知科学への移行(「認知革命」)によって、観察可能な行動だけでなく、行動の背後にある認知プロセスについて研究できるようになったと言われていた(が、これが単純化された「建国神話」であることが後に分かってきた)(1)。90年代半ば以降、ニューラルネットワークブームは一時下火になる一方、脳イメージング技術の進展を背

                  脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント?|「こころ」のための専門メディア 金子書房
                • AIが古代バビロニアのテキストを解読、ギルガメシュ叙事詩のコピーや失われた賛歌を発見

                  古代の破損した碑文や読み解くのが難しい古代文字の解読をAIが処理することで、専門家が数時間かける作業をものの数秒でこなすことができます。ドイツのルートヴィヒ・マクシミリアン大学(LMU)の研究チームは、「Fragmentarium」というAIが複雑な楔形(くさびがた)文字である古代バビロニアのテキストを読み解いて、美しい賛歌を発見したと報告しています。 Spiel mit dem Anfang der Weltliteratur - LMU München https://www.lmu.de/de/newsroom/newsuebersicht/news/spiel-mit-dem-anfang-der-weltliteratur.html AI Deciphers Ancient Babylonian Texts And Finds Beautiful Lost Hymn | IFLS

                    AIが古代バビロニアのテキストを解読、ギルガメシュ叙事詩のコピーや失われた賛歌を発見
                  • わずか1分で10日間の天気を予測可能なAI「GraphCast」をGoogle DeepMindが発表、スパコンで数時間かけた予測より高精度

                    Google DeepMindが気象予測AI「GraphCast」を発表しました。10日間の天気を予測する場合、従来の気象予測システムではスーパーコンピューターを数時間稼働させる必要がありましたが、GraphCastでは1台のマシンを1分稼働させるだけで従来の予測システムを超える精度での予測が可能とアピールされています。 Learning skillful medium-range global weather forecasting | Science https://www.science.org/doi/10.1126/science.adi2336 GraphCast: AI model for faster and more accurate global weather forecasting - Google DeepMind https://deepmind.google/

                      わずか1分で10日間の天気を予測可能なAI「GraphCast」をGoogle DeepMindが発表、スパコンで数時間かけた予測より高精度
                    • GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある

                      AIが予想外の能力を開花させることを「創発(emergent)」と言います。生物学の世界で「創発」とは、大量の物体が1つになって機能する自己組織化や集団行動を意味しますが、人工知能研究の世界では「突然これまで不可能だと思われていたタスクをこなせるようになること」を意味します。昨今の大規模言語モデルを研究する専門家の間で、大規模言語モデルの創発が話題となっています。 Characterizing Emergent Phenomena in Large Language Models – Google AI Blog https://ai.googleblog.com/2022/11/characterizing-emergent-phenomena-in.html The Unpredictable Abilities Emerging From Large AI Models | Quan

                        GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある
                      • AIに「深呼吸しよう」といった人間っぽい言葉をかけると問題の正答率が上昇するという研究結果

                        AIは入力されたプロンプトに従ってさまざまな問題を解決したり、自然な応答を生成したりすることができますが、その精度はプロンプトの書き方に影響されることがわかっています。新たに、「AIに『深呼吸をして』といった人間に送るようなアドバイスを与えると問題の正答率が上昇する」ということが、Google DeepMindの研究チームによって報告されました。 [2309.03409] Large Language Models as Optimizers https://arxiv.org/abs/2309.03409 Uh oh, now AI is better than you at prompt engineering | ZDNET https://www.zdnet.com/article/uh-oh-now-ai-is-better-than-you-at-prompt-engineer

                          AIに「深呼吸しよう」といった人間っぽい言葉をかけると問題の正答率が上昇するという研究結果
                        • OpenAIやDeepMindのCEOやトップ研究者ら、「AIによる人類絶滅リスク」警鐘声明に署名

                          AIに取り組む著名研究者、エンジニア、CEOなどのグループが5月30日(米国時間)、AIによる人類絶滅の危機について、新たな警告を発した。 「Statement on AI Risk」(AIリスクに関する声明)に署名したのだ。広く受け入れられるよう簡潔にまとめられたこの声明は、「Mitigating the risk of extinction from AI should be a global priority alongside other societal-scale risks such as pandemics and nuclear war.」(AIによる絶滅のリスクを軽減することは、パンデミックや核戦争などの他の社会的規模のリスクと並んで世界的な優先事項とすべきだ)というものだ。 この声明は、サンフランシスコに拠点を置く非営利団体Center for AI Safety(C

                            OpenAIやDeepMindのCEOやトップ研究者ら、「AIによる人類絶滅リスク」警鐘声明に署名
                          • マルチモーダルAI「Gemini」の性能をアピールするGoogleの公式ムービーはフェイクだったという指摘

                            Googleが2023年12月6日に発表した大規模言語モデル(LLM)の「Gemini」は、文字だけではなく画像や映像なども理解してユーザーとやり取りができるマルチモーダリティが大きな特徴で、Googleが公開したGeminiの性能を示すデモムービーは大きな話題となりました。しかし、このムービーで示されたGeminiのデモはフェイクではないかと指摘されています。 Google’s best Gemini demo was faked | TechCrunch https://techcrunch.com/2023/12/07/googles-best-gemini-demo-was-faked/ フェイクだと指摘されたデモムービーが以下。 Hands-on with Gemini: Interacting with multimodal AI - YouTube Bloombergの記者で

                              マルチモーダルAI「Gemini」の性能をアピールするGoogleの公式ムービーはフェイクだったという指摘
                            • xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表

                              イーロン・マスク氏が7月に立ち上げたAI企業xAIは、同社初のAIモデル「Grok」を発表した。まだ初期β段階だが、ベンチマークでは「ChatGPT-3.5」や「Inflection-1」を上回るとしている。 イーロン・マスク氏率いる米AI企業xAIは11月4日(現地時間)、同社初のAIモデル「Grok」を発表した。マスク氏はそれに先立ち、GrokをXのハイエンドサブスクプランユーザーに提供する計画だとポスト済みだ。 xAIは企業サイトのトップページで「Grokは、『銀河ヒッチハイク・ガイド』をモデルにしたAIで、ほぼすべてのことに答えることを目的としており、質問すべきことを提案することさえできる」「ウィットに富んだ質問に答えるよう設計されており、反抗的な性格でもあるので、ユーモアが嫌いであれば使わないように」と説明している。 xAIは、全人類に利益をもたらすAIツールを構築するためにフィ

                                xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表
                              • 人間と同レベルでプログラミングができるAI「AlphaCode」、DeepMindが開発 - fabcross for エンジニア

                                DeepMind Technologiesは、コード生成人工知能(AI)の「AlphaCode」を開発。 AlphaCodeはプログラミングコンテストでほぼ中央値となる成績を収め、人間と同レベルのコーディングスキルを持つことを示した。2022年2月2日の公式ブログで発表されていたが、このたび12月8日に、AlphaCodeについての論文が『Science』に掲載され、表紙を飾った。 DeepMindはAIを開発している企業だ。2015年には、同社の囲碁プログラム「AlphaGo」がAIとして初めて人間のプロ囲碁棋士を破り話題となった。 AlphaCodeは競技プログラミング向けに作られたシステムだ。競技プログラミングでは、批判的思考、論理、アルゴリズム、コーディング、自然言語理解を組み合わせて、予期せぬ問題に対する解決策を創出することが必要となる。予期せぬ問題に解決策を見出すのは、従来の機

                                  人間と同レベルでプログラミングができるAI「AlphaCode」、DeepMindが開発 - fabcross for エンジニア
                                • Google Colab で Gemini API を試す|npaka

                                  「Google Colab」で「Gemini API」を試したので、まとめました。 1. Gemini API「Gemini API」は、「Google DeepMind」が開発したマルチモーダル大規模言語モデル「Gemini」を利用するためのAPIです。 3. Gemini API の準備Colabでの「Gemini API」の準備手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install -q -U google-generativeai(2) 「Google AI Studio」からAPIキーを取得し、Colabのシークレットマネージャーに登録。 キーは「GOOGLE_API_KEY」とします。 import google.generativeai as genai from google.colab import userd

                                    Google Colab で Gemini API を試す|npaka
                                  • 囲碁AI「AlphaGo」に敗北した世界チャンピオンが「AIを負かすことはできない」と棋士を引退

                                    囲碁の世界タイトルを20回近く獲得し、2000年以降最強の棋士の1人とも評されるイ・セドル棋士が、2019年11月19日に韓国棋院に辞職願を提出したことを、韓国メディアの聯合ニュースが報じています。かつてAI企業DeepMindの開発した囲碁AI「AlphaGo」と戦って敗れたイ棋士は、引退の動機の1つとして「AlphaGoなど囲碁AIの圧倒的な強さ」を挙げているとのことです。 (Yonhap Interview) Go master Lee says he quits unable to win over AI Go players | Yonhap News Agency https://en.yna.co.kr/view/AEN20191127004800315 Former Go champion beaten by DeepMind retires after declaring

                                      囲碁AI「AlphaGo」に敗北した世界チャンピオンが「AIを負かすことはできない」と棋士を引退
                                    • AIが生成する画像を「ネコ」にするサイバー攻撃 絵師らを守る技術「Nightshade」 米シカゴ大が開発

                                      このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 米シカゴ大学に所属する研究者らが発表した論文「Nightshade: Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models」は、生成AIモデルの無断学習を抑止するために、学習されても予期せぬ動作をAIモデルに生成させる毒入りデータに画像を変換するツールを提案した研究報告である。 この攻撃は「Nightshade」と名付けられ、約200枚の細工画像をモデルの学習データに紛れ込ませるだけで、特定の単語に関連する画像生成を高確率で操作できてしまう。 攻撃者は特定の単

                                        AIが生成する画像を「ネコ」にするサイバー攻撃 絵師らを守る技術「Nightshade」 米シカゴ大が開発
                                      • Deep MindのAIがFPSで人類を圧倒 チームワークを学習

                                        Deep MindのAIがFPSで人類を圧倒 チームワークを学習 DeepMindの研究者たちはFPSチームとして働くために「お互いに教えあう」AIボットを作った。ボットは人間が発明した古典的な戦略を真似るだけでなく、バグを利用した独自戦略を発明することさえした。 昔からのゲーマーは、古典的なファースト・パーソン・シューター(FPS) ゲームである「Quake」がどれほど難しいかを知っています。迷路のようなフィールドで、他のプレイヤーと協力して、致命的な銃撃を避けながら、浮かんでいる目標を捕らえなければなりません。そして今、初めて人工知能(AI)がその複雑な一人称視点のビデオゲームでチームワークをマスターし、人間とコンピュータの両方のチームメイトと連携して行動を調整し、一貫して相手を打ち負かすことができるようになりました。 AIは車を運転したり、チェスや囲碁の世界最強のプレイヤーを1対1で

                                          Deep MindのAIがFPSで人類を圧倒 チームワークを学習
                                        • Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果

                                          Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果 Google DeepMindは、「Graph Neural Network」(GNN)採用の気象AIモデル「GraphCast」をオープンソースで公開した。欧州中期天気予報センターのデータでトレーニングされており、向こう10日間の気象予測を約1分で生成する。 米Google DeepMindは11月14日(現地時間)、「前例のない精度で中期天気予報を行うことができる」と謳う気象AIモデル「GraphCast」を発表した。 同日に科学雑誌「Science」に掲載された論文によると、世界の気象状況を最大10日前まで予測する場合、GraphCastは気象シミュレーションシステム「欧州中期天気予報センター」(ECMWF)の「高解像度予報」(HRES)より正確かつ迅速だったという。 異

                                            Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果
                                          • 大規模言語モデル(LLM)に関連するビジネスを展開する際に留意すべき法規制・知的財産権・契約|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

                                            OpenAIのChatGPT、MicrosoftのBing、GoogleのBardなど、言語系のAIサービスが急速に普及し始めました。1ちなみに記事冒頭のアイキャッチ画像は, 会社のロゴ風画像で「GPT」という文字をなんとか表示させようと画像生成AIで1時間悪戦苦闘したが結局、意味不明の文字列しか出てこなかったロゴ」です これらのサービスは、いずれも大規模言語モデル(Large Language Models; LLMs)をベースにしているという共通点があり、社会や産業に極めて大きなインパクトを与えると予想されています。 そこで、このような大規模言語モデル(LLM)に関連するビジネスを展開する際に留意すべき法規制・知的財産権・契約について、何回かに分けてまとめてみようと思います。 今回は、まずは総論部分として「大規模言語モデル(LLM)に関連するビジネス3つの領域」と「それぞれの領域におい

                                              大規模言語モデル(LLM)に関連するビジネスを展開する際に留意すべき法規制・知的財産権・契約|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
                                            • DeepMindが人間レベルにかなり近づいたAI「Gato」を構築、ゲームプレイ・チャット・ロボットアーム操作などが可能

                                              囲碁世界チャンピオンを負かし引退に追い込んだ囲碁AI「AlphaGo」などで知られるDeepMindが、テキスト出力の領域を超えた単一の汎化エージェントだという「Gato」を構築しました。Gatoは文脈に基づき、テキストを出力するか、関節を動かすか、あるいはボタンを押下するかといった動作を決定できるとのことです。 A Generalist Agent https://www.deepmind.com/publications/a-generalist-agent DeepMind’s new AI can perform over 600 tasks, from playing games to controlling robots | TechCrunch https://techcrunch.com/2022/05/13/deepminds-new-ai-can-perform-ove

                                                DeepMindが人間レベルにかなり近づいたAI「Gato」を構築、ゲームプレイ・チャット・ロボットアーム操作などが可能
                                              • GoogleのAIは古代ギリシャの碑文解読をものの数秒で行うことができるように

                                                Google傘下の人工知能開発企業DeepMindは病気の予測やエネルギー効率化などさまざなまな分野でAIアルゴリズムを役立てています。2019年10月15日(火)、新たにDeepMindは古代の碑文から「抜け落ちた記述」を予測するアルゴリズムを開発したと発表しました。人間の専門家が2時間かける作業を、AIはものの数秒で完了するとのことです。 [1910.06262] Restoring ancient text using deep learning: a case study on Greek epigraphy https://arxiv.org/abs/1910.06262 Restoring ancient text using deep learning: a case study on Greek epigraphy | DeepMind https://deepmind.c

                                                  GoogleのAIは古代ギリシャの碑文解読をものの数秒で行うことができるように
                                                • PyTorch vs TensorFlow in 2023

                                                  Should you use PyTorch vs TensorFlow in 2023? This guide walks through the major pros and cons of PyTorch vs TensorFlow, and how you can pick the right framework. PyTorch and TensorFlow are far and away the two most popular Deep Learning frameworks today. The debate over which framework is superior is a longstanding point of contentious debate, with each camp having its share of fervent supporters

                                                    PyTorch vs TensorFlow in 2023
                                                  • Introducing Gemini: our largest and most capable AI model

                                                    A note from Google and Alphabet CEO Sundar Pichai: Every technology shift is an opportunity to advance scientific discovery, accelerate human progress, and improve lives. I believe the transition we are seeing right now with AI will be the most profound in our lifetimes, far bigger than the shift to mobile or to the web before it. AI has the potential to create opportunities — from the everyday to

                                                      Introducing Gemini: our largest and most capable AI model
                                                    • 最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに

                                                      Google / Alphabet CEO Sundar Pichaiからのメッセージ すべてのテクノロジーの変化は、科学的探求を前進させ、人類の進歩を加速し、生活をより良くする機会となります。いま目の当たりにしている AI による変化は、私たちの人生で最も意味深いものになると確信しています。これは、これまでのモバイルやウェブへの移行よりも、はるかに大きなものになるでしょう。AI は、日常から非日常に至るまで、あらゆる場所の人々に機会を生み出す可能性を秘めています。AI は、イノベーションと経済発展の新たな波をもたらし、これまでにない規模で知識、学習、創造性、生産性を高めます。 世界中のあらゆる場所で、あらゆる人に AI を役立てられることが、私がとてもワクワクしている理由です。 私たちが AI ファーストを掲げ取り組みを開始してから 8 年近くが経ちますが、進化の速度はより一層早くなって

                                                        最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに
                                                      • 画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場

                                                        画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場2023.10.26 21:0081,577 Kyle Barr - Gizmodo US [原文] ( 岩田リョウコ ) AIに毒を盛る秘策。 アーティストが自分の作品をAIトレーニングに使用されることと戦う手段ってあるのでしょうか。それを研究している人たちがいます。 シカゴ大学のコンピュータサイエンスの教授Ben Zhao氏は、彼のチームが「Nightshade」という名前のツールを開発したとMIT Technology Reviewに語っています。 毒を盛った画像でトレーニングさせる作戦今のところ、アーティストがAI企業に対抗する唯一の選択肢は、訴訟を起こすこと。もしくは、開発者がアーティストが許諾しない意思に従ってくれることを願うことくらいしかできない状況です。 しかしこのツールは戦う姿勢を見せまくりです。なんとア

                                                          画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場
                                                        • ChatGPTやらMidjourney…生成系AIって今年どうなる?

                                                          進化が進む一方で、いろんな戦いも表面化していきそう。 OpenAIのChatGPTには、記事の執筆も(一応)頼めるし、「クールなガチョウの子守唄を書いて」なんて頼むこともできます。MidjourneyやStable Diffusion、DALL-E 2などなどの画像AIには、そんなガチョウの絵を描いてもらうこともできます。 でも、そこには倫理的な問題があります。AIがガチョウの絵本を描いてくれたとしても、絵本作家みたいな労力をまったくかけてないのに、普通にその本を売ってもいいんでしょうか? その場合、著作権はどこに帰属すべきでしょうか? AIを学習させるのに使われた絵本の著作権はどうなるんでしょうか? とはいえ、技術は急速に進化していても、今のところ生成系AIだけで売り物にしていいようなものをコンスタントに作れるかっていうと、それはまだです。でも、それを乗り越えるのがまだまだ先なのかもうす

                                                            ChatGPTやらMidjourney…生成系AIって今年どうなる?
                                                          • 人工知能(AI)は意識を持つようになるのか?を神経科学者が解説

                                                            2012年頃に「ディープラーニング」や「ニューラルネットワーク」が多くの分野で使われるようになってから、人工知能(AI)の分野は目覚ましい発展をみせてきました。「100年以内にAIは人間を超える」と言われることもありますが、AIが人間と同様の「意識」を持つことは将来的に起こりうるのか、神経学者が「意識」と「知能」の違いに言及しつつ解説しています。 Can AI Become Conscious? | News | Communications of the ACM https://cacm.acm.org/news/244846-can-ai-become-conscious/fulltext カリフォルニア工科大学教授であり神経学者でもあるクリストフ・コッホ氏はDNAの二重らせん構造を発見したフランシス・クリックとともに神経科学としての「意識」の研究に取り組んだ人物。またコッホ氏は同じく

                                                              人工知能(AI)は意識を持つようになるのか?を神経科学者が解説
                                                            • 韓国のトップ囲碁棋士、AIを「打ち負かすのは不可能」として引退決断

                                                              韓国の首都ソウルのホテルで、グーグル傘下のベンチャーが開発した「アルファ碁」との対局に臨むプロ囲碁棋士の李世ドル氏(2016年3月12日提供)。(c)AFP/GOOGLE DEEPMIND 【11月28日 AFP】米グーグル(Google)傘下のベンチャーが開発した囲碁の人工知能(AI)「アルファ碁(AlphaGo)」に勝利した唯一の人間である韓国のプロ囲碁棋士が先週、コンピューターを「打ち負かすのは不可能」と確信したとして引退を決断した。韓国・聯合(Yonhap)ニュースが27日、報じた。 国際的なタイトルを18も保持していた韓国の李世ドル(イ・セドル、Lee Se-Dol)九段(36)は2016年、アルファ碁との5番勝負に挑み、囲碁への注目を高めたと同時に、限界がないかのようなAIの学習能力への懸念も浮上した。 李氏は、アルファ碁との5番勝負のうち1勝を挙げたものの、残り4局で敗れた。

                                                                韓国のトップ囲碁棋士、AIを「打ち負かすのは不可能」として引退決断
                                                              • Google's best Gemini demo was faked | TechCrunch

                                                                Google’s new Gemini AI model is getting a mixed reception after its big debut yesterday, but users may have less confidence in the company’s tech or integrity after finding out that the most impressive demo of Gemini was pretty much faked. A video called “Hands-on with Gemini: Interacting with multimodal AI” hit a million views over the last day, and it’s not hard to see why. The impressive demo “

                                                                  Google's best Gemini demo was faked | TechCrunch
                                                                • 人工知能の欠点、破局的忘却とは? – 株式会社ライトコード

                                                                  一度覚えたことを忘れる?破局的忘却とは?現在、「人工知能(AI)」技術は至る所で耳にするようになりました。 例えば工場で、生産したものに傷がないか検品するにも、画像認識の人工知能が使われています。 その精度は凄まじく、人間より素早く、かつ正確に行うことができます。 しかし、そんな万能とも思えるような「人工知能」にもいくつか欠点があります。 破局的忘却(破滅的忘却)それは、破局的忘却(または、破滅的忘却)と呼ばれる欠点です。 なにやらカッコイイ響きの言葉です。 ですが、その内容は「一度何かを学習したネットワークに新しいものを覚えさせようとすると、以前学習したものを忘れてしまう」というもの(笑) 例えば、「りんご」と「みかん」を識別できるネットワークがあったとします。 そのネットワークに新しく「ぶどう」も識別させようと学習すると、「りんご」と「みかん」はもう忘れているのです! 【図、破局的忘却

                                                                    人工知能の欠点、破局的忘却とは? – 株式会社ライトコード
                                                                  • ディープラーニングで歌声音声合成エンジンを自作する

                                                                    この記事は、ドワンゴ Advent Calendar 2019の1日目の記事です。 モチベーション 最近、理想の人工知能(歌ったり踊ったり喋ったりできるキャラクター)を作りたいと思うようになりました。人工知能が歌を歌うためには、歌声音声合成エンジンが必要です。ということで、ディープラーニングを使って、歌声音声合成エンジンの作成に挑戦してみました。この記事では、実際に音声合成した歌声や、その仕組み、別条件での実験結果、ディープラーニング周りの手法を紹介します。 デモ動画実際に作成した音声合成エンジンを使った歌唱のデモです。 (歌声音声合成を作ったら絶対最初にカバーしたいと思っていた歌、ハジメテノオトのカバーです。) 歌唱デモ音声 まだ挑戦し始めてから2週間ほどしか経っていないのでかなり荒削りですが、それでもちゃんと歌詞や音程が取れていたり、溜めの部分で大きく息を吸う音が入っていたりと、そこそ

                                                                      ディープラーニングで歌声音声合成エンジンを自作する
                                                                    • Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ

                                                                      Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ2023.11.16 08:00150,044 Thomas Germain -Gizmodo US- [原文] ( R.Mitsubori ) 明日天気になあれ。 ついに、「今日どんな服装で出かけたらいいか」ロボットが教えてくれる時代が来ましたよ。GoogleのAI部門であるGoogle DeepMindは、従来のシステムを90%以上上回る最新の天気予報モデルを発表しました。その名も「GraphCast」という機械学習モデルで、天気予報アプリよりも早く正確に、しかも効率的にこの先10日間のお天気を教えてくれます。 現地時間の14日、Googleの研究チームは論文を発表。そのなかで「我々はこれが、天気予報の転換点になると確信しています」と記しています。 大量の過去気象データから未来を予測現在の天気予報は一般的に「数値天気予報(N

                                                                        Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ
                                                                      • Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) | テクノエッジ TechnoEdge

                                                                        Googleさん、5月のGoogle I/Oで予告していた新生成AIモデル「Gemini」のバージョン1.0をぎりぎり年内にリリースしましたね。問題が多いから年内リリースは無理そうという噂もありましたが、とりあえずちっさいモデル(ProとNano)だけぎりぎり年内に出して面目を保った感じです。 本命でマルチモーダルな最大サイズの「Gemini Ultra」は来年に持ち越し。安全性のチェックと強化学習に時間をかけているそうです。 このUltraのデモ動画がすごすぎて話題になっていますが、動画の概要説明に「For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity」(このデモでは、簡潔にするためにレイテンシが短縮され、Geminiの出力が短縮

                                                                          Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) | テクノエッジ TechnoEdge
                                                                        • KDDIが「Google メッセージ」をAndroid端末に採用 「RCSの普及とユーザー体験向上を目指す」

                                                                          KDDIが5月16日、Googleが提供するメッセージサービス「Google メッセージ」を、Android端末の標準アプリとして追加採用することを発表した。Googleが表明しているグローバル標準のRCSの取り組みに賛同し、AI技術なども活用しながらユーザー体験向上を目指すとしている。Android端末への採用時期は、あらためて告知する。 Google メッセージは、従来のSMSを拡張したRCS(Rich Communication Services)に準じており、電話番号ベースで写真や動画を送受信できる。RCSはGSMAで標準化されており、全世界で採用キャリアや対応機種が拡大している。 KDDIは、国内では同じくRCSに準拠したメッセージサービス「+メッセージ」を提供しているが、ここにGoogle メッセージが加わることになる。同社は、これまでのメッセージサービスで培ってきたアセットや

                                                                            KDDIが「Google メッセージ」をAndroid端末に採用 「RCSの普及とユーザー体験向上を目指す」
                                                                          • Anthropicのテキスト生成AI「Claude」がOpenAIのGPT-4の約3万2000トークンの3倍近い10万トークンに対応して長文の入力も可能に

                                                                            ChatGPTなどの対話型AIは、高精度なテキストを生成できる一方、入力が可能な言語の最小単位である「トークン」には限度があります。OpenAIのGPT-4は約3万2000トークンまでの入力が可能ですが、AI研究スタートアップのAnthropicがテキスト生成AI「Claude」のトークンを9000から10万へ拡張したことを発表しました。 Anthropic | Introducing 100K Context Windows https://www.anthropic.com/index/100k-context-windows Anthropic’s latest model can take ‘The Great Gatsby’ as input | TechCrunch https://techcrunch.com/2023/05/11/anthropics-latest-mode

                                                                              Anthropicのテキスト生成AI「Claude」がOpenAIのGPT-4の約3万2000トークンの3倍近い10万トークンに対応して長文の入力も可能に
                                                                            • 大規模言語モデルを使って自動車走行時の状況説明をさせてみる? -社内LLMハッカソン記-

                                                                              Turing株式会社の自動運転MLチームでエンジニアをしている岩政です。 Turingの自動運転MLチームでは、完全自動運転の開発に向けて、走行データから自動走行が可能な深層学習モデルの作成およびデータ基盤の整備、視覚情報以外にも言語を活用したマルチモーダルな基盤モデルの作成に取り組んでいます。 本記事では、視覚情報を認識するモデルと大規模言語モデルを組み合わせて、「自動車走行時の特に危険な状況を説明することができないか?」という観点から、社内ハッカソンで取り組んだことを紹介します。 社内LLMハッカソン 事の発端は、4月のある1日に急遽開催された大規模言語モデル(以下LLM)を活用した社内ハッカソンでした。高度な自動運転の実現において、一般的な社会常識のもと複雑な状況を理解して適切に行動するための「知能」は必要不可欠です。現在、Turingでは、LLMはその知能として高いポテンシャルがあ

                                                                                大規模言語モデルを使って自動車走行時の状況説明をさせてみる? -社内LLMハッカソン記-
                                                                              • Google I/Oで発表されたこと総まとめ

                                                                                Google I/Oで発表されたこと総まとめ2024.05.15 19:0069,495 Kyle Barr - Gizmodo US [原文] ( そうこ ) 日本時間の5月15日未明に開催されたGoogle(グーグル)の開発者向けカンファレンスGoogle I/O 2024の基調講演。今年の発表はアルファベット2つにまとめることができます。AI。 新たにGoogleのエコシステムに追加されていくAI機能が続々と発表されました。去年のGoogle I/Oで発表されたAI「Gemini」、今年はさらなら飛躍をとげます。 AI OverviewScreenshot: Google / Gizmodo US基調講演は、Googleらしく検索機能からスタート。去年まで「Search Generative Experience」ベータプログラムでのみ試せたAIによる検索が一般機能になります。 サン

                                                                                  Google I/Oで発表されたこと総まとめ
                                                                                • Metaが大規模言語モデル「LLaMA」を発表、GPT-3に匹敵する性能ながら単体のGPUでも動作可能

                                                                                  MetaのAI研究組織であるMeta AI Researchが、大規模言語モデル「LLaMA(Large Language Model Meta AI)」を2023年2月24日に発表しました。Meta AI Researchによれば、LLaMAはOpenAIのGPT-3よりもパラメーター数がずっと小さく、単体GPUでも動作可能でありながら、ベンチマークテストの一部ではGPT-3を上回ったとのことです。 LLaMA: Open and Efficient Foundation Language Models - Meta Research https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ Meta unveils a new large languag

                                                                                    Metaが大規模言語モデル「LLaMA」を発表、GPT-3に匹敵する性能ながら単体のGPUでも動作可能