並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 113件

新着順 人気順

人工知能の検索結果1 - 40 件 / 113件

  • Hello GPT-4o

    GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat

      Hello GPT-4o
    • デジタル庁2023年度事業 行政での生成AI利活用検証から見えた10の学び (1/3)|デジタル庁

      デジタル庁のAI担当の大杉直也です。この記事では、生成AIによる業務改善の一助になればと思い、実際の行政業務で生成AIの利活用を検討する際に得られた知見を共有します。 本記事は、「デジタル庁2023年度事業 行政での生成AI利活用検証の結果報告(以降、報告書とよびます)」で得られた知見を、よりわかりやすく具体的に示すために、「10の学び」の形式にまとめたものです。 その検証ではデジタル庁を中心とした行政職員を対象に、実際に複数種類のテキスト生成AIを取り扱える環境+ユースケースごとの独自開発を含むサポート体制を作り、(1)どの行政業務に対し、(2)どのようにテキスト生成AIを使えば、(3)どのくらい改善効果がありそうか、を調べました。また、報告書には含まれていなかった個別ヒアリング等による知見も反映させています。 文量が少し多くなってしまったため、全3回の構成で紹介いたします。第1回の本記

        デジタル庁2023年度事業 行政での生成AI利活用検証から見えた10の学び (1/3)|デジタル庁
      • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

        筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

          まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
        • GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」

          kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

            GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」
          • AIラジオ『zenncast』の技術構成(プロンプトつき)

            先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。 ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。 このZennではzenncastの技術構成や仕組みを紹介します(プロンプトつき)。 作ったもの まずはエピソードを一つ選んで1分くらい聴いてみてください! AIラジオの雰囲気が掴めると思います。 主な機能・特徴 毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介 お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地 これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify

              AIラジオ『zenncast』の技術構成(プロンプトつき)
            • 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

              米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

                「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
              • Gitの仕組みと用語 / GitHub Term

                物理情報工学ソフトウェア開発演習

                  Gitの仕組みと用語 / GitHub Term
                • ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)

                  5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

                    ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)
                  • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                    昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                      GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                    • AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介

                      私事ですが、骨折して2か月ほど半寝たきり&半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きます で……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。 裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。 残りの99.8%は ・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される ・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会

                        AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介
                      • GPT-4o の概要|npaka

                        以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

                          GPT-4o の概要|npaka
                        • OpenAIのAI危険対策チームトップが「限界に達し」退社 「安全確保が後回しになっている」

                          米OpenAIで人間よりもはるかに賢いAI「Superintelligence」(超知能)の制御を目指して昨年結成されたSuperalignmentチームのトップ、ヤン・ライケ氏は5月17日(現地時間)、退社するとXで発表した。 「私がOpenAIに参加したのは、ここが超知能の研究を行うのに世界で最適だと思ったからだ。だが、OpenAIの幹部チームと中核的優先事項についてずっと同意できず、限界点に達した」という。 Superalignmentチームはライケ氏と、共同創業者でチーフサイエンティストのイリヤ・サツケバー氏が率いてきた。サツケバー氏は14日に退社を発表している。 ライケ氏は、「超知能の構築は本質的に危険な取り組み」であり、「OpenAIは人類全体に大きな責任を担っている」が、「安全性が輝かしい製品の開発より後回しになっている」と警鐘を鳴らす。 OpenAIは昨年2月、AGI(Ar

                            OpenAIのAI危険対策チームトップが「限界に達し」退社 「安全確保が後回しになっている」
                          • [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

                            [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。 これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

                              [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開
                            • AIの発明 特許を認めない判決「発明者は人に限られる」 | NHK

                              AIの発明に特許を認められるかどうかが争われた裁判で、東京地方裁判所は「発明者は人に限られる」として特許を認めない判断を示しました。一方、今の法律はAIの発明を想定しておらず多くの問題が起きるとして、国会での議論を促しました。 アメリカに住む原告はAIが自律的に発明した装置について、発明者の名前を「ダバス、本発明を自律的に発明した人工知能」と書いて特許を出願しましたが、特許庁は3年前、「発明者は人間に限られる」として退ける決定をし、原告は決定の取り消しを求めて訴えを起こしました。 16日の判決で東京地方裁判所の中島基至裁判長は「知的財産基本法では、発明は人間の活動で生み出されるものだと定義されている。グローバルな観点でも、発明者に直ちにAIが含まれると解釈することに慎重な国が多い」と指摘し、原告の訴えを退けました。 一方、特許をめぐる法律はAIの発明を想定していないと指摘したうえで、「AI

                                AIの発明 特許を認めない判決「発明者は人に限られる」 | NHK
                              • Chrome DevToolsにもGeminiを搭載へ。エラーの解決策などAIが支援

                                Googleは、日本時間5月15日から開催中のイベント「Google I/O 2024」で、デスクトップ版のChromeが備える開発ツール「Chrome DevTools」に、同社の最新版の生成AIであるGeminiを組み込むと発表しました。 これによりDevToolsのコンソールで表示されるエラーメッセージなどをGeminiが解説し、エラーの解決などを支援してくれるようになります。 DevToolsのエラーをGeminiが解決 下記がGoogle I/Oのデベロッパー向け基……

                                  Chrome DevToolsにもGeminiを搭載へ。エラーの解決策などAIが支援
                                • 「AIずんだもん」3Dモデルが使用中止に 制作者が「不快な内容」と抗議

                                  YouTubeチャンネル「AIずんだもん」を運営するきらっちさんがXで、東北ずん子・ずんだもんプロジェクトのキャラクター・ずんだもんの3Dモデルの使用を中止すると発表した。 3Dモデルの制作者から「不快な内容に利用されているため、利用をやめてほしい」と抗議を受けたという。併せて、きらっちさんは運営に不備があったとして謝罪した。 なお、5月13日に事情を説明するために行われた配信では、3Dモデルを無断で使用していたと発言している。 事情を説明するために行った配信 チャット欄のコメントに反応するAIずんだもんYouTubeチャンネル「AIずんだもん」では、チャット欄のコメントにAIVTuber・AIずんだもんが応答する配信を行っていた。 AITuberとは、視聴者のコメントに反応して応答を行うキャラクターコンテンツのこと。AI技術を用いることで、まるでVTuberのようなやり取りが疑似的に行わ

                                    「AIずんだもん」3Dモデルが使用中止に 制作者が「不快な内容」と抗議
                                  • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

                                    1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

                                      大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
                                    • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                      昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                        OpenAIのGPT-4oを日本語OCRとして使ってみる
                                      • [第1話]深層のラプタ - 空空北野田 | 少年ジャンプ+

                                        JASRAC許諾第9009285055Y45038号 JASRAC許諾第9009285050Y45038号 JASRAC許諾第9009285049Y43128号 許諾番号 ID000002929 ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。

                                          [第1話]深層のラプタ - 空空北野田 | 少年ジャンプ+
                                        • NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体何なのか?

                                          NVIDIAが2024年5月15日に、経済産業省の助成や国内の主要クラウド企業との協力により、日本の生成AIインフラの構築を推進し、自国のデータを自国のAIで活用する「ソブリンAI」の基盤作りを強化していくこと発表しました。 NVIDIA to Help Elevate Japan’s Sovereign AI Efforts Through Generative AI Infrastructure Build-Out | NVIDIA Blog https://blogs.nvidia.com/blog/japan-sovereign-ai/ NVIDIA、生成AIインフラ構築をとおして日本のソブリンAIの取り組みを支援 | NVIDIAのプレスリリース https://prtimes.jp/main/html/rd/p/000000466.000012662.html NVIDIAは今

                                            NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体何なのか?
                                          • アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

                                            アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援 アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.

                                              アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援
                                            • 「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】

                                              主催の清風明育社は、コンピュータ専門学校「清風情報工科学院」を運営する学校法人。他ににじジャーニーの提供元や大阪府教育委員会などが協賛しているという。また、公式サイトには協力先として日本マイクロソフトの名前を記載している。当初は協賛にワコムも記載していたが、5月13日にネット上で批判の声が大きくなった後、同日中に記載がなくなった。 清風明育社は、コンテスト開催の背景について「(生成AIは)有料利用が前提とされることが多いため、若年層は手が出しにくい」「無料で利用できる高品質な生成AIアートのツールに触れることが、進路選択・職業選択において価値ある体験になる」と説明していた。 一方コンテストに対してはいくつかの批判も。まず「入賞作品の著作権は主催者に帰属する」点については「成果物を奪うつもりか」という批判が見られた。また、協賛社一覧にワコムの名前があったことから、同社に対し「クリエイター向け

                                                「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】
                                              • Googleは対話型AI「Bard」のミスで時価総額1000億ドルが吹き飛ぶ、現実味を帯びる生成AI倒産 【生成AI事件簿】顧客からの問い合わせに誤回答、社内規則や契約書類で重大ミス、大切な場面で失敗して評判失墜など | JBpress (ジェイビープレス)

                                                生成AIを活用する企業は増える一方だが、それとともに、AIの間違いによって損害を被る企業も増えている。 エア・カナダはチャットボットの誤回答で賠償金を支払うはめに。別の企業は生成AIが作成した解雇合意書に重要な項目が欠落していたため、高額な和解金を支払わなければならなくなった。 企業に求められるのは、生成AIは間違いを犯すという前提に基づいた準備や行動。AIが間違えているかどうか分からない領域では活用すべきではない。 (小林 啓倫:経営コンサルタント) チャットボットで損害を被ったエア・カナダ 企業内でのAI活用が加速している。社員や顧客と自然な言葉でやり取りできる生成AIが登場したことで、AIを応用できる業務が増え、具体的な成果も見えやすくなったためだ。 たとえば、カナダで1855年に設立され、現在では同国で最大の規模を誇るTD銀行(Toronto-Dominion Bank)は、コンタ

                                                  Googleは対話型AI「Bard」のミスで時価総額1000億ドルが吹き飛ぶ、現実味を帯びる生成AI倒産 【生成AI事件簿】顧客からの問い合わせに誤回答、社内規則や契約書類で重大ミス、大切な場面で失敗して評判失墜など | JBpress (ジェイビープレス)
                                                • OpenAI、次世代AIモデル「GPT-4o」を発表

                                                  日本時間2024年5月14日未明、OpenAIは新たなフラッグシップモデル「GPT-4o」を発表しました。このモデルは、音声、視覚、テキストのリアルタイム処理を可能とし、従来のAIモデルを大きく上回る性能を誇ります。OpenAIのCTOであるミラ・ムクティ氏は、「GPT-4oは、人間とマシンのインタラクションの未来を大きく変える一歩です。このモデルにより、コラボレーションがはるかに自然で簡単になります」と述べました。 「GPT-4o」の主な特徴を以下にまとめました。 他のモデルを凌駕する性能 GPT-4oは、OpenAIの以前のモデルであるGPT-4 Turboや、ライバル会社のClaude 3 Opusなどの大規模言語モデルと比較して、頭ひとつ抜けた性能向上を実現しました。サム・アルトマンCEOは、今年4月に "Chatbot Arena" でgpt2というコードネームでテストされていた

                                                    OpenAI、次世代AIモデル「GPT-4o」を発表
                                                  • グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

                                                      グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
                                                    • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

                                                      こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                                                        ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
                                                      • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性(アスキー) - Yahoo!ニュース

                                                        PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀です。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。 【もっと写真を見る】 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカル

                                                          まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性(アスキー) - Yahoo!ニュース
                                                        • AI発明の新技術、特許と認めず 東京地裁「人間に限定」

                                                          人工知能(AI)が発明した新技術が特許として認められるかどうかが争点となった訴訟があり、東京地裁は16日、知的財産基本法などに照らし「発明者は人間に限られる」として、米国籍の出願者の請求を棄却する判決を言い渡した。中島基至裁判長は一方で、現行法の制定時にAIの発達が想定されていなかったとし、国民的議論で新たな制度設計をすることが相当だと言及した。 判決によると、出願者は数年前に、発明者を「ダバス、本発明を自律的に発明した人工知能」と記載し、特定装置に関する特許を出願。特許庁は「発明者として記載できるのは人に限られる」として修正を命じたが応じなかったため、出願を却下した。 中島裁判長は「発明は人間の創造的活動により生み出されるものと定義される」と指摘。特許庁の判断は適法と結論付けた。 その上で、現行法の解釈では「AIがもたらす社会経済構造の変化を踏まえた的確な結論を導き得ない」と指摘。AIに

                                                            AI発明の新技術、特許と認めず 東京地裁「人間に限定」
                                                          • Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も

                                                            基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。 生成AI搭載検索エンジン「AI Overview」(旧SGE) 「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」(SGE)を改称し、改善したもの。 詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。 マルチステップリーゾニング(多段階推論)で、1つの質問で複数ステップの結果を提示する。 例として、ピラティスにつ

                                                              Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も
                                                            • AI、世界の雇用に影響 「津波」のよう=IMF専務理事

                                                              国際通貨基金(IMF)のゲオルギエワ専務理事は13日、人工知能(AI)が「津波」のように世界の労働市場を襲っているという認識を示した。2023年12月撮影(2024年 ロイター/Dado Ruvic) [チューリヒ 13日 ロイター] - 国際通貨基金(IMF)のゲオルギエワ専務理事は13日、人工知能(AI)が「津波」のように世界の労働市場を襲っているという認識を示した。 ゲオルギエワ氏はチューリヒで開催されたイベントで、AIが今後2年間で先進国の雇用の60%、世界の雇用の40%に影響を与える公算が大きいと指摘。「人々や企業が備える時間はほとんど残されていない」とし、「うまく管理できれば生産性は飛躍的に向上する可能性がある。しかし、誤情報の増幅に加え、社会の不平等が拡大する恐れもある」と述べた。 世界の経済情勢については、コロナ禍やウクライナでの戦争に言及し、衝撃を受けやすい状況になってい

                                                                AI、世界の雇用に影響 「津波」のよう=IMF専務理事
                                                              • 「人とAIの“模倣”は本質的に同じ」Rubyの父・まつもとゆきひろに聞く、技術の進化と“模倣”の関係 レバテックラボ(レバテックLAB)

                                                                「人とAIの“模倣”は本質的に同じ」Rubyの父・まつもとゆきひろに聞く、技術の進化と“模倣”の関係 2024年5月14日 一般財団法人Rubyアソシエーション 理事長/Ruby開発者 まつもと ゆきひろ(松本行弘) プログラミング言語Rubyの生みの親。株式会社ネットワーク応用通信研究所フェロー、一般財団法人Rubyアソシエーション理事長、NPO団体軽量Rubyフォーラム理事長などを務める。島根県松江市名誉市民。 近年、大量のデータから文章や画像を生み出す生成AIに注目が集まる中、改めて「模倣」が果たす役割を問い直そうという動きが広がっているように見受けられます。実際に、人間はこれまで、既存の技術を「模倣」しながら新しい技術をつくりだし、その繰り返しによって発展を遂げてきました。 世界中のプログラマーから支持を集める「Ruby」も、他のプログラミング言語のさまざまな要素を採り入れて誕生し

                                                                  「人とAIの“模倣”は本質的に同じ」Rubyの父・まつもとゆきひろに聞く、技術の進化と“模倣”の関係 レバテックラボ(レバテックLAB)
                                                                • 自家中毒に陥る生成AI(八田真行) - エキスパート - Yahoo!ニュース

                                                                  生成AIとメディア企業の連携ChatGPT等で知られるOpenAIが、世界最大の掲示板サイトであるRedditとの連携を発表した(gihyo.jpの記事)。アナウンスには「OpenAIはRedditのデータAPIにアクセスし、Redditからリアルタイムで構造化されたユニークなコンテンツを獲得します」とあるので、Redditへの投稿を大々的に学習対象とするということのようである。 生成AIの性能改善で鍵となるのは学習データだが、最近ではトレーニングに使えるデータが枯渇しつつある。人間にとってはウィキペディアやワールド・ワイド・ウェブはとうてい汲み尽くせない広大な知の海だが、それでもAIは学び尽くしてしまったのだ。そこで目が向くのが有料コンテンツだが、OpenAIはニューヨーク・タイムズ等にコンテンツの無断使用で訴えられており、そうしたリスクを極力避けるためにもデータの供給源としてメディア企

                                                                    自家中毒に陥る生成AI(八田真行) - エキスパート - Yahoo!ニュース
                                                                  • ChatGPT、GoogleドライブやOneDriveとデータ連携可能に

                                                                    米OpenAIは5月16日(現地時間)、ChatGPTに「Google Drive」「OneDrive」といったクラウドストレージとのデータ連携機能を追加すると発表した。各ストレージから直接ChatGPTにデータをアップロードし、表やグラフを作れるという。 ChatGPTに作らせた表やグラフの編集機能も強化する。例えば表の一部分を指定し、その部分だけに関して質問したり、クリックで色を変えたりできるようになるという。 新機能はいずれも、ChatGPTの有料サブスクリプション「ChatGPT Plus」「Team」「Enterprise」のユーザーに対し、今後数週間以内に提供する予定。13日に発表したばかりの新モデル「GPT-4o」で利用可能になるという。 OpenAIは新機能のデモとして、Google Drive内からスプレッドシートを直接ChatGPTにアップロードし、プレゼンテーション用

                                                                      ChatGPT、GoogleドライブやOneDriveとデータ連携可能に
                                                                    • もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用

                                                                      生成AI(人工知能)の活用で、どうやら日本は欧米などの海外から後れを取っているわけではなさそうだ。「むしろ私の感触では、日本の方が進んでいるかもしれない」――。2024年3月、生成AIに関するイベントでそう話した講演者の発言に、招聘(しょうへい)した筆者自身が少し驚いた。デジタル活用の不十分さがよく指摘される日本にあって、こと生成AI活用に関しては先進的だというのだ。 たしかに日本の積極的な取り組みを示す資料がある。PwC Japanグループは2024年3月19日、「第27回CEO意識調査」に基づく生成AI活用の現状と日本の状況分析を公表した。その関連資料には、「日本は生成AIの業務活用において主要各国に先行。背景にあるのは事業継続への危機感、サイロ化文化と生成AIとの親和性の高さ」と記されている。 毎年恒例のCEO(最高経営責任者)調査の中で、自社の業務に生成AIがどれだけ受け入れられて

                                                                        もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用
                                                                      • 2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁

                                                                        デジタル庁では、デジタル社会の実現に向けた重点計画(令和4年6月7日閣議決定)を踏まえ、AIの実態と動向を把握し、リスクと必要な対応策を特定したうえで、官民における適切な活用の検討を進めています。 昨今の生成 AIなどの技術革新により、さまざまな利点を得られるようになってきており、政府としても、このような技術の動向を見極めつつ、関係省庁における生成AIの業務利用について、第10回デジタル社会推進会議幹事会・書面開催など議論を重ねてきました。 これまでの議論の経緯も踏まえ、デジタル庁では、2023年12月より生成AIの適切な利活用に向けた技術検証を実施しました。2023年度の検証結果の全体的な内容と、検証で得られた具体的な生成AIへの入力文のサンプル、一部検証に用いたテストケースを公開します。 技術検証の目的今後の政府情報システムへの生成AI利活用に向けて以下のような具体的な知見を得ることを

                                                                          2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁
                                                                        • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

                                                                          OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

                                                                            新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
                                                                          • 生成AI“急速普及”電力需要が増加?どうなる今後のエネルギー | NHK

                                                                            「皆さんがスマートフォンで何かを検索するだけでデータセンターのコンピューターが働いている」 国内の電力需要は減少傾向にありましたが、生成AIの急速な普及などに伴い、一転して増加が見込まれています。 こうした中、国の中長期的なエネルギー政策の指針「エネルギー基本計画」の見直しの議論が始まりました。 目次 データセンター建設相次ぐ なぜ? 生成AIの急速な普及 電力需要に影響も

                                                                              生成AI“急速普及”電力需要が増加?どうなる今後のエネルギー | NHK
                                                                            • 「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?

                                                                              米OpenAIは5月13日(現地時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。このモデルの詳細は別記事にゆずり、本稿ではモデル名の読み方とその由来、「声」についてのうわさを紹介しよう。 oはomniのo GPT-4oは「ジーピーティーフォーオー」と読む。oは「omni」のo。omni(オムニ)は「オムニバス」「オムニチャンネル」などの日本語にもなっているように、すべて、全体、全方位などを表す言葉だ。 GPT-4oが、テキスト、音声、画像の任意の組み合わせを入力として受け入れ、テキスト、音声、画像の任意の組み合わせの出力を生成するマルチモーダルなAIであることを表している。 女性の声は映画「Her」に似ている? GPT-4o発表のライブストリームデモでは、OpenAIのミラ・ムラティCTO(最高技術責任者)とエンジニアがiPhoneに搭載されたGPT-4oと会話する形で

                                                                                「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?
                                                                              • AutodeskがAIによる3Dモデル生成新技術を発表するも、「ポリゴン数多すぎ」として実用性に疑問集まる。開発初期段階ゆえか盛り盛りポリゴン - AUTOMATON

                                                                                ホーム ニュース AutodeskがAIによる3Dモデル生成新技術を発表するも、「ポリゴン数多すぎ」として実用性に疑問集まる。開発初期段階ゆえか盛り盛りポリゴン 全記事ニュース

                                                                                  AutodeskがAIによる3Dモデル生成新技術を発表するも、「ポリゴン数多すぎ」として実用性に疑問集まる。開発初期段階ゆえか盛り盛りポリゴン - AUTOMATON
                                                                                • Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                                                  2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第46回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ LSTMの進化形「xLSTM」登場。Transformerと同等かそれ以上の性能 Google、タンパク質を予測するモデル「AlphaFold 3」発表 Googleが“未来予知”する時系列予測AI基盤モデル「TimeFM」を開発。金融や気象、交通などの一歩先を予測 Llama3 70Bと同等の性能を示す、オープンソース大規模言語モデル「DeepSeek-V2」 IBM、コーディング専用AIモデル「Granite Code Models」を開発 LSTMの進化形「xLSTM」登場。Tra

                                                                                    Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge