生成AI界隈で話題になっているAIサービス「Dify.AI」がなかなか面白いですよ。Dify.AIは、スタートアップの米LangGeniusが用意している大規模言語モデル(LLM)用のWebUI環境を利用して、いろいろなシステムを組み込むことで、プログラムを書くことなく簡単にチャットbotなどのネイティブAIアプリを開発できるサービスです。 Difyは大きく「チャットボット」、「エージェント」、「ワークフロー」の3つの機能に分かれており、簡単なチャットボットから、複数のLLMを組み合わせた複雑な動作をさせるように設計するものまで、多様なアプリを開発することが可能です。ChatGPTから、Claude 3、Geminiなどの主要なLLMをAPIから呼び出すことができるので、それらを組み合わせてサービスを作ることも可能です。例えばOpenAIのAPIキーを生成してDifyに入力すると「GPT-
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し
5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。
NVIDIAが2024年5月15日に、経済産業省の助成や国内の主要クラウド企業との協力により、日本の生成AIインフラの構築を推進し、自国のデータを自国のAIで活用する「ソブリンAI」の基盤作りを強化していくこと発表しました。 NVIDIA to Help Elevate Japan’s Sovereign AI Efforts Through Generative AI Infrastructure Build-Out | NVIDIA Blog https://blogs.nvidia.com/blog/japan-sovereign-ai/ NVIDIA、生成AIインフラ構築をとおして日本のソブリンAIの取り組みを支援 | NVIDIAのプレスリリース https://prtimes.jp/main/html/rd/p/000000466.000012662.html NVIDIAは今
スタンフォード大学のクリストファー・レ教授率いる研究チームがGPUを最大限に活用して一定時間当たりの演算量を最大化するためのドメイン固有言語(DSL)「ThunderKittens」をリリースしました。 ThunderKittens: A Simple Embedded DSL for AI kernels · Hazy Research https://hazyresearch.stanford.edu/blog/2024-05-12-quick-tk GPUs Go Brrr · Hazy Research https://hazyresearch.stanford.edu/blog/2024-05-12-tk 研究チームはNVIDIA H100を使用し、GPU使用率の最大化に取り組みました。H100はTensorコアを使用する半精度行列乗算計算の性能が989TFLOPSであり、その他
kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます.人生を楽しく生きよう(New!) kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41
Googleは現地時間2024年5月14日に開催された開発者向けイベント「Google I/O」で、簡単なプロンプトでループ音源を作成したり、メロディのジャンルを変更したり、複雑なテキストからメロディを提案したりできるAIツール「Music AI Sandbox」を発表しました。複数のミュージシャンがMusic AI Sandboxに取り組む様子や、Music AI Sandboxで作成したデモ音源も公開されています。 These tools allow users to create new instrumental sections from scratch, transfer styles between tracks, and much more. You can listen to brand new demo recordings created as part of thes
OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva
1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の
5月15日、Googleは新しいGemini 1.5 Proおよび1.5 Flashモデルを発表した。 昨年12月に初公開されたGemini 1.0モデルに続き、2月には1百万トークンのコンテキストウィンドウを備えたGemini 1.5 Proがリリースされ、さらなる機能拡張が行われてきた。今月は、Gemini 1.5 Proの改善に加えて、新しい1.5 Flashモデルが導入された。 Gemini 1.5 Proの改良と新しい1.5 Flashモデル Gemini 1.5 Pro: 翻訳、コーディング、推論などの主要な使用ケースにおいて一連の品質向上が行われ、より広範で複雑なタスクにも対応可能である。 Gemini 1.5 Flash: この小型モデルは、応答時間が重要な高頻度タスクに最適化されている。 利用可能性: 両モデルはプレビュー版として本日より200以上の国と地域で利用可能であ
2023年11月にあった那覇市長定例記者会見。沖縄の言葉で「はいさい ぐすーよー。ちゅーうがなびら(こんにちは皆さん。ご機嫌いかがでしょうか)」から始まった会見は、市の業務での生成AI本格導入に向けて「那覇市生成AI活用方針」を策定したというコメントを読み上げていた。「いっぺー にふぇーでーびる(ありがとうございました)」と締めたところで、知念覚市長がこう付け加えた。 「なお、このコメントもですね、生成AIによって下書きを作成し、職員が校正を行って作っております」 沖縄県内ではいち早く生成AI活用を導入した那覇市。同市DX推進室の長嶺伶生さんは「たたき台を手直しするだけで作れるので負担は少なくなっています」とそのメリットを挙げる。 住民の個人情報などデリケートな情報も多く扱う行政の現場。その利用にあたっては慎重に活用方針とガイドラインを作成し、日々の業務活用につなげている。行政が生成AIな
筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第46回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ LSTMの進化形「xLSTM」登場。Transformerと同等かそれ以上の性能 Google、タンパク質を予測するモデル「AlphaFold 3」発表 Googleが“未来予知”する時系列予測AI基盤モデル「TimeFM」を開発。金融や気象、交通などの一歩先を予測 Llama3 70Bと同等の性能を示す、オープンソース大規模言語モデル「DeepSeek-V2」 IBM、コーディング専用AIモデル「Granite Code Models」を開発 LSTMの進化形「xLSTM」登場。Tra
元ピクサーのアニメーターが語る「ハリウッドでAIが通用しない理由」2024.05.11 11:0014,448 Matt Novak - Gizmodo US [原文] ( そうこ ) 昨今、AIが生成した動画が良くも悪くも常に話題になっています。ネタ動画を作るだけではなくて、これでプロの現場・ハリウッドも劇的に変わるのではないか?という声も聞こえてきます。 その問いに「No」と答えるのは、『トイ・ストーリー』や『ファインディング・ニモ』などの制作に携わった、元Pixarアニメーターのクレイグ・グッドさん。 グッドさんいわく、AIをプロの現場で使うには、関係者全員をイラつかせてしまう大きな欠点があるといいます。それは、微調整が効かないこと。 生成AIは、作りたいものをテキストで入力するだけで画像や動画を作り出します。何もないゼロ状態から作り出されるものとして、正直驚くべき出来です。ただ、現
米アップルが対話型人工知能(AI)「ChatGPT」を開発した米オープンAIの技術をiPhoneに採用することで合意に近づいている。事情に詳しい複数の関係者が明らかにした。自社デバイスに人工知能(AI)機能を付加する広範な取り組みの一環だという。 非公開情報だとして、これら関係者が匿名で明らかにしたところでは、両社はアップルの次期iPhone用基本ソフト(OS)「iOS 18」へのChatGPT機能の統合に向け合意条件を最終調整している。アップルはまた、アルファベット傘下のグーグルと同社のチャットボット「Gemini」のライセンスについて協議中。いずれの交渉も合意に至っていない。 アップルとオープンAIの合意がまとまれば、アップルは来月発表する予定の新たなAI機能に人気の高いChatGPTを含めることができる。ブルームバーグは4月、両社の協議が再開されたと報じた。ただ、すぐに合意が発表され
対話型人工知能(AI)「ChatGPT」を開発した米オープンAIは、米太平洋時間13日午前10時(日本時間14日午前2時)にライブ配信を通じて製品アップデートを発表するとウェブサイトに発表した。AI界の巨人がどのような大型リリースを計画しているのか、臆測を呼んでいる。 オープンAIはこのイベントで検索プロダクトを発表することはないとしている。アルファベット傘下のグーグルとAI検索スタートアップ(新興企業)のパープレキシティに対抗する機能を、オープンAIは開発中だ。 発表は人気の「ChatGPT(チャットGPT)」とそのAIモデルのアップデートが中心になる。GPT-4のリリースからすでに1年余りが経過。新しいモデルの発表が待望されている。同社はしかし、このイベントはシリーズ最新GPT-5のローンチではないという。 サム・アルトマン最高経営責任者(CEO)は10日、ソーシャルメディア「X(旧ツ
OpenAIがAIを活用した検索サービス、もしくはChatGPTがウェブから情報を入手できるようにする拡張機能の発表を目前に控えていると、複数のメディアが報じました。発表は、Googleの年次カンファレンスであるGoogle I/O 2024が開催される2024年5月14日の前日に行われると予想されています。 OpenAI plans to announce Google search competitor on Monday, sources say | Reuters https://www.reuters.com/technology/openai-plans-announce-google-search-competitor-monday-sources-say-2024-05-09/ Apple to Power iOS 18 AI Features With In-House
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く