並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 486件

新着順 人気順

LLM&GPTの検索結果161 - 200 件 / 486件

  • マイクロソフト最新SLM「Phi-3」 メタ「Llama 3」あっさり抜く

    マイクロソフトは4月23日、生成AI向けの小規模言語モデル(SLM)「Phi-3-mini」を発表した。 Phi-3-miniは、パラメーター数が38億の比較的小型軽量な言語モデル。単純なタスクに適しており、特定のニーズに合わせて容易に微調整できる点を特徴とする。スマートフォンや自動車のコンピューター、リモートカメラといったリソースの少ないデバイスでも利用できるほか、オフライン動作にも対応し、ネット接続が困難な地域でも生成AIの恩恵を受けられるという。 同社が実施したベンチマークテストでは、パラメーター数で勝るメタの「Llama 3-8B-in」(80億)や、グーグルの「Gemma 7B」(70億)に対して、より優れた性能を発揮。特にLlama 3に関しては、4月18日のリリースからわずか5日でPhi-3-miniに追い越される形となった。 ただしPhi-3-miniも万能ではなく、広範な

      マイクロソフト最新SLM「Phi-3」 メタ「Llama 3」あっさり抜く
    • 特定のワードが大学の論文で出現しまくっておりChatGPTなどの生成AIが使用されたことを示す危険信号となりつつあることが明らかに

      学生の論文でAIが使用されていないかどうかを調査する「論文コンサルタント」によると、「タペストリー」「ビーコン」「充実したカリキュラム」「尊敬する教授陣」「活気に満ちた学術コミュニティ」といった特定のワードが、論文執筆にChatGPTをはじめとする生成AIツールを利用した兆候となりつつあるそうです。 Did You Use ChatGPT On Your School Applications? These Words May Tip Off Admissions - Slashdot https://tech.slashdot.org/story/24/02/06/1645228/did-you-use-chatgpt-on-your-school-applications-these-words-may-tip-off-admissions 2024年の冬および春は、ChatGPTやそ

        特定のワードが大学の論文で出現しまくっておりChatGPTなどの生成AIが使用されたことを示す危険信号となりつつあることが明らかに
      • Stability AI Japanが公開した30億パラメーターの日本語向けLLMを動かしてみた【生成AIストリーム】

          Stability AI Japanが公開した30億パラメーターの日本語向けLLMを動かしてみた【生成AIストリーム】
        • Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表

          英Stability AIは4月17日(現地時間)、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。 Stable Diffusion 3に「Awesome artwork of a wizard on the top of a mountain, he's creating the big text "Stable Diffusion 3 API" with magic, magic text, at dawn, sunrise.」(夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に

            Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
          • プロンプトだけで一歩先へ:AI画像生成でセンスをみがこう【生成AIストリーム】

              プロンプトだけで一歩先へ:AI画像生成でセンスをみがこう【生成AIストリーム】
            • ジム・ケラーのAIチップ企業「Tenstorrent」がAI推論に特化したPCIe拡張カード「Grayskull e75」と「Grayskull e150」をリリース&日本のLSTCやRapidusとの協力も発表

              RyzenのZenアーキテクチャやiPhone向けSoCの設計に携わったアーキテクトのジム・ケラー氏がCEOを務めるAIスタートアップのTenstorrentが、2024年3月5日にAI推論に特化したPCIe拡張カード「Grayskull e75」と「Grayskull e150」を発表しました。 Cards - Tenstorrent https://tenstorrent.com/cards/ Today we are officially launching our Grayskull Dev Kit, available for purchase on our website. This is our 1st gen AI PCIe card - an inference-only hardware kit we are releasing alongside TT-Metalli

                ジム・ケラーのAIチップ企業「Tenstorrent」がAI推論に特化したPCIe拡張カード「Grayskull e75」と「Grayskull e150」をリリース&日本のLSTCやRapidusとの協力も発表
              • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

                OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

                  新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
                • OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかに

                  OpenAIが開発する大規模言語モデル(LLM)のGPT-4は、一般公開されている脆弱(ぜいじゃく)性を悪用してサイバー攻撃を成功させることが可能であることが最新の研究により明らかになりました。 [2404.08144] LLM Agents can Autonomously Exploit One-day Vulnerabilities https://arxiv.org/abs/2404.08144 GPT-4 can exploit real vulnerabilities by reading advisories • The Register https://www.theregister.com/2024/04/17/gpt4_can_exploit_real_vulnerabilities/ LLM Agents can Autonomously Exploit One-da

                    OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかに
                  • 【GPTs(GPT Builder)】ノーコードで自分専用のChatGPTを開発できる!使い方や活用事例を紹介 | WEEL

                    日本時間11月7日午前3時にOpenAI DevDayが開催され、ChatGPTの新機能「GPTs」が新たにリリースされました。 この機能を活用すれば、ChatGPT上で手軽にGPT搭載ツールを作れるようになります。 しかも、自然言語のみでツールを作成できるので、プログラミングに関する難しい知識は一切必要ありません! 今回の記事では、GPTsの機能や使い方、活用事例をご紹介します。 最後まで目を通していただくと、GPTsを使ったAI開発の手法を理解できるので、今後はシステム開発を外注する必要がなくなるかもしれません。 ぜひ、最後までご覧ください! なお、OpenAI DevDayで公開されたGPTs以外の最新ツールを知りたい方はこちらの記事をご覧ください。 →OpenAI DevDay日本最速レポ!GPT-4 Turbo、GPTs、Assistant APIとは?ChatGPT最新情報徹底

                    • ChatGPT の Fine-tuning を試したけど上手くいかなかった話

                      これはなに? 新しくリリースされた ChatGPT (GPT-3.5 Turbo) の Fine-tuning を試してみたメモ。 ChatGPTに最新の知識や専門知識を注入できるかどうかをテストしてみた。 結局、自分が想定した動きにはできなかったので記事にして供養します🙏 tl;dr 一晩試してみた程度では、ChatGPTに最新の知識を教え込む目的での Fine-tuning はうまく動かなかった。 OpenAIが提示している想定のユースケースとずれている利用方法なので、もう少しトライしても上手くいかないんじゃないかなと思う。 学習データに入れた質問をそのまま投げてあげると回答できることもある程度だった。(このままでは到底使えない…) 出力のトーンや言語の指示にプロンプトの文字数を大量に使っていて、それを大幅に削減したい、という時には使えそうだなという印象だった。 学習データの自動生成

                        ChatGPT の Fine-tuning を試したけど上手くいかなかった話
                      • AIに「『スター・トレック』の船長になりきって」と指示すると数学の問題でより良いパフォーマンスが発揮されることを研究者が発見

                        by JD Hancock 「大規模言語モデル(LLM)にSFドラマ『スター・トレック』の登場人物になりきるようなプロンプトを入力すると、数学の問題を解く能力が向上した」という論文が、未査読論文リポジトリであるarXivに掲載されました。 あ [2402.10949] The Unreasonable Effectiveness of Eccentric Automatic Prompts https://arxiv.org/abs/2402.10949 AIs get better at maths if you tell them to pretend to be in Star Trek | New Scientist https://www.newscientist.com/article/2419531-ais-get-better-at-maths-if-you-tell-th

                          AIに「『スター・トレック』の船長になりきって」と指示すると数学の問題でより良いパフォーマンスが発揮されることを研究者が発見
                        • Metaが大規模言語モデル「LLaMA」を発表、GPT-3に匹敵する性能ながら単体のGPUでも動作可能

                          MetaのAI研究組織であるMeta AI Researchが、大規模言語モデル「LLaMA(Large Language Model Meta AI)」を2023年2月24日に発表しました。Meta AI Researchによれば、LLaMAはOpenAIのGPT-3よりもパラメーター数がずっと小さく、単体GPUでも動作可能でありながら、ベンチマークテストの一部ではGPT-3を上回ったとのことです。 LLaMA: Open and Efficient Foundation Language Models - Meta Research https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ Meta unveils a new large languag

                            Metaが大規模言語モデル「LLaMA」を発表、GPT-3に匹敵する性能ながら単体のGPUでも動作可能
                          • 言語生成AIの入力文、最初と最後に“重要情報”を入れた方が良い結果に 米スタンフォード大などが検証

                            このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米スタンフォード大学などに所属する研究者らが発表した論文「Lost in the Middle: How Language Models Use Long Contexts」は、大規模言語モデル(LLM)の性能について、入力コンテキストの長さや関連情報(答えを含む文書)の位置を変えることでどのような影響があるかについて調査した研究報告である。 調査結果から、関連情報を入力コンテキストの最初に記入すると最も高い精度が得られ、入力コンテキストの最後に関連情報を記入すると次に高い精度が得られることが分かった。一方、関連情報を中央に配置すると精度が

                              言語生成AIの入力文、最初と最後に“重要情報”を入れた方が良い結果に 米スタンフォード大などが検証
                            • ロボット工学や自動運転などで顕在化するAI課題を解決、MIT発「Liquid Neural Networks」とは何か - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                              現在の人工知能(AI)を取り巻く環境では、 大規模言語モデル(LLM)の話題から、ますます大規模なニューラルネットワークの開発競争が起きている。しかし、すべてのアプリケーションが、大規模なディープラーニングモデルの計算量とメモリの要求をできるわけではない。 このような環境の制約が、いくつかの興味深い研究の方向性につながっている。MIT(マサチューセッツ工科大学)の CSAL(コンピュータ科学・人工知能研究所)の研究者が開発した新しいタイプのディープラーニングアーキテクチャ「Liquid Neural Networks」は、特定の AI 問題に対して、コンパクトで適応性が高く、効率的なソリューションを提供する。これらのネットワークは、従来のディープラーニングモデルに内在する課題のいくつかに対処するように設計されている。 Liquid Neural Network は AI の新たなイノベーシ

                                ロボット工学や自動運転などで顕在化するAI課題を解決、MIT発「Liquid Neural Networks」とは何か - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                              • ChatGPTで変わった優秀人材像、ただしプロンプト技術だけでは「通用しない」ワケ

                                生成AIが影響しやすい職種 オープンAIと米ペンシルバニア大が2023年3月に共同発表した論文では、大規模言語モデルは「インターネットやトランジスタ、エンジン、電気などに匹敵する数十年に一度の技術」と位置づけられています。 生成AIの登場によってこれまで人間が手がけてきた仕事はどの程度、自動化されることになるのでしょうか。 ゴールドマン・サックスの分析では、米国内の現在の作業タスクの1/4がAIによって自動化される可能性があるといいます。特に事務系(46%)と法務系(44%)の職業でその割合が高く、建設業(6%)やメンテナンス業(4%)といった労働集約的な職業ではその割合が低いとされています。 事務サポートや法務など、決まったルールや過去の事例に基づいて進められるような業務においては、AIに取って代わられる作業の割合が特に大きいといえるでしょう。

                                  ChatGPTで変わった優秀人材像、ただしプロンプト技術だけでは「通用しない」ワケ
                                • LLMに非線形的な思考を与えてCoTを上回る性能を引き出す手法『IEP』と実行プロンプト CoTと組合せでさらに強力になる場合も | AIDB

                                  CoTの特徴と単一で使用する際の限界 Chain-of-Thought(CoT)は、LLMに推論能力を付与するための一般的な手法です。CoTは線形的な(直線的な)推論を実行させます。簡単に言うと「Aが真ならばBが真」といった形の推論を行わせることが多いです。 CoTは、問題解決の過程を一連のステップに分解し、それぞれのステップで特定の推論を行わせます。例えば、「雨が降っているなら、傘を持つべきだ」というような線形的な推論がCoTの一例です。質問応答(QA)タスクなどでよく使用されます。 しかし、このアプローチにはいくつかの問題点があります。 誤差の伝播 CoTは一つの思考のステップが次のステップに影響を与えるという連鎖的な構造を持っています。そのため、中間のステップで生じたわずかな誤差が、連鎖全体に伝播してしまう可能性があります。 CoTの中間ステップの評価は困難であり、最終的な答えだけが

                                    LLMに非線形的な思考を与えてCoTを上回る性能を引き出す手法『IEP』と実行プロンプト CoTと組合せでさらに強力になる場合も | AIDB
                                  • 生成AIでGPU不足深刻化、NVIDIA新投入のGH200とは? メタやテスラが抱える驚きのGPU数

                                    現在シリコンバレーで最も注目される話題は「GPU不足」といわれている。生成AIへの関心が高まる中、大規模言語モデルの開発が活発化し、それに伴いGPUをめぐる取得競争が激化しているためだ。そのため、NVIDIAが新たに発表した「GH200」にも注目が集まる。GH200はどんなGPUになるのか。そもそもなぜGPUが不足しているのか、現行GPU「H100」や「A100」は誰が、何個取得したのか、ChatGPTの開発にGPUはどれほど必要なのか。GPU関連の注目トピックを紹介しよう。 バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上

                                      生成AIでGPU不足深刻化、NVIDIA新投入のGH200とは? メタやテスラが抱える驚きのGPU数
                                    • GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー

                                      文章生成AIの研究開発が急速に進んでおり、無料で使える大規模言語モデル(LLM)も数多く公開されています。しかし、LLMの動作を実際に試すには高性能なハードウェアや複雑な環境構築が必要なことが多いため、最初から諦めている人も多いはず。無料で公開されている「LM Studio」を使えば、一般的な性能のPCでもコマンド不要で気軽にLLMの動作させられるとのことなので、実際にLM Studioを使ってLLMを使う手順を確かめてみました。 LM Studio - Discover, download, and run local LLMs https://lmstudio.ai/ ◆LM Studioのインストール LM StudioはWindows版とmacOS版が存在するほか、Linux向けのベータ版も存在します。Windowsで使う場合の必要条件は「AVX2に対応したCPU」のみ。近年販売さ

                                        GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー
                                      • ChatGPTはもう古い!?話題のClaude3を徹底解説

                                        こちらのトピックス“生成AI最前線「IKIGAI lab.」”は、学び合うことを目的としたオンラインビジネスコミュニティ「OUTPUT CAMP meets AI」のメンバーで運営しています。 3/20に行われたIKIGAI lab. 初のオンライン無料セミナーに参加してくださった皆様ありがとうございました。 さて、今日は巷で話題のAnthropic社の提供する生成AI、Claude3について解説していきます。

                                          ChatGPTはもう古い!?話題のClaude3を徹底解説
                                        • OpenAIの「超知性」誕生に備える研究チームがGPT-2のような弱いAIモデルでGPT-4のように強力なAIを制御する方法を詳しく説明

                                          チャットAI「ChatGPT」などの開発で知られるOpenAIは、人間よりもはるかに賢いAIである「超知性」が2033年までの10年間で開発されると推測しています。しかし、超知性を確実に制御する方法は現状構築されていません。OpenAIでは「スーパーアライメントチーム」を立ち上げ、超知性を制御するための研究が行われており、その方法を解説しています。 WEAK-TO-STRONG GENERALIZATION: ELICITING STRONG CAPABILITIES WITH WEAK SUPERVISION (PDFファイル)https://cdn.openai.com/papers/weak-to-strong-generalization.pdf Weak-to-strong generalization https://openai.com/research/weak-to-st

                                            OpenAIの「超知性」誕生に備える研究チームがGPT-2のような弱いAIモデルでGPT-4のように強力なAIを制御する方法を詳しく説明
                                          • コマンド不要でLLMのダウンロードから会話までを実行できる無料チャットAIアプリ「Jan」を使ってみた

                                            「Jan」は、大規模言語モデル(LLM)のダウンロードからローカルで動作させて実際にチャットするまでの流れをすべてGUIで実行できるアプリです。便利そうだったので、実際にPCにJanをインストールしてLLMとチャットするまでの手順を確かめてみました。 Jan | Rethink the Computer https://jan.ai/ JanはLLMをダウンロードしてローカルで実行するアプリです。LLMとサクサク会話するには、NVIDIA製GPUを搭載マシンかAppleシリコン搭載Macの使用が推奨されています。今回はGeForce RTX 3090を搭載したWindowsマシンで動作させてみます。 まずは以下のリンクをクリックしてJanのダウンロードページにアクセスします。 Download | Jan | Rethink the Computer https://jan.ai/down

                                              コマンド不要でLLMのダウンロードから会話までを実行できる無料チャットAIアプリ「Jan」を使ってみた
                                            • LLMベースの新しい言語『SUQL』が示唆する「非構造化データのクエリ」を処理するパラダイム | AIDB

                                              スタンフォード大学の研究者たちは、新しいプログラミング言語『SUQL』(Structured and Unstructured Query Language)を開発しました。 この言語は、SQL(Structured Query Language)の概念を拡張し、非構造化データのクエリ処理を可能にする新しいパラダイムを導入しています。構造化データ(例えばデータベース内のデータ)と非構造化テキストデータ(自由形式のテキストなど)の両方を処理する能力を持つ初めての言語として位置づけられています。 『SUQL』の開発は、データソースをより効果的に活用するための手法を模索する研究の一環です。従来の技術では、構造化データと非構造化データを一元的に処理することには課題がありました。 大規模言語モデル(LLM)に基づくプロンプトコンポーネントで構成される『SUQL』は、今後の開発トレンドを牽引する研究と

                                                LLMベースの新しい言語『SUQL』が示唆する「非構造化データのクエリ」を処理するパラダイム | AIDB
                                              • 大規模言語モデルの「幻覚」を軽減する32の最新テクニック バングラデシュなどの研究者らが発表

                                                このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 バングラデシュのIslamic University of Technology、米サウスカロライナ大学、米スタンフォード大学、米Amazon AIに所属する研究者らが発表した論文「A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models」は、大規模言語モデル(LLM)における幻覚(AIが根拠のないコンテンツを生成すること、ハルシネーションともいう)を軽減するための32のテクニック(研究)を紹介した研究報告である。 これらのテ

                                                  大規模言語モデルの「幻覚」を軽減する32の最新テクニック バングラデシュなどの研究者らが発表
                                                • 1つのGPU/CPUで推論可能な超軽量LLM「tsuzumi」を24年3月から提供へ

                                                  NTTは2023年11月、同社が独自開発した大規模言語モデル(LLM)「tsuzumi」を2024年3月から提供開始すると発表した。 tsuzumiのコンセプトについて、NTT 執行役員 研究企画部門長の木下真吾氏は「専門知識を持った、パラメーターサイズの小さなLLMの実現だ。tsuzumiは、パラメーターサイズを抑えつつ、言語学習データの質と量を向上させることで、軽量化と専門性を両立した」と語った。 専門知識を持った軽量LLM「tsuzumi」 tsuzumiは、パラメーターサイズが6億または70億と軽量でありながら、「世界トップクラス」(同社)の日本語処理性能を持つLLMだ。軽量なため、1つのGPUやCPUで推論動作が可能で、学習やチューニングに必要な時間やコストを軽減できるという。日本語/英語に対応する他、表が含まれる誓約書や契約書といった図表文書の視覚読解など、さまざまな形式にも対

                                                    1つのGPU/CPUで推論可能な超軽量LLM「tsuzumi」を24年3月から提供へ
                                                  • Midjourneyがリアルすぎて写真と見分けがつかないレベルに

                                                    Midjourneyがリアルすぎて写真と見分けがつかないレベルに2023.12.26 07:0029,730 Maxwell Zeff・Gizmodo US [原文] ( mayumine ) Midjourney の最新版、「Midjourney V6」登場、過去のバージョンと比較して「よりリアルな画像を生成できる」ようになり、そのクオリティは本物の写真と見分けがつかないほどです。 「Midjourney V6」は現在、Discordで冬休み期間限定配布のアルファ版でのみ利用可能。試すなら今です。 米Gizmodoでも試してみましたが、他のAI画像生成ツールと比べてもクオリティが圧倒的、驚くほどリアルでMidjourney特有のクリエイティビティも健在です。通常、AI画像生成ツールは、リアルかファンタジー、どちらかを選ぶ感じになりますが、「Midjourney V6」はこれまでの中でも最

                                                      Midjourneyがリアルすぎて写真と見分けがつかないレベルに
                                                    • 「サム・アルトマンはたぶん、GPT-4でGPT-5を作る」 深津貴之氏が予想する、人間の脳と同レベルのAIが誕生する時

                                                      「AIとビジネス」をテーマに、業種業態、部署の垣根を超え、産業を活性化するヒントを得るためのビジネスカンファレンス「Gen AI EXPO」(主催:弁護士ドットコム株式会社)。今回は、生成AIのエヴァンジェリストとして活躍し、「深津式プロンプト」を編み出し世に広めた深津貴之氏が登壇した特別セッション「ChatGPT活用術」の模様をお伝えします。プロンプトエンジニアリングで稼げない2つの理由や、人間の脳と同レベルのAIが誕生するタイミングなどが語られました。 前回の記事はこちら AIが進化する中で人間が身につけるべきスキル 田上嘉一氏(以下、田上):どんどん変わっていくので、僕なんかは追いつけないんですけども。AIが進化して自分の壁打ち相手から分身まで至った時に、今後、我々人間はどういったことが必要なのか、どういったスキルを身につけていくのがいいんでしょうかね。 深津貴之氏(以下、深津):ま

                                                        「サム・アルトマンはたぶん、GPT-4でGPT-5を作る」 深津貴之氏が予想する、人間の脳と同レベルのAIが誕生する時
                                                      • GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表

                                                        Googleの研究者が、大規模言語モデル(LLM)に無限の長さのテキストを処理させる手法だという「Infini-attention」に関する論文を発表しました。 [2404.07143] Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention https://arxiv.org/abs/2404.07143 Google’s new technique gives LLMs infinite context | VentureBeat https://venturebeat.com/ai/googles-new-technique-gives-llms-infinite-context/ Google Demonstrates Method to Scale Languag

                                                          GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表
                                                        • OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 | テクノエッジ TechnoEdge

                                                          OpenAIは5月14日、ChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開しました。chat.openai.comにアクセスしてダウンロードリンクが表示されれば利用できます(現在利用できるユーザーはPlusプランの購読者のみ)。ChatGPTアプリはこれでiPhone、Androidに続いてMac版が公開されたことになります。Windows版は年内に登場予定です。 機能としてはiPhoneアプリと同様で、現状ではGPT-4oの音声モデルや、カメラの映像を見ながら音声で対話したりといったことはできません。使われている音声モデルも、従来のものと同じで、遮られても会話をスムーズに続けたりといった機能は実装されていません。歌うこともできません。

                                                            OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 | テクノエッジ TechnoEdge
                                                          • 「“クールな”LLMアプリは簡単に作れるが、リリースレベルは難しい」 Azure OpenAIとCognitive Searchを使ったチャット機能開発

                                                            プロンプティングからOpenAI API、さらには周辺のライブラリやHubのエコシステムまで広く活用の助けになる知見を共有し、みんなで手を動かして楽しむためのコミュニティ「ChatGPT Meetup」。3回目に登壇したのは、吉田真吾氏。HRテックのSaaS「CYDAS PEOPLE」における、ChatGPTを活用したチャット機能開発について発表しました。 HRテックのSaaS「CYDAS PEOPLE」のチャット機能にChatGPTを活用 吉田真吾氏:どうもみなさんこんばんは。今日私からは、本番リリースに向かってLLMアプリケーションを構築している話をしようかなと思います。 第0回(ChatGPT Meetup Tokyo #0)でもお話をしたのですが、私は現在、RAG(Retrieval-Augmented Generation)フローを使ったLLMアプリケーションを作っています。 サ

                                                              「“クールな”LLMアプリは簡単に作れるが、リリースレベルは難しい」 Azure OpenAIとCognitive Searchを使ったチャット機能開発
                                                            • オープンソースで商用利用可能な大規模言語モデル「Llama 2」がReplicateに登場したのでAPI経由で使ってみた

                                                              AIモデルを誰でも簡単にデプロイできるサイト「Replicate」にて、2023年7月18日に公開されたばかりの高性能オープンソースAIモデル「Llama 2」が登場したので早速使ってみました。 Accessing Llama 2 from the command-line with the llm-replicate plugin https://simonwillison.net/2023/Jul/18/accessing-llama-2/ Llama 2のバリエーションの情報や、他のモデルとの性能比較については下記の記事で掲載しています。 Metaが商用可能な大規模言語モデル「Llama 2」を無料公開、MicrosoftやQualcommと協力してスマホやPCへの最適化も - GIGAZINE また、下記の通りLlama 2をブラウザから試せるツールも早速登場しています。 Meta

                                                                オープンソースで商用利用可能な大規模言語モデル「Llama 2」がReplicateに登場したのでAPI経由で使ってみた
                                                              • LLaMAのオープンソース実装OpenLLaMA、3000億トークンでトレーニングされたチェックポイントをリリース

                                                                OpenLM Researchは、米Meta AIが開発した大規模言語モデル「LLaMA(Large Language Model Meta AI)」のライセンスに基づく、オープンソースの大規模言語モデルOpenLLaMAのパブリックプレビューとなる「OpenLLaMA 7B」の、3000億トークンでトレーニングされたチェックポイントを、5月3日(現地時間)にリリースした。 今回リリースされた300Bチェックポイントは、既存の実装と広く互換性を持たせることを目的に、BOSトークンの影響を受けにくくしている。 トレーニングは、1.2兆を超えるトークンを含むLLaMAトレーニングデータセットを再現した、TogetherによるRedPajamaデータセットによって行われており、モデルアーキテクチャ、コンテキスト長、トレーニングステップ、学習率スケジュール、オプティマイザなど、元のLLaMAペーパ

                                                                  LLaMAのオープンソース実装OpenLLaMA、3000億トークンでトレーニングされたチェックポイントをリリース
                                                                • 生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) | テクノエッジ TechnoEdge

                                                                  API経由ながらStable Diffusion 3が利用可能に!今年、2024年2月24日に次世代Stable Diffusion、Stable Diffusion 3が発表された。いろいろな特徴があるのだが、画像品質の向上はもちろんのこと、Stable Diffusion (XL) が苦手だった文字 (但し日本語などは除く) にも対応し、早く使いたかったものの、まだ一般が試せる状態ではなかった。 ところがつい先日の4月17日、Stability AI Developer PlatformのAPI経由で利用可能となったので、使ってみたのが今回の内容となる。 APIを使うにあたって必要なAPI Keyは、Stability AI にアカウントを作ると用意され、自動的に24クレジットが付加される。1枚作って消費するクレジットは以下の通り。 Stable Diffusion 3は1枚6.5クレ

                                                                    生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) | テクノエッジ TechnoEdge
                                                                  • 日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫

                                                                    産業技術総合研究所と東京工業大学の研究チームは12月19日、日本語に強い大規模言語モデル(LLM)「Swallow」を公開した。米Metaが開発したLLM「Llama 2シリーズ」をベースに日本語能力を改善させたもの。ライセンスは「LLAMA 2 Community License」で、研究や商業目的で利用できる。 今回公開したのは、パラメータ数が70億(7B)、130億(13B)、700億(70B)のモデル3種類。Llama 2シリーズが持つ高い言語処理能力を維持しながら日本語能力を強化することを目指した。 このため、AIモデルに日本語の文字や単語などの語彙を追加し、新たに開発した日本語データで継続事前学習(学習済みのLLMに対して追加で事前学習を行う手法で、異なる言語などで言語モデルを活用するときに使われる)を行った。結果、日本語に関するベンチマークデータで、全モデルがベースモデルより

                                                                      日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫
                                                                    • 話題のAI「Command R+」無料iPhoneアプリで試せるように

                                                                      AI関連企業Hugging FaceのJulien Chaumond CTOは4月18日、自身のXアカウントで、AIチャットサービス「HuggingChat」のiOS版アプリを発表した。 we just shipped HuggingChat on iOS 💬 The app is super polished and gives you access to the community's best open AI models, on the go. Give it a try! link to Appstore below ⤵️ pic.twitter.com/ZItn9NLpay — Julien Chaumond (@julien_c) April 18, 2024 HuggingChatは2023年4月、ブラウザー版の提供が始まったオープンソースのチャットAIサービス。メタのL

                                                                        話題のAI「Command R+」無料iPhoneアプリで試せるように
                                                                      • コード生成AIは1兆5,000億ドルの経済価値に、メタは最新のコード生成AI「Code Llama」をリリース、その実力は | AMP[アンプ] - ビジネスインスピレーションメディア

                                                                        コード生成AIがもたらす経済効果 ジェネレーティブAIツール活用による生産性改善が期待されている。マッキンゼーの推計によると、ジェネーティブAIによる自動化が進むと、生産性向上により2045年頃には、最大で4兆4,000億ドルもの経済価値が創出される可能性がある。 業務別で見た場合、ジェネレーティブAIの付加価値が最大となるのは、マーケティング/営業で、7,600億〜1兆2,000億ドルの価値創出につながるとされる。この分野では、パーソナライズされたコンテンツ生成などにより、マーケティングの生産性は5〜15%増加、また営業の生産性も3〜5%向上すると推計されている。 マーケティング/営業に次いで、ジェネーティブAIの恩恵を受けるとみられているのが、ソフトウェア開発だ。自動化によってもたらされる価値は、5,800億〜1兆2,000億ドルに達すると予想されている。コード作成、修正と再構築、原因

                                                                        • AIに「それがファイナルアンサーなの?」「全力を尽くして」といった感情的な命令文を伝えるとパフォーマンスが向上する

                                                                          文章を機械的に処理する大規模言語モデル(LLM)に「自分を信じて」といった感情的な言葉を投げかけると、パフォーマンスが向上することがわかりました。 Large Language Models Understand and Can Be Enhanced by Emotional Stimuli (PDFファイル)https://arxiv.org/pdf/2307.11760.pdf Emotional prompts can enhance AI models across a wide range of tasks https://stackdiary.com/emotionprompts-ai-prompt-study/ Put emotional pressure on your chatbot to make it shine https://the-decoder.com/ga

                                                                            AIに「それがファイナルアンサーなの?」「全力を尽くして」といった感情的な命令文を伝えるとパフォーマンスが向上する
                                                                          • グーグルGemini、法人/デベロッパー向けに展開 サードパーティの最新分析が示すGeminiの実力とは? | AMP[アンプ] - ビジネスインスピレーションメディア

                                                                            大規模言語モデルのランドスケープとグーグルGeminiの位置付け 2023年は、コンシューマ領域における生成AIの利用が爆発的に増えた年となった。同年11月時点の情報によると、OpenAIが展開するChatGPTのアクティブユーザー数は1週間あたり1億人に達したとされる。 これに続き2024年はエンタープライズ(法人)領域における利用が増える見込みだ。 ブルームバーグは2024年1月12日OpenAIのブラッド・ライトキャップCOOの話として、同社が2023年8月に法人向けにリリースした「ChatGPT for Enterprise」に関して、現在260社の顧客がおり、15万人のユニークユーザーが利用していると伝えた。OpenAIはブルームバーグの取材で、法人顧客の具体的な社名には言及していないが、自社ブログでCanva、PwC、Zapierなどの多くの有力企業が利用していることを明らかに

                                                                              グーグルGemini、法人/デベロッパー向けに展開 サードパーティの最新分析が示すGeminiの実力とは? | AMP[アンプ] - ビジネスインスピレーションメディア
                                                                            • GitHub、社内コードを学習させカスタマイズ可能な「Copilot Enterprise」正式サービス開始

                                                                              GitHubは、AIがコードの生成や解説を行うGitHub Copilotの機能を基に、企業などが社内のコードやドキュメントに合わせて学習させカスタマイズ可能なサービス「Copilot Enterprise」を正式版として提供開始したと発表しました。 社内のコードやドキュメントを用いてカスタマイズ GitHub Copilotはオープンソースなどの公開されているソースコードを基に学習しているとされています。そのため、そのままでは社内のライブラリやコーディングルール、ドキュメントなどについての知識を持ちません。 今回正式版となったCopilot Enterpriseは、外部に公開されていない社内のコードやドキュメント、プルリクエストなどを追加でCopilotに学習させることで、社内のコードベースに基づいたCopilotによるコードの生成や、Copilot Chatでの質問に対する回答が可能に

                                                                                GitHub、社内コードを学習させカスタマイズ可能な「Copilot Enterprise」正式サービス開始
                                                                              • Microsoft社のアーキテクトが説く、LLM実装の最前線 登場から今までを振り返って、予想する未来像

                                                                                登壇者の自己紹介 蒲生弘郷氏:「ChatGPTの10ヶ月と開発トレンドの現在地」というタイトルで、蒲生から発表します。よろしくお願いいたします。 ちょっと私の自己紹介です。Azure OpenAI Champという立場で、外部発信などをやっています。いっぱい自己紹介をしていきたいところですが、本日はあまり時間もないので省略して、次にいきたいと思います。 今回は、けっこう開発者向けの発展的な内容を扱っていきますが、もし基本的な内容から確認していきたいという場合には、「Azure OpenAI 大全」というものを公開していて、リンクを貼っておくので、そちらの資料を併せてご確認いただければと思います。 「ChatGPT」の登場から今までを振り返る では、本日のテーマとして「ChatGPT」の登場から10ヶ月(※登壇当時)ということで、2022年11月から登場したChatGPTに関する技術について

                                                                                  Microsoft社のアーキテクトが説く、LLM実装の最前線 登場から今までを振り返って、予想する未来像
                                                                                • ChatGPT、Claude、Perplexityという3つの競合AIが同時にシステム障害を起こし利用不可に

                                                                                  OpenAIのチャットボットであるChatGPT、AnthropicのAIアシスタントであるClaude、Perplexity.aiのチャットボットであるPerplexityという3つの人気AIツールが、同時にシステム障害を起こし利用不可能となりました。 AI apocalypse? ChatGPT, Claude and Perplexity all went down at the same time | TechCrunch https://techcrunch.com/2024/06/04/ai-apocalypse-chatgpt-claude-and-perplexity-are-all-down-at-the-same-time/ アメリカ太平洋標準時の2024年6月4日、ChatGPTですべてのプランのユーザーに影響を与える大規模な障害が発生しました。OpenAIのサービス

                                                                                    ChatGPT、Claude、Perplexityという3つの競合AIが同時にシステム障害を起こし利用不可に