並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 486件

新着順 人気順

LLM&GPTの検索結果361 - 400 件 / 486件

  • あと2日で「ChatGPTブーム」は終わる | AppBank

    Google最強AI「LaMDA」チャットボットがまもなく登場する Googleは大規模言語モデル「LaMDA」や画像生成AI「Imagen」といったAI技術を数多く持っているにも関わらず、そのほとんどを公開せず、ブログ記事と研究論文で語るにとどめてきました。しかし、OpenAIが「DALL-E」や「ChatGPT」をリリースして話題となっている今、GoogleはこれまでになくAI製品のリリースを急いでいます。 今年初め、同社は「ChatGPT」の急成長に対して、会社の存続に関わる規模の緊急事態「コードレッド」を宣言し、引退していた共同創業者のラリー・ペイジとサーゲイ・ブリンを引きずり出してまでAI開発に乗り出しました。 Googleは毎年5月に開発者向けイベント「Google I/O」を開催するのが恒例であり、今回のイベントは明らかに「緊急」としか言いようのないものです。米大手テックメデ

      あと2日で「ChatGPTブーム」は終わる | AppBank
    • ChatGPTのようなエージェントを開発できる? 大規模言語モデルを活用可能なPaaS「Fixie.ai」登場

      Fixie.aiは2023年2月7日(米国時間)、クラウドでホストされ、大規模言語モデルを活用できるPaaS(Platform as a Service)「Fixie.ai」を発表した。 Fixie.aiは、GoogleとAppleの元幹部社員(エンジニア、プロダクトリーダー、AI専門家)が2022年に設立した新興企業。英単語の「fixie」は、後輪のギアが後輪の車軸に固定され、後退も可能で、ブレーキがない自転車を指す。 同社は今回発表したFixie.aiを、「独自のデータソース、システム、ツールに接続し、大規模言語モデルの能力を拡張するスマートエージェントを構築、ホスト、スケーリングするための新しいプラットフォーム」と説明している。 最近では、自然な会話ができる高機能Webサービスに使われている、人との対話をターゲットとする大規模言語モデル「ChatGPT」が話題を呼んでいるが、Fixi

        ChatGPTのようなエージェントを開発できる? 大規模言語モデルを活用可能なPaaS「Fixie.ai」登場
      • Copilot×Windowsで何ができる?AIでルーティン業務を時短する活用法3選 | ライフハッカー・ジャパン

        4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

          Copilot×Windowsで何ができる?AIでルーティン業務を時短する活用法3選 | ライフハッカー・ジャパン
        • OpenAIが動画生成AI「Sora」でどんな動画を作れるか示す作例を大量公開

          ChatGPTの開発元として知られるOpenAIは、テキストを入力するだけで高画質な動画を生成できるAI「Sora」の開発も進めています。新たに、Soraを用いて作成された動画の実例が大量に公開されました。 Sora: First Impressions https://openai.com/blog/sora-first-impressions Soraはテキストを入力するだけで最長1分間の動画を生成できるAIです。Soraは動画生成時に物理法則をシミュレートすることを特徴としており、被写体を違和感なく動かしたりカメラアングルをダイナミックに変化させたりできます。Soraの特徴は以下の記事で詳しくまとめています。 テキストから物理法則をシミュレートしながら動画を生成するAI「Sora」をOpenAIが発表 - GIGAZINE OpenAIはすでに複数のアーティストを対象にSoraのテス

            OpenAIが動画生成AI「Sora」でどんな動画を作れるか示す作例を大量公開
          • 米マイクロソフト、新たなAIモデル発表 モナリザも歌う?

            ニューヨーク(CNN) 米マイクロソフトは、顔の静止画像と話し声の音声クリップを取り込むと画像の人物が話しているようなリアルな動画を自動生成できる新たな人工知能(AI)モデル「VASA―1」を発表した。 この動画は写真だけでなく漫画や美術作品からも生成でき、リップシンク(口パク)や自然な顔・頭の動きを伴った本物のような仕上がりになる。 研究者らが示したデモ動画ではアニメーション化された「モナリザ」が俳優アン・ハサウェイさんのコミカルなラップを歌っている。 このAIモデルが生成する動画は面白いと同時にやや神経に障るほどリアルだ。マイクロソフトによれば、この技術は教育や「意思疎通に困難を抱える人のアクセシビリティーの向上」、あるいは人間ためのバーチャルコンパニオンの作成に利用できる可能性があるという。一方でこのツールが悪用され、現実の人間になりすますために使われる可能性があることも容易に想像で

              米マイクロソフト、新たなAIモデル発表 モナリザも歌う?
            • CopilotとChatGPTの違いを徹底解説!得意なこと・料金・導入方法など | ライフハッカー・ジャパン

              疲れやすい、呼吸の浅さを改善。ストレッチポールは毎日使いたいほど気持ちがいい!【今日のライフハックツール】

                CopilotとChatGPTの違いを徹底解説!得意なこと・料金・導入方法など | ライフハッカー・ジャパン
              • LLMにベートーヴェンなど特定の人物の行動や感情を模倣させる、イタコのような技術『Character-LLM(キャラクターLLM)』 | AIDB

                LLMをエージェントとして人間の行動をシミュレートする研究が進んでいます。今回新たに登場したのは、特定の人物、例えばベートーヴェンやクレオパトラなどの行動や感情を模倣させるよう訓練する新しいフレームワーク『Character-LLM(キャラクターLLM)』です。 簡単に言えば「イタコ(霊媒師)」のような技術です。特定の人物のプロフィール、経験、感情状態を学習させ、その人物として行動するエージェントを訓練します。単なる指示に基づく対話よりも、高度な形で人物をシミュレートすることが可能になります。 参照論文情報 ・タイトル:Character-LLM: A Trainable Agent for Role-Playing ・著者:Yunfan Shao, Linyang Li, Junqi Dai, Xipeng Qiu ・所属:School of Computer Science, Fuda

                  LLMにベートーヴェンなど特定の人物の行動や感情を模倣させる、イタコのような技術『Character-LLM(キャラクターLLM)』 | AIDB
                • ChatGPTの仕組み超解説:ChatGPTの裏側大解剖|ChatGPT研究所

                  AGIラボは、最高のAI情報をお届けするためのマガジン・コミュニティです。GPTsを筆頭にClaude 3やSoraなど注目のAIについても詳しく解説、今日から使えるAI活用情報を一番わかりやすくお伝えします。他に限定コミュニティへのアクセス、限定イベントへの参加権が含まれます。

                    ChatGPTの仕組み超解説:ChatGPTの裏側大解剖|ChatGPT研究所
                  • アップルが開発した「GPT-4を凌ぐ」AIとは…「ReALM」はコンテキストを理解する

                    Katherine Tangalakis-Lippert [原文] (翻訳:大場真由子、編集:井上俊彦) Apr. 15, 2024, 07:30 AM テックニュース 9,983 アップルの新しいAIシステム、ReaLM(Reference Resolution As Language Modeling)は、画面上の画像や会話のコンテキストを理解することができる。 SOPA Images via Getty Images アップルの研究者らは、画面上のコンテンツからそのコンテキストを「見て」理解する新しいAIシステムを開発した。 このReALM(Reference Resolution As Language Modeling)と呼ばれるシステムは、AIとより自然な対話を可能にするものだ。 ReaLMを開発した研究者らによると、このシステムは、コンテキストの理解において、OpenAIのG

                      アップルが開発した「GPT-4を凌ぐ」AIとは…「ReALM」はコンテキストを理解する
                    • 「書くのが苦手」がなくなるChatGPT活用術3選

                      コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕

                        「書くのが苦手」がなくなるChatGPT活用術3選
                      • プログラマーは「大量失業」の恐れ…米ペンシルバニア大の最新研究「ChatGPTで8割の働き方が変わる」の意味 AIをツールとして使いこなす能力が必要

                        プログラミングは生成AIの得意分野 現代の花形職業といえば、IT時代を象徴するプログラマーですが、このプログラマーの世界が大きく揺れています。実は、生成AIの得意分野にプログラミングがあるのです。 チャットGPTやバードといったテキスト生成AIは、膨大な量のデータを読み込ませて事前学習させています。このデータのなかに、プログラムも入っているのでしょう。簡単なプログラムなら、機能を指定するだけでほんの数秒で作成してくれます。 IT系の企業だけでなく、プログラムはさまざまな業務で活用されています。簡単なプログラムを自作して、文章を自動で作成したり、エクセルで簡単なマクロを作って複雑な計算を行わせたり、あるいは数値の分析を行って企画に役立てる、といったことを実践しているビジネスパーソンは少なくありません。 あるいは、自社のホームページの作成。ホームページはHTMLというマークアップ言語で作成され

                          プログラマーは「大量失業」の恐れ…米ペンシルバニア大の最新研究「ChatGPTで8割の働き方が変わる」の意味 AIをツールとして使いこなす能力が必要
                        • ファインチューニングとは何かをわかりやすく解説、RAGとの違い、生成AIで必須タスクの注意点とは

                          多くの企業において生成AIを任意のタスクに特化させ活用したいという機運が高まっている。この文脈で最近注目度が高まっているのが「ファインチューニング(Fine-tuning:微調整)」だ。生成AIのカスタマイズにおいては、これまでRAG(Retrieval-Augmented Generation)によるアプローチが主流だったが、関連ツールやサービスの充実によりファインチューニングを選ぶケースが増えている。ファインチューニングとはどのようなものなのか、RAGとの違いを含め、活用例と注意点をお伝えしたい。 バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15

                            ファインチューニングとは何かをわかりやすく解説、RAGとの違い、生成AIで必須タスクの注意点とは
                          • Googleが検索にAIやARを使ったアプデを続々発表

                            Googleが検索にAIやARを使ったアプデを続々発表2023.02.13 13:008,749 Lauren Leffer - Gizmodo US [原文] ( 福田ミホ ) Google(グーグル)は今後数カ月で、検索結果にAIが生成するテキストを入れようとしています。2月8日、フランス・パリのイベントで、このほかにも検索や地図などなど、いろんなアップデートが発表されました。 Googleはほんの少し前に、OpenAIのChatGPTライクなAIチャットボットBardを発表したばかりです。でもBardと違い、検索の中で生成されるAIの回答は「チャットボット」として切り出されるんじゃなく、検索の一部として見えるそうです。 以下、それがどんなものなのかとか、そのほかのいろんな発表をまとめていきます。 Googleは生成AIをどう使う?GIF: GoogleGoogle検索ではこれから答え

                              Googleが検索にAIやARを使ったアプデを続々発表
                            • Gemini搭載の「Google Bard」、ChatGPTとの違いと使い方 | ライフハッカー・ジャパン

                              4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

                                Gemini搭載の「Google Bard」、ChatGPTとの違いと使い方 | ライフハッカー・ジャパン
                              • なんと「AIに丸投げ」で「アプリ」が作れるスゴい時代が来た…意外と知らない「ChatGPTの使い方」(カレーちゃん,からあげ) @moneygendai

                                もう、ほぼ「魔法」です! Excel・PowerPointやデータ分析、画像生成など、かんたん雑用丸投げ術で仕事が楽になる! 2023年11月のアップデート対応! 待望の「ChatGPT Plus(有料版)」のビジネス活用に特化した書籍『面倒なことはChatGPTにやらせよう』(KS情報科学専門書)の内容を一部抜粋して紹介します。 ブラウザアプリを作る ライスくん「ChatGPTでアプリも作れるんだね。ボクはずっと作りたかった「食べ過ぎ防止アラームアプリ」を作ってみたよ!」 チキン姉さん「それはすごい! アラームが鳴ったら食べるのをやめられる?」 ライスくん「アプリには「無視」ボタンもついているから大丈夫!」 ChatGPTで、Webブラウザで動作するアプリケーションを作成することができます。 簡単なブラウザアプリでも、プログラミングのコードをゼロから書くのは面倒ですし、プログラミングの知

                                  なんと「AIに丸投げ」で「アプリ」が作れるスゴい時代が来た…意外と知らない「ChatGPTの使い方」(カレーちゃん,からあげ) @moneygendai
                                • GPT-4 Turboがアップデート。有料ChatGPTは何が一番進化した? | ライフハッカー・ジャパン

                                  PayPayカードのメリット・デメリット|怖いと言われる理由と評判レビュー。ゴールドと一般どっちがおすすめ?

                                    GPT-4 Turboがアップデート。有料ChatGPTは何が一番進化した? | ライフハッカー・ジャパン
                                  • エヌビディア、AI向け次世代チップ「ブラックウェル」発表

                                    米半導体メーカー、エヌビディアのジェンスン・フアン最高経営責任者(CEO)は18日、人工知能(AI)コンピューティングにおける同社の支配的地位をさらに強固にすることを目指した次世代チップを披露した。同社はこうした地位により時価総額が2兆ドル(約300兆円)を突破し、マイクロソフトとアップルに次ぐ世界3位となっている。 「ブラックウェル」と名付けられた新たなプロセッサーデザインはAIを支えるモデルの処理が数倍速くなると、同社はカリフォルニア州サンノゼで開幕した画像処理半導体(GPU)テクノロジーのイベント「エヌビディアGTC」で発表した。これには「トレーニング(学習)」として知られるテクノロジー開発と、「インファレンス(推論)」と呼ばれる活用のプロセスが含まれる。

                                      エヌビディア、AI向け次世代チップ「ブラックウェル」発表
                                    • AIスタートアップにアマゾン史上最大の40億ドルを出資 同社がAnthropicにかけるワケ

                                      アマゾンは、AIスタートアップ「Anthropic」へ、同社史上最大の投資となる40億ドルの出資を完了したと発表しました。最近Anthropicは、強力な大規模言語モデル「Claude 3」ファミリーをリリースし、ライバルのOpenAIを上回る性能を示しています。アマゾンにとってAnthropicへの投資は、AWSにおける生成AIプラットフォーム「Amazon Bedrock」の魅力をさらに高めるものになり、競争上の優位性を強化することにつながります。BedrockではAnthropicに加えCohereなどのクローズドモデルや、MistralやMeta の「Llama 2」などのオープンソースモデルが利用できるようになっているだけでなく、これらのモデルを活用し、ユーザーは独自のアプリを開発することも可能に。本記事では、アマゾンのAnthropic投資の概要に触れつつ、これらの投資がBed

                                        AIスタートアップにアマゾン史上最大の40億ドルを出資 同社がAnthropicにかけるワケ
                                      • 大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」

                                        ChatGPTなどのチャットAIは、内部で多数の計算を行って文章を生成しています。「LLM Visualization」は内部でどのようなパラメーターが保存されていてどういった計算が行われているのかを3D形式で見やすく視覚化してくれるサイトとなっています。 LLM Visualization https://bbycroft.net/llm サイトにアクセスするとこんな感じ。画面の左側に解説、右側に3Dモデルが設置されています。解説の「Continue」をクリックしてみます。 解説では約8万5000パラメーターのモデル「nano-gpt」で3種類の文字を並び替えるタスクを行い、大規模言語モデル内部の計算を確認していくとのこと。スペースキーを押すことで次のセクションへと進めます。 解説の段階に応じて3Dモデルの注目するべき場所がアップになるため、どの場所の話をしているのかが分かりやすくなって

                                          大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」
                                        • 妙に人間臭い…GoogleのAIってひょっとして「生きている」?

                                          妙に人間臭い…GoogleのAIってひょっとして「生きている」?2024.02.14 23:008,109 Maxwell Zeff - Gizmodo US [原文] ( そうこ ) GoogleのAI「Gemini」。先日、Bardから正式にGeminiとなりました。スーパー賢い対話型AIであり、OpenAIのChatGPTの対抗馬となります。すでに使ってみた人からは、その性能の高さに驚きの声があがっています。が、一部、奇妙な感想も…。 Geminiって、まるで生きているみたい。 向こう側に誰かいる…?ペンシルベニア大学ウォートン・ビジネス・スクールのEthan Mollick教授は、Geminiの最先端モデルにアーリーアクセスできた人の1人。すでに1カ月ほど使用しており、自身のブログにてAI体験をこう記しています。 「GPT-4はゴーストだらけだ。Geminiも同じくゴーストだらけ。

                                            妙に人間臭い…GoogleのAIってひょっとして「生きている」?
                                          • Stability AIが「Stable Video 3D」を発表  単一画像から「回しても形が崩れない」3Dビデオ生成を実現 | Ledge.ai

                                            Top > 学術&研究 > Stability AIが「Stable Video 3D」を発表  単一画像から「回しても形が崩れない」3Dビデオ生成を実現

                                              Stability AIが「Stable Video 3D」を発表  単一画像から「回しても形が崩れない」3Dビデオ生成を実現 | Ledge.ai
                                            • 見えてきたプログラマー不要時代、GitHubが「Copilot Workspace」を発表

                                              プログラミング分野で、久々に大きなニュースが飛び込んできた。米GitHub(ギットハブ)が2023年11月上旬に米国で開催したイベント「GitHub Universe 2023」で発表した新サービス「Copilot Workspace」だ。同月8日(米国時間)に行われた初日の基調講演の最後で、同社のThomas Dohmke(トーマス・ドムケ)最高経営責任者(CEO)が披露した。2024年に提供を開始する予定だという。 GitHubを使ったソフトウエア開発では、解決すべき課題を「Issue(イシュー)」という形で管理する。それぞれのイシューについてソフトウエア開発者がコードに手を加え、変更したコードをリポジトリー(ソフトウエア本体のコード)に取り込んでもらうよう依頼する。この依頼を「プルリクエスト」と呼ぶ。 Copilot Workspaceは、こうした一連の作業をAI(人工知能)がすべて

                                                見えてきたプログラマー不要時代、GitHubが「Copilot Workspace」を発表
                                              • 300以上の言語で訓練されたGoogleの翻訳AI「Universal Speech Model(USM)」の最新情報が公開、将来的に1000以上の言語を翻訳可能にする計画

                                                機械学習によって翻訳ソフトウェアの性能は飛躍的に進歩していますが、地球上に存在する言語の中には話者が少なく、学習に必要なデータが不十分なものもあります。新たにGoogleが、YouTubeの字幕生成に利用される大規模言語モデル「Universal Speech Model(USM)」を300以上の言語でトレーニングし、比較的マイナーな言語を含む翻訳タスクで非常に優れた性能を発揮したことを報告しました。 Universal Speech Model https://sites.research.google/usm/ Universal Speech Model (USM): State-of-the-art speech AI for 100+ languages – Google AI Blog https://ai.googleblog.com/2023/03/universal-sp

                                                  300以上の言語で訓練されたGoogleの翻訳AI「Universal Speech Model(USM)」の最新情報が公開、将来的に1000以上の言語を翻訳可能にする計画
                                                • KDDIのメタバース「αU」とGoogleの生成AI「Gemini Pro」が連携 2024年度以降に商用化

                                                  KDDIは、2月26日からメタバース/Web3サービス「αU」とGoogleの生成AI「Gemini Proモデル」などを連携した生成AIサービスの取り組みを開始。2024年2月開催のMWC Barcelona 2024で展示し、2024年度以降に順次商用化していく予定だ。 バーチャル空間に店舗を空間再現するショッピングサービス「αU place」との連携で、1枚の服の画像から試着イメージを生成して自分が着たイメージを確認できる、AIチャットサービスで季節やシーンに合わせた商品を提案してもらえるなどのショッピング体験を提供する。 360度自由視点で楽しめる音楽ライブ配信サービス「αU live」との連携では、ユーザーが入力した内容に合わせてライブ会場の空間が森や海などへリアルタイムに変化し、ユーザーごとにカスタマイズされたデジタル空間ならではの演出を楽しめるという。 写実的な渋谷のメタバー

                                                    KDDIのメタバース「αU」とGoogleの生成AI「Gemini Pro」が連携 2024年度以降に商用化
                                                  • 秒単位で3Dモデルを作成する生成AI「Tripo」、高品質のコンテンツをより手軽に | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

                                                    AI技術の進歩に伴い、コンピューター上で三次元の立体物を作成する「3Dモデリング」の分野でも大きな変化が生じようとしている。従来の3Dモデリングはゲームや映画、テレビ、建築などさまざまな業界で利用されてきたが、制作プロセスが煩雑で制作期間が長いうえ、コストが高く、3Dモデリングの度に少なくとも数千元(数十万円)かかる。一方で、2D画像生成で成功した生成AIの技術を3Dモデリングに応用する可能性が見えてきた。 OpenAIは2021年に文字を入力すると直ちに鮮明な画像を生成する「DALL・E」を発表した。これにより2D画像の生成にAIが利用されるようになり、3Dモデリング分野にもAIを応用するヒントが示された。 2023年初めに設立された「VAST」はこの3Dモデリングを手がけている。アルゴリズムチームの全員が国内外のトップ大学やテック企業の出身者で、AIとグラフィック関連の経験が豊富だ。V

                                                      秒単位で3Dモデルを作成する生成AI「Tripo」、高品質のコンテンツをより手軽に | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
                                                    • 世界が変わる。ChatGPT新機能、有料ユーザー全員が使えるように

                                                      代わりに画面左上の「ChatGPT 4」の部分をクリックすることで、「GPT-4」「GPT-3.5」「Plugins」を切り替えることができるようになっている。 なお、これまでは個別に選ぶ必要のあった「Browse with Bing」「Advanced Data Analysis」「DALL-E 3」は「GPT-4」を選ぶだけですべて利用できるようだ。ただし「Plugins」のみはこれまで通り選択の必要がある。 また、明記はされていないが2023年4月までの情報を持っていることを確認できたため、LLMも最新の「GPT-4 turbo」になっていると思われる。 「GPTs」も使えるぞ

                                                        世界が変わる。ChatGPT新機能、有料ユーザー全員が使えるように
                                                      • メタの大規模言語モデルが問う「オープンであること」の価値

                                                        メタが7月18日に無償公開した大規模言語モデル「Llama 2(ラマ)」を使ったサービスや製品の開発が相次いでいる。先行するオープンAIなどのモデルに比べてどこが優れているのか。 by Melissa Heikkilä2023.08.16 5 13 この記事は米国版ニュースレターを一部再編集したものです。 動きは速かった。メタが7月18日に人工知能(AI)モデル「Llama 2(ラマ)」をリリースしてから1週間も経たないうちに、スタートアップ企業や研究者たちはこのモデルを使ってチャットボットやAIアシスタントを開発してしまったのだ。このモデルを使って作られた製品がさまざまな企業からリリースされるのも、時間の問題だろう。 私は以前の記事で、Llama 2がオープンAI(OpenAI)やグーグルなどにもたらす可能性のある脅威について考察している。軽快かつ透明性があり、カスタマイズ可能なモデルを

                                                          メタの大規模言語モデルが問う「オープンであること」の価値
                                                        • 「ChatGPTの1周年を記念して」、オープンソースLLMがChatGPTにどこまで追いついているか体系的調査報告 | AIDB

                                                          ChatGPTのリリースは、AI研究や商業分野における大きな転換点となりました。指示チューニング、ファインチューニング、そして人間のフィードバックからの強化学習などもあわせて、さまざまなタスクで能力を示してきました。 この成功に触発され、オープンソースLLMは急速に進化しています。 そこで研究者らは、ChatGPTのリリースから1年を振り返り、オープンソースLLMがどのように進化し、例えばどのようなタスクでChatGPTと競合するレベルに達しているかを調査しました。 本記事では調査報告内容を読んでいきます。 参照論文情報 タイトル:ChatGPT’s One-year Anniversary: Are Open-Source Large Language Models Catching up? 著者:Hailin Chen, Fangkai Jiao, Xingxuan Li, Cheng

                                                            「ChatGPTの1周年を記念して」、オープンソースLLMがChatGPTにどこまで追いついているか体系的調査報告 | AIDB
                                                          • 日本発オルツの対話型AI「LHTM-2」は「ChatGPT」とどう違うのか!? 高性能AIチャットボットが普及する未来とは? オルツCTOに聞く - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                                            Open AIが昨年11月に発表した「ChatGPT」や、その高性能な大規模言語処理モデル「GPT-3」、最新版「GPT-4」が話題だ。「ChatGPT」は、ジェネレーティブAIを対話型AIに活用したチャットボットで、従来のチャットボットや音声アシスタントのように、ユーザーからの質問に答えるだけでなく、小説を書いたり、小説や記事の要約(サマリー)を書いたり、それらを指定した文字数内にまとめる、それを翻訳するなど、多岐に渡る才能を披露し、世間を驚かせている。 その「ChatGPT」と同様の大規模言語処理モデルを開発している日本の企業がある。株式会社オルツだ。2022年6月にシリーズDラウンドで35億円の資金調達を実施し、累計調達額は62億円に及ぶ。 オルツの高精度なチャットボット「LHTM-2」 オルツの大規模言語処理モデルの名称は「LHTM-2」(ラートム・ツー)で、「GPT-3」と同水準

                                                              日本発オルツの対話型AI「LHTM-2」は「ChatGPT」とどう違うのか!? 高性能AIチャットボットが普及する未来とは? オルツCTOに聞く - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                                            • LangChain のための wandb 入門|npaka

                                                              この入門記事は、「Weights & Biases」のご支援により提供されています。 1. wandb「wandb」 (Weights & Biases) は、機械学習の実験管理とモデルのパフォーマンス追跡に特化したツールです。 「wandb」の主な機能は、次のとおりです。 ・トレース : 実験のパラメータ、評価指標、出力を自動的にログに記録します。これにより、異なる実験間での比較や分析が容易になります。 ・視覚化: 学習中の評価ををリアルタイムで視覚化します。これにより、モデルのパフォーマンスを直感的に理解しやすくなります。 ・ハイパーパラメータの最適化 : 異なるハイパーパラメータのセットを試して、最適な組み合わせを見つけるのに役立ちます。 ・チームコラボレーション : チームメンバー間で実験のデータを共有し、コラボレーションを促進します。 ・統合 : 主要な機械学習フレームワーク (

                                                                LangChain のための wandb 入門|npaka
                                                              • スマホ時代は終わり。元Appleデザイナーが手がける「ChatGPT搭載デバイス」の正体 | AppBank

                                                                元AppleデザイナーがCEOを務める、「スクリーンのない未来」を目指す米企業Humane。同社が開発した、AI搭載の新型デバイス「AI Pin」の全貌が明らかになりつつあります。 *Category:テクノロジー Technology *Source:Tine ,The Verge ,Humane 「2023のベスト発明」に選ばれた未発表のAIガジェット Humane共同創設者のイムラン・チャウドリ氏は、Appleの元デザイナーとしても有名な人物です。同氏は19年間Appleにデザイナーとして在籍し、iPhoneのiOSの開発に携わりました。 Humaneは約5年もの間「何を開発しているのか」すら明かしていませんでしたが、数ヶ月前から「AI Pin」という製品を大々的に宣伝し始めました。4月のTED講演では、共同創設者のイムラン・チャウドリがいくつかのデモを披露しています。 さらに、パリ

                                                                  スマホ時代は終わり。元Appleデザイナーが手がける「ChatGPT搭載デバイス」の正体 | AppBank
                                                                • AIによる大失業時代、リスキリングで生き残るための“意外な方法”

                                                                  岸田首相が「リスキリングに5年で1兆円を投じる」と表明した2022年10月から、約1年半が経過した。 2024年3月28日、2024年度予算成立後の記者会見でも岸田首相は「人手不足対策」として「リスキリングを通じた労働生産性の向上などに取り組む」と発言したものの、政府のリスキリング政策は、誰を対象に、どのように生産性を上げていくのかが見えてこない面がある。 ただ、AIの進化により実際に多くの仕事が代替され、技術的失業のリスクは高まっており、そのための対策としてリスキリングの重要性は増してる。 AI時代に活躍できる人材になるため、私たちはどのようにリスキリングと向き合って行けばいいのか? 日本におけるリスキリングの第一人者で、ジャパン・リスキリングイニシアチブの後藤宗明氏に聞いた。 後藤宗明…新卒で富士銀行(現みずほ銀行)入行。アメリカでの起業やNPOの日本法人設立を経て、帰国後は米フィンテ

                                                                    AIによる大失業時代、リスキリングで生き残るための“意外な方法”
                                                                  • 従来の小さなニューラルネットワークでも「メタ学習」でChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌 | AIDB

                                                                    ニューヨーク大学をはじめとする研究チームが、Nature誌にて革新的な研究を公表しました。報告によれば、従来型のニューラルネットワークでも、ChatGPTなどの先端的な生成AIを上回る性能を発揮する可能性が示されています。 この新技術は、限られたデータ量であっても高い効果を発揮するとされ、生成AIにおける多くの課題—コスト、資源、データの制約—を解決する新たな進路を開く可能性があります。 研究で提案されたAIモデルは、「人間に匹敵する言語の汎用性」を有すると評価されています。もしそれが真実であれば、現行の大規模言語モデルがまだ達成していない、新次元の能力に到達しています。 参照論文情報 ・タイトル:Human-like systematic generalization through a meta-learning neural network ・著者:Brenden M. Lake,

                                                                      従来の小さなニューラルネットワークでも「メタ学習」でChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌 | AIDB
                                                                    • 深津貴之氏が教える、ChatGPTの答えの精度を上げる聞き方 2023年に読まれた「生成AI活用術」記事まとめ

                                                                      2023年に読まれた「生成AI活用術」記事1位 ■記事の紹介 「チャットAI使いこなし最前線」をテーマとしたnote主催イベントをログ化。note CXOで、「深津式プロンプト」を編み出し世に広めた深津貴之氏がChatGPTの活用法を解説しました。この記事では、OpenAIがChatGPTを公開した理由や、ChatGPTの精度を上げる質問の仕方などが語られました。 このイベントログのシリーズはこちらから 2023年に読まれた「生成AI活用術」記事2位 ■記事の紹介 起業家向け経営ノウハウ誌「創業手帳」が主催した「創業手帳EXPO」に登壇した、累計40万部突破の『たった1日で即戦力になるExcelの教科書』の著者・吉田拳氏のセッションをログ化。ランキング2位に入ったこちらの記事では、Excelで効率化するための2つの原則や、「インプット」「マスタ」「アウトプット」の3種類のシートが必要な理由

                                                                        深津貴之氏が教える、ChatGPTの答えの精度を上げる聞き方 2023年に読まれた「生成AI活用術」記事まとめ
                                                                      • Open AI「Sora」やStability AI「SD3」など、画像・動画生成AIの著しい進化の背景にある「Diffusion Transformers」とは? | AMP[アンプ] - ビジネスインスピレーションメディア

                                                                        Open AIやGoogleなどといった競合に対抗するべく、Stable Diffusion 3(SD3)を発表したStability AI。最新かつ最強の画像生成AIモデルとされているSD3は、「Diffusion Transformers」に基づいた新しいアーキテクチャを採用し、さまざまなハードウェアで動作する。このDiffusion Transformersとはどのようなアプローチなのだろうか。 2022年には存在していたDiffusion Transformers 今話題となっているDiffusion Transformersそのものは、2022年夏にAIリサーチ研究のシーンに登場したAIモデルアーキテクチャ。ニューヨーク大学のコンピュータサイエンス教授のXie氏が、当時MetaのAIリサーチラボでインターンをしていたPeebles氏(Xie氏がメンター)と共に、機械学習上の2つの

                                                                          Open AI「Sora」やStability AI「SD3」など、画像・動画生成AIの著しい進化の背景にある「Diffusion Transformers」とは? | AMP[アンプ] - ビジネスインスピレーションメディア
                                                                        • 大規模言語モデルでホワイトカラーの仕事はこう変わる。Gunosyが動画要約AI機能を実装した理由 | Ledge.ai

                                                                          Top > ビジネス > 大規模言語モデルでホワイトカラーの仕事はこう変わる。Gunosyが動画要約AI機能を実装した理由

                                                                            大規模言語モデルでホワイトカラーの仕事はこう変わる。Gunosyが動画要約AI機能を実装した理由 | Ledge.ai
                                                                          • アマゾン、数千億~数兆パラメータの生成AIトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。性能は初代比最大4倍 | テクノエッジ TechnoEdge

                                                                            ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 Amazon Web Services(AWS)は、ラスベガスで開催中のイベント「AWS re:Invent 2023」の基調講演で、AIのトレーニングに最適化した独自プロセッサ「AWS Trainium2」を発表しました。 Trainium2は、最大数兆個のパラメータを持つ基盤モデルおよび大規模言語モデルのトレーニング用に設計されています。 2020年に発表された第一世代のTrainiumチップと比較して、最大4倍のトレーニング性能と3倍のメモリ容量を実現し、エネルギー効率(性能/ワット)を最大2倍まで改善するように設計されています。 Trainium2は、単一のインスタンスに16個のTrainiumチップを含むAmazon EC2 Tr

                                                                              アマゾン、数千億~数兆パラメータの生成AIトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。性能は初代比最大4倍 | テクノエッジ TechnoEdge
                                                                            • OpenAIがGPT-4のアップグレード版大規模言語モデル「GPT-4 Turbo」を発表、2023年4月までの知識を持ちコンテキストウィンドウは128Kで価格は控えめ

                                                                              AI開発企業のOpenAIが、2023年11月6日に行われた年次開発者向けイベント「DevDay」で、大規模言語モデル「GPT-4」のアップグレード版である「GPT-4 Turbo」を発表しました。 New models and developer products announced at DevDay https://openai.com/blog/new-models-and-developer-products-announced-at-devday OpenAI introduces GPT-4 Turbo: Larger memory, lower cost, new knowledge | Ars Technica https://arstechnica.com/information-technology/2023/11/openai-introduces-gpt-4-tu

                                                                                OpenAIがGPT-4のアップグレード版大規模言語モデル「GPT-4 Turbo」を発表、2023年4月までの知識を持ちコンテキストウィンドウは128Kで価格は控えめ
                                                                              • めちゃくちゃ重いけど動くぞ!Excelで「GPT-2」を再現したスプレッドシート

                                                                                OpenAIの「ChatGPT」やマイクロソフトの「Copilot」、グーグルの「Gemini」など、対話型AIの心臓部である大規模言語モデル(LLM)。だがその仕組を理解するにはプログラミングの知識が不可欠だ。 「Spreadsheets are all you need.ai」というウェブサイトでは、驚くことにExcelのスプレッドシートを使って、LLM(GPT2)がどのように動作するかを再現している。 GPT-2をローカルで再現 同サイトで提供されている「Spreadsheets-are-all-you-need」は、大規模言語モデル(LLM)の動きを再現するExcelシートだ。 ChatGPTのように、「Mike is quick. He moves(マイクは素早い。彼は◯◯動く)」とセルに入力するとチャット型AIのように「quickly(素早く)」と続きを出力してくれるという。

                                                                                  めちゃくちゃ重いけど動くぞ!Excelで「GPT-2」を再現したスプレッドシート
                                                                                • 生成AI革命の次は「ロボット革命」 夢が近づく3つの理由

                                                                                  「チャットGPT」で生成AIが一気にブレークしたように、家庭用ロボットも実用化の時期が近づいているかもしれない。そう考えられる理由を3つ、説明しよう。 by Melissa Heikkilä2024.04.23 2 10 この記事は米国版ニュースレターを一部再編集したものです。 ロボット工学が始まって以来、この分野の究極の目標は、家事をこなすロボットを作ることだった。しかし、長い間、それは夢でしかなかった。ロボット工学の研究者たちは、研究室でパルクールのような目を見張るようなことをロボットにさせることはできた。だが、そのためには通常、厳重に管理された環境で綿密な計画を立てる必要がある。そのため、子どもやペットのいる家庭や、間取りが千差万別で、あらゆるものが散らかっている家では、ロボットが確実に動作するのは難しい。 ロボット工学者の間で、「モラベックのパラドックス」と呼ばれる有名な観察事象が

                                                                                    生成AI革命の次は「ロボット革命」 夢が近づく3つの理由