並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 4138件

新着順 人気順

OpenAIの検索結果161 - 200 件 / 4138件

  • 「Paper Interpreter」を使って論文を読もう!|Daichi Konno / 紺野 大地

    こんにちは、東京大学で医師かつ脳や人工知能の研究をしている紺野大地と申します。 2023年11月6日、OpenAI社から「自分専用のChatGPTを作れる機能」であるGPTs(ジーピーティーズ)が発表されました。 早速触ってみたところ、 「この技術を使えば、誰もが論文を読めるAIを作れる!」と確信し、論文解説AI「Paper Interpreter」を作って公開したところ、非常に大きな反響がありました! (こちらのリンクから、今すぐ使えます。) 論文の内容を分かりやすく解説してくれる「Paper Interpreter」を公開しました! 使い方は簡単で、論文のPDFをアップロードするだけです。 テキストだけでなく、図やグラフについても説明してくれる点がポイントです! 早速公開したので、ぜひ使ってみてください😊https://t.co/xHhKGO4WOZ pic.twitter.com/

      「Paper Interpreter」を使って論文を読もう!|Daichi Konno / 紺野 大地
    • ServerlessDays Tokyo 2023が最高すぎた! - Qiita

      はじめに 4年ぶりの開催となるServerlessDays Tokyoに参加してきました https://tokyo.serverlessdays.io/ 「もっとうまくやりたい、誰よりも上手にやりたい」 というメッセージとともに開催されたServerlessDays Tokyo 2023ですが、超豪華なスピーカー陣を国内外から集め、ここ数年のServerlessの成熟と未来をしっかりと味わえる濃いイベントです。 1日目がセッション、2日目がワークショップということで、熱力の高いうちに激熱なサービスを素早く学べる構成になっていて、とても充実した内容でした。 所感 4年前のServerless LambdaをはじめとするFaaSをいかに簡単にデプロイ、運用していくかというツール系の話と S3やSQS,SNSなどのFaaS以外のServerlessなサービスの組み合わせでLowOpsな仕組みを

        ServerlessDays Tokyo 2023が最高すぎた! - Qiita
      • Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新

        米Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスの提供を開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 同社は従来、生成AIの頭脳部分となるLLM(大規模言語モデル)として「Gemini」ブランドを利用し、サービス名は「Bard」として提供していたが、サービス名も今回Geminiに統一。NanoやProなど、すでに発表している3つのLLMのうち、パラメータ数が最大で複雑なタスクをこなせるとしていた「Gemini Ultra」を使ったサービスはこれまで登場していなかった。今回、UltraからAdvancedにリネームしての正式ローンチとなる。 Gemini Advancedは数学、物理学、歴史、法律、医学、倫理を含む57科目の組み合わせを使用するベンチマークテストで人間の専門家を上回る成

          Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新
        • 「自分でLLMを動かすことでイメージがつきやすくなる」 ローカルで使うメリットと、日本語特化LLMを動かすために必要なスペック

          システムから言語モデルがどのように使えるか、その時どういうことに気をつける必要があるかを考える「『ChatGPTなどの言語モデルはどのようにシステムで使えるか』きしだなおき氏」。ここで、LINE Fukuoka株式会社のきしだなおき氏が登壇。続いて、システムがChatGPTをどのように使うかと、日本語特化のLLMについて話します。 システムはChatGPTをどのように使うか きしだなおき氏:今、人間がどう使うかという話を中心に話しました。(次に)じゃあシステムからどう使うかとなると、APIを使った利用になりますね。 今日(2023年6月14日時点)朝起きたら「関数定義が可能になったよ」みたいなものが出ていて。今回の(セッションで話した)概要(の内容)とか…。(この概要は)昨日になってやっと(運営に)送ることができたんですけど、「どういう話をしようか」と思って朝起きたら、毎日状況が変わってい

            「自分でLLMを動かすことでイメージがつきやすくなる」 ローカルで使うメリットと、日本語特化LLMを動かすために必要なスペック
          • 開発生産性が上がるって分かったので GitHub Copilot Business を積極活用しています - Money Forward Developers Blog

            エンジニアリング戦略室の高井といいます。 みなさん、GitHub Copilot は利用されていますか? GitHub Copilot は GitHub と OpenAI が共同で開発した生成 AI を活用した開発支援ツールです。コードの自動補完、コード生成、ドキュメントの提案など、多岐にわたる機能を提供し、開発者の生産性を向上させることを目的としています。 マネーフォワードでは、昨年度にトライアルとして Copilot の利用を開始しました。本記事では、Copilot を利用して半年以上経過して、その利用がどのような効果をもたらしたかをレポートします。なお、ここで GitHub Copilot として言及されている Copilot のプランは GitHub Copilot Business です。 Copilot 利用状況・分析対象 なお、分析にはエンジニアリング組織のパフォーマンスを可

              開発生産性が上がるって分かったので GitHub Copilot Business を積極活用しています - Money Forward Developers Blog
            • Slackで動くChatGPTのチャットボットをGoogle Apps Script(GAS)でサクッと作ってみる

              Slackで動くChatGPTのチャットボットを作りたい 本記事では、Slackで下記仕様を実現できるChatGPTのチャットボットをGoogle Apps Script(GAS)でサクッと作成していきます。 botが所属するSlackのチャンネル内でメンションされると、スレッドで返信する botとのダイレクトメッセージの場合は、メンション無しでもスレッドで返信する botが参加しているスレッド内でのメッセージには、メンション無しでも(スレッド内の会話内容を読み取った上で)返信する また、下記項目も自由に設定することができます。何でも明るく回答してくれる社内のアイドル的なbotを作ってみるのも良いかもしれません。 botのアイコン、振る舞い(人格・役割など)の設定 gpt-3.5-turboやgpt-3.5-turbo-16kなどのGPTモデル設定 今回のbotは、非エンジニアの方でも作成

                Slackで動くChatGPTのチャットボットをGoogle Apps Script(GAS)でサクッと作ってみる
              • いまこそ学ぶLLMベースのAIエージェント入門―基本的なしくみ/開発ツール/有名なOSSや論文の紹介

                大規模言語モデル(LLM)の応用例として「AIエージェント」が大きな話題の1つとなっています。 AIエージェントは、与えられた目的に対して、何をすべきか自律的に判断して動作します。 たとえば、必要に応じてWeb上の情報を検索して回答してくれたり、試行錯誤しながらプログラムを実装してくれたりします。 2024年2月現在では、OpenAIのAssistants APIやGPTs、Agents for Amazon BedrockやLangGraphなどがリリースされ、AIエージェントを開発するエコシステムも急速に発展しています。 そんな中、この勉強会では「いまこそ学ぶLLMベースのAIエージェント入門」と題して、LLMベースのAIエージェントの基本を解説します。 LLMベースのAIエージェントの基本的なしくみ(MRKLやReActなど)や各種開発ツール、有名なOSSや論文で実装されたAIエージ

                  いまこそ学ぶLLMベースのAIエージェント入門―基本的なしくみ/開発ツール/有名なOSSや論文の紹介
                • GPT連携アプリ開発時の必須知識、RAGをゼロから解説する。概要&Pythonコード例

                  こんにちは。わいけいです。 今回の記事では、生成AI界隈ではかなり浸透している RAG について改めて解説していきます。 「低予算で言語モデルを使ったアプリを開発したい」というときに真っ先に選択肢に上がるRAGですが、私自身もRAGを使ったアプリケーションの実装を業務の中で何度も行ってきました。 今回はその知見をシェア出来れば幸いです。 RAG(Retrieval-Augmented Generation)とは まず、 そもそもRAGとは何ぞや? というところから見ていきましょう。 RAG(Retrieval-Augmented Generation) は自然言語処理(NLP)と特に言語モデルの開発において使用される技術です。 この技術は、大規模な言語モデルが生成するテキストの品質と関連性を向上させるために、外部の情報源からの情報を取得(retrieval)して利用します。 要は、Chat

                    GPT連携アプリ開発時の必須知識、RAGをゼロから解説する。概要&Pythonコード例
                  • OpenAI社員9割、サム・アルトマン氏復帰求め「退社も」 取締役会に - 日本経済新聞

                    【シリコンバレー=渡辺直樹】米オープンAIの社員らは20日、取締役会(理事会)に総退陣を求め、解任したサム・アルトマン氏らを復帰させなければ、自分たちもそろって退社すると迫る文書を提出した。770人いる社員のうち、すでに9割超にあたる約730人が署名した。人工知能(AI)の有望企業をめぐる混乱は社員の「反乱」という重大な局面に発展しはじめた。日本経済新聞が入手した文書によると、要求は取締役会に

                      OpenAI社員9割、サム・アルトマン氏復帰求め「退社も」 取締役会に - 日本経済新聞
                    • GPT-4に日本語特化モデル OpenAI Japan始動会見で発表

                      米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表 OpenAIは、11月に発表した「GPT-4 Turbo」のプレビュー版をリリースすると発表した。「GPT-4」が怠け者になってきたという苦情を受け、怠けにくくしたという。公式版は数カ月中にリリースする計画だ。 マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応 米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenA

                        GPT-4に日本語特化モデル OpenAI Japan始動会見で発表
                      • OpenAIが作ったGPTs 全22選|ChatGPT研究所

                        皆さん、OpenAIが公式のGPTsを開発をしていることはご存じですか? 実は、 OpenAI 謹製のGPTsにも有用なものがたくさんあります。 本記事ではOpenAIが手がけるGPTs、全22個をご紹介していきます。 GPTsの基本ついておさらいしたい方は以下の noteをご覧ください! それでは、早速見ていきましょう! 1. Data Analyst(データ分析)ファイルを入力するだけで、データ分析や視覚化をサポートします。データをより深く理解するための強力なツールです。 以下は、ニューヨークの不動産情報に関するファイルを入力した例です。「要点をまとめて」という簡単な指示で、データ分析から要点をまとめるところまで一気に行ってくれます。 2. Web Browser(ウェブ検索)インターネットから検索して、情報収集やリサーチをサポートしてくれるGPT。普通のChatGPTもブラウジング能

                          OpenAIが作ったGPTs 全22選|ChatGPT研究所
                        • ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあなただけのAIパートナーを作ろう - Qiita

                          はじめに はじめまして。株式会社ずんだもんのアルバイトエンジニアのinadaです。 今日は誰でも作れるずんだもんと題してローカルPCにずんだもんAIを作ります。この記事はそのチュートリアル記事です。 (誰でもと書いてますが、RTX 3060(12G)搭載以上のPC推奨です。CPUマシンでも出来る部分はありますが非推奨です。RTX 3060(12G)のグラボは5万ぐらいで買えるので持ってなければ買っちゃいましょう。) 対象読者/記事の範囲 ローカルPCで動かせる大規模言語モデルを、学習用のデータの用意から、学習、動かすところまで一通りどんなものか、お試ししてみたい人。 自分だけの世界にただ一人だけのうちの子、またはパートナー(うちの嫁)を作り育てたい。そんな沼にはまりたい、興味がある人。 AIの仕組みや用語は当記事では解説しません。AIの用語(モデル, loss, epoch, checkp

                            ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあなただけのAIパートナーを作ろう - Qiita
                          • 資本家は資本主義を嫌う、そして「メタになれ」と言う | p2ptk[.]org

                            以下の文章は、コリイ・ドクトロウの「Capitalists Hate Capitalism」という記事を翻訳したものである。 Pluralistic 今週のポッドキャストでは、Locus Magazineに書いたコラム 「資本家は資本主義を嫌う」を読んだ: https://locusmag.com/2024/03/cory-doctorow-capitalists-hate-capitalism/ 「資本家は資本主義を嫌う」とはどういうことか? それは、「利益」と 「レント」(rent: 一般的には地代や家賃、使用料を指すが、ここでは経済学の「超過利潤(企業が競争的市場で得られる以上に享受する利益)」を指す)の違いに尽きる。資本家は資本(お金、またはそれで買えるもの)を労働者の労働と組み合わせて、利益(資本家の取り分)と賃金(労働者の取り分)を生み出す。 一方、レントは、資本家が利益を生み

                              資本家は資本主義を嫌う、そして「メタになれ」と言う | p2ptk[.]org
                            • Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました|ELYZA, Inc.

                              Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました 本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開 性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデモや評価用データセットも合わせて公開 既に社内では、130億、700億パラメータのモデルの開発も進行中 はじめにこんにちは。ELYZAの研究開発チームの佐々木、中村、平川、堀江です。 この度ELYZAは、Metaの「Llama 2」をベースに、日本語による追加事前学習を行なった日本語言語モデル「ELYZA-japanese-Llama-2-7b」と、そこにELYZA独自の事後学習を施した「

                                Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました|ELYZA, Inc.
                              • GPT-4oを使って2Dの図面から3DのCADモデルを作る

                                はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

                                  GPT-4oを使って2Dの図面から3DのCADモデルを作る
                                • Azure OpenAIで独自データ追加機能(Add your data)を試してみた - Qiita

                                  はじめに 23年6月19日にAzure OpenAIに独自データを追加できる機能「Add your data」がパブリックプレビューで発表されました。GPTは自分が知らない情報に関して、答えることができないですが、この機能を使うことで独自のデータとGPTモデルを簡単に連携させることができ、GPTが知らない独自のデータを参照して回答を生成できるようになります。また、回答のソースを独自データに限定することもできるので、ChatGPTの活用の幅が大きく広がります。 一通り使ってみたので、具体的な利用方法を解説していきます(公式ドキュメントにも詳しく記載されています)。 (23年9月追記) Add your dataにベクトル検索の機能が追加されました。詳細はこちらのブログで丁寧に解説されていますので、ご参照ください。 独自データの追加 使えるモデルはチャット形式のモデル「gpt-3.5-turb

                                    Azure OpenAIで独自データ追加機能(Add your data)を試してみた - Qiita
                                  • 全エンジニア必見!情報収集のためのリンク集 - Qiita

                                    この記事はNuco Advent Calendar 2023の12日目の記事です。 はじめに 技術は目まぐるしく変化・進歩していて、トレンドに追いつくには、まず信頼できる情報源が必要です。 このリンク集では、エンジニア向けのコンテンツを種類別に紹介します。業界の最新ニュース、学術論文、実践的な動画解説、そして専門家のコミュニティなど多様なリソースをまとめました。 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 知識共有コミュニティ Qiita 言わずもがな、国内最大級のコミュニティサービスです。言語・分野ごとのタグがあり、どのエンジニアにとっても使いやすいサイトになっています。 Zenn 「知識を共有するエンジニアに対価

                                      全エンジニア必見!情報収集のためのリンク集 - Qiita
                                    • ChatGPT can now see, hear, and speak

                                      We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w

                                        ChatGPT can now see, hear, and speak
                                      • 生成 AI で僕らのプログラミング勉強はどうなるのか? - Qiita

                                        生成 AI の登場によって、僕らはプログラムを書く時代が終わりに近づいている?! 2023 年に OpenAI 社が発表した ChatGPT は、特に僕ら IT エンジニアにとって衝撃な発表だったのではと思います。 今まで、ググったり、参考書をもとに実装したり、GitHub などからコードを参考にして実装していたものが、「テキストだけ」で実装できるほどになりました。 生成 AI を用いたサービスやツールの登場 ChatGPT の GPTs や LLM、これらを用いたプロジェクトが研究・開発されたり、オリジナル GPT を作成して業務の効率化を図ったり、僕らの仕事は大きく変わっていきました。 また、プログラミングが全くわからなくても、プロンプトのみでいろいろなことができるようになりました。 ビジネスシーンで非エンジニアという方々にも、導入が進んでいるのではないでしょうか? 僕がウォッチしてい

                                          生成 AI で僕らのプログラミング勉強はどうなるのか? - Qiita
                                        • GPT-4の精度は悪化している? 3月に解けた数学の問題解けず GPT-3.5にも敗北──米国チームが検証

                                          「GPT-4の精度は時間とともに変わっている」──そんな研究成果を米スタンフォード大学と米カリフォルニア大学バークレー校の研究チームが発表した。3月と6月時点のGPT-4の精度を比較したところ、一部タスクでは精度が大きく悪化していたという。ただし、この論文は査読前のもので第三者によるレビューは受けていない。 GPT-4は、米OpenAIが提供する大規模言語モデル(LLM)。3月の発表後、チャットAI「ChatGPT」にも搭載され、性能の高さが大きな話題を集めた。LLMは、データのフィードバックや設計変更などをすると性能が変化する。しかし、OpenAIはLLMの更新について発表しておらず、公開以後の性能変化も明らかにしていない。そこで研究チームは、3月と6月時点でのGPT-4、前モデルであるGPT-3.5に精度の違いがあるのか検証した。 実験ではChatGPTに対して「数学の問題の回答」「機

                                            GPT-4の精度は悪化している? 3月に解けた数学の問題解けず GPT-3.5にも敗北──米国チームが検証
                                          • ChatGPTで構成された仮想のソフトウェア会社にシステム開発を行ってもらうChatDevがおもしろい - きしだのHatena

                                            ChatGPTによるメンバーで構成された仮想のソフトウェア会社にシステム開発を行ってもらうChatDEVが結構おもしろかった。 ChatDEVは、ChatGPTによってCTOやプログラマー、レビュアー、テスターといった役割をもつエージェントをやりとりさせることでソフトウェア開発を自動化しようという試みの実装です。 https://github.com/OpenBMB/ChatDev アイデアは論文にまとまっていて、こちらで概要が翻訳されています。 [LLM 論文]アプリ全自動開発"ChatDev"の日本語訳|すめらぎ 使い方としては、とりあえずClone git clone https://github.com/OpenBMB/ChatDev.git そして依存モジュールのインストール cd ChatDev pip3 install -r requirements.txt あと、OpenA

                                              ChatGPTで構成された仮想のソフトウェア会社にシステム開発を行ってもらうChatDevがおもしろい - きしだのHatena
                                            • 今すぐ使える! ChatGPTで欲しい回答を生み出す「プロンプト」の書き方 その基本パターンを解説

                                              今すぐ使える! ChatGPTで欲しい回答を生み出す「プロンプト」の書き方 その基本パターンを解説:ChatGPT使いこなし術(4/4 ページ) 汎用性の高いプロンプトのコツ さて、こうした型を認識しても、ビジネスシーンなどでそのまま活用するのはやや手間だ。それよりはある程度、プロンプトとしてコピペで入力しやすい型を用意しておくのが良いだろう。上述した4つの基本形を生かして考えてみると、指示や質問のほかに「役割」「目的」「条件」「出力例」「補足情報」などを指定することを、まず試してみると良い。この際、全てを文章にする必要はなく、「#」を活用してカテゴリーごとに箇条書きのように整えていくことがおすすめだ。 【プロンプトの例】 #指示・質問:ChatGPTを知らない人に、ChatGPTを紹介する記事のリード文を書いてください。 #役割:プロのライター #目的:商品の利用促進 #条件:です・ます

                                                今すぐ使える! ChatGPTで欲しい回答を生み出す「プロンプト」の書き方 その基本パターンを解説
                                              • 「AI敗戦」を直視できない人たち

                                                日本はAIの学習を行うのに必要不可欠なGPUを十分に調達できていないという記事があった。 https://wirelesswire.jp/2023/08/85203/ 一本調子な煽り文体はどうにかならないのかとは思ったのだが、記事に対する反論をネットで一通り読んでみて驚いた。内容が幼稚すぎる。 ChatGPTがあるんだから今さら同じのを作っても意味がない 要するに日本は自国でのAIの研究開発は諦める。そして他国企業が開発したモデルだけを使わせていただくような縛りプレイをこの先もずっと続けていこうじゃないかという意見だ。 「ボクは足し算なんか勉強しなくてもいいんだ。だって隣の花子ちゃんは掛け算や割り算もできるんだから、困ったら答えを聞けばいいんだもん」という頭の悪い小学生の言い訳のような意見だが、困ったことになぜか一定の支持を集めている。 当然のことながらOpenAIのモデルは英語やアメリカ

                                                  「AI敗戦」を直視できない人たち
                                                • GoogleのAI「Bard」、YouTube動画の内容要約も可能に

                                                  Googleは、生成AIチャット「Bard」がYouTube動画について理解する能力が上がったと発表した。例えばレシピ動画を見ずに材料や作り方を確認できる。 米Googleは11月21日(現地時間)、生成AIチャット「Bard」が「YouTube動画を理解する能力の第一歩を踏み出した」と発表した。 同社は9月に、YouTubeからリアルタイム情報を取得できるようにしているが、今回のアップデートで、動画の概要や、長い動画のどの当たりで目的の情報が得られるかなどを答えられるようになったようだ。 Googleは例として、ケーキのレシピ動画を探している場合、そのレシピに必要な卵の数を尋ねられるようになるとしている。 「美味しいミルクティーの入れ方を紹介するYouTube動画から、手順を教えてください」と尋ねたところ、複数の画像入りの説明が表示された。最初の手順に「ティーポットに水と紅茶を入れ」とあ

                                                    GoogleのAI「Bard」、YouTube動画の内容要約も可能に
                                                  • LangChainを使わない - ABEJA Tech Blog

                                                    TL; DR LangChainのメリデメを整理する過程で、今となってはopenai-pythonのうちChatGPTのAPIをを簡単に取り回せる程度のシンプルなライブラリがあるだけでも十分便利なんじゃないかと思ったので、ライブラリを個人で作ってみました。(バージョン0.0.1なのでちょっとお粗末な所もありますが) github.com はじめに こんにちは、データサイエンティストの坂元です。ABEJAアドベントカレンダーの13日目の記事です。世は大LLM時代ということで、ありがたいことにABEJAでも複数のLLMプロジェクトを推進させて頂いています。私自身もいくつかのLLMプロジェクトに参画しています。LLMといえばLangChainが便利ですね。OpenAI APIの利用だけでなく、各種ドキュメントのパースが出来たり、HuggingFaceやインデックスDBを扱う他のライブラリとインテ

                                                      LangChainを使わない - ABEJA Tech Blog
                                                    • アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

                                                      アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。 一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮 複数(30億、70億、300億)のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。 各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2(画像理解)、TextVQA(画像内のテキスト情報)、ScienceQA(科学知識)、MMBench(マルチモーダル)、MathVista(数学)などの

                                                        アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表
                                                      • オペレーティング・システムから、オペレーティング・エージェントへ|深津 貴之 (fladdict)

                                                        今回の発表で強く感じたことは、やはりOpenAIの目指すChatGPTが単なるチャットアプリケーションではないということだ。 従来のオペレーティングシステム(OS)はハードウェアとアプリケーションの架け橋である。だがOpenAIはChatGPTを「言語で命令できるオペレーティングエージェント」と位置付け、人生のあらゆるタッチポイントで新たなゲートキーパーとなろうとしているように思える。 IT競争は手前の取り合い歴史を振り返れば、IT競争の常道とは、ゲートウェイを手前に築くことにあったようだ。PCの争いをOSが無意味化し、OSの争いをブラウザが、ブラウザの争いを検索エンジンがと、そしてそれをスマホとアプリが…このようにITの争いは常に手前を争うものだった。こうして一番手前を抑えた企業は、大きな利益を手に入れた。 今、OpenAIの動きは、このメタゲームに大きな変化を加えつつある。 OpenA

                                                          オペレーティング・システムから、オペレーティング・エージェントへ|深津 貴之 (fladdict)
                                                        • Microsoft、AIの影響で年間水消費量がプール2,000個分に

                                                          Microsoft、AIの影響で年間水消費量がプール2,000個分に2023.09.14 20:0040,681 Angely Mercado - Gizmodo US [原文] ( そうこ ) AI台頭によって、AIがとんでもないエネルギー喰いだということが明らかになりました。電力はもちろん、炭素排出量も多く、環境への不可は仮想通貨を超えるとも言われており、AI活用とともにエネルギー効率化も求められています。 その中でも、消費量が特にに大きいのが水。 Microsoftの環境に関する報告書が公開Microsoft(マイクロソフト)が毎年公開している環境に関する報告書、2022年版がアップされました。 2021年の水使用料は477万2890トン。これが2022年には639万9415トンにまでアップ。実にたった1年で約30%も使用量が増加。オリンピックのプールでいうと、この増加量は2,000

                                                            Microsoft、AIの影響で年間水消費量がプール2,000個分に
                                                          • GPT-3.5-turboの新機能を使ってCVPRの論文を良い感じに検索・推薦・要約するシステム

                                                            はじめに 5月からTuringに中途入社した棚橋です。リクルートで広告配信システムの開発や量子アニーリングに関する研究開発に関わっていました。現在、Turingのリサーチチームで完全自動運転システムの研究開発に取り組んでいます。 3行でまとめ 今月開催されるCVPR2023では約2400本もの論文が発表されるため、見るべき論文を事前に検索しておきたい。 社内で行われた大規模言語モデル(LLM)ハッカソンをきっかけに、LLMのEmbeddingを用いて論文の「検索・推薦・要約」システムを作成し公開した。 検索クエリに文章を使った曖昧な検索が行えたり、類似論文の推薦ができる。6/13にアップデートされたGPT3.5の新機能であるファンクション機能を使うことで、複数観点に分けて研究内容の要約を出力させた。 ↓ 今回作成した、LLMを使ったCVPR論文検索システム 事の発端 Turingは、ハンド

                                                              GPT-3.5-turboの新機能を使ってCVPRの論文を良い感じに検索・推薦・要約するシステム
                                                            • マルウエア作成に対話型生成AIを悪用した事案についてまとめてみた - piyolog

                                                              2024年5月28日、生成AIを使用したマルウエアを作成した容疑で警視庁が男を逮捕したことが報じられました。ここでは関連する情報をまとめます。 対話型生成AIを使用しランサムウエアらしきものを作成 男の容疑は不正指令電磁的記録作成。2023年3月31日に自宅PCやスマートフォンを使用して、対話型生成AIを使用し、不正プログラムの設計情報を組み合わせてマルウエアを作成した疑い。2024年3月に警視庁は男を偽造身分証を使用してSIMカードの不正契約を行ったなどとして詐欺容疑(今回の事案とは別件)で逮捕しており、*1 捜査より自宅から押収されたPCを解析したところマルウエアが発見された。*2 生成AIを使用したマルウエア作成の事案摘発は全国で初めてとされる。*3 男が作成したマルウエアは、実行環境のデータを破壊(暗号化とも報道)し、暗号資産の要求をする機能が含まれており、いわゆるランサムウエアに

                                                                マルウエア作成に対話型生成AIを悪用した事案についてまとめてみた - piyolog
                                                              • NTT版大規模言語モデル「tsuzumi」 | NTT R&D Website

                                                                近年、ChatGPTを始めとする大規模言語モデル*1に大きな注目が集まっておりますが、これらは膨大な知識をモデル内に有することで高い言語処理性能を示す一方、学習に要するエネルギーは、原発1基1時間分の電力量が必要*2とも言われており、また、運用には大規模なGPUクラスタを必要とし様々な業界に特化するためのチューニングや推論にかかるコストが膨大であることから、サステナビリティおよび企業が学習環境を準備するための経済的負担面で課題があります。 NTTでは、これらの課題を解決する研究開発を進め、今回、軽量でありながら世界トップレベルの日本語処理性能を持つ大規模言語モデル「tsuzumi*2」を開発しました。「tsuzumi」のパラメタサイズは6~70億と軽量であるため、市中のクラウド提供型LLMの課題である学習やチューニングに必要となるコストを低減します。「tsuzumi」は英語と日本語に対応し

                                                                  NTT版大規模言語モデル「tsuzumi」 | NTT R&D Website
                                                                • 人間中心設計からAI中心設計へ ~AIエージェントによって変わるソフトウェアのパラダイム | gihyo.jp

                                                                  チャット型ソフトウェアからAIアシスタント型ソフトウェアへの変化 OpenAIが発表したChatGPTの登場から、一年以上が経とうとしています。ChatGPT API公開後の初期段階では、人間とAI(特にここでは大規模言語モデル)との単純な対話を提供するソフトウェアが中心でした。しかし今では、OpenAI GPTs(以下GPTs)やMicrosoft Copilot(以下Copilot)を代表とする、AIによる外部データへのアクセスやAPI通信によって人間を支援する「AIアシスタント型」のソフトウェアが台頭してきています。 GPTsは、ユーザー自身が好みのAIアシスタントを制作できる仕組みです。ChatGPTは汎用的な仕組みのため、特定の業務を行わせようとすると、役割や前提を含んだ長々としたプロンプトを入力する必要がありました。その点でGPTsは、AIに対する指示だけでなく、AIが参照可能

                                                                    人間中心設計からAI中心設計へ ~AIエージェントによって変わるソフトウェアのパラダイム | gihyo.jp
                                                                  • Cursor Proを3日間で300回も使い倒してみた所感

                                                                    はじめに AI搭載コードエディターCursorが話題なので自分にとって使いやすいのか実験してみました。 まだまだCursorの実験途中ではありますが、CursorProをサブスクしてたった3日でgpt-4に332回聞いてました。 Cursorはプロンプトの会話から現在のコードにDiffで提案してくれたり、エラーを解決してくれたり本当に便利で最高なのですが、頼り過ぎも良くないなと反省することもあったので、やったこと全部と感想をシェアしていきたいと思います。 やったこととしては、Cursorのチャットに質問しながら予備知識のないChatVRMというオープンソースのチャットアプリケーションの追加実装をしました。わりと簡単に実装できたこととうまくできなかったことがあるので例を挙げて紹介していきます。 Cursorとは Cursor(カーソル)とは、VScodeをフォークして作られたOpenAIのg

                                                                      Cursor Proを3日間で300回も使い倒してみた所感
                                                                    • 個人向け「Windows Copilot」が12月1日にやってくる 生成AIはPCの使い方をどう変えるのか?

                                                                      日本マイクロソフトが、生成AIを活用したアシスタントツール「Copilot」の個人向け正式版を12月1日にリリースする。現在のプレビュー版に引き続き、Webブラウザやアプリからアクセスして利用できるだけでなく、Windows 11に一機能として組み込まれる。これまでのPCの使い方に大きな変化を及ぼす、生成AIの新機能に触れる人口が大きく増えそうだ。では、具体的にどのような機能が使えるのか。 GPT-4ベースのCopilot Copilotは、人間と会話するような自然な言葉で物事を調べたり、コンテンツを創作したり、アプリの操作を指示したりできる米Microsoftの独自技術だが、ベースとなっているのは「ChatGPT」で一世を風靡(ふうび)した米OpenAIの大規模言語モデル(LLM)「GPT-4」だ。 2社の協業によって、GPT-4に検索エンジン「Bing」のアルゴリズムを統合したものがC

                                                                        個人向け「Windows Copilot」が12月1日にやってくる 生成AIはPCの使い方をどう変えるのか?
                                                                      • 研究ツールまとめ2023|cvpaper.challenge

                                                                        はじめに今年の夏, MIRU 2023 チュートリアルにて「CVPR 2023 速報」[Full ver.] [MIRU ver.]を発表させて頂きました. MIRU2023会期中, 非常に辛(から)かった飲み会の席にて偶然にも面白いB4の学生さん(Oさん)とお話する機会がありました.その出会いをきっかけに, Oさんとは共同主著を前提として共同研究を実施させて頂くことになりました. もちろん, OさんはB4の学生さんということもあり, 初めての研究でコーディング未経験という状態からのスタートです. かねがね, cvpaper.challenge研究メンバーとしても, 極めて変化の激しいコンピュータビジョン分野にてトレンドを創出するためには, どのように効率的に研究を進めていけば良いのか, 研究メンバーのプレゼンスを最大化するための方法論については片岡さんとも相談を重ねていました. また,

                                                                          研究ツールまとめ2023|cvpaper.challenge
                                                                        • チャット形式でプログラミングが可能なローカルで動作するオープンソースなAIツール「Open Interpreter」を使ってみた

                                                                          OpenAIが開発したプラグイン「Code Interpreter」を使用すると、ChatGPTにプログラミングのコードを生成してもらうことが可能ですが、インターネットに接続できないのに加え、使用できるパッケージやアップロードの容量、実行時間などに制限があります。「Open Interpreter」はローカルで動作することでそうした制限を突破し、柔軟にさまざまなプログラムを生成・実行してくれるオープンソースなAIツールとのことなので、実際に使って試してみました。 KillianLucas/open-interpreter: OpenAI's Code Interpreter in your terminal, running locally https://github.com/KillianLucas/open-interpreter/blob/main/docs/README_JA.m

                                                                            チャット形式でプログラミングが可能なローカルで動作するオープンソースなAIツール「Open Interpreter」を使ってみた
                                                                          • GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ

                                                                            はじめに 結論 背景 課題 Fine-tuning とは? Data の準備 Fine-tuning を実施 結果 おわりに 参考 はじめに こんにちは、DROBE の都筑です。 みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。 結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する事で、特定のタスクに関しては GPT-4 相当の性能が出る事が確認できた GPT-4 利用時点で使っていたプロンプトをそのまま使った場合の性能が一番高く、token 節約のためにプロンプトの省略をすると性能が劣化した 背景 LLM を利用したサービスの開発において、OpenAI を利用する場合にはモデルの選択肢がいくつかあります。2023年9月現在では、GPT-4 と GPT-3.5-

                                                                              GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ
                                                                            • OpenAI「GPTs」がもたらす革命 誰でも「自分のコパイロット」時代へ【西田宗千佳のイマトミライ】

                                                                                OpenAI「GPTs」がもたらす革命 誰でも「自分のコパイロット」時代へ【西田宗千佳のイマトミライ】
                                                                              • これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) | テクノエッジ TechnoEdge

                                                                                IT系海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 AI一色だった5月のGoogle I/Oで発表された新サービスの中でも、一般ユーザーが手軽に使えそうだと期待したのが「Search Generative Experience」(以下「SGE」)でした。まずは米国でのみの提供でしたが、これが8月30日に日本とインドでも使えるようになりました。米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。 SGEは、Microsoftの「新しいBing」のような、Web検索を生成AIチャットボットとのやりとりで行うというサービスです。全収入に占める広告収入の割合がごくわずかなMicrosoftと違い、GoogleにとってのGoogle検索(の広告)は重要

                                                                                  これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) | テクノエッジ TechnoEdge
                                                                                • 俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

                                                                                  こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。 麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか? 特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。 そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ 現状の点数計算の練習

                                                                                    俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ