並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 4315件

新着順 人気順

nlpの検索結果121 - 160 件 / 4315件

  • GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita

    先日OpenAIより発表されたGPT-4が話題ですが、同タイミングで公表されたTechnical Reportを読んでみたところ、全99ページのうち後半60ページを占めるドキュメント「GPT-4 System Card」において解説されていた、言語AIが抱える危険性と、いかにしてGPT-4が危険な回答を回避するように学習されているかについての内容が非常に興味深かったため、簡単にまとめてみました。 https://arxiv.org/pdf/2303.08774.pdf サマリ GPT-4のリリースに向けて、OpenAIでは安全性を評価するために50人超の専門家らを含む"レッドチーム"を結成。2022年8月から8ヶ月に渡ってリスクの評価とその軽減に向けたチューニングを実施してきた リスク評価における実験の中には「自身をコピーするプログラムを実行できるGPT-4が自己増殖をしないか確認する」と

      GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita
    • 大学の授業でチャットGPTをどう扱うかについての覚え書き

      1 はじめに 前回このブログを使ったのは3年前のちょうどこの時期のようです。コロナ禍で少し遅れてオンラインで授業が始まって、授業準備をしているときにコロナ関連の情報をまとめておこうと思って書いた記事でした。で、その後3年がたち、コロナ禍は一応区切りを迎えているわけですが、新学期の授業を始めるにあたっていろいろ考えなければならないという意味ではそのときと同じような状況が(もちろんいろんな意味で位置づけは違うのですが)再び…。 ということで、チャットGPTの話です。すでによく知られているようにこのアプリが登場したのは昨年11月、時期的には2022年度後期にすでに広まっていた可能性はあったし、実際アメリカの大学では一足早くレポートでの利用なんかが問題になったりしましたが、実質的にはこの4月から始まる2023年度が、日本の大学にとってチャットGPT元年ということになるのだと思います。 具体的な話に

      • ChatGPTに自社データを組み込んで新しい検索体験を模索してみました|masa_kazama

        イントロChatGPTやBing、NotionAIなどの大規模自然言語モデル(LLM)を活用したサービスが注目を集めています。対話、要約、翻訳、アイデア生成などの多様なタスクにおいて、とても性能が高いです。ただ、ChatGPTでは、ときどき嘘が混じっていたり、文献が捏造されたりすることがあります。 ChatGPTとの対話画面(結果の書籍は存在しない)それを防ぐために、BingやPerplexityでは、文献を引用した上で、なるべく嘘が紛れ込まない形で回答してくれます。 Perplexityでは引用もつけてくれるしかし、これらのAIは、Web上の公開されている一部のデータを元に学習しているので、公開されてないデータに対しては当然ながら、正しく回答できません。 そこで、この記事では、自社が保有しているデータをChatGPTに組み込んで、自社オリジナルのPerplexityのようなシステムを作る

          ChatGPTに自社データを組み込んで新しい検索体験を模索してみました|masa_kazama
        • 世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! - Qiita

          追記: U-Netの中間層は常にSelf-Attentionとなります。ご指摘いただきました。ありがとうございます。(コード) オミータです。ツイッターで人工知能のことや他媒体の記事など を紹介しています。 @omiita_atiimoもご覧ください! 世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! 未来都市にたたずむサンタクロース(Stable Diffusionで生成) 2022年8月、世界に大きな衝撃が走りました。それは、Stable Diffusionの公開です。Stable Diffusionは、テキストを受け取るとそれに沿った画像を出力してくれるモデルです1。Stable Diffsuionは10億個近いパラメータ数をもち、およそ20億個の画像とテキストのペア(LAION-2B)で学習されています。これにより、Stable Diffusionは入

            世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! - Qiita
          • Elasticsearch運用ノウハウ | メルカリエンジニアリング

            こんにちは、メルカリMicroservices SREチームの藤本(@jimo1001)です。 私は現在、Embedded SRE として サーチインフラチームに入り活動しています。このサーチインフラチームは、Elasticsearchを使用した検索基盤を管理し、様々なマイクロサービスに検索機能を提供するチームです。この検索基盤は非常に巨大なプラットフォームで、メルカリ全体のマシンリソースの高い割合を占めており、メルカリの検索を支える非常に重要なものです。私の Embedded SRE としてのミッションは検索基盤の信頼性の向上と自動化を推進することです。 今回は、メルカリの検索基盤で利用している Elasticsearch における運用のノウハウを紹介したいと思います。 Elasticsearch とは Elasticsearch は、Elastic社が開発する Apache Lucen

              Elasticsearch運用ノウハウ | メルカリエンジニアリング
            • ChatGPTで独自データを学習させて回答してもらう方法 - Qiita

              ChatGPT,使っていますか? ChatGPTは文章を要約したり、プログラム作ってくれたり、一緒にブレストしてくれたりして本当に便利なのですが、社内情報などの独自データに関する情報については回答してくれません。 プロンプトに情報を記述して、そこに書かれている情報から回答してもらう方法もありますが、最大トークン4000の壁がありますので、限界があるかと思います。 この課題についてなんとかならないかと考えて色々と調べて見たところ、解決する方法が見つかり、いろいろと検証をして見ましたのでその結果をシェアしたいと思います。 サンプルコード(GoogleColab) 百聞は一見にしかずということで、実際に試したサンプルは以下にありますので、まずは動かしてみることをお勧めします。 このコードを上から順番に動かすと、実際にインターネット上から取得したPDFファイルに関する内容をChatGPTが回答して

                ChatGPTで独自データを学習させて回答してもらう方法 - Qiita
              • 生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について

                各種方針等 arrow_forward_ios生成系AIについて 生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について 2023年4月3日 東京大学理事・副学長(教育・情報担当) 太田 邦史 この半年ほどの期間で、生成系人工知能(Generative AI)が複数発表され、社会的に大きな注目を集めています。基本的には、インターネット上などに存在する既存の文章や画像イメージを大量に機械学習し、これに強化学習を組み合わせなどして、一定レベルの品質の文章や画像を生成するシステムです。とくに、2022年11月に公開され、話題になった大規模言語モデルChatGPTはバージョンが更新され、最新のGPT-4では生成される文章などの質や正確性が著しく向上しています1。 これらの生成系AIは、平和的かつ上手に制御して利用すれば、人類の

                  生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について
                • GPTの仕組みをちゃんと勉強したい本 - きしだのHatena

                  やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。 まず理論的な概要。 機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思います。 最初は数式が多いのだけど、Σをfor文だと思いつつ、定義が説明文中に埋まってるPerlよりたちが悪い記号主体言語だと思えば読めるけどめんどくさいので飛ばしても問題ないと思います。 深層学習からマルチモーダル情報処理へ (AI/データサイエンスライブラリ“基礎から応用へ” 3) 作者:中山 英樹,二反田 篤史,田村 晃裕,井上 中順,牛久 祥孝サイエンス社Amazon で、もういきなり作る。 トークナイザーから全部つくっていきます。TensorFlowでBERTをつくってGPT2をつくる

                    GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
                  • もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ

                    こんにちは。「リーダブルコード」を先月読破して、感銘を受けた弁護士の人です。 なにに感銘を受けたかというと、「エンジニアが高級言語を効率的にコーディングするための工夫」は、契約という言語をコーディングするために援用できることがとても多いということです。 例えば、リーダブルコードは「関数には空虚な名前(tmpとかretvalとか)でなく、エンティティの実体に即した名前をつけよう!」と提案しています。 これめっちゃわかります!!!なぜなら、契約言語では当事者というクラスの表現のために「甲」「乙」という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。 しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも「一定のインプットを入れると、必ず一定のアウトプット

                      もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ
                    • 「ChatGPT」に使われる言語モデル「GPT」からうまく答えを引き出すためのOpenAI公式ガイド

                      対話型AI「ChatGPT」は人間の言葉を受けて自然な文章を返してくれますが、人間が求める答えをうまく引き出すにはちょっとしたコツが必要です。ChatGPT開発元のOpenAIは「GPTのベストプラクティス」と題し、ChatGPTに使われるモデル「GPT」からより良い結果を得るための6つの戦略をまとめて公開しました。 GPT best practices - OpenAI API https://platform.openai.com/docs/guides/gpt-best-practices OpenAIが提唱する戦略は以下の6つです。 ・明確な指示を書く ・参考テキストを提供する ・複雑なタスクをよりシンプルなサブタスクに分割する ・GPTに考える時間を与える ・外部ツールを利用する ・パフォーマンステストを実施する ◆1:明確な指示を書く 関連性の高い答えを得るには、ユーザーは文章

                        「ChatGPT」に使われる言語モデル「GPT」からうまく答えを引き出すためのOpenAI公式ガイド
                      • 【2024年最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt

                        2023年の流行語大賞にも選ばれた「生成AI」。 ChatGPTだけでなく、Google BardやClaude2など似たようなAIチャットボットも登場し、性能も日に日に上がっている感覚がありますね。 しかし、結局どれが一番賢いんだろう?と思いつつひとまずChatGPTを使っている方も多いはず。 そこで、今どのチャットAIが一番頭良いのか白黒つけてしまおう!ということで、ちょうど週末に行われた大学入試共通テスト2024を使って学力テストを行いました! 参加する学生は、 ①GPT-4くん ②Google Bardちゃん ③Claude2さん の三名です 果たして誰が学力王の座に輝くのか・・・? 選手入場①GPT-4くん一人目は、皆さんご存じChatGPTです。Open AI予備校に月額$20の課金して学力武装しています。 特徴としては、プロンプトの研究が進んでおり、画像やPDFファイルの読み

                          【2024年最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt
                        • ChatGPTにゆっくり解説やらせたらヤバかった

                          ChatGPT-4が公開されたので遊んでたところこれゆっくり解説できるんじゃね...?となったのでやってみました。 実際にできたもの 実際AIに台本を書いてもらい、編集した動画がこちらです。 チャンネル自体全然動かしてないこともあって本編のみ公開しても再生されないと思ったので本編と対になるショート動画も制作しました。 short long このクオリティーの台本をAIがサクッと作ってくれるってすごい時代ですよね。なお、この動画のタイトル自体AIに考えてもらったものです。 またいくつか動画をアップロードしましたが、途中からは編集過程も自動化しました。 用いた技術 ChatGPT Node.js AquesTalkPlayer Remotion 1.ChatGPT 言わずもながら台本を作ってくれる作家さんです。 以下のようなプロンプトを渡し、ゆっくり解説風の対話を書いてくれるように命令しました

                            ChatGPTにゆっくり解説やらせたらヤバかった
                          • 【GPT】プロンプトエンジニアリング手法まとめ - Qiita

                            はじめまして、sonesuke( https://twitter.com/sonesuke ) です。 LLMのニュースを追っかけ続けたので、これからキャッチアップする人用にまとめておきます。 単発のプロンプトテクニックについてはこちらご覧ください。 これだけは知っとけ用語 各手法の説明を読む前に、これらの用語を読んでおくと各手法がわかります。知っている人は飛ばしてください。 プロンプトエンジニアリング 入力(プロンプト)を工夫して性能をあげようというアプローチ。 機械学習系で精度アップといえば、追加学習させたりモデルを拡張するのですが、LLMではモデルが大き過ぎてコストが洒落になりません。 そのような事情からプロンプト側を工夫することで、回答に直接影響を与えるという手法が発達しています。 ファインチューニング モデルを新たな学習データで追加学習させ、モデルのパラメータを更新し、精度を高め

                              【GPT】プロンプトエンジニアリング手法まとめ - Qiita
                            • 誰でもわかる全文検索入門

                              全文検索エンジンも、事前に検索対象のデータを調べてこのような索引を作っておくことで、高速な検索を実現しています。 インターネット検索の例 たとえばインターネット検索の場合、まず各サイトからデータを収集して、その中から索引に載せる単語を選んで索引を作ります。索引のデータは下の図の右側のような表になっています。各単語と、それがどのサイトのどこにあったのかを記録しておく形です。 検索の時は、この索引データを調べます。例えば利用者が「理解」という言葉で検索したら、索引の「理解」のところを調べます。そうすると「サイトAの8文字目と18文字目、サイトGの……」と出現場所がわかるので、すぐに結果を返せます。 なお、この図では索引の単語の並び方が適当ですが、実際には本と同じように「あいうえお順」などに並べておいて、すぐに単語を見つけられるようにしてあります。 索引にない単語 この仕組みの場合、索引にある単

                                誰でもわかる全文検索入門
                              • ゴールデンウィークは自宅で学習だ!Google Cloud のトレーニングラボが30日間無料で利用できます! #うちで過ごそう | DevelopersIO

                                Pluralsight および Coursera はキャンペーン期間終了後、通常料金が課金されますのでご注意ください。 今回は無料で利用可能な Qwiklabs と Pluralsight を申請しました。招待メールは各サービスごとに届きます。 お得な利用方法 無料期間の開始は、特別オファーの申請時点ではありません。各種サービスでサブスクリプション登録が完了してから 30 日間になります。 どちらもそれなりにボリュームがありますので、最初にいずれか一方を有効化し、5月31日までにもう一方を有効化すると、実質的に 2 ヶ月弱の間、無料で GCP の学習環境が利用可能になります。 もちろんハンズオン中心の Qwiklabs と、講義動画および確認テスト中心の Pluralsight を同時に進めたい場合は同時に利用しても良いでしょう。 Qwiklabs(セルフペースハンズオン) まずは Qwi

                                  ゴールデンウィークは自宅で学習だ!Google Cloud のトレーニングラボが30日間無料で利用できます! #うちで過ごそう | DevelopersIO
                                • DATAFLUCT Tech Blog

                                  2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日本で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

                                    DATAFLUCT Tech Blog
                                  • 「敬語をちょっと直すだけでほぼ完璧な翻訳」Google翻訳以上?DeepL翻訳がスゴいという話

                                    精神科医K @dwdaai DeepL翻訳ガチでやばい こら時代が変わるわ グーグル翻訳でもなんとか意味は取れるがDeepL翻訳は敬語をちょっと直すだけでほぼ完璧な翻訳 twitter.com/jaguring1/stat… 2020-03-20 19:31:09 小猫遊りょう(たかにゃし・りょう) @jaguring1 試しに、いま僕が読み返している、グーグルのAI開発を率いている大天才Jeff Deanの論文(2019年11月13日)の概要を、DeepL翻訳(1枚目)とグーグル翻訳(2枚目)に入れてみた。 Jeff Deanの論文 arxiv.org/abs/1911.05289 DeepL翻訳 deepl.com/translator グーグル翻訳 translate.google.com/?hl=ja pic.twitter.com/9o5VJkfm11 2020-03-20 18

                                      「敬語をちょっと直すだけでほぼ完璧な翻訳」Google翻訳以上?DeepL翻訳がスゴいという話
                                    • ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ

                                      はじめに はじめまして、8月にコネヒトに入社したy.ikenoueです。 突然ですがみなさん、生成AIは使っておりますでしょうか? ChatGPTやStable Diffusionといった代表的な生成AIの発表から約1年が経過し、そろそろブームも落ち着くかと思っていたのですが、つい先日もOpenAI DevDayにてChatGPTに関する様々なアップデートが発表されるなど、相変わらず目まぐるしい日々が続いていますね。 弊社における生成AIの活用状況はというと、以前に下記の記事にて、Slack上でChatGPTと会話できる環境を社内提供しているという取り組みをご紹介しました。 tech.connehito.com 本日は、上記の社内ツールに新たに追加した「社内文書の参照機能」についてご紹介します。 「社内文書の参照機能」の概要と開発動機 まずは「社内文書の参照機能」の概要と開発にいたった動機

                                        ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ
                                      • 「うぽつ」が定着し始めたのは2011年、「草」が流行り出したのは2016年──約56億のコメントデータからニコニコ動画15年の歴史を振り返ってみた

                                        本日(2021年12月12日)、ニコニコ動画は15周年を迎えた。 もともと、YouTubeの動画にコメントを付けるサービスとして始まったニコニコ。この15年の間に書き込まれたコメント数は「約56億」にも及ぶ(生放送は除く)。 単純計算で、1年に約3.6億、1日に100万を超えるコメントが書き込まれているわけだが、実際にはどのようなコメントがよく書き込まれていたのか。流行っていたのか。 そんなちょっとした好奇心をきっかけに、今回はニコニコ動画に書き込まれた15年分のコメントデータを抽出。年別で書き込み数の多いコメントTOP10や、「うぽつ」や「草」などおなじみのコメント数の書き込み数の推移など、コメントからニコニコ15年の歴史を振り返っていく。 文/竹中プレジデント ―あわせて読みたい― ・ニコニコ動画15周年の日に、ほぼ毎週ずーーっと動画投稿している筋金入りのニコ厨にサービス開始からの思い

                                          「うぽつ」が定着し始めたのは2011年、「草」が流行り出したのは2016年──約56億のコメントデータからニコニコ動画15年の歴史を振り返ってみた
                                        • Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita

                                          08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ

                                            Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita
                                          • 【ChatGPTのおすすめプラグイン一覧】猛者達が選んだ最強プラグインの使い方69選 | WEEL

                                            現在、600を超えるChatGPTプラグインが存在します。 多すぎないか?全部試す時間なんてないよ……皆さんそう思っているのではないでしょうか。 そこで今回は、ChatGPTプラグインを片っ端から試した猛者達をリサーチし、彼らが本当にオススメしているChatGPTプラグイン69選と実際に弊社が使ってみた記事、更には各プラグインの評価までをご紹介します。 ※この記事では多くのプラグインを紹介しているため、「Ctrl+F」もしくは「Command+F」で、知りたいプラグインを検索することがおすすめです。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる ChatGPTプラグインとは? ChatGPTプラグインとは、ChatGPTにさまざまな機能を追加できるツールです。 プラグインを使うと、ChatGPTで以下のよう

                                            • 【Ver.2.3に改訂】ChatGPT英語例文自動添削プロンプト(GPT-3.5でも日本語対話が可能になりました)

                                              このプロンプトはVer.3に改訂し、別記事に掲載しました。Ver.3では、ユーザーが学びたい語彙を指定すると、すぐにChatGPTが定義・連語・例文・類義語などを提示するようにしました。 【Ver. 3に改訂】 学術英語語彙の使い方を学ぶためのChatGPTプロンプト https://yanase-yosuke.blogspot.com/2023/10/ver-3-chatgpt.html ただしChatGPTと日本語で対話したい方は、こちらのVer.2.3をお使いください。 ■ 効果- 以下で紹介するChatGPT (GPT-3.5) のプロンプトは、英語での対話を通じて、英語の学術的な語彙の使い方を教えてくれます。 - ChatGPTは、利用者が作成した英文の正しさや適切性について英語で説明してくれますし、利用者はその説明についていくらでも質問をすることができます。その結果、その語彙の

                                                【Ver.2.3に改訂】ChatGPT英語例文自動添削プロンプト(GPT-3.5でも日本語対話が可能になりました)
                                              • ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

                                                Anthropicは10月16日(現地時間)、同社が公開するAIチャットボット「Claude 2」の公開範囲を日本を含む世界95の国と地域に拡大したことを明らかにした。 リストにEU加盟国なし We’re rolling out access to https://t.co/RxKnLNNcNR to more people around the world. Starting today, users in 95 countries can talk to Claude and get help with their professional or day-to-day tasks. You can find the list of supported countries here: https://t.co/PbMuaqJcjU — Anthropic (@AnthropicAI) O

                                                  ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に
                                                • ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ー﹘-⁃➖⁻! - Qiita

                                                  はじめに これらの横棒、コンピュータにとっては全て違うのですが 見分けがつくでしょうか? -˗ᅳ᭸‐‑‒–—―⁃⁻−▬─━➖ーㅡ﹘﹣-ー𐄐𐆑 郵便番号、住所、電話番号など、横棒が使われているデータを扱うとき、 人が入力したデータや購入したデータであると、同じ記号が使われていないことはよくあることです。 090-1234-5678 090᭸1234᭸5678 090‑1234‑5678 090−1234−5678 これらの電話番号の文字列も phone_no_list = ['090-1234-5678', '090᭸1234᭸5678', '090‑1234‑5678', '090−1234−5678'] # 文字をUnicodeコードポイントに変換 for n in phone_no_list: # 文字列の4番目の横棒の文字コードを見てみる print(n[3], ord(n[3]

                                                    ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ー﹘-⁃➖⁻! - Qiita
                                                  • 「プロンプトエンジニアリング」の“教科書”、日本語版が登場 無償でAIの上手な使い方を解説

                                                    資料を和訳したのは、HRテック事業などを手掛けるギブリー(東京都渋谷区)の取締役を務める新田章太さん。翻訳作業にもGPT-4を活用したとし「日本語翻訳をよりナチュラルにできるよう、プロンプティングしながら作業したので、実質の翻訳作業はたった1日で終わった」と説明している。 関連記事 東大松尾教授が答える、ChatGPTとは何なのか? 一問一答 国内におけるAIの権威である東京大学の松尾豊教授は、ChatGPTをどう見ているのか? ChatGPTは、一時的なトレンドか技術的転換点か、AI研究者から見てChatGPTは? 日本もLLMを作ったほうがいいのか? といった問に答えた GPT-4にGPT-4の発表を要約させてみた 人間よりも良い記事になるか? 超長文をChatGPTに読ませる方法も 米OpenAIの大規模言語モデル「GPT-4」。言語処理性能がずば抜けているというが、ではGPT-4は

                                                      「プロンプトエンジニアリング」の“教科書”、日本語版が登場 無償でAIの上手な使い方を解説
                                                    • まっくす on Twitter: "昨今のお絵描きAIの進捗が著しく、いろんな方に一歩踏み込んで知ってもらいたいと思ったのでその仕組みについて解説資料を公開します〜(先日の技術書典の本の内容です)。これからいろんな分野の方が押さえておいても良い技術だと思うので、仕組みから興味持ってもらいたいなーという気持です。(1/5) https://t.co/p7iBSY7ma5"

                                                        まっくす on Twitter: "昨今のお絵描きAIの進捗が著しく、いろんな方に一歩踏み込んで知ってもらいたいと思ったのでその仕組みについて解説資料を公開します〜(先日の技術書典の本の内容です)。これからいろんな分野の方が押さえておいても良い技術だと思うので、仕組みから興味持ってもらいたいなーという気持です。(1/5) https://t.co/p7iBSY7ma5"
                                                      • GPT4内のプログラム、地味に特許とろうと温めてたけど、間に合わなさそうなのでもう出しちゃお。 以下みたいに書くと、雑なプロンプトでも勝手に高品質になる。

                                                          GPT4内のプログラム、地味に特許とろうと温めてたけど、間に合わなさそうなのでもう出しちゃお。 以下みたいに書くと、雑なプロンプトでも勝手に高品質になる。
                                                        • ユニットテストをGitHub CopilotとChatGPT使って書いてみたらやばかったです | DevelopersIO

                                                          GitHub Copilotとの単体テストがやばい。ChatGPTが書いてくれるテストもすごい。もうこれらがない時代には戻れないような気がします。 こんにちは。AWS事業本部コンサルティング部に所属している今泉(@bun76235104)です。 みなさんユニットテスト書いてますか? 昨今AIがダミーデータを書いてくれたり、ユニットテストそのものを書いてくれたりと技術の進歩がすごいですね。 私はリファクタリングが好きですが、リファクタリングをする前に絶対に必要なもの。 そうテストですね。 今回私がテストを後回しにしてしまった以下のOSSについてGitHub CopilotとChatGPTのそれぞれの力を借りながら、テストを書いてみました ※ これは以前私が始めたプロジェクトであり、OSSとして公開されているので学習に使われても問題のないコードです。 なお、GitHub Copilotの料金や

                                                            ユニットテストをGitHub CopilotとChatGPT使って書いてみたらやばかったです | DevelopersIO
                                                          • Perplexity AI

                                                            Bulletproof coffee, also known as butter coffee or keto coffee, is a high-calorie drink made with added fats, intended to fuel your start to the day. It was created by Dave Asprey, the originator of the Bulletproof Diet, and is popular among low-carb dieters and those following a ketogenic diet. The drink consists of coffee made from high-quality beans, unsalted butter, and a medium-chain triglyce

                                                            • pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

                                                              これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ

                                                                pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama
                                                              • ChatGPTの衝撃 第2章 -2024年6月バージョン-

                                                                企業・組織に属している方向けの ChatGPT の社会・ビジネスへの影響を考えるお話です。 人とComputerの在り方が大きく変わったこれらも交えて。それらが周囲にあふれ出すその日のために、今はしっかりと Prompt の仕方を学んでおきたいものです。そのためのサンプルも幾つか継続して提示しています - AI Transformation と、その構成要素 - ChatGPT の具体的な業務での利用例 - とある人のChatGPT業務利用の話。ただし1年以上前。 - Microsoft 365 Copilot の可能性 そして、自分で動かすための演習。こちらが演習のコンテンツです。 https://github.com/dahatake/ChatGPT-Prompt-Sample-Japanese/tree/main/Workshop

                                                                  ChatGPTの衝撃 第2章 -2024年6月バージョン-
                                                                • 「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する | AIDB

                                                                  ホーム AI論文解説, LLM, プロンプト 「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する 「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する 2023/11/3 AI論文解説 LLM プロンプト AIDB Research 感情を込めたプロンプトが大規模言語モデル(LLM)の性能を向上させることが示されました。「自分を信じて限界を超えてください」や「困難は成長のチャンスです。」といった自信や成長に関わる要素を含む指示が、モデルの出力品質に貢献するとの報告です。 この発見は、人間の感情を取り入れたアプローチが、人工知能の分野においても重要な役割を果たす可能性を示唆しています。Microsoftなどの研究グル

                                                                    「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する | AIDB
                                                                  • 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開

                                                                    株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 2023年1月18日 株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 ※音声コーパス: 音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右する。 ※2「ReazonSpeech」を用いた文字起こしサービスをプロジェクトwebサイトにて実際に試すことができます。 プロジェクトwebサイト:https://

                                                                      超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開
                                                                    • サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―

                                                                      株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、最大68億パラメータの日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことをお知らせいたします。 近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。 一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および日本文化に強いLLMは少ない状況です。 ■最大68億パラメータの日本語LLM(大規模言語モデル)の公開について こうした背景のもと、当社は日本語LLMの開発に取り組んでおり、このたび一部モデルをHugging Face Hubにて公開いたしました。公開されたモデルはオープンな日本語データ※2で学習したもので

                                                                        サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―
                                                                      • (数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門

                                                                        (数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理 複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ 概要: ChatGPT などで使われている Transformer モデルは、 ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。 本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。 実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、 その注釈版である The Annotated Transformer を参照のこと。 日本語では この解説 がわかり

                                                                        • 話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita

                                                                          話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDFOpenAIChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに 本記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。 具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する 分割したテキストからテキスト間の関連を表すベクターデータを作成する 作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与

                                                                            話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita
                                                                          • つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用

                                                                            つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用 この本では、LangChain と Streamlit を用いて、ChatGPT APIを活用するAIアプリを開発していきます。つくりながら学ぶことを重視し、簡単なチャットアプリ開発から始めて、Embeddingを活用するアプリ開発まで、ステップバイステップで学べます。 AIアプリをローカル環境で開発した後は、WEB上にデプロイする方法も学びます。クラウドの知識もほぼ必要なく、ランニングコストも掛からない方法で行うため、ぜひ作ったアプリを公開することにチャレンジしてみましょう。 500円と設定していますが投げ銭用です。本文は全て無料で読めます。

                                                                              つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用
                                                                            • 子供にマインクラフト使ったPythonプログラミングを教えようとしたらChatGPT使ったプログラミング不要な世界を体験させちゃった | DevelopersIO

                                                                              子供にマインクラフト使ったPythonプログラミングを教えようとしたらChatGPT使ったプログラミング不要な世界を体験させちゃった こんにちは、会社ではCX事業本部モダンオフショア推進担当、家庭では3児の父親の藤村です。 IT業界で働く親として、子供には幼い頃からプログラミングに親しんでもらいたいと思い、時々Scratchを使った簡単なプログラミングなどを教えていたのですが、ちょっとすると「友達とゲームする時間だから止めるね!」といって、友達とのNintendo Switch使ったオンラインゲーム(FortniteやMinecraftなど)をやり始めてしまい、親としては少し残念な気持ちになっていました。 そんな時に、『マインクラフトでわくわく学ぶ!Pythonプログラミング入門』という書籍が最近発売されたことを知りました。 マインクラフトでPythonを学ぶ!これは息子にドンピシャの内容

                                                                                子供にマインクラフト使ったPythonプログラミングを教えようとしたらChatGPT使ったプログラミング不要な世界を体験させちゃった | DevelopersIO
                                                                              • Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説

                                                                                Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説:これからのAIの話をしよう(自動翻訳編)(1/4 ページ) 国産翻訳エンジンを使った「みらい翻訳」が高精度だとネットで話題に。なぜGoogle翻訳より高精度といわれているのか。開発者のNICT隅田氏に聞いた。 今年3月、大阪メトロの英語サイトが路線名の「堺筋線」を「Sakai Muscle Line」と誤訳していたことがネットで話題になりました。米Microsoftの自動翻訳ツールによる翻訳をそのまま掲載していたことが原因です。 「さすが大阪、ボケ方が半端ない」などと友人にからかわれてしまったのですが、この事件には根深い問題が隠れています。 Google翻訳を使うと、いまでも堺筋線は「Muscular line」で、三両目は「Third eye」と訳されます。精度が高いと評判のGoogle翻訳でも誤訳してい

                                                                                  Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説
                                                                                • ChatGPTの10ヶ月と開発トレンドの現在地

                                                                                  9/28の #日本CTO協会 さんのイベントで登壇した資料を公開しました。 「ChatGPTの10ヶ月と開発トレンドの現在地」 開発のトレンドの最新情報をざっくり纏めています。 ・Prompt Engineering開発の現在地 ・RAG開発の現在地 ・Plugin開発の現在地 ・GPT-Vの登場と生成AI時代のこれからについて やや開発者寄りな内容なので、基礎を知りたい場合はAzure OpenAI大全も併せてご確認を。 (こっちも近々最新化します…) https://speakerdeck.com/hirosatogamo/chatgpt-azure-openai-da-quan

                                                                                    ChatGPTの10ヶ月と開発トレンドの現在地