ragの人気記事 120件 - はてなブックマーク

1 - 40 件 / 120件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ragの検索結果1 - 40 件 / 120件

ragに関するエントリは120件あります。 LLM、 AI、 RAG などが関連タグです。人気エントリには『ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ』などがあります。

ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ
- 487 users
- tech.connehito.com
- テクノロジー
- 2023/11/15
はじめにはじめまして、8月にコネヒトに入社したy.ikenoueです。突然ですがみなさん、生成AIは使っておりますでしょうか？ ChatGPTやStable Diffusionといった代表的な生成AIの発表から約1年が経過し、そろそろブームも落ち着くかと思っていたのですが、つい先日もOpenAI DevDayにてChatGPTに関する様々なアップデートが発表されるなど、相変わらず目まぐるしい日々が続いていますね。弊社における生成AIの活用状況はというと、以前に下記の記事にて、Slack上でChatGPTと会話できる環境を社内提供しているという取り組みをご紹介しました。 tech.connehito.com 本日は、上記の社内ツールに新たに追加した「社内文書の参照機能」についてご紹介します。「社内文書の参照機能」の概要と開発動機まずは「社内文書の参照機能」の概要と開発にいたった動機
- ChatGPT
- AI
- あとで読む
- 開発
- LLM
- 検索
- 人工知能
- rag
- 文章生成AI
- 自然言語処理
ChatGPTの10ヶ月と開発トレンドの現在地
- 440 users
- speakerdeck.com/hirosatogamo
- テクノロジー
- 2023/09/29
9/28の #日本CTO協会さんのイベントで登壇した資料を公開しました。「ChatGPTの10ヶ月と開発トレンドの現在地」開発のトレンドの最新情報をざっくり纏めています。・Prompt Engineering開発の現在地・RAG開発の現在地・Plugin開発の現在地・GPT-Vの登場と生成AI時代のこれからについてやや開発者寄りな内容なので、基礎を知りたい場合はAzure OpenAI大全も併せてご確認を。 (こっちも近々最新化します…) https://speakerdeck.com/hirosatogamo/chatgpt-azure-openai-da-quan
- ChatGPT
- あとで読む
- AI
- Azure
- GPT
- OpenAI
- 開発
- CTO
- 機械学習
- LLM
RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
- 304 users
- dev.classmethod.jp
- テクノロジー
- 2024/02/06
はじめに新規事業部生成AIチーム山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい
- RAG
- LLM
- AI
- あとで読む
- ChatGPT
- 検索
- 自然言語処理
- 機械学習
- deeplearning
- ドキュメント
RAGの実装戦略まとめ - Qiita
- 279 users
- qiita.com/jw-automation
- テクノロジー
- 2024/03/19
それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチこちらは、性質の異なる複数の検索方式（例えばベクトル検索とキーワード検索）を組み合わせて検索精度を向上させる手法になります。各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質
- RAG
- AI
- LLM
- あとで読む
- プログラミング
- 開発
- 自然言語処理
- 検索
- ChatGPT
- qiita

⼤規模⾔語モデルの拡張（RAG）が終わったかも知れない件について
- 263 users
- speakerdeck.com/nearme_tech
- テクノロジー
- 2024/04/09
Zero Waste, Radical Magic, and Italian Graft – Quarkus Efficiency Secrets
- LLM
- AI
- RAG
- あとで読む
- GPT
- 人工知能
RAGの性能を改善するための8つの戦略 | Fintan
- 262 users
- fintan.jp
- テクノロジー
- 2024/02/09
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
- RAG
- LLM
- AI
- あとで読む
- 検索
- ChatGPT
- OCR
- チューニング
- 自然言語処理
- 人工知能
【未経験者大歓迎】RAG超入門：AWSが推奨するRAGを体験するハンズオン - Qiita
- 244 users
- qiita.com/moritalous
- テクノロジー
- 2024/05/03
2024/5/5更新：生成AIに興味を持った方向け、続編を投稿しました。「Qiitaに聞いた！！」をAmazon Bedrockで作った！（Claude 3でRAG）タイトルはふざけてますが、プロンプトエンジニアリングにより本投稿と同様の内容を行う解説をしています。（BedrockのClaude 3モデルと、Google検索を使った構成です）生成AIはとても注目度が高い技術ですが、すこしとっつきにくいところがあるかもしれません。新しいモデルや活用手法が毎日のように登場し、ウォッチし続けるのはかなり大変です。タイミングを逃して入門できていない方向けに、とりあえず作って体感してみようというコンセプトで、ハンズオン記事を作成しました。🎉🎉🎉 ハンズオンの内容は「RAG」です。RAGは生成AIの活用法としてよく出てくるキーワードです。ハンズオンでは、ただのRAGではなく最先端の
- aws
- あとで読む
- RAG
- AI
- LLM
- qiita
- 自然言語処理
- 入門
- ブログ
- 参考
社内ナレッジ共有GPTの作り方を動画で徹底解説【GPTsハッカソン＠GMO Yours最優秀賞作品】｜ChatGPT研究所
- 208 users
- chatgpt-lab.com
- テクノロジー
- 2024/03/20
前書き本記事では、2/27に開催されたGPTsハッカソン @GMO Yours で優勝した社内ナレッジ共有GPT『Share Knowledge In Your Company』と『FAQ collector』の作り方をご紹介します。 ※本記事は、本GPT作成者のArai Motokiさんに寄稿していただきました 2024/02/27 に行われたGPTsハッカソン＠GMO Yoursの最優秀賞作品です。私（製作者自身）が動画で解説し、作り方も全文公開します。できる限りみなさまのお役に立てるように解説をいたします。長文なので大変だと思いますが、解説動画までを見るだけでも学びはあると思います! 想定している読者申し訳ございませんが、すべてを説明するにはかなりの長文になってしまうため、想定している読者は何度かGPTsを作ったことがあり、より深くGPTsを理解したい人、GPTsの精度を上げてい
- ChatGPT
- あとで読む
- AI
- RAG
- api
- 文章生成AI
- 生成AI
- データ
- GPT
- 動画
「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
- 203 users
- tech.connehito.com
- テクノロジー
- 2023/12/09
※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。はじめにこの記事はコネヒトアドベントカレンダー 8日目の記事です。コネヒト Advent Calendar 2023って？コネヒトのエンジニアやデザイナーやPdMがお送りするアドベントカレンダーです。コネヒトは「家族像」というテーマを取りまく様々な課題の解決を目指す会社で、ママの一歩を支えるアプリ「ママリ」などを運営しています。 adventar.org こんにちは！コネヒトの機械学習エンジニア y.ikenoueです。突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS
- aws
- あとで読む
- 検索
- 開発
- AI
- rag
- Generative AI
- LLM
- amazon
GPT連携アプリ開発時の必須知識、RAGをゼロから解説する。概要＆Pythonコード例
- 185 users
- zenn.dev/spiralai
- テクノロジー
- 2024/02/10
こんにちは。わいけいです。今回の記事では、生成AI界隈ではかなり浸透している RAG について改めて解説していきます。「低予算で言語モデルを使ったアプリを開発したい」というときに真っ先に選択肢に上がるRAGですが、私自身もRAGを使ったアプリケーションの実装を業務の中で何度も行ってきました。今回はその知見をシェア出来れば幸いです。 RAG（Retrieval-Augmented Generation)とはまず、そもそもRAGとは何ぞや？というところから見ていきましょう。 RAG（Retrieval-Augmented Generation) は自然言語処理（NLP）と特に言語モデルの開発において使用される技術です。この技術は、大規模な言語モデルが生成するテキストの品質と関連性を向上させるために、外部の情報源からの情報を取得（retrieval）して利用します。要は、Chat
- ChatGPT
- LLM
- あとで読む
- python
- AI
- GPT
- 開発
- 自然言語処理
- OPENAI
- deeplearning
社内情報検索システムで用いられるRAGの4つの実装方法
- 180 users
- speakerdeck.com/mkazutaka
- テクノロジー
- 2023/10/13
2 松本和高  株式会社エクスプラザリードエンジニア  X: _mkazutaka  Github: mkazutaka  18年にバックエンドエンジニアとしてメルカリに入社。その後、ミラティブ、フリーランスを得て株式会社エクスプラザに所属。フロントエンドからバックエンドまで幅広く開発しています。趣味で、FXの自動売買Botを作成している  現在08/30に第一子が生まれ現在育休中  https://note.com/mkazutaka/n/n9f0e2c4dee96 CONFIDENTIAL INFORMATION: Not for Public Distribution - Do Not Copy 3 株式会社エクスプラザ（EXPLAZA, Inc.）会社名プロダクトの力で、豊かな暮らしをつくるミッション代表取締役CEO 高橋一生代表者 2020年07月03日設
- LLM
- あとで読む
- RAG
- システム
- UX
- 検索
生成AIの「RAG」とは？知っておきたい重要キーワードを解説する【イニシャルB】
- 163 users
- internet.watch.impress.co.jp
- テクノロジー
- 2024/04/08
- AI
- あとで読む
- RAG
- 生成AI
- 自然言語処理
- 人工知能
- LLM
- 機械学習
社内用語集を気軽に質問できるSlackBotを作ってみた (RAGの応用アプリ) - ABEJA Tech Blog
- 154 users
- tech-blog.abeja.asia
- テクノロジー
- 2024/02/08
こんにちは！株式会社 ABEJA で ABEJA Platform 開発を行っている坂井（GitHub : @Yagami360）です。 LangChain を使用すれば、RAG [Retrieval Augment Generation] を使用した LLM アプリケーションを簡単に作成できるので便利ですよね。今回 LangChain での RAG を使用して、LLM が学習に使用していない特定ドメインでの用語を応答する Slack ボットをさくっと作ってみたので共有します。本コード一式は、以下の GitHub レポジトリに保管しています。 github.com 使い方コード解説アーキテクチャ RAG の仕組みヒューマンインザループによる継続的品質改善まとめ We Are Hiring! 使い方事前準備として｛用語集スプレッドシートの作成・Slack アプリの初期設定・各種
- LLM
- あとで読む
- RAG
- slack
- AI
- アプリ
- algorithm
- 学習
AWSの生成AIで社内文書検索！ Bedrockのナレッジベースで簡単にRAGアプリを作ってみよう - Qiita
- 152 users
- qiita.com/minorun365
- テクノロジー
- 2024/03/01
この記事について AWSコミュニティ最大級のイベント「JAWS DAYS 2024」内のワークショップにて実施したハンズオンコンテンツとなります。イベントでは口頭で説明しながら実施しますが、この記事さえ読めば誰でも体験できるように作っていますので、当日イベントにお越しになれない方もぜひご活用ください。（スムーズにいけば30分程度で完了します）本ハンズオンの実施にあたり、多少の課金（数十円〜数百円以内）が発生することをご了承ください。実施後には忘れず不要なリソースの削除をお願いします。なお、Bedrockのモデル呼び出し料金はAmazon製のTitanシリーズを除き、マーケットプレイス扱いとなるためAWSクレジット（クーポン）の適用範囲外となります。 ※事前にAWSアカウントの作成をお願いします。クレジットカード情報が必要です。ログイン用のEメールアドレスとパスワードをお忘れなく！ 0
- aws
- あとで読む
- RAG
- AI
- 人工知能
- Bedrock
- アプリ
- qiita
- 検索
RAGにおけるドキュメント検索精度向上について(概要編)
- 151 users
- zenn.dev/sompojapan_dx
- テクノロジー
- 2023/11/11
はじめまして。損害保険ジャパン株式会社 DX推進部の眞方です。普段はリードエンジニアとして、新しいサービスのアーキテクチャ検討からローンチまでの作業や、新規技術を用いたアプリのプロトタイプ実装などを行なっています。弊社では、LLM（Large Language Models）を活用したアプリケーションの開発を積極的に検討し、既に社内でいくつかのプロトタイプをローンチしています。本記事では、その最も一般的？なユースケースの一つとも言えるRAG（Retrieval Augmented Generative）の構築において、ドキュメント検索精度の向上にどのように取り組んだ内容の概要を紹介させていただきます。実際の詳細な手法および結果については、別記事（実践編）で解説予定です。はじめに RAGとは？この記事を読まれている方の中にはご存知の方も多いでしょうが、RAGとはRetrieval A
- LLM
- あとで読む
- AI
- ドキュメント
- 検索
- GPT
- deeplearning
優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう！ - Qiita
- 145 users
- qiita.com/itokazu
- テクノロジー
- 2024/04/14
1. はじめに Cohere社が最近リリースしたLLMのCommand R+がGPT4に迫る性能を発揮していたり、RAG利用での性能で話題となっています。そのCommand R+でRAGを体験できるチャットアプリの実装がLightningAIにてチュートリアルが公開(CC-BY-4.0ライセンスとして)されています。これを身近な環境で動かしてみたいと思います。このチャットボットでCohere社の以下のモデルが使われています LLM: Command R+ Embed: embed-english-v3.0 / embed-multilingual-v3.0 Reranker: rerank-english-v3.0 / rerank-multilingual-v3.0 以下の動画のようにブラウザでPDFファイルをアップロードしてチャットで問い合わせができます。 2. 必要なもの以下
- AI
- あとで読む
- LLM
- qiita
- API
RAGを複雑な質問に強くする手法「CoA」について
- 142 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/04/16
本記事では、「Chain-of-Abstraction (CoA) Reasoning」についてざっくり理解します。軽めの記事です。株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、最近聞くようになった「Chain-of-Abstraction (CoA) Reasoning」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー LLMが外部ツールを使って回答を生成するときの、回答精度を高める手法についての論文です。Metaの研究者らによって2024年1月に提案されました。「Chain-of-Abstraction (CoA)」という手法を使うメリットは、RAGに応用することで
- RAG
- LLM
- AI
- あとで読む
- 自然言語処理
- 機械学習
- 読んだ
LLMのRAG（外部知識検索による強化）をまとめた調査報告 | AIDB
- 117 users
- ai-data-base.com
- テクノロジー
- 2023/12/28
LLMのRAG（外部知識検索による強化）についての調査結果が報告されています。基本フレームワークと各構成要素の詳細、評価、そして今後の発展について言及されており網羅的です。本記事では、その報告内容を抜粋してお届けします。参照論文情報タイトル：Retrieval-Augmented Generation for Large Language Models: A Survey 著者：Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Haofen Wang 所属：Tongji University, Fudan University URL：https://doi.org/10.48550/arXiv.2312.10997 本記事の関連研究：LLMにナレッジグ
- LLM
- RAG
- あとで読む
- 人工知能
- 検索
- AI
世田谷区がAI botを内製　非エンジニア職員がローコードで開発　ChatGPT活用「ヒデキ」
- 104 users
- www.itmedia.co.jp
- テクノロジー
- 2024/03/13
世田谷区が、職員用のチャットツールを使ってChatGPTに質問できるbot「Hideki」（ヒデキ）を内製で開発し、1月から全職員に提供している。非エンジニアの職員チームが、ローコードツールなどを駆使して3カ月で完成させたという。生成AI活用の支援などを手掛けるクラウドネイティブが3月12日に発表した。 Microsoft Azure OpenAI Serviceを活用。職員が普段から使っているTeamsのチャットツールでヒデキに質問でき、ChatGPTを業務に活用できる。文章校正やWord／Excel操作に関する疑問の解消、アイデアの壁打ちなどに活用されているという。利用した職員127人に聞いたところ、「生産性の向上を実感した」人が73％に上り、通常業務で1日平均約34分削減、アイデアや企画の素案作成は、1回当たり平均約77分削減できたいう。非エンジニアチームが兼務で開発、3カ月で完
- AI
- GovTech
- RAG
- あとで読む
- ChatGPT
- エンジニア
- アイデア
自社データ × ChatGPTで社内AIを構築するRAG ツール｜Doox β版をリリースしました - Qiita
- 94 users
- qiita.com/heapjp
- テクノロジー
- 2024/04/01
TLDR 社内のデータを元に質問への回答を LLM が生成する仕組み（RAG）を構築するためのサービスを開発しました。 β 版として無料で公開しているので是非使ってみてください。サーバーレスな構成で Next.js を動かしている。技術のキャッチアップは大変だ。背景仕事をしていると社内の規定 / 製品情報 / 過去の履歴 .. などに関する問い合わせは日常的に発生するものだし、その工数は結構ある。通常は Wiki を作ってナレッジを共有するが、結局「近い人や担当に聞く」という行為はなかなか減らない。色々な企業が、社内のデータを元に質問への回答を LLM が生成する仕組み（RAG）を独自に開発しているようで、技術ブログとかに書いている方も多い。社内向け RAG の構築を SaaS プロダクトで提供したら各社の社内の問い合わせ工数と独自に RAG を構築するコストを下げられて嬉しいん
- ChatGPT
- あとで読む
- rag
- js
- 開発
- qiita
- aws
- ツール
- development
- データ
Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
- 87 users
- blog.shikoan.com
- テクノロジー
- 2024/04/27
2.3k{icon} {views} 複数のLLM（GPT/Claude3）とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題（TSP）が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。できたもの Arxivの検索APIを使って検索拡張生成（RAG）したらサーベイを自動生成できたやっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題（TSP）を解いてソートをかける論文の要旨をGPT-3.5-Turboで要約ソートした
- RAG
- AI
- あとで読む
- 自然言語処理
- アルゴリズム
- LLM
- 論文
- 研究
RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた | DevelopersIO
- 83 users
- dev.classmethod.jp
- テクノロジー
- 2023/09/22
はじめに新規事業部山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい情報に関して回答
- RAG
- LLM
- ai
- OpenAI
- あとで読む
- ChatGPT
- 検索
- 人工知能
- プログラミング
【ChatGPT】とベクトルデータベースによる企業内データの活用(いわゆるRAG構成) - Qiita
- 77 users
- qiita.com/ksonoda
- テクノロジー
- 2023/09/29
本記事は日本オラクルが運営する下記Meetupで発表予定の内容になります。発表までに今後、内容は予告なく変更される可能性があることをあらかじめご了承ください。下記セッションでは、本記事の内容以外にデモンストレーションも実施する予定です。 ※セミナー実施済の動画に関しては以下をご参照ください。はじめに 2022年暮れ、ChatGPTの登場以降、あらゆる企業がDXの在り方を問われはじめ、大規模言語モデルの仕組みをどのように業務に取り入れるかを検討されていると思います。その検討の一つとして、「GPT(LLM)が学習していない企業内のデータや最新のデータも有効活用すべき」という点は非常に大きな論点なのではないでしょうか。ご存じの通り、LLMとはインターネット上に存在するドキュメントデータをクローリングにより大量に収集し、それを学習データとして機械学習にかけたモデルです。従って、至極当たり
- LLM
- RAG
- ChatGPT
- あとで読む
- LangChain
- データベース
- 人工知能
Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ
- 73 users
- techblog.nhn-techorus.com
- テクノロジー
- 2024/03/30
Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発するはじめにこんにちは！第一SAチームのshikaです。普段、あるAmazon RDS上のデータベース（MySQL）に対し、SQLを実行してデータを参照しています。毎回SQLクエリを実行するのが手間だったので、データ検索を容易にするWebアプリケーションを開発しました。このアプリケーションには、AWSの生成AIサービス「Amazon Bedrock」を活用しており、生成AIを用いた対話式の検索機能を実現しています。できあがったアプリケーションの画面は以下です。データはテストデータを使ってます。以下の通り、架空の会社の従業員情報に関するデータです。本記事ではこのアプリケーションの構成、仕組みについて、特にAmazon Bedrockの部分を重点を置いて解
- AI
- あとで読む
- AWS
- RAG
- 自然言語処理
- 調査
- データ
Retrieval-based LM (RAG system) ざっくり理解する
- 71 users
- speakerdeck.com/smiyawaki0820
- テクノロジー
- 2023/11/01
自分用の整理・勉強会用として作成した解説資料です。内容の正確性については保証しかねますので必ず論文を参照してください。誤りや引用漏れ等がありましたら @catshun_ までご指摘いただけますと幸いです。
- LLM
- rag
- 自然言語処理
- あとで読む
- NLP
- 論文
GPTsより精度の高いRAGシステムの構築
- 69 users
- speakerdeck.com/mkazutaka
- テクノロジー
- 2023/12/20
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
- RAG
- LLM
- AI
- あとで読む
ローカルで気軽にRAGを使って会話することが簡単すぎてビビった。 - Qiita
- 65 users
- qiita.com/mitsumizo
- テクノロジー
- 2024/02/25
今日は、ローカルにてRAG(Retrieval-Augmented Generation)を使って、あるPFDについて質問するチャットを作ろうと思う。 OpenAIを使うので、無料ではないので注意されたい。今回のソースは LangChain 完全入門という本を参考にしていて、とても勉強になるので購入をお勧めする。行いたいことローカルでPDFを読み込ませて、内容を質問したり、要約させること。大きな流れ環境準備チャットアプリの土台の作成プロンプトを定義アップロードされたPDFファイルを分割内容をベクトル化し保存入力された質問とPDFから抽出した適した文をOpenAIに送信回答を得る。詳細環境準備環境構築 Python : 3.11.6 pip ライブラリ chainlit==1.0.101 チャット画面を簡単に作るライブラリ chromadb==0.4.22 ベク
- ChatGPT
- RAG
- AI
- LLM
- あとで読む
- プログラミング
- pdf
- qiita
- programming
「Amazon Q Business」正式リリース。MS365やS3などの社内の情報源と接続、会社の経営情報から有給休暇の残りまでチャットAIが答えてくれる
- 63 users
- www.publickey1.jp
- テクノロジー
- 2024/05/08
「Amazon Q Business」正式リリース。MS365やS3などの社内の情報源と接続、会社の経営情報から有給休暇の残りまでチャットAIが答えてくれる Amazon Web Servicesは、新たなAIサービス「Amazon Q Business」の正式リリースを発表しました。 Amazon Q Businessは企業向けのAIサービスで、Amazon S3やAmazon RDS、Amazon Auroraを始めとするAWSのサービスやMicrosoft 365、Salesforce、Dropbox、Google Drive、Gmailなどのさまざまな社内の情報源と接続可能です。サードパーティのアプリケーションにAPI経由で接続するカスタムプラグインの構築が可能になります。これにより、ユーザーは自然言語のプロンプトを使用して、Amazon Q BusinessからAPIを通じてサ
- aws
- あとで読む
- AI
- Amazon
- techfeed
- api
RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解 | SIOS Tech. Lab
- 59 users
- tech-lab.sios.jp
- テクノロジー
- 2024/02/23
◆ Live配信スケジュール ◆ サイオステクノロジーでは、Microsoft MVPの武井による「わかりみの深いシリーズ」など、定期的なLive配信を行っています。 ⇒ 詳細スケジュールはこちらから ⇒ 見逃してしまった方はYoutubeチャンネルをご覧ください【4/18開催】VSCode Dev Containersで楽々開発環境構築祭り〜Python/Reactなどなど〜 Visual Studio Codeの拡張機能であるDev Containersを使ってReactとかPythonとかSpring Bootとかの開発環境をラクチンで構築する方法を紹介するイベントです。 https://tech-lab.connpass.com/event/311864/ こんにちは、サイオステクノロジー武井です。今回は、「RAG構築のためのAzure OpenAI Serviceリファレンスア
- RAG
- Azure
- AI
- OpenAI
- 人工知能
- あとで読む
- 検索
ナレッジグラフを用いたRAGの改善 - Ahogrammer
- 54 users
- hironsan.hatenablog.com
- テクノロジー
- 2024/03/21
RAG（Retrieval Augmented Generation）は大規模言語モデル（LLM）の性能を改善するための手法の1つであり、質問に対する回答を生成する際に、外部知識源から情報を取り込みます。これにより、LLM 自体で学習できる情報量に制限されることなく、より正確で詳細な回答を生成することができます。よく使われているRAGでは、外部知識源として検索エンジンにテキストをインデックスしておき、質問に関連するテキストをベクトル検索や全文検索を用いて取得します。しかし、構造化データを扱うことには苦労するため、質問によっては回答が不十分、あるいはまったく回答できないことに繋がります。これらの問題を克服するために、ナレッジグラフを用いたRAGが構築されることがあります。ナレッジグラフでは、エンティティとその間の関係がグラフ構造で表現されており、単純な検索を用いた場合には回答できないよ
- RAG
- AI
- LLM
- あとで読む
- 検索
Claude3を使って人間が読むようにパワポ資料を読み込んでみる | DevelopersIO
- 54 users
- dev.classmethod.jp
- テクノロジー
- 2024/03/06
はじめに新規事業部生成AIチーム山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい
- Claude
- RAG
- AI
- LLM
- あとで読む
LangChain への OpenAIのRAG戦略の適用｜npaka
- 53 users
- note.com/npaka
- テクノロジー
- 2023/11/18
以下の記事が面白かったので、かるくまとめました。・Applying OpenAI's RAG Strategies 1. はじめに「Open AI」はデモデーで一連のRAG実験を報告しました。評価指標はアプリケーションによって異なりますが、何が機能し、何が機能しなかったかを確認するのは興味深いことです。以下では、各手法を説明し、それぞれを自分で実装する方法を示します。アプリケーションでのこれらの方法を理解する能力は非常に重要です。問題が異なれば異なる検索手法が必要となるため、「万能の」解決策は存在しません。 2. RAG スタックにどのように適合するかまず、各手法をいくつかの「RAGカテゴリ」に分類します。以下は、カテゴリ内の各RAG実験を示し、RAGスタックに配置する図です。 3. ベースライン距離ベースのベクトルデータベース検索は、クエリを高次元空間に埋め込み（表現）し、「距離」に基
- LLM
- OpenAI
- SQL
- あとで読む
【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています - Qiita
- 51 users
- qiita.com/shure___
- テクノロジー
- 2024/04/02
自身の研究のためにLLMに関する論文を表形式でまとめています。このレポジトリでは特にさまざまな分野の論文を表にする(Comprehensive)ことを目的としています。具体的には以下のキーワードに注目しています。 CoT / VLM / Quantization / Grounding / Text2IMG&VID / Prompt / Reasoning / Robot / Agent / Planning / RL / Feedback / InContextLearning / InstructionTuning / PEFT / RLHF / RAG / Embodied / VQA / Hallucination / Diffusion / Scaling / ContextWindow / WorldModel / Memory / ZeroShot / RoPE / Spe
- LLM
- RAG
- あとで読む
- 論文
- qiita
- github
- 考察
- 資料
大規模言語モデルを作る、拡張する
- 48 users
- speakerdeck.com/stillpedant
- テクノロジー
- 2024/02/22
大規模言語モデルの作りかたを 1. 事前学習 (Pre-Training) 2. 事後学習 (Post-Training) 3. モデル選定・評価 (Model Selection / Evaluation) に分けてご紹介します。 https://dbsj.org/dbsj_lecture/ でのトーク内容です。
AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します！/Azure RAG knowledge share
- 47 users
- speakerdeck.com/jnymyk
- テクノロジー
- 2024/02/03
2024/1/31に開催された【StudyCo×KAGコラボ】Azure・AWSでLLMアプリ開発レベルアップ！事例＆ハンズオンで発表した資料です。 AzureでRAGによる社内文章検索をやってみてさまざまな試行錯誤を通して得たナレッジを共有します！
- RAG
- Azure
- あとで読む
- AI
- LLM
- 自然言語処理
- 開発
- 検索
RAGの新しい手法「CRAG」を3分で理解する
- 47 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/03/26
本記事では、最近よく聞くようになった「CRAG」についてざっくり理解します。軽めの記事です。はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、RAGの新手法として最近注目されている「Corrective Retrieval Augmented Generation (CRAG)」の論文[1]について、日本語で簡単にまとめたものです。「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの性能を高めるための新しい手法です。Googleなどの研究者によって2024年2月に提案されました。CRAG（日本語にすると「修正型検索拡張生成」）という手法を使うメリットは、ハルシネーション（幻覚）を減らせることです。CRAGが従来の「RAG」より
- RAG
- LLM
- あとで読む
- 検索
- 勉強
- search
- AI
RAGに質問分類させる「Adaptive-RAG」の解説
- 46 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/04/30
本記事では、「Adaptive-RAG」についてざっくり理解します。軽めの記事です。株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、Adaptive系で現在、最も「コスパ」が良いとされる「Adaptive-RAG」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの回答精度を高めるための手法です。韓国科学技術院（KAIST）の研究者らによって2024年3月に提案されました。「Adaptive-RAG」という手法を使うメリットは、ユーザーからの入力としてシンプルな質問・複雑な質問、どちらも想定される場合に、「そこまで遅くなりすぎずに、ある程度の回答精度がでる」という点
- LLM
- AI
- rag
- あとで読む
- 検索
Dify で RAG を試す｜npaka
- 45 users
- note.com/npaka
- テクノロジー
- 2024/05/06
1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2つの主要課題に対処するためのフレームワークです。開発者はこの技術を利用して、AI搭載のカスタマーボット、企業知識ベース、AI検索エンジンなどをコスト効率よく構築できます。これらのシステムは、自然言語入力を通じて、さまざまな形態の組織化された知識と相互作用します。下図では、ユーザーが「アメリカの大統領は誰ですか？」と尋ねると、システムは回答のためにLLMに質問を直接渡しません。代わりに、ユーザーの質問について、知識ベース (Wikipediaなど) でベクトル検索を実施します。意味的な類似性マッチングを通じて関連するコンテンツを見つけ (たとえば、「バイデンは現在の第46代アメリカ合衆国大統領です...」)、LLMに発見した知識とともにユ
- RAG
- LLM
- AI
- ドキュメント
- 機械学習
- あとで読む
RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life
- 43 users
- secon.dev
- テクノロジー
- 2023/12/04
この記事は、情報検索・検索技術 Advent Calendar 2023の12月4日の記事である。昨今のLLMの台頭により、外部情報を In-Context Learning として利用しLLMの生成結果の性能を高めることが可能な RAG(Retrieval Augmented Generation) の重要性の高まりを感じる。ただ、RAG を使ったシステムを構築してみようにも、データが少ないと面白みが少なかったりする。その為、Wikipedia 日本語の約550万文から簡単に検索可能でRAGの入力データとして使えるような embeddings と、素早い速度でベクトル検索できるような faiss 用の index を作成した。例えば、Wikipedia から該当の文を検索する用途はこのように使える。 from datasets.download import DownloadMana
- LLM
- RAG
- 自然言語処理
- あとで読む
- 検索
生成AI業界は「GPT2」で騒然、RAGは実用化へ新手法が続々
- 43 users
- xtech.nikkei.com
- テクノロジー
- 2024/05/10
生成AI（人工知能）を含む最新のAI研究動向を知るため、世界中の研究者やエンジニアが参照しているのが、論文速報サイト「arXiv（アーカイブ）」である。米OpenAI（オープンAI）や米Google（グーグル）などAI開発を主導するIT企業の多くが、研究成果をarXivに競って投稿している。そんなarXivの投稿論文から、2024年4月（1日～30日）にSNSのX（旧Twitter）で多く言及されたAI分野の注目論文を紹介する。調査には米Meltwater（メルトウォーター）のSNS分析ツールを利用した。対象はXの全世界のオリジナル投稿、コメント、再投稿、引用投稿である。調査は、日経BPが2024年1月に新設したAI・データラボの活動の一環として実施した。「GPT2」に再び脚光？スケーリング則の論文最初に取り上げるのが、大規模言語モデル（LLM）のスケーリング則に関する論文「Phys