タイトル「RAG」を検索 - はてなブックマーク

1 - 40 件 / 210件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

RAGの検索結果1 - 40 件 / 210件

RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
- 307 users
- dev.classmethod.jp
- テクノロジー
- 2024/02/06
はじめに新規事業部生成AIチーム山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい
- RAG
- LLM
- AI
- あとで読む
- ChatGPT
- 検索
- 自然言語処理
- 機械学習
- deeplearning
- ドキュメント
RAGの実装戦略まとめ - Qiita
- 282 users
- qiita.com/jw-automation
- テクノロジー
- 2024/03/19
それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチこちらは、性質の異なる複数の検索方式（例えばベクトル検索とキーワード検索）を組み合わせて検索精度を向上させる手法になります。各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質
- RAG
- AI
- LLM
- あとで読む
- プログラミング
- 開発
- 自然言語処理
- 検索
- ChatGPT
- qiita
RAGの性能を改善するための8つの戦略 | Fintan
- 264 users
- fintan.jp
- テクノロジー
- 2024/02/09
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
- RAG
- LLM
- AI
- あとで読む
- 検索
- ChatGPT
- OCR
- チューニング
- 自然言語処理
- 人工知能
⼤規模⾔語モデルの拡張（RAG）が終わったかも知れない件について
- 264 users
- speakerdeck.com/nearme_tech
- テクノロジー
- 2024/04/09
Zero Waste, Radical Magic, and Italian Graft – Quarkus Efficiency Secrets
- LLM
- AI
- RAG
- あとで読む
- GPT
- 人工知能
【未経験者大歓迎】RAG超入門：AWSが推奨するRAGを体験するハンズオン - Qiita
- 245 users
- qiita.com/moritalous
- テクノロジー
- 2024/05/03
2024/5/5更新：生成AIに興味を持った方向け、続編を投稿しました。「Qiitaに聞いた！！」をAmazon Bedrockで作った！（Claude 3でRAG）タイトルはふざけてますが、プロンプトエンジニアリングにより本投稿と同様の内容を行う解説をしています。（BedrockのClaude 3モデルと、Google検索を使った構成です）生成AIはとても注目度が高い技術ですが、すこしとっつきにくいところがあるかもしれません。新しいモデルや活用手法が毎日のように登場し、ウォッチし続けるのはかなり大変です。タイミングを逃して入門できていない方向けに、とりあえず作って体感してみようというコンセプトで、ハンズオン記事を作成しました。🎉🎉🎉 ハンズオンの内容は「RAG」です。RAGは生成AIの活用法としてよく出てくるキーワードです。ハンズオンでは、ただのRAGではなく最先端の
- RAG
- aws
- あとで読む
- AI
- LLM
- qiita
- 自然言語処理
- 入門
- ブログ
- 参考
GPT連携アプリ開発時の必須知識、RAGをゼロから解説する。概要＆Pythonコード例
- 186 users
- zenn.dev/spiralai
- テクノロジー
- 2024/02/10
こんにちは。わいけいです。今回の記事では、生成AI界隈ではかなり浸透している RAG について改めて解説していきます。「低予算で言語モデルを使ったアプリを開発したい」というときに真っ先に選択肢に上がるRAGですが、私自身もRAGを使ったアプリケーションの実装を業務の中で何度も行ってきました。今回はその知見をシェア出来れば幸いです。 RAG（Retrieval-Augmented Generation)とはまず、そもそもRAGとは何ぞや？というところから見ていきましょう。 RAG（Retrieval-Augmented Generation) は自然言語処理（NLP）と特に言語モデルの開発において使用される技術です。この技術は、大規模な言語モデルが生成するテキストの品質と関連性を向上させるために、外部の情報源からの情報を取得（retrieval）して利用します。要は、Chat
- ChatGPT
- LLM
- あとで読む
- python
- AI
- GPT
- 開発
- 自然言語処理
- OPENAI
- deeplearning
社内情報検索システムで用いられるRAGの4つの実装方法
- 180 users
- speakerdeck.com/mkazutaka
- テクノロジー
- 2023/10/13
2 松本和高  株式会社エクスプラザリードエンジニア  X: _mkazutaka  Github: mkazutaka  18年にバックエンドエンジニアとしてメルカリに入社。その後、ミラティブ、フリーランスを得て株式会社エクスプラザに所属。フロントエンドからバックエンドまで幅広く開発しています。趣味で、FXの自動売買Botを作成している  現在08/30に第一子が生まれ現在育休中  https://note.com/mkazutaka/n/n9f0e2c4dee96 CONFIDENTIAL INFORMATION: Not for Public Distribution - Do Not Copy 3 株式会社エクスプラザ（EXPLAZA, Inc.）会社名プロダクトの力で、豊かな暮らしをつくるミッション代表取締役CEO 高橋一生代表者 2020年07月03日設
- LLM
- あとで読む
- RAG
- システム
- UX
- 検索
生成AIの「RAG」とは？知っておきたい重要キーワードを解説する【イニシャルB】
- 163 users
- internet.watch.impress.co.jp
- テクノロジー
- 2024/04/08
- AI
- あとで読む
- 生成AI
- RAG
- 自然言語処理
- 人工知能
- LLM
- 機械学習
社内用語集を気軽に質問できるSlackBotを作ってみた (RAGの応用アプリ) - ABEJA Tech Blog
- 154 users
- tech-blog.abeja.asia
- テクノロジー
- 2024/02/08
こんにちは！株式会社 ABEJA で ABEJA Platform 開発を行っている坂井（GitHub : @Yagami360）です。 LangChain を使用すれば、RAG [Retrieval Augment Generation] を使用した LLM アプリケーションを簡単に作成できるので便利ですよね。今回 LangChain での RAG を使用して、LLM が学習に使用していない特定ドメインでの用語を応答する Slack ボットをさくっと作ってみたので共有します。本コード一式は、以下の GitHub レポジトリに保管しています。 github.com 使い方コード解説アーキテクチャ RAG の仕組みヒューマンインザループによる継続的品質改善まとめ We Are Hiring! 使い方事前準備として｛用語集スプレッドシートの作成・Slack アプリの初期設定・各種
- LLM
- あとで読む
- RAG
- slack
- AI
- アプリ
- algorithm
- 学習
AWSの生成AIで社内文書検索！ Bedrockのナレッジベースで簡単にRAGアプリを作ってみよう - Qiita
- 153 users
- qiita.com/minorun365
- テクノロジー
- 2024/03/01
この記事について AWSコミュニティ最大級のイベント「JAWS DAYS 2024」内のワークショップにて実施したハンズオンコンテンツとなります。イベントでは口頭で説明しながら実施しますが、この記事さえ読めば誰でも体験できるように作っていますので、当日イベントにお越しになれない方もぜひご活用ください。（スムーズにいけば30分程度で完了します）本ハンズオンの実施にあたり、多少の課金（数十円〜数百円以内）が発生することをご了承ください。実施後には忘れず不要なリソースの削除をお願いします。なお、Bedrockのモデル呼び出し料金はAmazon製のTitanシリーズを除き、マーケットプレイス扱いとなるためAWSクレジット（クーポン）の適用範囲外となります。 ※事前にAWSアカウントの作成をお願いします。クレジットカード情報が必要です。ログイン用のEメールアドレスとパスワードをお忘れなく！ 0
- RAG
- aws
- あとで読む
- AI
- 人工知能
- Bedrock
- アプリ
- qiita
- 検索
RAGにおけるドキュメント検索精度向上について(概要編)
- 151 users
- zenn.dev/sompojapan_dx
- テクノロジー
- 2023/11/11
はじめまして。損害保険ジャパン株式会社 DX推進部の眞方です。普段はリードエンジニアとして、新しいサービスのアーキテクチャ検討からローンチまでの作業や、新規技術を用いたアプリのプロトタイプ実装などを行なっています。弊社では、LLM（Large Language Models）を活用したアプリケーションの開発を積極的に検討し、既に社内でいくつかのプロトタイプをローンチしています。本記事では、その最も一般的？なユースケースの一つとも言えるRAG（Retrieval Augmented Generative）の構築において、ドキュメント検索精度の向上にどのように取り組んだ内容の概要を紹介させていただきます。実際の詳細な手法および結果については、別記事（実践編）で解説予定です。はじめに RAGとは？この記事を読まれている方の中にはご存知の方も多いでしょうが、RAGとはRetrieval A
- LLM
- あとで読む
- AI
- ドキュメント
- 検索
- GPT
- deeplearning
優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう！ - Qiita
- 145 users
- qiita.com/itokazu
- テクノロジー
- 2024/04/14
1. はじめに Cohere社が最近リリースしたLLMのCommand R+がGPT4に迫る性能を発揮していたり、RAG利用での性能で話題となっています。そのCommand R+でRAGを体験できるチャットアプリの実装がLightningAIにてチュートリアルが公開(CC-BY-4.0ライセンスとして)されています。これを身近な環境で動かしてみたいと思います。このチャットボットでCohere社の以下のモデルが使われています LLM: Command R+ Embed: embed-english-v3.0 / embed-multilingual-v3.0 Reranker: rerank-english-v3.0 / rerank-multilingual-v3.0 以下の動画のようにブラウザでPDFファイルをアップロードしてチャットで問い合わせができます。 2. 必要なもの以下
- AI
- あとで読む
- LLM
- qiita
- API
RAGを複雑な質問に強くする手法「CoA」について
- 144 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/04/16
本記事では、「Chain-of-Abstraction (CoA) Reasoning」についてざっくり理解します。軽めの記事です。株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、最近聞くようになった「Chain-of-Abstraction (CoA) Reasoning」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー LLMが外部ツールを使って回答を生成するときの、回答精度を高める手法についての論文です。Metaの研究者らによって2024年1月に提案されました。「Chain-of-Abstraction (CoA)」という手法を使うメリットは、RAGに応用することで
- RAG
- LLM
- AI
- あとで読む
- 自然言語処理
- 機械学習
- 読んだ
【Amazon Bedrock】AWSサービスのみを使ったシンプル構成のRAGアプリを作ってみた - NRIネットコムBlog
- 133 users
- tech.nri-net.com
- テクノロジー
- 2023/10/19
はじめに RAGとは構成図作成リソース Lambda 1. PDFから文書抽出&Embedding取得Lambda 2. 回答作成用Lambda AWS SAM テンプレート Streamlit 動作確認まとめはじめにこんにちは堤です。 Amazon BedrockがGAとなり、AWS内で完結してLLMアプリケーションを構築できるようになりました。試しにRAGアプリケーションを作成してみようと思いましたが、現状AWSでRetrievalするデータソースを作成しようとすると、Amazon OpenSearch Serverless やAmazon Kendraを使用するしかありません。これらのサービスを使うのはコストもそれなりにかかり少しハードルが高いなーと思っていたら以下のブログを見つけました。 aws.amazon.com 構成図を見ると分かるように、S3にembedding
- aws
- あとで読む
- LLM
- 生成AI
- AI
- tech
LLMのRAG（外部知識検索による強化）をまとめた調査報告 | AIDB
- 116 users
- ai-data-base.com
- テクノロジー
- 2023/12/28
LLMのRAG（外部知識検索による強化）についての調査結果が報告されています。基本フレームワークと各構成要素の詳細、評価、そして今後の発展について言及されており網羅的です。本記事では、その報告内容を抜粋してお届けします。参照論文情報タイトル：Retrieval-Augmented Generation for Large Language Models: A Survey 著者：Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Haofen Wang 所属：Tongji University, Fudan University URL：https://doi.org/10.48550/arXiv.2312.10997 本記事の関連研究：LLMにナレッジグ
- LLM
- あとで読む
- RAG
- 人工知能
- 検索
- AI
自社データ × ChatGPTで社内AIを構築するRAG ツール｜Doox β版をリリースしました - Qiita
- 94 users
- qiita.com/heapjp
- テクノロジー
- 2024/04/01
TLDR 社内のデータを元に質問への回答を LLM が生成する仕組み（RAG）を構築するためのサービスを開発しました。 β 版として無料で公開しているので是非使ってみてください。サーバーレスな構成で Next.js を動かしている。技術のキャッチアップは大変だ。背景仕事をしていると社内の規定 / 製品情報 / 過去の履歴 .. などに関する問い合わせは日常的に発生するものだし、その工数は結構ある。通常は Wiki を作ってナレッジを共有するが、結局「近い人や担当に聞く」という行為はなかなか減らない。色々な企業が、社内のデータを元に質問への回答を LLM が生成する仕組み（RAG）を独自に開発しているようで、技術ブログとかに書いている方も多い。社内向け RAG の構築を SaaS プロダクトで提供したら各社の社内の問い合わせ工数と独自に RAG を構築するコストを下げられて嬉しいん
- ChatGPT
- あとで読む
- rag
- js
- 開発
- qiita
- aws
- ツール
- development
- データ
Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
- 86 users
- blog.shikoan.com
- テクノロジー
- 2024/04/27
2.3k{icon} {views} 複数のLLM（GPT/Claude3）とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題（TSP）が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。できたもの Arxivの検索APIを使って検索拡張生成（RAG）したらサーベイを自動生成できたやっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題（TSP）を解いてソートをかける論文の要旨をGPT-3.5-Turboで要約ソートした
- RAG
- AI
- あとで読む
- LLM
- 自然言語処理
- アルゴリズム
- 論文
- 研究
RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた | DevelopersIO
- 82 users
- dev.classmethod.jp
- テクノロジー
- 2023/09/22
はじめに新規事業部山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい情報に関して回答
- RAG
- LLM
- ai
- OpenAI
- あとで読む
- ChatGPT
- 検索
- 人工知能
- プログラミング
オープンソースのRAGアプリ「RAGFlow」を試す
- 82 users
- zenn.dev/kun432
- テクノロジー
- 2024/05/28
かなり新し目のフレームワークRAGプラットフォームアプリ RAGFlowとは？ RAGFlowは、深い文書理解に基づいたオープンソースのRAG（Retrieval-Augmented Generation）エンジンである。LLM（大規模言語モデル）を組み合わせることで、様々な複雑なフォーマットのデータから根拠のある引用に裏打ちされた、真実味のある質問応答機能を提供し、あらゆる規模のビジネスに合理化されたRAGワークフローを提供する。
- LLM
- RAG
- AI
- あとで読む
- 人工知能
- dev
- アプリ
【ChatGPT】とベクトルデータベースによる企業内データの活用(いわゆるRAG構成) - Qiita
- 78 users
- qiita.com/ksonoda
- テクノロジー
- 2023/09/29
本記事は日本オラクルが運営する下記Meetupで発表予定の内容になります。発表までに今後、内容は予告なく変更される可能性があることをあらかじめご了承ください。下記セッションでは、本記事の内容以外にデモンストレーションも実施する予定です。 ※セミナー実施済の動画に関しては以下をご参照ください。はじめに 2022年暮れ、ChatGPTの登場以降、あらゆる企業がDXの在り方を問われはじめ、大規模言語モデルの仕組みをどのように業務に取り入れるかを検討されていると思います。その検討の一つとして、「GPT(LLM)が学習していない企業内のデータや最新のデータも有効活用すべき」という点は非常に大きな論点なのではないでしょうか。ご存じの通り、LLMとはインターネット上に存在するドキュメントデータをクローリングにより大量に収集し、それを学習データとして機械学習にかけたモデルです。従って、至極当たり
- LLM
- RAG
- ChatGPT
- あとで読む
- LangChain
- データベース
- 人工知能
Retrieval-based LM (RAG system) ざっくり理解する
- 75 users
- speakerdeck.com/smiyawaki0820
- テクノロジー
- 2023/11/01
自分用の整理・勉強会用として作成した解説資料です。内容の正確性については保証しかねますので必ず論文を参照してください。誤りや引用漏れ等がありましたら @catshun_ までご指摘いただけますと幸いです。
- LLM
- rag
- 自然言語処理
- あとで読む
- NLP
- 論文
Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ
- 73 users
- techblog.nhn-techorus.com
- テクノロジー
- 2024/03/30
Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発するはじめにこんにちは！第一SAチームのshikaです。普段、あるAmazon RDS上のデータベース（MySQL）に対し、SQLを実行してデータを参照しています。毎回SQLクエリを実行するのが手間だったので、データ検索を容易にするWebアプリケーションを開発しました。このアプリケーションには、AWSの生成AIサービス「Amazon Bedrock」を活用しており、生成AIを用いた対話式の検索機能を実現しています。できあがったアプリケーションの画面は以下です。データはテストデータを使ってます。以下の通り、架空の会社の従業員情報に関するデータです。本記事ではこのアプリケーションの構成、仕組みについて、特にAmazon Bedrockの部分を重点を置いて解
- AI
- あとで読む
- AWS
- RAG
- 自然言語処理
- 調査
- データ
GPTsより精度の高いRAGシステムの構築
- 68 users
- speakerdeck.com/mkazutaka
- テクノロジー
- 2023/12/20
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
- RAG
- LLM
- AI
- あとで読む
ローカルで気軽にRAGを使って会話することが簡単すぎてビビった。 - Qiita
- 65 users
- qiita.com/mitsumizo
- テクノロジー
- 2024/02/25
今日は、ローカルにてRAG(Retrieval-Augmented Generation)を使って、あるPFDについて質問するチャットを作ろうと思う。 OpenAIを使うので、無料ではないので注意されたい。今回のソースは LangChain 完全入門という本を参考にしていて、とても勉強になるので購入をお勧めする。行いたいことローカルでPDFを読み込ませて、内容を質問したり、要約させること。大きな流れ環境準備チャットアプリの土台の作成プロンプトを定義アップロードされたPDFファイルを分割内容をベクトル化し保存入力された質問とPDFから抽出した適した文をOpenAIに送信回答を得る。詳細環境準備環境構築 Python : 3.11.6 pip ライブラリ chainlit==1.0.101 チャット画面を簡単に作るライブラリ chromadb==0.4.22 ベク
- ChatGPT
- RAG
- AI
- LLM
- あとで読む
- プログラミング
- pdf
- qiita
- programming
LangChainとフルサーバーレスですばやくセキュアなRAGアプリをつくるための実践解説/LangChain_Book
- 63 users
- speakerdeck.com/yoshidashingo
- テクノロジー
- 2023/11/22
2023.11.21 講演した資料です。 ChatGPT/LangChainによるチャットシステム構築［実践］入門 https://forkwell.connpass.com/event/301152/
RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解 | SIOS Tech. Lab
- 63 users
- tech-lab.sios.jp
- テクノロジー
- 2024/02/23
◆ Live配信スケジュール ◆ サイオステクノロジーでは、Microsoft MVPの武井による「わかりみの深いシリーズ」など、定期的なLive配信を行っています。 ⇒ 詳細スケジュールはこちらから ⇒ 見逃してしまった方はYoutubeチャンネルをご覧ください【4/18開催】VSCode Dev Containersで楽々開発環境構築祭り〜Python/Reactなどなど〜 Visual Studio Codeの拡張機能であるDev Containersを使ってReactとかPythonとかSpring Bootとかの開発環境をラクチンで構築する方法を紹介するイベントです。 https://tech-lab.connpass.com/event/311864/ こんにちは、サイオステクノロジー武井です。今回は、「RAG構築のためのAzure OpenAI Serviceリファレンスア
- RAG
- Azure
- AI
- OpenAI
- あとで読む
- 人工知能
- 検索
AWS 内で大規模言語モデルを利用できる Amazon Bedrock を使って作る RAG アプリケーション - クックパッド開発者ブログ
- 57 users
- techlife.cookpad.com
- テクノロジー
- 2023/10/19
こんにちは。機械学習グループの深澤(@fukkaa1225)です。先日、Amazon Bedrock が一般利用できるよう(GA)になりました。本記事ではこちらを用いて RAG(Retrieval-augmented generation) アプリケーションを作成してみた様子と、他 LLM モデルとの比較結果についてご紹介します。 Amazon Bedrock とは aws.amazon.com 公式サイトより文言を引用します。 Amazon Bedrock は、Amazon や主要な AI スタートアップ企業が提供する基盤モデル (FM) を API を通じて利用できるようにする完全マネージド型サービスです。そのため、さまざまな FM から選択して、ユースケースに最も適したモデルを見つけることができます。Amazon Bedrock のサーバーレスエクスペリエンスにより、すぐに FM
Prompt Flowを使ってRAGの回答を自動評価する - Taste of Tech Topics
- 56 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/07/25
皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 Microsoft Buildを経て、AzureにもGPTを利用したサービスが数多く発表されており、LLMをサービスとして利用できる使い方増えていてワクワクしますね。今回と次回の記事を通して、その中のサービスの一つであるAzure Machine Learning Prompt Flowというサービスを使ってRAG（Retrieval Augmented Generation）の回答を自動評価するシステムを試してみます。この記事では、まずはPrompt Flowを使って手動で回答を評価してみるところまでを検証します。 ※RAGとは事前に知識を検索エンジンなどに
- Azure
- LLM
- 自然言語処理
- Python
- あとで読む
- tech
社内文書検索&QAシステムの RAG ではないところ - Algomatic Tech Blog
- 56 users
- tech.algomatic.jp
- テクノロジー
- 2024/05/30
こんにちは。NEO(x) 機械学習エンジニアの宮脇（@catshun_）です。 RAG システムの開発、いざ業務に統合するとなると結構大変ですよね。構築してみたがユーザ数が伸びず、、なんてことはよくあると思います。実際こんな記事も話題になりましたね。本記事では、コラムとして RAG システムの設計で考慮したい点を自戒を込めて記述したいと思います。誤っている記述等もあると思いますが、本記事を読んだ方の議論のネタになってくれれば幸いです。また Retrieval-based LM の技術的な話は、以下で触れておりますので併せてご覧ください。 RAG とは RAG (Retrieval-Augmented Generation) とは、社内文書・長期記憶に該当する対話履歴・API 仕様書などの外部知識資源を、言語モデルが扱えるよう入力系列に挿入する手法です。もともと Lewis+'
- RAG
- AI
- あとで読む
- 検索
- search
- blog
有田芳生 on Twitter: "@RAG93147546 横田滋さんが「絶対に言ってはいけない」と基本にしていたことを息子さんが破りました。被害者家族の政治的発言は北朝鮮を挑発するだけです。これで日朝交渉は重ねて動きません。残念です。"
- 55 users
- twitter.com/aritayoshifu
- 政治と経済
- 2020/06/11
@RAG93147546 横田滋さんが「絶対に言ってはいけない」と基本にしていたことを息子さんが破りました。被害者家族の政治的発言は北朝鮮を挑発するだけです。これで日朝交渉は重ねて動きません。残念です。
- 有田芳生
- 北朝鮮
- twitter
- 政治
- 海外
- politics
- あとで読む
- 社会
ナレッジグラフを用いたRAGの改善 - Ahogrammer
- 54 users
- hironsan.hatenablog.com
- テクノロジー
- 2024/03/21
RAG（Retrieval Augmented Generation）は大規模言語モデル（LLM）の性能を改善するための手法の1つであり、質問に対する回答を生成する際に、外部知識源から情報を取り込みます。これにより、LLM 自体で学習できる情報量に制限されることなく、より正確で詳細な回答を生成することができます。よく使われているRAGでは、外部知識源として検索エンジンにテキストをインデックスしておき、質問に関連するテキストをベクトル検索や全文検索を用いて取得します。しかし、構造化データを扱うことには苦労するため、質問によっては回答が不十分、あるいはまったく回答できないことに繋がります。これらの問題を克服するために、ナレッジグラフを用いたRAGが構築されることがあります。ナレッジグラフでは、エンティティとその間の関係がグラフ構造で表現されており、単純な検索を用いた場合には回答できないよ
- RAG
- AI
- LLM
- グラフ
- あとで読む
- 検索
LangChain への OpenAIのRAG戦略の適用｜npaka
- 53 users
- note.com/npaka
- テクノロジー
- 2023/11/18
以下の記事が面白かったので、かるくまとめました。・Applying OpenAI's RAG Strategies 1. はじめに「Open AI」はデモデーで一連のRAG実験を報告しました。評価指標はアプリケーションによって異なりますが、何が機能し、何が機能しなかったかを確認するのは興味深いことです。以下では、各手法を説明し、それぞれを自分で実装する方法を示します。アプリケーションでのこれらの方法を理解する能力は非常に重要です。問題が異なれば異なる検索手法が必要となるため、「万能の」解決策は存在しません。 2. RAG スタックにどのように適合するかまず、各手法をいくつかの「RAGカテゴリ」に分類します。以下は、カテゴリ内の各RAG実験を示し、RAGスタックに配置する図です。 3. ベースライン距離ベースのベクトルデータベース検索は、クエリを高次元空間に埋め込み（表現）し、「距離」に基
- LLM
- OpenAI
- SQL
- あとで読む
生成AI入門：議事録を答えるチャットAI（RAGアプリ）を作ってみよう【プログラミング不要】
- 49 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2023/11/09
生成AI入門：議事録を答えるチャットAI（RAGアプリ）を作ってみよう【プログラミング不要】：AI・データサイエンス超入門生成系AIの導入が急速に広がる今、その有用性や活用法が気になる方へ。一例としてプログラミング不要で、“会議の議事録を基に質問に答えてくれる「独自のチャットAI」”の作成を試みます。社会人の目線で、実践的な生成系AIの雰囲気をつかみましょう！連載目次現在、企業への生成系AI*1の導入が急速に拡大しています。2023年10月23日に日本マイクロソフトが記者向けに発表した内容によれば、日本国内でAzure OpenAI Service（Microsoftが提供するクラウドAIサービス）を活用している企業は560社以上、全世界では1万1000社を突破しています。このような状況から、「うちの会社も生成系AIを導入すべきか？」「生成系AIが何の役に立つのか？」と気になっている
RAGの新しい手法「CRAG」を3分で理解する
- 48 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/03/26
本記事では、最近よく聞くようになった「CRAG」についてざっくり理解します。軽めの記事です。はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、RAGの新手法として最近注目されている「Corrective Retrieval Augmented Generation (CRAG)」の論文[1]について、日本語で簡単にまとめたものです。「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの性能を高めるための新しい手法です。Googleなどの研究者によって2024年2月に提案されました。CRAG（日本語にすると「修正型検索拡張生成」）という手法を使うメリットは、ハルシネーション（幻覚）を減らせることです。CRAGが従来の「RAG」より
- LLM
- RAG
- あとで読む
- 検索
- 勉強
- search
- AI
LLMを利用したRAG（Retrieval Augmented Generation）と著作権侵害｜知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
- 48 users
- storialaw.jp
- テクノロジー
- 2023/08/05
1　はじめに近時、LLMを利用し、社内外の文書データを用いた精度の高いチャットボットを構築するために、RAG（Retrieval Augmented Generation）という手法が注目されています。 LLMをそのまま利用してチャットボットの構築を行うと、通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができないか、あるいは正しくない回答を返してしまいます。この問題を解決する手法として注目されているのがRAGです。この手法は、あらかじめ社内外の文書データをデータベース（DB）として準備しておき、ユーザからの質問がなされた場合には、当該質問と関連性が高い文書データを検索し、その文章データを質問文に付加してLLMに入力することで、精度が高い、かつ実際の文書データに紐付いた回答を生成することができるというものです。ここで、プロンプトに入力するためにDBとして
- LLM
- 機械学習
- 著作権
- AI
AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します！/Azure RAG knowledge share
- 47 users
- speakerdeck.com/jnymyk
- テクノロジー
- 2024/02/03
2024/1/31に開催された【StudyCo×KAGコラボ】Azure・AWSでLLMアプリ開発レベルアップ！事例＆ハンズオンで発表した資料です。 AzureでRAGによる社内文章検索をやってみてさまざまな試行錯誤を通して得たナレッジを共有します！
- RAG
- Azure
- あとで読む
- AI
- LLM
- 自然言語処理
- 開発
- 検索
Dify で RAG を試す｜npaka
- 47 users
- note.com/npaka
- テクノロジー
- 2024/05/06
1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2つの主要課題に対処するためのフレームワークです。開発者はこの技術を利用して、AI搭載のカスタマーボット、企業知識ベース、AI検索エンジンなどをコスト効率よく構築できます。これらのシステムは、自然言語入力を通じて、さまざまな形態の組織化された知識と相互作用します。下図では、ユーザーが「アメリカの大統領は誰ですか？」と尋ねると、システムは回答のためにLLMに質問を直接渡しません。代わりに、ユーザーの質問について、知識ベース (Wikipediaなど) でベクトル検索を実施します。意味的な類似性マッチングを通じて関連するコンテンツを見つけ (たとえば、「バイデンは現在の第46代アメリカ合衆国大統領です...」)、LLMに発見した知識とともにユ
- RAG
- LLM
- Dify
- AI
- 機械学習
- ドキュメント
- あとで読む
RAGに質問分類させる「Adaptive-RAG」の解説
- 46 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/04/30
本記事では、「Adaptive-RAG」についてざっくり理解します。軽めの記事です。株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、Adaptive系で現在、最も「コスパ」が良いとされる「Adaptive-RAG」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの回答精度を高めるための手法です。韓国科学技術院（KAIST）の研究者らによって2024年3月に提案されました。「Adaptive-RAG」という手法を使うメリットは、ユーザーからの入力としてシンプルな質問・複雑な質問、どちらも想定される場合に、「そこまで遅くなりすぎずに、ある程度の回答精度がでる」という点
- LLM
- AI
- rag
- あとで読む
- 検索
Q&A + RAG に特化したLLMをSFTで学習させ4bit量子化モデルを作り、GPT3.5以上の性能を7Bモデルで達成する - A Day in the Life
- 45 users
- secon.dev
- テクノロジー
- 2023/12/15
なお、評価に使ったコードはこちらの eval_xxx というコードである。 https://github.com/hotchpotch/youri-7b-stf-qa-context-jaqket/ Supervised Fine-tuning Trainer(SFT) を使った学習 STFは手軽な方法で指示に対して特定フォーマットの出力(Instruction Tuning)を学習させることができる方法である。学習のさせ方も簡単で、例えば ### 指示: 今日の天気は何ですか？ ### 入力: 本日は大雨ですね。 ### 応答: 大雨のような例文を用意する。例では「### 応答:」以降がうまく出力されるように学習して欲しいデータである。この時、例文と「### 応答:」だけ与えれば、よしなに学習してくれる。実際の学習時には、「応答:」以降を推論し、望ましい回答である「大雪」のtokenの
- LLM
- あとで読む
- AI
- 人工知能
- 学習
- 勉強
生成AI業界は「GPT2」で騒然、RAGは実用化へ新手法が続々
- 43 users
- xtech.nikkei.com
- テクノロジー
- 2024/05/10
生成AI（人工知能）を含む最新のAI研究動向を知るため、世界中の研究者やエンジニアが参照しているのが、論文速報サイト「arXiv（アーカイブ）」である。米OpenAI（オープンAI）や米Google（グーグル）などAI開発を主導するIT企業の多くが、研究成果をarXivに競って投稿している。そんなarXivの投稿論文から、2024年4月（1日～30日）にSNSのX（旧Twitter）で多く言及されたAI分野の注目論文を紹介する。調査には米Meltwater（メルトウォーター）のSNS分析ツールを利用した。対象はXの全世界のオリジナル投稿、コメント、再投稿、引用投稿である。調査は、日経BPが2024年1月に新設したAI・データラボの活動の一環として実施した。「GPT2」に再び脚光？スケーリング則の論文最初に取り上げるのが、大規模言語モデル（LLM）のスケーリング則に関する論文「Phys