エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
社内Slack Botを改善するためにRagasでRAGを評価する|QunaSys
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
社内Slack Botを改善するためにRagasでRAGを評価する|QunaSys
はじめにはじめましてQunaSys、CRSチームの山口です。 みなさん、業務でRAGを使用していますか? 論文探... はじめにはじめましてQunaSys、CRSチームの山口です。 みなさん、業務でRAGを使用していますか? 論文探し効率化のためのSlack BotであるPaperBotくんではRAGを使用しています。 PaperBotくんの要約機能であまりいい回答が返ってこなくて、いくつかのテクニックを使ってRAGの精度を上げようとしました。が、いまいち良くなったのかどうかいまいち評価できませんでした。 この課題を解決するために、今回の記事では「論文探し効率化のためのBotであるPaperBotくん」の評価を、RAGを評価するためのフレームワークであるRagasで実施したいと思います。 RagasでTest early and oftenができるようになりましょう! 最後には評価がきちんとできているかを確認するためにgpt-3.5-turboとgpt-4-turbo-previewでの比較を見ていきたいと