タグ

aiとdbに関するmoritataのブックマーク (2)

  • ベクトルデータの容量を96%削減するBinary Embedding

    導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 RAGのシステムの中では、どんな情報にアクセスするかを決定する際に、Embeddingと呼ばれる文章をベクトル化する技術が使用されています。そして多くの場合では小数(float)の多次元ベクトルが採用されています。 しかし、Embeddingの中には各ベクトルの数値を1Bitのデータとして扱うBinary Embeddingというものが存在します。 記事では、Embeddingの手法の一つであるそのBinary Embeddingについて解説と検証を行います。 サマリー Binary Embeddingを採用することで以下のような効果を得ることができます。 保管するベクトルデータの容量を96%ほど削減で

    ベクトルデータの容量を96%削減するBinary Embedding
  • ChatGPT、Bingによるプロンプトの生成・変換(NyaFuさんバージョン)|BD

    すっごいネタ来ました! この記事を読んでできるようになること ・プロンプトの自然言語←→羅列表記変換 ・適当な文章(日英問わず)のプロンプト化 ・作成したプロンプトのランダム生成 ・日語での要約 ・プロンプトの微調整 まずは、こちらを読んでください! 間にJSON変換をかませるだとっ!? こんな面白いネタ、そりゃもうやっちゃいますよね。 てことで、半クローズな環境でNyaFuさんにすっごいGPTプロンプトを見せてもらったので、さっそくどんどんと手を入れてしまいました。(NyaFuさん、その節はすいませんでした) その後、快く了承いただけたので、今回はコラボ記事を書かせていただきます!みんなもNyaFuさん、フォローしようぜ! 仕組みと考え方についてはNyaFuさんの記事でしっかりと確認しておいてください。使い始めてから自分用にカスタマイズしやすくなります。 ChatGPT-4もしくはBi

    ChatGPT、Bingによるプロンプトの生成・変換(NyaFuさんバージョン)|BD
  • 1