並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 3399件

新着順 人気順

検索エンジンの検索結果241 - 280 件 / 3399件

  • 検索エンジンをVespaへ移行しています - Stanby Tech Blog

    検索エンジンをVespaへ移行しています こんにちは、スタンバイで検索周りの開発を担当している鷹取です。 今回はスタンバイで利用している検索エンジンをVespaへ移行している話を紹介します。 検索エンジン移行の背景 Stanby Tech Blogのスタンバイ2+1年の軌跡の記事で説明されている通り、 スタンバイでは、主に求人検索機能を提供していますが、その中でもオーガニック(無料掲載)と広告(有料掲載)という2種類の検索が存在します。 この2種類の検索ではそれぞれで異なる検索エンジンを使用しています。 オーガニック検索: Yahoo! ABYSSという検索プラットフォーム 広告検索: Elasticsearch このようになっている背景については、前述の記事に詳細が記載されていますので、興味がある方はそちらをご参照ください。これまで、この2種類の検索エンジンを運用してきましたが、それぞれ

      検索エンジンをVespaへ移行しています - Stanby Tech Blog
    • 開発者が知るべきキャッシュ設計でよく遭遇する問題

      はじめに 分散システムの設計および開発において、キャッシュはパフォーマンス向上のための非常に重要な要素です。頻繁にアクセスされるデータをキャッシュすることで、アクセス速度が遅いデータベースへのアクセスを削減し、データへの迅速なアクセスを可能にします。これにより、システムの全体的な効率とパフォーマンスが向上します。 しかし、キャッシュは慎重に設計しないとむしろパフォーマンス上のデメリットになるケースが存在します。 この記事ではよく遭遇するキャッシュ設計の問題とその回避策について解説します。 Cache penetration DBに存在しない値を検索したときに、DBから返された空の結果をキャッシュしない場合に発生するシナリオです。 このシナリオではDBに存在しない値を繰り返し検索することにより、その値がキャッシュされていないため検索ごとにDBへのアクセスが必要になってしまいます。 存在しない

        開発者が知るべきキャッシュ設計でよく遭遇する問題
      • 4コマ「萩往還を歩いてみた」佐々並→山口(5/6)~錦鶏湖から山口駅まで何時間? - どさんこ九州に住む

        カーナビもグーグル先生も、不可思議な道案内をしてくれるときありませんか? ちなみに条件は「徒歩」で検索しています。 錦鶏湖から山口駅まで5km弱らしい。 普通なら1時間強?

          4コマ「萩往還を歩いてみた」佐々並→山口(5/6)~錦鶏湖から山口駅まで何時間? - どさんこ九州に住む
        • Google Bard便利すぎ。Gmailから検索して表まで作るだなんて…

          Google Bard便利すぎ。Gmailから検索して表まで作るだなんて…2023.12.20 20:00103,390 小暮ひさのり 仕事、楽になる予感しかしない。 Googleのチャットボット「Google Bard」。話してみると、受け答えはまだまだ勉強中といった感じで、ChatGPTの方が先を行っている感はありますけど、それでも新機能を突っ込んでくるのがGoogleの偉いところ。 先日、「Google Workspace」の拡張機能が実装され、Gmail、Drive、Docsとも連携できるようになりました。特に刺さったのがGmail。この機能、Gmailをメインでやりとりしているなら使ったほうがいいですよ。 Gmailからいろいろな情報を探して提示できるのが神すぎ…Image: 小暮ひさのりGmailを見られて助かるのが、「あのメール返したかな?」とか「あの案件の期日いつって言われ

            Google Bard便利すぎ。Gmailから検索して表まで作るだなんて…
          • RAGにおけるドキュメント検索精度向上について(実践編)

            損害保険ジャパン株式会社 DX推進部の眞方です。この記事では、RAG(Retrieval Augmented Generative)の構築時に、ドキュメント検索精度の向上を目指して検索モデルの改善を行った際の手法、および結果について解説させていただきます。 概要を知りたい、という方は以前書いた前回の記事を読んでください。 はじめに 今回はRAGにおける検索モデルの改善を目的として、独自のデータを使用してfine-tuneを行いました。 RAGにおける検索(赤枠)の部分を改善する取り組みを行いました。 検索モデル 学習のためのライブラリとしては、sentence transformersを使用しました。また、モデルは日本語BERTを使用しています。 データ 今回RAGの対象となるドキュメントは、大きく次の2つが存在しています。 規定集 保険商品の説明等が書かれているドキュメントです(詳細は前

              RAGにおけるドキュメント検索精度向上について(実践編)
            • Amazon BedrockのKnowledge baseで簡単にRAGを構築 - Taste of Tech Topics

              ポトフがおいしい季節ですね、菅野です。 Amazon BedrockのKnowledge baseがGAとなり、Amazon BedrockでもRAGが作成できるようになりました。 docs.aws.amazon.com 今回はKnowledgeベースを実際に作成して統計データを検索するRAGを構築してみます。 RAGとは RAGアーキテクチャ(Retrieval-Augmented Generation)は、自然言語処理において、Google検索のような検索技術と、ChatGPTのような文章生成技術を組み合わせた技術です。 このアーキテクチャを利用すると、生成AIが学習していないデータ、例えば自社の内部レポートのようなデータを用いて、ChatGPTライクな応答システムを構築できます。 具体的には、何か質問を受けると、質問に関連した文章を検索し、その検索結果を元に自然となるような回答を生成

                Amazon BedrockのKnowledge baseで簡単にRAGを構築 - Taste of Tech Topics
              • 【整骨院・整体院向け】リスティング広告運用のコツ7選|予算設定や相性も解説 -webma-

                整骨院・整体院がリスティング広告を使うべき理由リスティング広告は、GoogleやYahoo!の検索結果に表示される広告です。 「整骨院」を検索したときの広告表示例 クリックされるたびに費用が発生するため「PPC(Pay Per Click)広告」とも呼ばれます。 整骨院・整体院が集客のためにリスティング広告を使うべき理由は次の2点です。 それぞれ解説します。 サービスと検索との相性が良いから体の不調を感じたユーザーが取る代表的なアクションが「検索」です。 ケイビーカンパニー株式会社が実施した調査によると、クリニック(歯科・整骨院など)を探す際に最も利用される手段は「自然検索」で、68%以上の人が利用しています。 「腰の痛みを何とかしたい」「足首を捻挫してしまった」など、何かしらの体のトラブルを解決しようと、インターネット検索で整骨院や整体院を探すユーザーが多いわけです。 整骨院や整体院でよ

                  【整骨院・整体院向け】リスティング広告運用のコツ7選|予算設定や相性も解説 -webma-
                • グーグルAI検索、メディアのトラフィックに大打撃

                  This copy is for your personal, non-commercial use only. Distribution and use of this material are governed by our Subscriber Agreement and by copyright law. For non-personal use or to order multiple copies, please contact Dow Jones Reprints at 1-800-843-0008 or visit www.djreprints.com. https://jp.wsj.com/articles/news-publishers-see-googles-ai-search-tool-as-a-traffic-destroying-nightmare-3e64a2

                    グーグルAI検索、メディアのトラフィックに大打撃
                  • ElasticsearchのANNを利用して100万件のベクトル検索を高速化! - Taste of Tech Topics

                    この記事は Elastic Stack (Elasticsearch) Advent Calendar 2023 18日目の記事です。 こんにちは。 Acroquestのデータサイエンスチーム「YAMALEX」に所属する@shin0higuchiです😊 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。 さて、最近はLLMの発展に伴ってRAG(Retrieval-Augumented Generation)が盛んに活用されています。 その中で、キーワードベースの検索だけでなくベクトル検索を併用するケースが多く見られ、実際にElasticsearchが利用されているケースも多く目にします。そのため、Elasticsearchのベクトル検索に興味を持っている方も多いと思います。今回の記事では、Elasticsearchのベクトル検索の速度な

                      ElasticsearchのANNを利用して100万件のベクトル検索を高速化! - Taste of Tech Topics
                    • 法律のデータ構造と検索

                      デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。 この記事では、日本の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。 この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。 法律と法令 法律とは 法律の制定と公布 法律と法令の違い 法律の改正 法令のデータ構造 e-Govの法令データ 法令標準XMLスキーマ 法令番号と法令ID 題名 本則と附則 条・項・号 編・章・節・款・目 法令XMLパーサ:

                        法律のデータ構造と検索
                      • 営業時間中であるかどうかがGoogleローカル検索でより強いランキングシグナルになる

                        [レベル: 中級] Google のローカル検索において、営業時間中であるかどうかが、以前よりも強いランキング要因になったとのことです。 営業していない時間帯はランキングが下がる ローカル SEO に精通している Joy Hawkins(ジョイ・ホーキンス)氏が、ローカル SEO フォーラムでの報告をもとに自身でも調査したところ、営業時間中であるかどうかがランキングに影響を与えている可能性が極めて高いことを確認できました。 営業時間中は上位表示できていても、営業時間外はランキングが下がるというのです。 複数のケースでこうした状況が確かめられました。 営業時間が時間がランキング要因になったに違いないとホーキンス氏は結論付けています。 営業時間はは以前からランキング要因、影響力を強めた この変化について、Google 検索の広報を務めてる Search Liaison にホーキンス氏が尋ねたと

                          営業時間中であるかどうかがGoogleローカル検索でより強いランキングシグナルになる
                        • Googleがサポート詐欺を支援し収益を上げる 実際に表示された130の広告【俺の詐欺画像フォルダが火を吹くぜ】 - SEO辻正浩のブログ

                          サポート詐欺とネット広告 サポート詐欺の被害拡大が大きな問題になっています。 サポート詐欺は様々な手法でパソコンの不調を警告する画面をPC上に表示させ電話をかけるように煽り、サポート費用としてGoogle PlayギフトカードやiTunesギフトカードを買わせて支払わせたりPCの遠隔操作で振込をさせて、お金を奪う詐欺です。 この詐欺自体は昔からあるものですが、増加したようで2023年9月末には消費者庁も注意喚起を行っています。 www.caa.go.jp また、夏以後に日本各地の警察も注意喚起を始めた他、様々な報道機関やネット媒体がその問題を報じ続けています。 (2/14)詐欺:“サポート詐欺”に注意! | NHK (5/15)パソコン「サポート詐欺」電話かけてみた 72分間の通話の全容 | NHK | デジタルでだまされない (7/2)【動画解説】パソコン「サポート詐欺」警告が出た時の対

                            Googleがサポート詐欺を支援し収益を上げる 実際に表示された130の広告【俺の詐欺画像フォルダが火を吹くぜ】 - SEO辻正浩のブログ
                          • JapanKnowledge版『日本国語大辞典』でテーマを探索しよう - ronbun yomu

                            この記事は「言語学な人々 Advent Calendar 2023」の17日目の記事です。 adventar.org 前置き 小学館『日本国語大辞典(第2版)』(以下、日国)の JapanKnowledge 版(以下、JK版日国)は、紙媒体にはない検索機能を備えています。*1 JapanKnowledge Lib 使い方ガイド JapanKnowledge 全体を対象とした「詳細(個別)検索」でも以下の検索を行うことができますが、 見出し検索 or 全文検索 AND, OR, NOT検索 完全一致、前方一致、後方一致、部分一致 この詳細検索の対象を『日国』に限定すると、検索範囲(見出し or 全文 or 用例 or …)をさらに細かく設定できたり、品詞で絞ったりできるようになります。 方法は以下の通り。 「詳細(個別)検索」にマウスオーバーして「日本国語大辞典」 または、「詳細(個別)検索

                              JapanKnowledge版『日本国語大辞典』でテーマを探索しよう - ronbun yomu
                            • LLMの出力における問題は「LLMの処理が原因」とは限らない プロンプト以外に考えられる4つの要因

                              「FastLabel × LayerX × LINE 3社が語る『生成AI×プロダクト開発』で直面する課題と乗り越え方」は、生成AIをプロダクト開発にどのように活用しているか、その際に直面した課題と克服するためのアプローチなどをFastLabel、LayerX、LINEのエンジニアが共有するイベントです。ここで株式会社LayerXの中村氏が登壇。ここからは、LLMの精度評価における、LLMの処理以外で考えられる原因分析について話します。前回はこちらから。 精度評価 中村龍矢氏:では具体的に、精度評価と改善にいければと思います。 まず精度評価というと、パッとイメージしやすいのが、「どういうスコアをやるか」というところで。これは最近はツールもノウハウもいろいろ出ているので、あまり悩むことはないんじゃないかなと思っています。LLMが吐いた答えが正しいかどうかを判定する方法ですね。 一番シンプルな

                                LLMの出力における問題は「LLMの処理が原因」とは限らない プロンプト以外に考えられる4つの要因
                              • ネット広告は「みんなに見てもらう」から「見たくないなら金払え」になってしまってなんだかなってなる話…『にぎやかな未来』の世界に来てしまった

                                品場諸友 @shinabamorotomo 広告と云うモノが「みんなに見てもらう」物から「見たく無ければ金を払え」というモノになってしまった。勿論世の中には金を払ってでも見たくない広告が溢れていたことも事実だけど。でもなあなんかなあ、とは思う。ちょっと。 2023-12-12 03:39:00 Mno_ @Mno_Citz @shinabamorotomo 90年代CMには興味をもってもらう為の魅せる演出が何かしらありましたけど、近年のものは即物的で安普請かつ押し付けがましく(下品で生理的嫌悪感を催すものも)しかもそれを何度も何度も繰り返すとか、「この内容なら宣伝効果バッチグー!!」とか本気で思ったの●鹿なの? と( 2023-12-12 11:05:36

                                  ネット広告は「みんなに見てもらう」から「見たくないなら金払え」になってしまってなんだかなってなる話…『にぎやかな未来』の世界に来てしまった
                                • Google — 25 Years in Search: The Most Searched

                                  Google is celebrating the most searched figures and moments in 25 years of Google Search. From BTS to Taylor Swift, see the moments that have changed the world and inspired the next generation to come. Explore more at https://trends.google.com/trends/yis/2023/GLOBAL/ #YearinSearch Audio described version here: https://www.youtube.com/watch?v=AqduXftWeEE Music by: U2 “I Still Haven’t Found What

                                    Google — 25 Years in Search: The Most Searched
                                  • 「このバンドが好きなら、これらのバンドも好きかも」をAIが提案する音楽マップが話題に - amass

                                    「このバンドやミュージシャンが好きなら、これらのバンドやミュージシャンも好きかもしれない」というのをAI(人工知能)が提案する音楽マップ「Music-Map」が話題に。マップ上、2つの名前が近ければ近いほど、両方のアーティストが好きである確率が高くなるという。これは、人工知能と新しいユーザーインターフェースの実験Gnod(Global Network of Discovery)の一環として作られたものです。 ■音楽マップ「Music-Map」 https://www.music-map.com/

                                      「このバンドが好きなら、これらのバンドも好きかも」をAIが提案する音楽マップが話題に - amass
                                    • Elasticsearchでkangxi radicalsを正規化して検索する - 橋本商会

                                      テキストをPDF化した時に、見た目が同じでよりcodepointが先に現れる12215の方になってしまうらしい

                                      • 2023 年 Google 検索ランキングを発表

                                        メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                          2023 年 Google 検索ランキングを発表
                                        • YOASOBI「アイドル」、2023年のGoogle検索「Songs」で世界1位--猫・犬画像の1位は?

                                          YOASOBI「アイドル」、「Songs」カテゴリーで世界1位に 2023年に全世界で最も検索された言葉は、「Songs」カテゴリーでYOASOBIの「アイドル」が1位を獲得。鼻歌で曲を検索する「Hum to Search」でも3位に入ったほか、藤井風さんの「死ぬのがいいわ」が9位となり、日本の楽曲が2曲ランクインしている。また、「Games」で7位となった「スイカゲーム」は、日本では1位にランクインしている。 2004~2023年で世界で最も検索された言葉は 2004年以降に世界で最も検索された言葉としては、アニメカテゴリーでは「NARUTO−ナルト−疾風伝」、テーマ音楽では「スーパーマリオブラザーズ」、ビデオゲームでは「マインクラフト」になるという。このほか、「渋谷スクランブル交差点」「ポケモン」「サッカー」「クリスティアーノ ロナウド」「BTS」「BLACKPINK」「lol」などが

                                            YOASOBI「アイドル」、2023年のGoogle検索「Songs」で世界1位--猫・犬画像の1位は?
                                          • 「Google ドキュメント」にプレースホルダーチップが追加 ~検索でチップを簡単入力/個人のGoogle アカウントでも利用可能

                                              「Google ドキュメント」にプレースホルダーチップが追加 ~検索でチップを簡単入力/個人のGoogle アカウントでも利用可能
                                            • 多言語E5をファインチューニングして検索性能を向上させる - Ahogrammer

                                              多言語のテキスト埋め込み用のモデルであるMultilingual-E5[1]をファインチューニングして、検索性能が向上するか否かを日本語のデータセット検証してみました。結果としては、ファインチューニングすることで、OpenAIのtext-embedding-ada-002を上回る性能を確認できました。なお、E5については以下の記事で解説しているので、必要に応じて参照してください。 hironsan.hatenablog.com 本記事の構成は次のとおりです。 実験設定 実験結果 参考資料 実験設定 今回の実験では、多言語E5をファインチューニングして得られたモデルをベクトル検索に使うことで、検索性能がどのように変化するかを検証します。多言語E5にはbaseとlargeの2つのモデルがあるので、これらをファインチューニングする前後の検索性能を測定することにします。また、比較用のモデルとしてO

                                                多言語E5をファインチューニングして検索性能を向上させる - Ahogrammer
                                              • 静的サイトに特化した検索ライブラリ Pagefind を試す | grip on minds

                                                Pagefind は静的サイトであれば(HTML ファイルさえあれば)、基本的にどのようなサイトであっても以下の 2 ステップで導入できます。 Pagefind をインストールし、検索用ファイルを生成する Pagefind の UI を読み込み、インスタンスを作成する まず、検索用のインデックスファイルを生成します。本サイトのフレームワークは Astro を使用しているので、Astro のビルドと連携させるために npm パッケージをインストールします。 Pagefind の npm パッケージをインストールするコマンド npm install pagefind 次に、Astro のビルド後に Pagefind CLI を実行するように、npm-scripts を記述します。 package.json に記述する npm-scripts の例 { "scripts": { "build":

                                                • SIF/uSIFを使ってRustで簡単高速文埋め込み - Kampersandaのブログ

                                                  本記事は、情報検索・検索技術 Advent Calendar 2023 9日目の記事です。 SIF/uSIFという文埋め込み手法と、そのRust実装であるsif-embeddingを紹介します。最後にちょこっとベクトル検索もします。 はじめに SIF SIF-weighting Common Component Removal アルゴリズム 使用上の注意 uSIF sif-embedding 準備 単語埋め込みの準備 ユニグラム言語モデルの準備 Let's 文埋め込み 性能評価 速度性能 評価用データセットを使ったベンチマーク 英語 日本語 ベクトル検索 おわりに はじめに 自然言語文の密ベクトル表現を文埋め込みと呼びます。文埋め込み同士のコサイン類似度などを使って、文同士の意味的な類似度が計算できるので、自然言語処理や情報検索などで重宝します。特に最近では、今年のAdvent Calen

                                                    SIF/uSIFを使ってRustで簡単高速文埋め込み - Kampersandaのブログ
                                                  • 「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ

                                                    ※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。 はじめに この記事はコネヒトアドベントカレンダー 8日目の記事です。 コネヒト Advent Calendar 2023って? コネヒトのエンジニアやデザイナーやPdMがお送りするアドベント カレンダーです。 コネヒトは「家族像」というテーマを取りまく様々な課題の解決を 目指す会社で、 ママの一歩を支えるアプリ「ママリ」などを 運営しています。 adventar.org こんにちは!コネヒトの機械学習エンジニア y.ikenoueです。 突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS

                                                      「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
                                                    • OpenAIのGPTsを活用してAzure AI Searchとシームレスに連携する方法 - JBS Tech Blog

                                                      最近、OpenAIから新たにGPTsが発表され、その可能性に注目が集まっています。そこで、GPTsの機能をAzure AI Searchと組み合わせることで、新しいデータ検索が可能であるか調べてみました。 この記事では、GPTsとAzure AI Searchを連携させることによって、データアクセスと情報検索がどのように変わるか、その実践的な試みと成果についてご紹介します。 GPTsとは? Azure AI Searchの概要 Azure Web Appsの役割 データについて GPTsとAzure AI Searchを連携させた結果 GPTsをAzure AI Searchに接続する設定方法 Azure AI Searchのセットアップ Azure AI Searchの作成 データの保存 Azure AI Searchからデータをインポート インデックスで検索 Azure Web App

                                                        OpenAIのGPTsを活用してAzure AI Searchとシームレスに連携する方法 - JBS Tech Blog
                                                      • 「いろんなことに興味を持ちなさい」SEOの第一人者・渡辺隆広の人生を決定づけた一言。 - ミエルカマーケティングジャーナル

                                                        様々な領域の「知」を求めて、有識者の皆さんと対談する連載「 #知の探索 」。インタビュアーは、当社本田卓也が務めます。 今回のゲストは、SEOの第一人者と呼べる存在・渡辺隆広さんです。日本でまだ「SEO」という言葉が浸透していなかった1997年、渡辺さんはSEO支援サービスをスタートさせました。2003年に発売された著書『検索にガンガンヒットするホームページの作り方』は、SEOの概念や実践をまとめた名著として多くの業界関係者に愛読されています。 渡辺さんは、いつSEOと出会い今の道を志すようになったのか。これまであまり語られなかった過去について聞きつつ、SEOの未来やSEOに携わるために必要なことを話していただきました。 (執筆・撮影:サトートモロー 進行・編集:本田卓也) 心理カウンセラーの言葉が人生を変えた 本田: こうして渡辺さんにインタビューさせていただく機会が来るとは、思っていま

                                                          「いろんなことに興味を持ちなさい」SEOの第一人者・渡辺隆広の人生を決定づけた一言。 - ミエルカマーケティングジャーナル
                                                        • 官報、電子版が正本に 改正法成立 「ネットで無料で閲覧可能に」とデジタル庁

                                                          官報のデジタル版は現在も「インターネット官報」で公開されているが、無料で閲覧できるのは直近90日間のPDFデータのみ。検索したい場合は有料サービスに登録する必要がある。 新法についてデジタル庁は「インターネットでいつでも・どこでも・無料で閲覧できるよう、官報の電子化と連携して法令立案プロセスのDXを進める」としている。 関連記事 破産者情報サイトに停止命令 個人情報保護委 個人情報保護委員会が、破産者情報サイトに停止命令。従わない場合は、刑事告発を検討する。 個人情報保護委員会、「新・破産者マップ」調査へ 「事実確認の上で適切に対処したい」 自己破産した人の氏名や住所をGoogleマップ上にプロットした「破産者マップ」が公開されている問題に対し、個人情報保護委員会は対応を進めていることを明らかにした。 閉鎖した「破産者マップ」、行政指導されていた 個人情報保護法に違反? 個人情報保護委員会

                                                            官報、電子版が正本に 改正法成立 「ネットで無料で閲覧可能に」とデジタル庁
                                                          • Solr クエリを速度改善したら Solr 全体のパフォーマンスが向上した - 一休.com Developers Blog

                                                            この記事は 一休.com Advent Calendar 2023 6日目の記事です。 一休レストランの開発チームでエンジニアをしている香西です。 今回は Solr クエリの速度改善についてお話します。 背景 2023年10月、一休レストランのスマートフォン用 レストラン詳細ページをリニューアルしました! UI/UX の見直しとともに、使用技術も一新しました。 バックエンド言語:Python から Rustへ フロントエンドフレームワーク:Nuxt.js から Next.jsへ*1 スマートフォン用 レストラン詳細ページ 課題 「日付を選ぶカレンダーの表示が遅い」 社内限定リリースの直後、多方面からこの声が聞こえてきました... レストランへ行く日付を選ぶカレンダーは予約フローの第一ステップなので、表示速度が遅いことは致命的です。 特に、設定データ(料理のコース種類・席の種類など)が多いレ

                                                              Solr クエリを速度改善したら Solr 全体のパフォーマンスが向上した - 一休.com Developers Blog
                                                            • ハイブリッド検索で必ずしも検索性能が上がるわけではない - Ahogrammer

                                                              最近では、RAG(Retrieval Augmented Generation)を使って、検索して得られた文書を生成時に活用することがありますが、その性能を改善するための手法の1つとしてハイブリッド検索が知られています。ハイブリッド検索は、2つ以上の異なる検索技術を組み合わせた検索方法です。最近は、全文検索とベクトル検索の組み合わせを見ることが多く、その良いとこ取りをすることで検索性能を改善します。 ハイブリッド検索の有効性はいたるところで報告されていますが、「適当に全文検索とベクトル検索を組み合わせるだけで性能が上がるのか?」というとそれには疑問があります。ハイブリッド検索では、全文検索とベクトル検索の結果をランク融合アルゴリズムを使って統合することが行われます。そのような仕組み上、どちらか片方の検索性能が低い場合、全体としての性能が下がることが考えられるはずです。 そこで本記事では、日

                                                                ハイブリッド検索で必ずしも検索性能が上がるわけではない - Ahogrammer
                                                              • Windowsのファイル検索のコツとその仕組み - いおりのパソコン技術メモ

                                                                注:この記事ではWindows7の画面を使用してますが、Windows10でも同じことができます。 Windowsではファイルの検索は、 フォルダの右上部分にある小さな検索ボックスから検索できます。 しかし、いざ検索してみると 「検索に引っかからない」 「検索が遅い」 「なぜか関係ないものまで検索される」 といった事に悩まされた人も多いのではないのでしょうか? Windowsでファイルを検索するテクニック ここでは、Windows7のファイル検索のシステムの仕組みについて紹介します。 また検索のコツを紹介したいと思います。 長くなるので先に結論だけ言います。 まず検索ボックスに入力する方法です。 例えば「word」という単語を検索したい場合、次のように入力します 「~"*word*"」 wordの前後にアスタリスク「*」とダブルクォーテンションマーク「"」で囲み、 一番前にチルダ「~」を付

                                                                  Windowsのファイル検索のコツとその仕組み - いおりのパソコン技術メモ
                                                                • 来場者が急増したその後は?「周央サンゴ×志摩スペイン村」炎上なしで成功したコラボの裏側 | Kindai Picks

                                                                  人気Vtuber周央サンゴさんとのコラボで大きな話題を呼んだ「志摩スペイン村」。期間中は若年層を中心に前年比1.9倍もの人が訪れ、イベント終了から7カ月以上たった現在でも、その反響は続いています。どのようにして来る人の心を掴んだのか、観光や推し活に興味を持つ近畿大学 総合社会学部の学生が調査。取り組みのウラガワから、私たちが学ぶべき「姿勢」が見えてきました。 こんにちは。三重県出身、近畿大学 総合社会学部 総合社会学科(社会・マスメディア系専攻)4年生の西村伊織です。大学では、社会問題や現代社会で今注目を浴びているモノ・コトと人との関わりについて、社会・心理・環境などさまざまな視点から学んでいます。 所属しているのは岡本健先生のゼミで、先生の指導のもと自由なテーマで社会学を研究する手法を学んでいます。ゼミには、サウナ、プロデュースコスメ、eスポーツなど個性的なテーマで研究している人たちがい

                                                                    来場者が急増したその後は?「周央サンゴ×志摩スペイン村」炎上なしで成功したコラボの裏側 | Kindai Picks
                                                                  • RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life

                                                                    この記事は、情報検索・検索技術 Advent Calendar 2023の12月4日の記事である。 昨今のLLMの台頭により、外部情報を In-Context Learning として利用しLLMの生成結果の性能を高めることが可能な RAG(Retrieval Augmented Generation) の重要性の高まりを感じる。ただ、RAG を使ったシステムを構築してみようにも、データが少ないと面白みが少なかったりする。その為、Wikipedia 日本語の約550万文から簡単に検索可能でRAGの入力データとして使えるような embeddings と、素早い速度でベクトル検索できるような faiss 用の index を作成した。 例えば、Wikipedia から該当の文を検索する用途はこのように使える。 from datasets.download import DownloadMana

                                                                      RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life
                                                                    • 「鮮度3000倍…?」オホーツクの食材を使ったお弁当「オホ弁」関係者全員が(指摘したらバレる......)となって名前がヤバいと言えなかった説

                                                                      リンク NHK NEWS WEB オホーツクの食材をふんだんに「オホ弁」第2弾をお披露目|NHK 北海道のニュース 【NHK】オホーツク地方の食材をふんだんに使ったお弁当、通称「オホ弁」の第2弾が完成し、27日に網走市で披露されました。 「オホ弁」は地元の食材を… 15 users 32

                                                                        「鮮度3000倍…?」オホーツクの食材を使ったお弁当「オホ弁」関係者全員が(指摘したらバレる......)となって名前がヤバいと言えなかった説
                                                                      • SQLiteでLinderaを使った日本語全文検索 - *iroi*

                                                                        これは はてなエンジニアアドベントカレンダー2023 3日目の記事です。 はてなエンジニア Advent Calendar 2023 - Hatena Developer Blog はてなエンジニアのカレンダー | Advent Calendar 2023 - Qiita 昨日は id:pokutuna さんの blog.pokutuna.com でした。私も若い頃に同僚とGitHub上で白熱してしまい観光名所になってしまっていたような気がします。気を付けていきましょう。 さて、この記事では SQLiteでLinderaを使った日本語全文検索をする話を紹介します。 モチベーション laiso.hatenablog.com 上の記事でも話題になっているように個人開発ではDBのコストは問題です。同様に全文検索したいときにもコストに頭を悩ませているのではないでしょうか? たとえば Amazon

                                                                          SQLiteでLinderaを使った日本語全文検索 - *iroi*
                                                                        • OpenAI Embeddings APIとベクトル検索エンジンValdを使って類似文章検索をしてみよう

                                                                          ベクトルの準備 次にタイトル文章をベクトル化していきます。 OpenAIのアカウントを作成し、こちらからAPIキーを取得し、それを環境変数OPENAI_API_KEYに設定した後、次のコードを実行するだけで、入力文章のベクトルを取得できます。 import os import openai openai.api_key = os.environ["OPENAI_API_KEY"] client = openai.OpenAI() def get_embedding(text, model="text-embedding-ada-002"): text = text.replace("\n", " ") return client.embeddings.create(input=[text], model=model).data[0].embedding get_embedding("入力し

                                                                            OpenAI Embeddings APIとベクトル検索エンジンValdを使って類似文章検索をしてみよう
                                                                          • 「このアーティストが好きな人はこっちも好きかも」をマップで示してくれる「Music-Map」

                                                                            世の中にはさまざまなアーティストがいるため、好みのアーティストを探そうにも数が多すぎてなかなかピンとくるものに出会えません。似たようなアーティストの探索に使えるのが、世界中のユーザーの好みを元にアーティストのマッピングを行うサービスの「Music-Map」です。 Music-Map - Find Similar Music https://www.music-map.com/ Music-Mapでは、ウェブサイトの訪問者に「何が好きで何が嫌いか」を尋ねることによって関係性を学習するシステム「Gnod」に基づいてアーティストのマッピングを行っています。「Aというアーティストが好き」と答えた人の多くが「Bというアーティストも好き」と答えた場合、AとBは近しい関係として設定されます。 「Music-Map」にアクセスすると検索ボックスが出現するので、好きなアーティスト名を入力して検索アイコンをク

                                                                              「このアーティストが好きな人はこっちも好きかも」をマップで示してくれる「Music-Map」
                                                                            • Azure AI Search(旧: Cognitive Search)のチャンク分割+ベクトル化が簡単になったので試す!(2/2) - Qiita

                                                                              Azure AI Search(旧: Cognitive Search)のチャンク分割+ベクトル化が簡単になったので試す!(2/2)AzureCognitiveSearchAISearch はじめに 前回ではAzure AI Searchのチャンク分割+ベクトル化のやり方について解説しました。 この方法では言語アナライザーがデフォルト(英語)になってしまうので、フルテキスト検索の精度が悪くなってしまいます。今回は言語アナライザーを日本語にする方法について解説していきます。 やり方 インデックスを作る部分は前回の記事をご参照ください。今回はこちらの作成済みのインデックスを使います。 JSONの編集をクリックし、メモ帳などにコピーします。 既存のインデックスは一度削除します。 インデックスの追加(JSON)をクリックします。 先ほどメモ帳にコピーしたJSON形式のインデックスを貼り付けます。

                                                                                Azure AI Search(旧: Cognitive Search)のチャンク分割+ベクトル化が簡単になったので試す!(2/2) - Qiita
                                                                              • MySQLで全文検索機能を使う際のパフォーマンスについて調査してみた - iimon tech blog

                                                                                こんにちは、CTOの森です。iimonは今回が初のアドベントカレンダー参加です! 本記事はiimonアドベントカレンダー1日目の記事となります。 はじめに 検証した環境 MySQL/mecabのインストール 大量のデータを入れる 1レコードのINSERTにかかった時間 検索してみる 検索文字列が「出来事」の場合 インデックスなし N-gram(bi-gram) IN NATURAL LANGUAGE MODE IN BOOLEAN MODE MeCab IN NATURAL LANGUAGE MODE IN BOOLEAN MODE 検索文字列が「チューリングはロンドンのリッチモンドに住み」の場合 まとめ 参照したサイト 最後に はじめに 今回はMySQLで全文検索機能を使う際のパフォーマンスについて書こうと思います! 全文検索をちゃんと使うのであればElasticsearchやSolrな

                                                                                  MySQLで全文検索機能を使う際のパフォーマンスについて調査してみた - iimon tech blog
                                                                                • 2023 年の Bard 活用方法トップ 10を発表

                                                                                  メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                                                                    2023 年の Bard 活用方法トップ 10を発表