並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 1277件

新着順 人気順

検索エンジンの検索結果1 - 40 件 / 1277件

  • 実務で生成AIサービスを開発してわかったこと

    生成AIを使ったサービスを開発してわかったことをメモしておきます。 開発したもの 業種 SaaS 課題 提供サービス内でユーザーがアイディアを考えることが難しかった。様々なデータを人力で集めてくる必要があった 解決策 アイディア起案に繋がりそうなデータを自動で集めてきて提示する。手法はベクトル検索、AIによる要約生成。 その他 チャットUIは作っていない。ユーザーの入力は最初の検索テキスト入力文のみ。 開発前の検証・プロトタイピング 開発する前に生成AIの出力を検証することが必要 生成AIの出力の質はサービスの肝だから 生成AIの出力は事前の予想と違うこともあり早い段階で出力を確認しておかないと後々の仕様変更があったときにキツイから AIに渡すデータの中身を確認しておく 例えばRAGを使って社内ドキュメントやDBを検索する場合、それらのデータの中身を吟味する必要がある 必要なデータと不要な

      実務で生成AIサービスを開発してわかったこと
    • なぜ、最悪の業績なのに年商の20%にもあたる1億円の売上を手放してまで楽天市場から退店するのか|鷲尾 岳 / ワシオ株式会社 3代目社長

      【はじめに】・自己紹介こんにちは。 今年の1月にワシオ株式会社(以下ワシオ)の代表取締役社長に就任しました、三代目の鷲尾 岳(ワシオ タカシ)と申します。 鷲尾家の次男坊として1991年2月10日に生まれ、小学校5年生までは地元の公立、小6から私立の学校に転校し、中3までは福井県、高校は和歌山県にある姉妹校にて寮生活をしていました。 ここで詳しくは書きませんが、その学校の特徴として、「義務教育は最低限」「校則は生徒が主になって話し合って決める」「1年を通して大半のコマを占める”プロジェクト”という授業で目標を決め、達成に向けて何をするか生徒が決める」「やりたいことは大概やらせてもらえる」などなど、おそらくかなり一般的な学校からかけ離れた環境で多感な時期を過ごしました。 高校を卒業した後、大学で中国語を学んだので、卒業してからは父の伝手を頼って入社後すぐに中国で駐在させてくれる会社さんにご縁

        なぜ、最悪の業績なのに年商の20%にもあたる1億円の売上を手放してまで楽天市場から退店するのか|鷲尾 岳 / ワシオ株式会社 3代目社長
      • PCの操作をすべて録画&文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」

        PCを使っていると、過去の操作内容やブラウザで閲覧していた情報を思い出したくなるタイミングが頻繁に発生します。そんな時に役立ちそうなPC操作記録アプリ「Windrecorder」がオープンソースで開発されています。 GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. https://github.com/yuka-friends/Windrecorder I made an o

          PCの操作をすべて録画&文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」
        • 話題のローコードツール「Dify」で生成AIアプリを作ってみよう! - Qiita

          Difyって何? 少し前から話題の、プログラミングなしで生成AIアプリケーションを開発できるOSSです。 「Dify すごい」 でSNSを検索すると、驚き屋さんがみんな驚いています。このゴールデンウィークはAmazon BedrockとDifyの話題でもちきりでしたね。 元々は「GPTビルダーのOSS版ね。はい解散」という感じだったのですが、最近追加された「ワークフロー」機能がすごく便利のようです。 ちょっとしたアプリなら、ローコードで簡単に作れてしまうとのこと。 最近は自分でPCやサーバー準備して動かさなくても、SaaS版が公式から準備されたようです。無料プランもあります。 やってみた サインアップ 公式サイト右上の「Get Started」からサインアップします。 GitHub連携すると、いきなり開発画面に辿り着きました!いいUX。 「(いち?)から作成」よりワークフローを作ってみまし

            話題のローコードツール「Dify」で生成AIアプリを作ってみよう! - Qiita
          • Windows 11と10で動作を遅くしていると指摘されるスタートメニューのWeb検索を無効化する方法は?

            Windows 11ではスタートメニューの検索バーで、Windows 10ではスタートアイコン横の検索ボックスか検索アイコンで、PC内を検索して一致する結果を呼び出すことができます。しかしこの時、同時に入力したキーワードでBingのWeb検索候補も表示されるため、検索結果が表示されるまで数秒待つ必要があります。テクノロジー系メディアのTom's Hardwareの編集長であるアブラム・ピルチ氏が、WindowsのWeb検索機能を無効にするための操作について解説しています。 How to Disable Windows Web Search and Speed Up Your PC | Tom's Hardware https://www.tomshardware.com/how-to/disable-windows-web-search Windows 11でWindowsキーを押して「g

              Windows 11と10で動作を遅くしていると指摘されるスタートメニューのWeb検索を無効化する方法は?
            • 【未経験者大歓迎】RAG超入門:AWSが推奨するRAGを体験するハンズオン - Qiita

              2024/5/5更新:生成AIに興味を持った方向け、続編を投稿しました。 「Qiitaに聞いた!!」をAmazon Bedrockで作った!(Claude 3でRAG) タイトルはふざけてますが、プロンプトエンジニアリングにより本投稿と同様の内容を行う解説をしています。 (BedrockのClaude 3モデルと、Google検索を使った構成です) 生成AIはとても注目度が高い技術ですが、すこしとっつきにくいところがあるかもしれません。新しいモデルや活用手法が毎日のように登場し、ウォッチし続けるのはかなり大変です。 タイミングを逃して入門できていない方向けに、 とりあえず作って体感してみよう というコンセプトで、ハンズオン記事を作成しました。🎉🎉🎉 ハンズオンの内容は「RAG」です。RAGは生成AIの活用法としてよく出てくるキーワードです。ハンズオンでは、ただのRAGではなく最先端の

                【未経験者大歓迎】RAG超入門:AWSが推奨するRAGを体験するハンズオン - Qiita
              • Google検索を殺した男――Googleはいつ、どこでメタクソ化に舵を切ったのか | p2ptk[.]org

                以下の文章は、コリイ・ドクトロウの「The specific process by which Google enshittified its search」という記事を翻訳したものである。 Pluralistic どんなデジタルビジネスでも、技術的には「メタクソ化」できる。つまり、ビジネスの根本的な機能をユーザごとにリアルタイムで変更できるため、ビジネス顧客、エンドユーザ、株主の間で価値を素早く移転できるのだ。 https://pluralistic.net/2023/02/19/twiddler/ このスレッドをエッセイ形式で読んだり共有したい方は、私の監視フリー、広告フリー、トラッキングフリーのブログ、pluralistic.netをチェックしてほしい(訳注:もともとのテキストはTwitter上のスレッドに書かれている)。 https://pluralistic.net/2024/0

                  Google検索を殺した男――Googleはいつ、どこでメタクソ化に舵を切ったのか | p2ptk[.]org
                • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

                  2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

                    Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
                  • 表記揺れ検出ツール「テキストゆれないくん」 - inzkyk.xyz

                    その他のサンプル: Wikipedia:良質な記事, Wikipedia:長いページ 紹介 「テキストゆれないくん」は文章に含まれる表記揺れを検出するツールです。「コンピュータ」と「コンピューター」、あるいは「全て」と「すべて」といった同じ単語の別表記が使われていないかどうかをチェックできます。 「テキストゆれないくん」は元々このサイト (https://inzkyk.xyz/) の文章校正用に開発されました。機能が成熟してきたので UI を付けて公開します。 このページから手動で使う限り、「テキストゆれないくん」は商用/非商用を問わず自由に使って構いません。「テキストゆれないくん」は無保証で提供されます。 特徴 ウェブブラウザから使える このページをウェブブラウザで開いているなら、「テキストゆれないくん」は既に動いています。このページの最初にあるのは「テキストゆれないくん」を使うための完

                      表記揺れ検出ツール「テキストゆれないくん」 - inzkyk.xyz
                    • なぜGoogleは“あなたの不満”を無視できるのか | p2ptk[.]org

                      以下の文章は、コリイ・ドクトロウの「Too big to care」という記事を翻訳したものである。 Pluralistic Google検索を初めて使ったときのことを覚えているだろうか。まるで魔法にかかったようだった。Altavistaや Yahooの検索品質が徐々に劣化していく中にあって、Googleは文字通り卒倒ものだった。インターネットへの最高の入り口だったのだ。 今日、Googleは検索市場の90%のシェアを占めている。彼らはその地位を力ずくで手に入れた。Googleは数百億ドルを賄賂に費やして、あらゆるデバイス、あらゆるサービス、あらゆるウェブサイトの検索ボックスの裏側にあるデフォルト検索エンジンの地位を確実にしている。 https://pluralistic.net/2023/10/03/not-feeling-lucky/#fundamental-laws-of-econo

                        なぜGoogleは“あなたの不満”を無視できるのか | p2ptk[.]org
                      • Google検索の品質悪化はリーダーが変わったことの影響だという指摘

                        by Anthony Ryan ウェブ検索市場では、Googleが長年圧倒的なシェアを占めていますが、Google検索の品質は年々悪化していることが研究で示されています。そんなGoogle検索の品質がなぜ悪化したのか、イギリスのジャーナリストであるエドワード・ジトロン氏が自身のニュースレターで解説しています。 The Man Who Killed Google Search https://www.wheresyoured.at/the-men-who-killed-google/ 2018年から2020年までグーグルの検索部門の責任者を務めていたベン・ゴームズ氏はGoogle黎明期からの中心メンバーで、検索エンジンの設計にも携わっています。 by OFFICIAL LEWEB PHOTOS ゴームズ氏は、検索結果の関連性を高めるために、「ページランク」と呼ばれるアルゴリズムを単一マシンで

                          Google検索の品質悪化はリーダーが変わったことの影響だという指摘
                        • 「スマホOS」寡占するアップル/グーグルを規制する法案、自民党でとりまとめ終わる 今国会成立へ

                            「スマホOS」寡占するアップル/グーグルを規制する法案、自民党でとりまとめ終わる 今国会成立へ
                          • かくしてGoogleはスパマーに敗北した | p2ptk[.]org

                            以下の文章は、コリイ・ドクトロウの「Google reneged on the monopolistic bargain」という記事を翻訳したものである。 Pluralistic 驚くべきことに、かつてAltavistaやYahooをふっと飛ばし、魔法の検索ツールで世界を驚かせたGoogleが、突如クソの山になってしまった。 Googleの検索結果はひどいものだ。ページの上部はスパム、詐欺、広告だらけだ。始末に終えないのは、その広告も詐欺だらけなのだ。時には、資金力のある敵対者がGoogleを出し抜いて大金を稼ごうと大掛かりな詐欺が試みることもある。 https://www.nbcnews.com/tech/tech-news/phone-numbers-airlines-listed-google-directed-scammers-rcna94766 しかし通常、こうした詐欺を働くのは

                              かくしてGoogleはスパマーに敗北した | p2ptk[.]org
                            • 一度は読むべき「哲学」の名著 カリスマが選ぶ入門・古典・傑作8冊

                              日経BOOKプラスに掲載されている記事、本、著者を任意のキーワードで検索することができます。 ※ISBNも検索にご利用いただけます。ISBNとは出版物固有の13桁の番号で、裏表紙に記載されています。本サイトでISBNを使って書籍を検索する際は、ハイフン(-)を省略し、13桁の数字のみを半角文字で入力してください。

                                一度は読むべき「哲学」の名著 カリスマが選ぶ入門・古典・傑作8冊
                              • テレワークは若手の成長を阻害してるって話

                                komitsubo @komitsubo 最近痛感したのはやっぱり若い人にとってリモートワークは成長の阻害でしかないとう事。リモートワークでやっていたら何日もかかっていただろう問題が、出社しているだけでその辺歩いてる経験者が困ってると一緒に見てくれて問題を1時間とかで解決してたりするのをみるとホント思う。 2024-04-07 08:08:53 komitsubo @komitsubo 結局ググった所で自身の今抱えている問題に完全直結する解答を探すのは難しい。要求をどうまとめるかも、設計、実装をどうするかも、問題をどういうアプローチで解決するかや原因の推定も身近で経験者が一緒に同じものを見て考えて案をくれたり一緒に作ったりしてくれるのは莫大な経験値になる。 2024-04-07 08:14:25

                                  テレワークは若手の成長を阻害してるって話
                                • AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

                                  「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。 そもそもChatGPTの心臓部である大規模言語モデル(LLM)は、膨大な知識を元にテキストを「生成」する仕組みだ。 逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。 だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚(ハルシネーション)を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。 結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。 今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

                                    AI検索「Perplexity」がかなり便利だったので紹介します (1/5)
                                  • AIが優れているのではなくグーグルが劣化しただけ

                                    「AIを使えばやりたいプログラミング言語のコーチがタダでしてもらえるんだぜ!」 くだらん。 昔のグーグルだったら「[プログラミング言語名] 勉強 やり方」でググったら最高にイカしたページにたどり着いた。 作りたいシステムがあっても「[言語名] [やりたいこと] コード」でググれば欲しかった情報がドンピシャでガッポガポ。 そんな黄金時代があった。 インターネットの黄金時代。 ADSLが世界をつなぎ始めた世界、ネットの海が光速で流れていなかった穏やかな時間。 あの頃、ネットの海から求めていた知恵を引き上げるのは今よりずっと簡単だった。 今のネットは汚れきったヘドロの塊であり素のまま飲めば猛毒となる巨大な汚水、まるで東京湾だ。 AIがやっていることはネット上に溢れた有象無象を濾し取って、少しだけ昔のインターネットに近づけるだけの作業でしかない。 昔はほんのちょっとした言葉の組み合わせでたどり着け

                                      AIが優れているのではなくグーグルが劣化しただけ
                                    • グーグル検索で「フォレスト・ガンプ/一期一会」って検索するとなんか絵文..

                                      グーグル検索で「フォレスト・ガンプ/一期一会」って検索するとなんか絵文字の人間が増えながらひたすら走ってるんだけどストーリーと連動してたりする? どういう話?

                                        グーグル検索で「フォレスト・ガンプ/一期一会」って検索するとなんか絵文..
                                      • 増田内検索が改善されてる

                                        キーワードを検索すると一瞬でまともな検索結果が表示されるようになってる。 なんかクソみたいなエイプリルフールネタが来てるが。

                                          増田内検索が改善されてる
                                        • 【終了しました】はてな匿名ダイアリーに「ビッグ検索」機能をリリースしました - はてラボ 開発者ブログ

                                          4月2日 追記:はてな匿名ダイアリーの「ビッグ検索」機能を終了します 2024年4月1日にリリースした「ビッグ検索」機能の提供を終了します。 「ビッグ検索」は24時間の長きにわたり、ご利用の皆様のビッグな疑問に答えてまいりましたが、あまりにも巨大な検索フォームを維持・運用することが困難となってまいりました。空間効率の有効利用、また持続可能性の観点からサービス提供を終了させていただくことになりました。 ご利用の皆様には申し訳ありませんがご理解、ご了承のほどよろしくお願いいたします。 なお、「ビッグ検索」と同時に実装されました「はてな匿名ダイアリー全文検索機能」は引き続きご利用いただけます。 本文 本日2024年4月1日、はてな匿名ダイアリーに「ビッグ検索」機能をリリースしました。 はてな匿名ダイアリーは、2006年から「名前を隠して楽しく日記。」をモットーに運営してまいりました。匿名という敷

                                            【終了しました】はてな匿名ダイアリーに「ビッグ検索」機能をリリースしました - はてラボ 開発者ブログ
                                          • Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ

                                            Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する はじめに こんにちは! 第一SAチームのshikaです。 普段、あるAmazon RDS上のデータベース(MySQL)に対し、SQLを実行してデータを参照しています。 毎回SQLクエリを実行するのが手間だったので、データ検索を容易にするWebアプリケーションを開発しました。 このアプリケーションには、AWSの生成AIサービス「Amazon Bedrock」を活用しており、生成AIを用いた対話式の検索機能を実現しています。 できあがったアプリケーションの画面は以下です。 データはテストデータを使ってます。以下の通り、架空の会社の従業員情報に関するデータです。 本記事ではこのアプリケーションの構成、仕組みについて、特にAmazon Bedrockの部分を重点を置いて解

                                              Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ
                                            • Bingで”アマゾン”と検索すると検索結果の一番上に本物と同じURLの詐欺サイトが出現、「クリック不可避」「URLだけで判断できない」と話題に

                                              Naomi Suzuki @NaomiSuzuki_ 03/27 Bingの検索結果に、サポート詐欺に誘導する偽アマゾンの広告出現(図1-2)。中継サイト(hxxps://hotcarsinjp.shop/bing/)経由でWindowsをサポート詐欺サイトに(図3)、他は公式サイトに(図4)転送。騙されないようお気を付けください。 pic.twitter.com/TYTRxFPb6K 2024-03-27 13:32:07

                                                Bingで”アマゾン”と検索すると検索結果の一番上に本物と同じURLの詐欺サイトが出現、「クリック不可避」「URLだけで判断できない」と話題に
                                              • データベースの在庫の持ち方をビットで管理してる話 - 一休.com Developers Blog

                                                こんにちは、一休.comスパ(以下、「スパ」)の開発を担当しているshibataiと申します🙏 今回はスパのデータベースの在庫の持ち方で試行錯誤した話をさせていただきます。 背景 2024-03-29追記: 一休.comスパにおける在庫の特徴について 一休.comスパが扱う「在庫」は、「ある日付の特定の時間に対する空き枠」です。以降の説明では、スパ施設ごと、日付ごと、また時間ごとに増えていく「在庫」をいかに効率よく扱うかについて説明しています。 詳細については次のスレッドも参照してください! https://t.co/Y0SPmDE4yZ この記事のコメントみてると、少し我々のシステムの要件が伝わってないというかそこの説明が記事に不足しているように思った。ので以下その補足— naoya (@naoya_ito) March 29, 2024 現在の実装 スパは予約を受け付けるために在庫の

                                                  データベースの在庫の持ち方をビットで管理してる話 - 一休.com Developers Blog
                                                • 誰も教えてくれないハローワーク求人の探し方

                                                  ハロワ求人はゴミばっかと言うのがネット上の定説であるが、実態として、 無料だからハロワはダメ!とか言うがIndeedも無料である。ハロワの求人票は嘘ばっかと言うが民営は民営で盛りがちであるし、同じ求人だと大抵民営の方が写真は多いが条件の記載は雑である。転職エージェントの方がいいと言ってるのはだいたい転職エージェントかアフィサイトかプロ驚き屋である。ハイクラス求人が無いというがそもそも大多数にハイクラス求人は関係ない。広告宣伝費をかけられる会社はハロワに出さないのは事実だが、広告宣伝費をかけないと売れない求人である可能性も同時に存在する。 というのが実際のところであろうし、また以上のような言説では真面目にハローワークインターネットサービスの仕様を検証しているところなど無く、Xランドでは少し触って極端にクソな求人をピックアップしてやっぱりクソ!とか言ってる程度である。 当然ながら仕様を理解して

                                                    誰も教えてくれないハローワーク求人の探し方
                                                  • ナレッジグラフを用いたRAGの改善 - Ahogrammer

                                                    RAG(Retrieval Augmented Generation)は大規模言語モデル(LLM)の性能を改善するための手法の1つであり、質問に対する回答を生成する際に、外部知識源から情報を取り込みます。 これにより、LLM 自体で学習できる情報量に制限されることなく、より正確で詳細な回答を生成することができます。 よく使われているRAGでは、外部知識源として検索エンジンにテキストをインデックスしておき、質問に関連するテキストをベクトル検索や全文検索を用いて取得します。しかし、構造化データを扱うことには苦労するため、質問によっては回答が不十分、あるいはまったく回答できないことに繋がります。 これらの問題を克服するために、ナレッジグラフを用いたRAGが構築されることがあります。ナレッジグラフでは、エンティティとその間の関係がグラフ構造で表現されており、単純な検索を用いた場合には回答できないよ

                                                      ナレッジグラフを用いたRAGの改善 - Ahogrammer
                                                    • 末期がんの夫がすがった145万円ワクチン 「効果ない治療だった」:朝日新聞デジタル

                                                      ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                                        末期がんの夫がすがった145万円ワクチン 「効果ない治療だった」:朝日新聞デジタル
                                                      • インデックスを理解したい - Qiita

                                                        はじめに みなさんはDBのインデックスを正しく使えていますか? 私はなんとなく「DBのパフォーマンスを向上するためのもの」という認識はあったのですが、 どのような場面で使うものなのか、逆にどのような場面では使うべきでないのかなど 明確に理解できていませんでした。 今回はそんなインデックスについての理解を深めたいと思います。 インデックスとは インデックスとは、その名の通り「索引」です。 表現の仕方と変えると、(x, a)という形式の配列であるとも言えます。 xというキー値とそれに結びつくaというデータ情報があり、 これを利用することですべてのデータを網羅して見ることなく、 まさに本の索引のように目的のデータにたどり着くことができます。 インデックスはSQLのパフォーマンスを改善するための非常にポピュラーな手段であり、 理由としては下記の3点が挙げられます。 アプリケーションのコードに影響を

                                                          インデックスを理解したい - Qiita
                                                        • RAGの実装戦略まとめ - Qiita

                                                          それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

                                                            RAGの実装戦略まとめ - Qiita
                                                          • アップル、 iPhoneへのグーグルAI「Gemini 」搭載で交渉中-関係者

                                                            米アップルは、アルファベット傘下グーグルの生成AI(人工知能)サービス「ジェミニ( Gemini)」の「iPhone(アイフォーン)」への搭載に向け交渉しており、AI業界を揺るがす大型合意につながる可能性がある。事情に詳しい複数の関係者が明らかにした。 非公開情報を理由に関係者が匿名を条件に語ったところでは、両社はアイフォーンのソフトウエアに今年搭載する新たな機能を強化するため、グーグルの生成AIモデル、ジェミニの使用許可(ライセンス)をアップルに与える交渉を活発に行っている。 関係者によれば、アップルは対話型AI「ChatGPT(チャットGPT)」を開発した米オープンAIとも最近話し合いを持ち、同社のモデルの使用も検討しているという。 アップルとグーグルとの合意が実現すれば、両社の検索エンジンでのパートナーシップがさらに強化される。グーグルは同社の検索エンジンをアイフォーンや他のデバイス

                                                              アップル、 iPhoneへのグーグルAI「Gemini 」搭載で交渉中-関係者
                                                            • 似た文書をベクトル検索で探し出したい ~SentenceTransformersとFaissで効率的にベクトル検索~

                                                              はじめに この記事では、ベクトル検索で似た文書を検索するコードを解説します。具体的には、Sentence Transformersライブラリを用いてベクトル化、Faissという近似最近傍探索ライブラリを用いて高速な検索を行います。 用語説明 ベクトル検索 ... 文書の検索にベクトルを使用する方法。例えば、文書に映画に関する内容が 10 %、音楽が 2 %、俳優が30%含まれていた時、シンプルにそれを表すと [0.1, 0.02, 0.3]というベクトルを作ることができる。Googleの説明が詳しい。 Sentence Transformers ... ベクトル検索に必要なベクトル化を行うためのライブラリ Faiss ... ベクトル同士の類似度を高速に検索してくれるライブラリ。以下のHakkyさんのページが詳しい。 コード 入力:検索したい文字のリスト、検索される文字のリスト 出力:どの

                                                                似た文書をベクトル検索で探し出したい ~SentenceTransformersとFaissで効率的にベクトル検索~
                                                              • 食べログ離れ加速、評価への不信と高コスト…「店探しもグーグルとインスタ」

                                                                「食べログ」より 「食べログ」「ぐるなび」「ホットペッパーグルメ」などさまざまなグルメサイトが存在するが、消費者や飲食店の間でグルメサイト離れが進んでいるといわれている。実際にSNSでお店を選ぶ人も多いが、実態はいかに。今回はグルメサイト離れについてプレスリリースを発表した株式会社TableCheckに話を聞いた。 きっかけはグーグル、インスタグラムの参入 TableCheckは飲食店向けに予約・顧客管理システムを提供している。店舗のオウンドメディアやグルメサイト、電話などからのあらゆるチャネルからの予約を一括で管理できるSaaS企業。そんな同社は以前、グルメサイト離れに関するプレスリリースを発表した。同リリースによると、消費者の間でグルメサイトを信頼しないという声が聞かれるようになり、飲食店検索ではグーグルが台頭するようになったという。飲食店側に対するアンケートでも3割がグルメサイトのユ

                                                                  食べログ離れ加速、評価への不信と高コスト…「店探しもグーグルとインスタ」
                                                                • サクラエディタでよく使う正規表現たち【備忘録】 - Qiita

                                                                  よくお世話になっている正規表現ですが、毎日使うものでもないので、なかなか覚えることができず。。。 使う度に検索するものもあるので、自分のための正規表現備忘録を作成することにしました。 データ整理などに使っているだけなので、偏りがあるかもしれません。 全角文字だけ

                                                                    サクラエディタでよく使う正規表現たち【備忘録】 - Qiita
                                                                  • chatgptで手間なく月5桁ブログを量産する6ステップ

                                                                    本記事では「chatgptで手間なく月5桁稼ぐブログを量産する6ステップ」を解説していきます。 こんな人に読んで欲しいです 読んで欲しい人 ・0から新しい副業収入を作りたい人 ・ブログで今苦戦している人 ・これからブログを始める人 実際に私もchatgptをフル活用して月5桁稼ぐブログを量産しています。 しかも穴場を狙ってるので、ほぼ放置して自動的に収益が入ってきている状態です。 今回はそのノウハウを特別に無料で公開。 まずは本記事の全体像をご紹介します。 ステップ1 目標を数値化 ステップ2 キーワードを厳選 ステップ3 記事を量産 ステップ4 被リンクを獲得 ステップ5 記事をリライト ステップ6 ステップ2〜5を繰り返す 本記事内では ・記事作成をほぼ自動化してくれる「記事作成gptsくん」 ・3~5000文字の記事を量産する「最強スプシ」 ・個人ブログでも取れる被リンクサイト これ

                                                                    • Kagi Searchをメインの検索エンジンとして使っている

                                                                      最近はGoogleではなくKagi Searchをメインの検索エンジンとして使っています。 Kagi Searchは$108/year($10/month)の有料の検索エンジンです。 広告モデルではない検索エンジンなので、有料のサブスクリプションモデルとなっています。 Plan Types | Kagi’s Docs いくつかプランがあり、検索し放題のProfessionalプランが$10/monthです Ultimate Plan ($25/month)だと外部のOpenAIのGPT 4とかClaude 3との連携とかも入ってきます 月に1-2万回ぐらいは検索することを考えると、 (108 / (10000 * 12)) * 150 で大体1検索が0.1円ぐらいのイメージですが、こちらもKagiのLLM機能は利用できるので、実質もう少しコスパは良いと思います。 検索ソースにはGoogle

                                                                        Kagi Searchをメインの検索エンジンとして使っている
                                                                      • 2026年までに検索エンジンは生成AIのチャットボットにシェアを奪われ、利用が25%減少する。ガートナーの予想

                                                                        米ガートナーは、2026年までに従来の検索エンジンは生成AIによるチャットボットやそのほかのバーチャルエージェントにシェアを奪われ、利用されるボリュームが25%減少するという予想を明らかにしました。 ガートナー社によると、2026年までに従来の検索エンジンのボリュームは25%減少し、検索マーケティングはAIチャットボットやその他のバーチャルエージェントにシェアを奪われるという。 「生成AIによるソリューションは、従来の検索エンジンで行われていたユーザーのクエリを置き換え、回答を得るための代替エンジンになりつつある。生成AIが企業のあらゆる側面に組み込まれるにつれて、企業はマーケティングチャネル戦略を再考する必要に迫られるだろう」と、同社バイスプレジデントアナリストのAlan Antin氏は予想の中で説明しています。 Antin氏は、生成AIがコンテンツ制作のコストを下げるため、検索エンジン

                                                                          2026年までに検索エンジンは生成AIのチャットボットにシェアを奪われ、利用が25%減少する。ガートナーの予想
                                                                        • これでもうUIデザイン用のSVGアイコンに困らない! 商用無料のSVGアイコンを横断検索・ダウンロードでき、カスタマイズもできる便利サイト -Iconbuddy

                                                                          商用で無料利用できる、MITライセンスなどのオープンソースで利用できるSVGアイコンは、たくさんのサイトからリリースされています。これらをまとめて検索してダウンロードでき、しかもカスタマイズもできてしまう便利サイトを紹介します。 FigmaとVS Codeのプラグインも揃っており、そこから直接アイコンを利用することもできるので、かなり便利です。 Iconbuddy -200K+ open source free svg icons Iconbuddyの特徴 SVGアイコンの利用方法 Iconbuddyで利用できるSVGアイコン Iconbuddyの特徴 Iconbuddyは、オープンソースで利用できる200,000種類以上のSVGアイコンを無料で検索、ダウンロード、さらにアイコンのカスタマイズもできるアイコン検索エンジンです。 Iconbuddy -200K+ open source fr

                                                                            これでもうUIデザイン用のSVGアイコンに困らない! 商用無料のSVGアイコンを横断検索・ダウンロードでき、カスタマイズもできる便利サイト -Iconbuddy
                                                                          • 画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビュー

                                                                            Teedyはさまざまな種類のファイルの中身を読み取って検索できる状態にしてくれるドキュメント整理ツールです。受信したメールを自動で取り込む設定もできるとのことなので、実際にセルフホストして使い勝手を確かめてみました。 sismics/docs: Lightweight document management system packed with all the features you can expect from big expensive solutions https://github.com/sismics/docs TeedyのインストールにDockerを利用するので、下記のリンクから自分の環境に合った方法でDockerをインストールします。 Install Docker Engine | Docker Documentation https://docs.docker.com

                                                                              画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビュー
                                                                            • 検索システムのフロントを SSR・Remix で作り直した - Unyablog.

                                                                              かなり昔に Elasticsearch ベースの検索システム(Heineken)を作っていた。 Elasticsearch で部内 Wiki 検索高速化 - Speaker Deck 特に更新せず数年動かしていたのだけど、サーバーの置き換えに伴って Kubernetes に置きたいよねという話になり、ついでに Elasticsearch も新しくしたいよね、となった結果、現状のフロントエンドだと最新の Elasticsearch では動かないということがわかった。 nonylene.hatenablog.jp フロントエンドの改修が必要なわけだが、ここでフロントエンドの構成を見ると… FlowType create-react-app PureComponent Bootstrap 3 古すぎる!絶対アップデート難しいし触りたくない技術しかない。 フロントまわりの構成を変えたいとずっと思っ

                                                                                検索システムのフロントを SSR・Remix で作り直した - Unyablog.
                                                                              • サーバーレスマイクロサービスを構築するための設計アプローチの比較 | Amazon Web Services

                                                                                Amazon Web Services ブログ サーバーレスマイクロサービスを構築するための設計アプローチの比較 AWS Lambda でワークロードを設計すると、コードレベルでもインフラレベルでも表現できるモジュール性のために、開発者に疑問が生じます。また、コードを実行するためにサーバーレスを使用するには、基盤となる機能コンポーネントからビジネスロジックを抽出するためのさらなる検討が必要です。この意図的な関心の分離により、堅牢なモジュール性が保証され、進化的なアーキテクチャへの道が開かれます。 この投稿は同期ワークロードに焦点を当てていますが、他のワークロードのタイプでも同様の考慮が当てはまります。API の境界を特定し、コンシューマと API について擦り合わせた後、その境界と関連するアーキテクチャを構成します。 Lambda 関数を使用して API を構成する最も一般的な 2 つの方

                                                                                  サーバーレスマイクロサービスを構築するための設計アプローチの比較 | Amazon Web Services
                                                                                • グーグル、検索結果から低品質サイトを削減へ

                                                                                    グーグル、検索結果から低品質サイトを削減へ