並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 3367件

新着順 人気順

検索エンジンの検索結果1 - 40 件 / 3367件

  • Google検索を殺した男――Googleはいつ、どこでメタクソ化に舵を切ったのか | p2ptk[.]org

    以下の文章は、コリイ・ドクトロウの「The specific process by which Google enshittified its search」という記事を翻訳したものである。 Pluralistic どんなデジタルビジネスでも、技術的には「メタクソ化」できる。つまり、ビジネスの根本的な機能をユーザごとにリアルタイムで変更できるため、ビジネス顧客、エンドユーザ、株主の間で価値を素早く移転できるのだ。 https://pluralistic.net/2023/02/19/twiddler/ このスレッドをエッセイ形式で読んだり共有したい方は、私の監視フリー、広告フリー、トラッキングフリーのブログ、pluralistic.netをチェックしてほしい(訳注:もともとのテキストはTwitter上のスレッドに書かれている)。 https://pluralistic.net/2024/0

      Google検索を殺した男――Googleはいつ、どこでメタクソ化に舵を切ったのか | p2ptk[.]org
    • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

      178{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした要

        Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
      • なぜGoogleは“あなたの不満”を無視できるのか | p2ptk[.]org

        以下の文章は、コリイ・ドクトロウの「Too big to care」という記事を翻訳したものである。 Pluralistic Google検索を初めて使ったときのことを覚えているだろうか。まるで魔法にかかったようだった。Altavistaや Yahooの検索品質が徐々に劣化していく中にあって、Googleは文字通り卒倒ものだった。インターネットへの最高の入り口だったのだ。 今日、Googleは検索市場の90%のシェアを占めている。彼らはその地位を力ずくで手に入れた。Googleは数百億ドルを賄賂に費やして、あらゆるデバイス、あらゆるサービス、あらゆるウェブサイトの検索ボックスの裏側にあるデフォルト検索エンジンの地位を確実にしている。 https://pluralistic.net/2023/10/03/not-feeling-lucky/#fundamental-laws-of-econo

          なぜGoogleは“あなたの不満”を無視できるのか | p2ptk[.]org
        • 基本概念から理解するAzure AI Search - Azure OpenAI Serviceとの連携まで - 電通総研 テックブログ

          こんにちは。XI 本部AIトランスフォーメーションセンター所属の山田です。 先日、部内の勉強会でAzure AI Searchについて紹介したので、テックブログでもその内容を紹介したいと思います。 Azure AI Searchとは? Azure AI Searchに保存されるデータに関する用語と概念 Azure AI Searchのスケーラビリティに関する用語と概念 Azure AI Searchでサポートされる検索の仕組み 全文検索について Azure AI Searchのアナライザー ベクトル検索について ベクトルの近傍検索アルゴリズム ハイブリッド検索 検索インデックスのスキーマ設計 検索インデックスにドキュメントを追加する方法 Pushモデル Pushモデルを利用する場合のアーキテクチャの例 Pullモデル Pullモデルを利用する場合のアーキテクチャの例 インデクサーの計算リソ

            基本概念から理解するAzure AI Search - Azure OpenAI Serviceとの連携まで - 電通総研 テックブログ
          • Heroku PostgresとAWS BedrockとHugging FaceでRAGを作ってみた - Qiita

            2023年11月にHeroku Postgresql 15 がpgvectorに対応しました。これによりHeroku Postgresがベクトルデータベースとして利用できるようになりました。 本記事では、最近話題のClaude2.1やText Embeddingと組み合わせ、Heroku Postgres内データを元に生成AIが回答してくれる、 Retrieval Augment Generation (RAG) を試作し、実際どんな回答を返してくれるか?検証してみました。 今回使用したもの 個人的に興味のあるものや、使いやすいものを選びましたので、特にこの組み合わせでないといけないわけではないです。 ■ ベクトルデータベース & ナレッジベース Heroku Heroku Postgres (PostgreSQL) pgvector ※今回の主役! ■ 大規模言語モデル AWS Bedr

              Heroku PostgresとAWS BedrockとHugging FaceでRAGを作ってみた - Qiita
            • Google検索の品質悪化はリーダーが変わったことの影響だという指摘

              by Anthony Ryan ウェブ検索市場では、Googleが長年圧倒的なシェアを占めていますが、Google検索の品質は年々悪化していることが研究で示されています。そんなGoogle検索の品質がなぜ悪化したのか、イギリスのジャーナリストであるエドワード・ジトロン氏が自身のニュースレターで解説しています。 The Man Who Killed Google Search https://www.wheresyoured.at/the-men-who-killed-google/ 2018年から2020年までグーグルの検索部門の責任者を務めていたベン・ゴームズ氏はGoogle黎明期からの中心メンバーで、検索エンジンの設計にも携わっています。 by OFFICIAL LEWEB PHOTOS ゴームズ氏は、検索結果の関連性を高めるために、「ページランク」と呼ばれるアルゴリズムを単一マシンで

                Google検索の品質悪化はリーダーが変わったことの影響だという指摘
              • The Man Who Killed Google Search

                Wanna listen to this story instead? Check out this week's Better Offline podcast, "The Man That Destroyed Google Search," available on Apple Podcasts, Spotify, and anywhere else you get your podcasts. This is the story of how Google Search died, and the people responsible for killing it. The story begins on February 5th 2019, when Ben Gomes, Google’s head of search, had a problem. Jerry Dischler,

                  The Man Who Killed Google Search
                • 「スマホOS」寡占するアップル/グーグルを規制する法案、自民党でとりまとめ終わる 今国会成立へ

                    「スマホOS」寡占するアップル/グーグルを規制する法案、自民党でとりまとめ終わる 今国会成立へ
                  • ついに来た Firebaseでベクトル検索

                    はじめに Firebaseでベクトル検索ができるようになったとのことなので、試してみました! そもそもベクトル検索って何ってところからGPTに質問しながらなんとかできた感じなので、解釈が間違っていたり説明が不十分な箇所もあるかと思いますが、こんなことができるんだという参考になれば幸いです。 今回やりたいこと ベクトル検索ができると聞き、真っ先に思い浮かんだのが去年開発したポケモン対戦記録アプリの類似対戦検索機能です。 「過去の対戦から今回の対戦相手のパーティと相手のパーティが似ている順にソートして取得する」です。 理由は説明すると長いので、興味のある人だけ読んでみてください。 なぜ似ている順にソートして取得したいか ポケモン対戦において最もよく遊ばれているルールの1つに相手と自分のパーティ6匹を見せ合って、実際に戦闘に繰り出す3匹を決めて3vs3で戦う6→3というルールがあります。 この時

                      ついに来た Firebaseでベクトル検索
                    • かくしてGoogleはスパマーに敗北した | p2ptk[.]org

                      以下の文章は、コリイ・ドクトロウの「Google reneged on the monopolistic bargain」という記事を翻訳したものである。 Pluralistic 驚くべきことに、かつてAltavistaやYahooをふっと飛ばし、魔法の検索ツールで世界を驚かせたGoogleが、突如クソの山になってしまった。 Googleの検索結果はひどいものだ。ページの上部はスパム、詐欺、広告だらけだ。始末に終えないのは、その広告も詐欺だらけなのだ。時には、資金力のある敵対者がGoogleを出し抜いて大金を稼ごうと大掛かりな詐欺が試みることもある。 https://www.nbcnews.com/tech/tech-news/phone-numbers-airlines-listed-google-directed-scammers-rcna94766 しかし通常、こうした詐欺を働くのは

                        かくしてGoogleはスパマーに敗北した | p2ptk[.]org
                      • AWS 入門ブログリレー 2024 〜Knowledge bases for Amazon Bedrock編〜 | DevelopersIO

                        Knowledge bases for Amazon Bedrock について2024年04月22日時点の情報をさらぁっとまとめてみました。AWSサービス入門記事として是非ご活用下さい。 こんにちは! AWS 事業本部コンサルティング部のたかくに(@takakuni_) です。 当エントリは弊社 AWS 事業本部による『 AWS 入門ブログリレー 2024』の 29 日目のエントリです。 このブログリレーの企画は、普段 AWS サービスについて最新のネタ・深い/細かいテーマを主に書き連ねてきたメンバーの手によって、 今一度初心に返って、基本的な部分を見つめ直してみよう、解説してみようというコンセプトが含まれています。 AWS をこれから学ぼう!という方にとっては文字通りの入門記事として、またすでに AWS を活用されている方にとっても AWS サービスの再発見や 2024 年のサービスアッ

                          AWS 入門ブログリレー 2024 〜Knowledge bases for Amazon Bedrock編〜 | DevelopersIO
                        • 被リンク獲得代行|リンクビルディング代行のUC-Marketing

                          検索エンジン最適化(SEO)において成功を収めるためには、外部サイトからの質の高い被リンクを獲得することが不可欠です。これにより、サイトの信頼性が向上し検索結果での優位性が高まります。 Backlinkoというアメリカの有名なSEO支援企業が発表した、「Google検索順位を決定づける200の要素」によると、コンテンツの品質に次ぐ重要な要素が被リンクの獲得です。SEOの概念が誕生して以来、リンクビルディング戦略の重要性は変わらず、現在も重要な位置を占めています。 このことは、新規のWebサービスを立ち上げる際や、Webマーケティングを強化する際に、より多くの高品質な被リンクを積極的に獲得し、サイトのドメインパワーを強化することの重要性を示しています。 しかし、多くの場合、適切なリンクビルディングの方法が不明であったり、内部対策だけでも手がいっぱいで、外部対策にまで手を広げることができないと

                          • コサイン類似度のいろんな書き方 - どこにでもいるSEの備忘録

                            前にこんなことやってました。 www.nogawanogawa.work コサイン類似度の計算を高速化したくなることがちょくちょくあるのですが、「ぶっちゃけどれくらいのスループットが出せるもんなの?」というのが気になったので完全に興味本位でやってみます。 コサイン類似度 定義と素朴なpythonでの実装 コサイン類似度の2つの計算パターン 諸条件 2つのベクトルの配列間ですべての組み合わせのコサイン類似度を計算 baseline numpy sklearn xlr8 pytorch jax Numba 実行速度結果 2つのベクトルの配列間で同じインデックスの組み合わせのコサイン類似度を計算 baseline numpy jax Numba 実行速度結果 使用したコード 参考文献 感想 コサイン類似度 定義と素朴なpythonでの実装 コサイン類似度は下記のような式になります。 これがなんの

                              コサイン類似度のいろんな書き方 - どこにでもいるSEの備忘録
                            • 一度は読むべき「哲学」の名著 カリスマが選ぶ入門・古典・傑作8冊

                              日経BOOKプラスに掲載されている記事、本、著者を任意のキーワードで検索することができます。 ※ISBNも検索にご利用いただけます。ISBNとは出版物固有の13桁の番号で、裏表紙に記載されています。本サイトでISBNを使って書籍を検索する際は、ハイフン(-)を省略し、13桁の数字のみを半角文字で入力してください。

                                一度は読むべき「哲学」の名著 カリスマが選ぶ入門・古典・傑作8冊
                              • 検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE

                                こんにちは!JADEの垣本です。 最近一気読みしたマンガは『ダンジョン飯』、今いちばん続きが気になるマンガは『忍者と極道』です。 前回の記事「私がSEOのコンテンツプランニングで大切にしていること」では、「コンテンツを作るときに考えるべきことは?」という話を書きました。今回は、その手前の段階である「そもそもどんなコンテンツが必要?」という点を掘り下げたいと思います。 特に「検索クエリってどうやって洗い出すの?」「検索クエリをピックアップしてみたけど、優先順位の付け方が分からない……」という悩みをお持ちの方へ。私なりの回答をご提案します。 ※前回の記事に引き続き、当記事におけるコンテンツは、自然検索流入を増やすことをKPIとしたものを念頭に置いています。 よくある質問「月5本の記事を作りたいのですが、何から着手すべきですか?」 よくある質問への答え「検索ジャーニーから考えましょう」 実践:し

                                  検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE
                                • AIがユーザーの意図を察して補助するBing新機能「ディープ検索」が一般公開! その実力を試す【イニシャルB】

                                    AIがユーザーの意図を察して補助するBing新機能「ディープ検索」が一般公開! その実力を試す【イニシャルB】
                                  • バラバラだったデータを統合 文化財の一覧検索システム公開 | 毎日新聞

                                    検索した文化財のデータ。文化財ごとにIDとなる「日本全国文化財番号」を新たに設定した=奈文研のホームページから 奈良文化財研究所(奈良市)は、国や都道府県が指定する文化財に関する報告や記録を集約し、一覧検索できるデータベース「全国文化財目録」を公開した。対象は同じなのに、組織によって異なる名称が使われていた報告書のデータを統合し、情報の収集や比較がしやすくなった。まずは調査概要の情報のみまとめており、今後も関連情報の統合を進めて、研究や情報管理で飛躍的な効率向上を目指す。 国や自治体が公開している文化財約73万件を精査し、同じ対象なのに呼び方の違いなどで重複していたものを除いた約51万件(無形文化財なども含む)に固有のIDを付与。IDごとに調査記録などの情報を関連付けた。関連画像をAI(人工知能)で見分ける仕組みも開発中で、関連する画像をIDごとに集約させることを目指す。発掘担当者などが調

                                      バラバラだったデータを統合 文化財の一覧検索システム公開 | 毎日新聞
                                    • 「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ

                                      Appleが6月のWWDCで正式発表する「iOS 18」について。 新たにSafariブラウジングアシスタント機能や暗号化されたビジュアル検索機能が搭載されるという情報が出ています。 iOS 18のイメージAppleのサーバー上のコードから発見したとして報告されており、当初、SafariのブラウジングアシスタントはiCloudプライベートリレーのインフラを使い、プライバシーを重視した形でAppleに関連データを送信するのではないかと推測されていましたが、その後、プライベートリレーとの関係はないかもしれないともしています。 MacRumorsは、SafariのブラウジングアシスタントはiOS 18でiPhoneに搭載されると噂されている新しい生成AI機能のうちのひとつかもしれないと推測しています。GPT-4を搭載したCopilotを備えたMicrosoft Edgeや、ウェブページを要約して

                                        「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ
                                      • Googleはどのようにクエリを解釈しコンテンツをランク付けするのか?

                                        [レベル: 初級] Google 検索がどのようにして検索結果を配信するのかを、Gary Illyes(ゲイリー・イリース)氏が動画で解説しました。 検索の仕組みを YouTube で解説する「How Search Works」シリーズのエピソード 4 です。 SEO 初級者向けの内容ではありますが、個人的に、今までのエピソードのなかでいちばん好きな内容だったのでこの記事で紹介します。 SEO 上級者でも(知識確認のために?)役立つ解説です。 クエリ解釈とランク付けの仕組み ゲイリーは、クエリ解釈とランク付の仕組みを説明します。 概要は次のとおりです。 Google 検索では、ストップワード(不要な語)の削除や対象の認識、類似語への拡張などを処理し、ユーザーの検索内容を解析する Google は、解析した検索内容をもとに、インデックスの中から検索結果を抽出する 検索結果のランキングは、ウェ

                                          Googleはどのようにクエリを解釈しコンテンツをランク付けするのか?
                                        • コラム:グーグル、AI時代の最大リスクは対アップル関係か

                                          4月5日、 米アルファベット傘下のグーグルにとって人工知能(AI)技術は脅威なのか、それともビジネスチャンスなのか。写真はアップルとグーグルのロゴ。2021年9月撮影(2024年 ロイター/Dado Ruvic) [ニューヨーク 5日 ロイター BREAKINGVIEWS] - 米アルファベット(GOOGL.O), opens new tab傘下のグーグルにとって人工知能(AI)技術は脅威なのか、それともビジネスチャンスなのか。アルファベットの株主にとっては大変な難問だ。 足元で問われているのは、AIのチャットボット(自動応答システム)の方がより良い情報により素早くたどり着けるようになるか、という問題だ。しかし、業績上は深く、そして大きな利益を生むアップル(AAPL.O), opens new tabとの関係の方が大きなリスクをもたらしている。 グーグルは1999年の創業以来、オンライン検

                                            コラム:グーグル、AI時代の最大リスクは対アップル関係か
                                          • 葬儀社がSEOで上位表示・集客成功を実現するための6つのヒント -webma-

                                            「ホームページの流入数が伸びない」 「SEOが重要なのはわかるけど、具体的に何をすれば良いかわからない」 このようにお悩みではありませんか? 「SEO」とは、GoogleやYahoo!のようなネット検索でWebサイトが上位に表示されやすい状態を作り、集客につなげるための取り組みです。 近年ではスマホでの情報収集が一般的になり、葬儀屋さん探しでもネット検索を頼る人が増えました。 地域密着型の葬儀社でも、「地域名 葬儀」などのキーワードで検索する人と接点が持てなければ、集客が難しくなってきています。 そこでこの記事では、葬儀社が上位表示や集客成功を実現できるよう、葬儀業におけるSEOのポイントを解説します。 この記事のトピック 葬儀業の集客でSEOが効果的な理由 葬儀社がSEOで上位表示するための7つのヒント 葬儀社のSEOにおける注意点 葬儀社がSEOを依頼するときによくある質問 この記事を

                                              葬儀社がSEOで上位表示・集客成功を実現するための6つのヒント -webma-
                                            • RAGの性能を高める「Self-RAG」を3分で理解する

                                              本記事では、よく聞く「Self-RAG」についてざっくり理解します。軽めの記事です。 はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。 この記事は何 この記事は、RAGの新手法として昨年発表された「Self-RAG」の論文[1]について、日本語で簡単にまとめたものです。 この論文は「CRAG」[2]など、最近出ている別のRAGアーキテクチャにも影響を与えているので、理解する価値がありそうです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 本題 ざっくりサマリー RAGの性能を高めるための新しい手法です。ワシントン大学などの研究者によって2023年10月に提案されました。Self-RAGという手法を使うメリットは、回答品質を上げられること、ハルシネーション(幻覚)を減らせるこ

                                                RAGの性能を高める「Self-RAG」を3分で理解する
                                              • Azure OpenAI ServiceによるRAG実装ガイドを公開しました | SIOS Tech. Lab

                                                みなさん、こんにちは。サイオステクノロジー武井です。今回は、Azure OpenAI ServiceによるRAG実装ガイドを公開しましたので、ご紹介させてください。 ※ このブログでのご紹介ととも以下のイベントでもガイドに関する詳細なご説明や、ガイドにはないデモなどを実施しますので、ぜひご参加ください。 Azure OpenAI ServiceによるRAG実装ガイドを公開しました https://tech-lab.connpass.com/event/315703 Azure OpenAI ServiceによるRAG実装ガイドとは? 以下のURLで公開しております。執筆しているうちに100ページ超の壮大なものとなってしまいました。 https://dev.noriyukitakei.jp/docs/aoai-rag-dev-guide.pdf 本ガイドの目的は、「シンプル」「強力」「すぐ動

                                                  Azure OpenAI ServiceによるRAG実装ガイドを公開しました | SIOS Tech. Lab
                                                • テレワークは若手の成長を阻害してるって話

                                                  komitsubo @komitsubo 最近痛感したのはやっぱり若い人にとってリモートワークは成長の阻害でしかないとう事。リモートワークでやっていたら何日もかかっていただろう問題が、出社しているだけでその辺歩いてる経験者が困ってると一緒に見てくれて問題を1時間とかで解決してたりするのをみるとホント思う。 2024-04-07 08:08:53 komitsubo @komitsubo 結局ググった所で自身の今抱えている問題に完全直結する解答を探すのは難しい。要求をどうまとめるかも、設計、実装をどうするかも、問題をどういうアプローチで解決するかや原因の推定も身近で経験者が一緒に同じものを見て考えて案をくれたり一緒に作ったりしてくれるのは莫大な経験値になる。 2024-04-07 08:14:25

                                                    テレワークは若手の成長を阻害してるって話
                                                  • キキ@5/19👑FLT on X: "みんな~~Bingの検索使うのやめとけ~~~~!! Yahooが出ないからって「Yahoo Japan ホームページ表示」って検索したら一番上にトラップ広告出てたりするからマジでやめといたほうがいいっす https://t.co/APrlVajDN2"

                                                    • AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

                                                      「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。 そもそもChatGPTの心臓部である大規模言語モデル(LLM)は、膨大な知識を元にテキストを「生成」する仕組みだ。 逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。 だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚(ハルシネーション)を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。 結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。 今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

                                                        AI検索「Perplexity」がかなり便利だったので紹介します (1/5)
                                                      • [AIチャットボット]Amazon LexとAmazon Kendraを利用して、お問い合わせ内容を種別判定してみた | DevelopersIO

                                                        [AIチャットボット]Amazon LexとAmazon Kendraを利用して、お問い合わせ内容を種別判定してみた はじめに Amazon LexとAmazon Kendraを利用して、チャットでのお問い合わせ内容を種別判定する方法をまとめました。 お客さまのお問い合わせを種別判定し、種別ごとに担当者に振り分ける一次対応を想定したチャットボットシステムを構築する際に、Kendraが種別判定機能を担います。 種別判定は、一般的な生成AIモデルでも可能ですが、生成AIが利用できない企業様もいらっしゃいますので、今回はKendraで試してみます。 構成 構成としては、下記の通りです。 ユーザーがお問い合わせする際、種別判定までのフローは以下の通りです。 事前に複数のFAQファイルをS3に保存し、それらをKendraにインポートします。 ユーザーからお問い合わせ内容をLexで受け取ります。インテ

                                                          [AIチャットボット]Amazon LexとAmazon Kendraを利用して、お問い合わせ内容を種別判定してみた | DevelopersIO
                                                        • GitHub - nilsherzig/LLocalSearch: LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the

                                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                            GitHub - nilsherzig/LLocalSearch: LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the
                                                          • AIが優れているのではなくグーグルが劣化しただけ

                                                            「AIを使えばやりたいプログラミング言語のコーチがタダでしてもらえるんだぜ!」 くだらん。 昔のグーグルだったら「[プログラミング言語名] 勉強 やり方」でググったら最高にイカしたページにたどり着いた。 作りたいシステムがあっても「[言語名] [やりたいこと] コード」でググれば欲しかった情報がドンピシャでガッポガポ。 そんな黄金時代があった。 インターネットの黄金時代。 ADSLが世界をつなぎ始めた世界、ネットの海が光速で流れていなかった穏やかな時間。 あの頃、ネットの海から求めていた知恵を引き上げるのは今よりずっと簡単だった。 今のネットは汚れきったヘドロの塊であり素のまま飲めば猛毒となる巨大な汚水、まるで東京湾だ。 AIがやっていることはネット上に溢れた有象無象を濾し取って、少しだけ昔のインターネットに近づけるだけの作業でしかない。 昔はほんのちょっとした言葉の組み合わせでたどり着け

                                                              AIが優れているのではなくグーグルが劣化しただけ
                                                            • 無駄なクロールにさようなら、Googleがクロール量削減を目指す

                                                              [レベル: 上級] 今年の私の使命は、クロールの量をさらに減らし、ネットワーク上の転送データ量を削減することです。 Google の Gary Illyes(ゲイリー・イリース)氏が LinkedIn でこのように投稿しました。 Google の取り組み:洗練されたクロールとネットワーク効率化 イリース氏は次のように続けます。 数日前、Reddit のあるコミュニティで、Google のクロール頻度が去年と比べて減少したのではないか、という投稿がありました。大局的に見れば、それは間違いです。クロール量は以前とほぼ同じですが、スケジューリングがより緻密になったことで、クロールに値する可能性の高い URL に重点を置くようになっただけです。 それでも実際には、もっとクロール量を減らすべきだと考えています。たとえば、キャッシュの管理やユーザーエージェント間の内部キャッシュ共有をさらに改善し、通信

                                                                無駄なクロールにさようなら、Googleがクロール量削減を目指す
                                                              • インターンでRAGシステムの検索エンジンの改善をおこないました - Uzabase for Engineers

                                                                UB Researchチームで2週間の短期インターンをしている梶川です。 現在、UB ResearchではRAGシステム構築に向けた研究を行っており、社内のさまざまなデータを正確に拾い上げるための検索エンジンの開発と評価を行っています。 今回、その検索エンジンに代わるモデルを用いて、実際の検索テキストで検索を実施した結果を報告します。 概要 近年、LLMを用いた文書生成が流行しており、その中でも外部情報を検索し、LLMに追加して生成させるRAGという技術が活用されています。RAGによって、LLMが知らない情報に対して正確な応答を返すことができ、UB Researchでもニュース記事や有価証券報告書などの情報に対してRAGを適用することを考えています。既存の検索エンジンには、国内データで学習されたBERTベースのモデルを用いていますが、今回、最新のモデルであるBGE-M3を用いて、検索を実施

                                                                  インターンでRAGシステムの検索エンジンの改善をおこないました - Uzabase for Engineers
                                                                • グーグル検索で「フォレスト・ガンプ/一期一会」って検索するとなんか絵文..

                                                                  グーグル検索で「フォレスト・ガンプ/一期一会」って検索するとなんか絵文字の人間が増えながらひたすら走ってるんだけどストーリーと連動してたりする? どういう話?

                                                                    グーグル検索で「フォレスト・ガンプ/一期一会」って検索するとなんか絵文..
                                                                  • 増田内検索が改善されてる

                                                                    キーワードを検索すると一瞬でまともな検索結果が表示されるようになってる。 なんかクソみたいなエイプリルフールネタが来てるが。

                                                                      増田内検索が改善されてる
                                                                    • 【終了しました】はてな匿名ダイアリーに「ビッグ検索」機能をリリースしました - はてラボ 開発者ブログ

                                                                      4月2日 追記:はてな匿名ダイアリーの「ビッグ検索」機能を終了します 2024年4月1日にリリースした「ビッグ検索」機能の提供を終了します。 「ビッグ検索」は24時間の長きにわたり、ご利用の皆様のビッグな疑問に答えてまいりましたが、あまりにも巨大な検索フォームを維持・運用することが困難となってまいりました。空間効率の有効利用、また持続可能性の観点からサービス提供を終了させていただくことになりました。 ご利用の皆様には申し訳ありませんがご理解、ご了承のほどよろしくお願いいたします。 なお、「ビッグ検索」と同時に実装されました「はてな匿名ダイアリー全文検索機能」は引き続きご利用いただけます。 本文 本日2024年4月1日、はてな匿名ダイアリーに「ビッグ検索」機能をリリースしました。 はてな匿名ダイアリーは、2006年から「名前を隠して楽しく日記。」をモットーに運営してまいりました。匿名という敷

                                                                        【終了しました】はてな匿名ダイアリーに「ビッグ検索」機能をリリースしました - はてラボ 開発者ブログ
                                                                      • 実例で理解するベクトル検索。YouTubeの関連動画検索をつくってみた

                                                                        生成AIの隆盛に伴い、ベクトル検索やベクトルデータベースが注目されています。 ベクトルについてより理解するために簡単なデモサービスを作ってみました。 この記事では作ったサービスをもとにベクトルについて説明し、後半では生成AIとベクトルの関連について紹介します。 つくったもの 「しもふりサーチ」 - お笑いコンビ「霜降り明星」のYouTubeチャンネル、「しもふりチューブ」の過去動画を検索できるサービスです。 このサービスには以下の2つの機能があります。 1. 文章での動画検索 文章で動画を検索する 「粗品さんがクイズを出題する回」 や 「せいやさんがギターを弾く回」 など、自然言語で動画を検索できます。 2. 関連動画レコメンド 内容の近い動画をレコメンドする 動画を選ぶと、過去動画の中から内容の近い動画をレコメンドします。 これらの機能はベクトル検索で実現されています。詳細を説明していき

                                                                          実例で理解するベクトル検索。YouTubeの関連動画検索をつくってみた
                                                                        • 「検索サイトが軒並みカスになっていく…」Bing検索→先頭に偽サイトが出る、Google検索→頼んでないのにAIの回答が生成される、インターネットが使いにくい件

                                                                          Naomi Suzuki @NaomiSuzuki_ 検索結果の先頭が偽物ですが、次の本物と同じ公式サイトのURLが表示されてヤバさ倍増です。XのURLカード(URL付投稿に画像やURLを表示する奴)もそうですが、リダイレクタを介すと、転送先の情報を表示するようになっているようです。リダイレクタがアクセス元を識別し、偽サイトと公式サイトに振り分けることで、公式サイトのURLを表示するように騙しているのかもしれません。 2024-03-27 18:19:27 ROCA @rocaz マジでBingはヤバい、Chrome検索結果の上位を公式サイト以外の広告枠が占めてる。これらが全て詐欺サイトとは言えないけど、ファーストビューの範囲に公式サイトが無いんだよ Edgeを無理矢理薦めてくるMicrosoft以上に激ヤバ。もう検索業辞めちまえ pic.twitter.com/3NXYTqcLT9 x.

                                                                            「検索サイトが軒並みカスになっていく…」Bing検索→先頭に偽サイトが出る、Google検索→頼んでないのにAIの回答が生成される、インターネットが使いにくい件
                                                                          • Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ

                                                                            Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する はじめに こんにちは! 第一SAチームのshikaです。 普段、あるAmazon RDS上のデータベース(MySQL)に対し、SQLを実行してデータを参照しています。 毎回SQLクエリを実行するのが手間だったので、データ検索を容易にするWebアプリケーションを開発しました。 このアプリケーションには、AWSの生成AIサービス「Amazon Bedrock」を活用しており、生成AIを用いた対話式の検索機能を実現しています。 できあがったアプリケーションの画面は以下です。 データはテストデータを使ってます。以下の通り、架空の会社の従業員情報に関するデータです。 本記事ではこのアプリケーションの構成、仕組みについて、特にAmazon Bedrockの部分を重点を置いて解

                                                                              Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ
                                                                            • 「Microsoft 365」モバイルアプリにCopilotが導入へ ~Microsoftが更新内容を発表/生成AIによる検索やチャット、画像生成が可能に。音声テキスト変換なども

                                                                                「Microsoft 365」モバイルアプリにCopilotが導入へ ~Microsoftが更新内容を発表/生成AIによる検索やチャット、画像生成が可能に。音声テキスト変換なども
                                                                              • Bingで”アマゾン”と検索すると検索結果の一番上に本物と同じURLの詐欺サイトが出現、「クリック不可避」「URLだけで判断できない」と話題に

                                                                                Naomi Suzuki @NaomiSuzuki_ 03/27 Bingの検索結果に、サポート詐欺に誘導する偽アマゾンの広告出現(図1-2)。中継サイト(hxxps://hotcarsinjp.shop/bing/)経由でWindowsをサポート詐欺サイトに(図3)、他は公式サイトに(図4)転送。騙されないようお気を付けください。 pic.twitter.com/TYTRxFPb6K 2024-03-27 13:32:07

                                                                                  Bingで”アマゾン”と検索すると検索結果の一番上に本物と同じURLの詐欺サイトが出現、「クリック不可避」「URLだけで判断できない」と話題に
                                                                                • データベースの在庫の持ち方をビットで管理してる話 - 一休.com Developers Blog

                                                                                  こんにちは、一休.comスパ(以下、「スパ」)の開発を担当しているshibataiと申します🙏 今回はスパのデータベースの在庫の持ち方で試行錯誤した話をさせていただきます。 背景 2024-03-29追記: 一休.comスパにおける在庫の特徴について 一休.comスパが扱う「在庫」は、「ある日付の特定の時間に対する空き枠」です。以降の説明では、スパ施設ごと、日付ごと、また時間ごとに増えていく「在庫」をいかに効率よく扱うかについて説明しています。 詳細については次のスレッドも参照してください! https://t.co/Y0SPmDE4yZ この記事のコメントみてると、少し我々のシステムの要件が伝わってないというかそこの説明が記事に不足しているように思った。ので以下その補足— naoya (@naoya_ito) March 29, 2024 現在の実装 スパは予約を受け付けるために在庫の

                                                                                    データベースの在庫の持ち方をビットで管理してる話 - 一休.com Developers Blog