並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 7 件 / 7件

新着順 人気順

サーチエンジンの検索結果1 - 7 件 / 7件

  • Pythonで100万ドキュメントオーダーのサーチエンジンを作る(PageRank, tfidf, 転置インデックスとか) - にほんごのれんしゅう

    検索エンジンを何故作ってみたかったか もともとこのブログのコンセプトのNLP的なことで、情報を整理してなにか便利にしたかった(Googleと同じモチベーションの世界の情報を整理する) 4年前にほぼ同じシステムを作ろうとしたとき、500万を超える大量のインデックスを検索するシステムは、数学的な理解度が十分でない+エンジニアリング力が伴わないなどでギブアップした背景があり、今回再チャレンジしたくなった ほぼすべての機能をpure python(+いくつかの例外はある)で実装して、世の中の ソフトウェアを使うだけ の検索エンジンをやってみたなどではなく、実際に理解して組んでみることを目的としたかった 依存パッケージと依存ソフトウェア GitHubのコードを参照してください 様々なサイトを巡回する必要があり、requestsが文字コードの推論を高確率で失敗するので、nkf をlinux環境で入れて

      Pythonで100万ドキュメントオーダーのサーチエンジンを作る(PageRank, tfidf, 転置インデックスとか) - にほんごのれんしゅう
    • 「私が10代のオタクなら一晩でサイト立ち上げてサーチエンジンに登録してた」グッズは即完売、話題の映画『鬼太郎誕生 ゲゲゲの謎』に「入村」する人続出

      映画『鬼太郎誕生 ゲゲゲの謎』11.17(金)公開 @kitaroanime50th 初めて明かされる、鬼太郎の父たちの物語 原作:#水木しげる キャスト:#関俊彦 #木内秀信 #古川登志夫 #沢城みゆき #野沢雅子 監督:#古賀豪 脚本:#吉野弘幸 キャラクターデザイン:#谷田部透湖 アニメ「#ゲゲゲの鬼太郎」(1~6期) kitaro-tanjo.com

        「私が10代のオタクなら一晩でサイト立ち上げてサーチエンジンに登録してた」グッズは即完売、話題の映画『鬼太郎誕生 ゲゲゲの謎』に「入村」する人続出
      • 世界最大級の海賊版電子書籍サイトへの法的措置に対抗して誕生した海賊版サーチエンジン「Anna’s Archive」とは?

        世界最大級の電子書籍データベースで 「世界最大の図書館」を名乗る海賊版サイトでもある「Z-Library」は、2022年11月に突如閉鎖したり運営者が逮捕・起訴されたりと存続が危ぶまれていました。Z-Libraryに対する一連の法的措置に対抗して、非営利のオンラインシャドウライブラリメタサーチエンジンの「Anna's Archive」が作られました。 Anna’s Archive https://annas-archive.org/ Anna’s Archive: Open-source data library | Hacker News https://news.ycombinator.com/item?id=36530662 インターネット最大の海賊版電子書籍データベースの1つであるZ-Libraryは、1000万冊を超える電子書籍と8600万件を超える学術記事を提供しており、毎月数

          世界最大級の海賊版電子書籍サイトへの法的措置に対抗して誕生した海賊版サーチエンジン「Anna’s Archive」とは?
        • 令和時代のサーチエンジンになるか? 気鋭のベクトル検索OSS Milvus についてまとめてみた - Taste of Tech Topics

          はじめに 情報検索・検索エンジン Advent Calendar 2019 24日目の記事です。 担当は@yktm31です。 本記事ではMilvusという大規模ベクトル類似度検索エンジンについて紹介したいと思います。 一般的な検索は所謂、単語を使って検索するような方式ですが、近しいベクトルの計算によって 画像から画像を検索する、テキストから画像を検索するようなことにも応用ができます。 Milvusはそのような用途に適切なライブラリです。 zillizという上海のベンチャー企業が開発していて、2019年11月5日にOSS化されました。 たまたまGitHubのTrendingで見つけ興味を持ったのですが、なんにせよ公開から日が浅く、情報が少ないです。 2019年12月現在、手がかりとなる有力なソースは主に3つです。 1. 公式webサイト 2. GitHubリポジトリ 3. medium 本記

            令和時代のサーチエンジンになるか? 気鋭のベクトル検索OSS Milvus についてまとめてみた - Taste of Tech Topics
          • 猫ネコサーチエンジン

            ネコア ペット用品 猫を初めて飼う時に困る猫グッズの揃え方の紹介をしています。また猫をすでに飼っている人の為にも猫を飼っていくうえで悩んでいることを解決するような情報を提供しています。 保護猫との生活を綴ります 猫のブログ 野良猫を保護し、10年が経過したこのタイミング。猫の食べ物や、猫の病気、野良猫さんを保護した事。我が家の三猫についても。2020年6月7日から四猫となりました。

            • e探偵・興信所検索サーチエンジン

              e探偵・興信所サーチエンジン 探偵・興信所を探す時、探そうにも、探偵や興信所の数が多く、どこの探偵がいいのかわからない…とお困りではありませんか? 当サイトでは、全国に数え切れないほど存在する探偵・興信所の情報を、地域ごとに分けてご紹介しています。 あなたのお住いの地域、又は調査を依頼したい地域に絞って、効率的に探偵を探すことができます。 もしあなたが探偵選び・興信所選びにお困りならば、ぜひ当サイトをご閲覧ください! ■探偵・興信所は簡単に決めてはいけません! あなたのご希望の地域でいいなと思える探偵や興信所を見つけても、依頼先をそこに決めるのは一旦待ってください。 他の探偵の情報もチェックして、できる限り多くの候補を見つけてください。 面倒に思うかもしれませんが、これはとても大切なことです。 探偵や興信所は、各業者によって、料金システムも調査力も運営方針も、本当にそれぞれです。 料金に関

              • コラム - グーグルのクラウドを支えるテクノロジー | 第64回 サーチエンジンのロードバランシング・アルゴリズム(パート1)|CTC教育サービス 研修/トレーニング

                [IT研修]注目キーワード Python UiPath(RPA) 最新技術動向 Microsoft Azure Docker Kubernetes 第64回 サーチエンジンのロードバランシング・アルゴリズム(パート1) (中井悦司) 2019年8月 はじめに 今回からは、2019年に公開された論文「Cache-aware load balancing of data center applications」を元にして、サーチエンジンのロードバランシングに関するアルゴリズムを紹介します。検索対象の単語ごとに担当するサーバーを分けて、サーバー内部のキャッシュのヒット率を高めるというシンプルなアイデアですが、複数の単語を含む検索文に適用するには、すこしばかり数学的な考え方が必要になります。今回は、具体的なアルゴリズムを説明する準備として、システム全体のアーキテクチャーを整理しておきます。 サーチ

                1