タグ

searchと*historyに関するsh19910711のブックマーク (4)

  • Mahout使って分析しちゃいました。

    EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

    Mahout使って分析しちゃいました。
    sh19910711
    sh19910711 2024/04/30
    "Mahout: Luceneの成果の中で、機械学習に関するものがMahoutというサブプロジェクトとして分離 / Hadoopも同じく、Luceneプロジェクトの中のNutchというWeb検索エンジンのサブプロジェクトから派生" 2013
  • ElasticsearchとTasteプラグインで作るレコメンドシステム

    Apache Mahout で提供されているTasteフレームワークをElasticsearchに組み込むことで、Elasticsearchをレコメンドシステムとして利用する方法をご紹介します。

    ElasticsearchとTasteプラグインで作るレコメンドシステム
    sh19910711
    sh19910711 2024/04/14
    "Mahout: MapReduceはやめてSparkにシフト + 近頃はScala向けのSamsaraを提供 + どこを目指しているのかがわからない / Mahout Taste: 協調フィルタリングのフレームワーク + 情報をElasticsearchのインデックスで管理" 2015
  • Heapsの法則によるコーパス中の語彙数予測と評価実験 - シリコンの谷のゾンビ

    さて先日あることがきっかけでヒープスの法則 (Heaps' law) のことを思い出した.最初はヒープの法則と記憶していたのだけれど,'がHeapsの後ろにあるので,ヒープスの法則とかヒープス則と呼ぶのが正しいのだろう.ここではHeapsの法則と呼ぶことにする. Heapsの法則とはN語数から成るコーパスにおいて,総語彙数Dは以下の等式で表現できるというもの*1 ここで,kとβはコーパスによって定められた定数とする.英文コーパスではβは大体0.4-0.6になるらしい*2 この法則が示唆することは,コーパスサイズの増加に対して語彙は増え続けるというもの.まぁlogスケールにおいては直線なので,徐々にサチっていくのは確かであるが. Wikipediaでヒープスの法則の出展を調べてみると,どうやら1978年出版のHeaps著"Information Retrieval"[1]内で提案されたものら

    Heapsの法則によるコーパス中の語彙数予測と評価実験 - シリコンの谷のゾンビ
    sh19910711
    sh19910711 2024/04/09
    "情報検索が専門ですとかほざいている人間がHeaps本を読まないわけにはいかない / 自分が生まれる前に書かれた本に,現代の検索エンジンの基礎が書かれていると思うとゾクゾクした" 2012
  • 検索エンジンの歴史が一枚の絵でわかるインフォグラフィック » SEO Japan

    今回のインフォグラフィックはSEO Japanならでは、検索エンジンの歴史について1枚の絵にまとめてみました!こうしてみると、色々な検索エンジンが生まれては消えていったんですね。。。栄枯盛衰を感じる一枚となりました。 — SEO Japan 検索エンジンといえばGoogleが余りに圧倒的な存在になっている今日。多くの人にとって日々の情報ツールとして検索エンジンの無い生活なんて考えられない状態になっていると思いますが、Googleにしても10年ちょっと、検索エンジン自体の歴史も20年程度しかないのです。ここまで人々の生活に必須のツールに検索エンジンが成長する過程において、数々の検索エンジンが登場し、消え去っていきました。。。今回はそんな検索エンジンの歴史を一枚のインフォグラフィックにまとめてみました。Enjoy! (画像をクリックすると大き目のサイズの画像が表示されます) 主に英語圏の検索エ

    検索エンジンの歴史が一枚の絵でわかるインフォグラフィック » SEO Japan
  • 1