Luceneに関するFumblePersonのブックマーク (1)

  • Apache Lucene - Wikipedia

    Apache Lucene(アパッチ ルシーン)は、Doug Cuttingによって開発された、Java製のFLOSSの検索ライブラリである。Luceneは、強力な文書インデキシング及び検索機能、スペルチェック、ハイライト、テキスト解析機能を提供する。Apacheのトップレベルプロジェクトの1つである。 概要[編集] Luceneは、Apache Solr、Elasticsearch等の検索プラットフォームで利用される検索ライブラリである。以前はLucene.NET、Mahout、Tika、Nutchといったサブプロジェクトが存在したが、現在はすべて独立したApacheのトップレベルプロジェクトとなっている。2010年3月から、Apache SolrがLuceneのサブプロジェクトとして開発コミュニティがマージされた。 Luceneで日語のテキスト解析を利用するためには、Kuromoji

    FumblePerson
    FumblePerson 2014/08/21
    “1000万ドキュメントくらいの規模まで1台のマシンで対応できる。それ以上を複数のマシンで分散検索できるようにするHadoopというサブプロジェクトがある。”
  • 1