タグ

Libraryと検索に関するpmakinoのブックマーク (5)

  • Perl製全文検索ライブラリ「ぴょんぴょん」

    Perlだけで動く、「低機能」「割と高速」な全文検索ライブラリです。 転置インデックスを利用しているので、検索は高速です。 データの登録はローカルで行っておき、検索のみサーバー側で行う設計です。 検索速度・シンプルさ・サーバーを選ばない といった点は特筆すべき。 しかし、登録はサーバー上ではできません。 「Perlしか動かないサーバー上で、全文検索を高速にしたい」という目的のために、あらゆる犠牲を払っています。 また、登録時のメモリのい方が半端じゃないので、登録できるインデックスは使用可能メモリの数分の一になります。 ■おすすめな人 ・サーバー上で全文検索をしたい。しかも、量が数十メガとか数百メガあるので、マジメに検索すると遅くて困る! ・データの登録は滅多に無いので、ローカルでやってもそんなに面倒じゃない。(から我慢する!) ・Perlでプログラム作れる人(これはライブラリなので、単体

  • incsearch.js - インクリメンタルサーチライブラリ

    クライアントサイドで、JavaScriptによるインクリメンタルサーチを行うためのライブラリです。 (【お知らせ】ver2.0からprototype.jsを必要としなくなりました) 下記のような機能を持っています。 入力内容をもとに検索を行い、一致するデータを表示します。 単純なリスト表示と、テーブル形式での表示に対応しています。 Ajaxでは無く、初回画面表示時のみデータの読み込みを行い、それ以降は、クライアント側で対象データから検索します。したがって、入力内容に変化があってもサーバ側にアクセスすることはありません。 一致した文字を強調表示します。 複数キーワード(AND条件)での検索が行えます。 オプションで検索条件などを簡単に切り替えられます。 表示件数の上限を指定でき、ページ遷移にも対応しています。 ソース incsearch.js (ver2.2 : 2008/04/02) Gi

  • 辞書を使わずに同義語を解析する言語解析エンジン,Sematicsが発表

    Sematicsは6月15日,言語解析エンジンの最新版「Perceptron Engine」を発表した。語句の辞書データを使わずに解析するため高速という。同社の従来エンジン「Automaton Parser」で実現していた形態素解析と構文解析に加え,文脈解析と意味解析の機能を備えた。 同社の言語解析エンジンの特徴は,語句の辞書データを用いずに解析を行うこと。辞書が必要ないため,高速に処理できるほか,フット・プリントをコンパクトにできる。「(パソコンを使って)1センテンスを1000分の2秒で解析できる。500センテンスの解析は1秒で済む」(代表取締役の吹谷和雄氏)という。 同社が開発した第1号のエンジンであるAutomaton Parserは,統計的確率論によって,形態素解析と構文解析を実行するソフトである。語句を分割した最小単位である形態素ごとに分けて品詞を付与し,文節の係り受けを解析する

    辞書を使わずに同義語を解析する言語解析エンジン,Sematicsが発表
  • テキスト検索エンジンライブラリ - Apache Lucene 2.0 登場 | エンタープライズ | マイコミジャーナル

    The Apache Lucene Project, the Apache Lucene (Java)は27日(米国時間)、Apache Luceneの最新版であるApache Lucene 2.0を公開した。Apache LuceneはJavaで作成された高性能高機能なテキスト検索エンジンライブラリ。同プロジェクトは、Apache Luceneはテキスト検索を必要とするアプリケーション、とくにクロスプラットフォームで動作する必要がある場合には適切なテキスト検索エンジンライブラリだとしている。 Apache Lucene 2.0はApache License Version 2.0のもとで公開されているオープンソースソフトウェア。1.9.1からのバグフィックスが主な変更点である。ただし、1.x系において非推奨となっていた機能については2.0からは削除されているため注意されたい。 Apach

  • JavaScriptオンリーで動く高速サーチエンジン&タグクラウド:phpspot開発日誌

    Tipue JS Tipue JS is an Open Source JavaScript site search engine. It works with any browser that supports JavaScript and at least partially supports the W3C DOM Level 1. JavaScriptの高速サーチエンジン、Tipue JS。 JavaScriptのみで動作するのでサーバーサイドでの検索処理は不要。 但し、tip_data.js というファイルでデータを持っておき、ブラウザに読ませる必要があります。 現在の所、日語は通らないようですが、なかなか面白いプログラムですね。 図) Tipueによる検索結果画面 もう一つ。 同じサイトで配布されているCloud JSが面白いです。 Cloud JS Cloud JS use

  • 1