2006.10.14 NTTデータの全文検索エンジン Ludia を調べてみる カテゴリ:ことばの処理 全文検索エンジン「Ludia (TM)」の公開を開始 ~PostgreSQLに全文検索機能を提供~ 二種類の主要な全文検索インデックス方式(N-gram、形態素解析)を共にサポート 複数の検索方法(ブーリアン検索、近傍位置検索、類似文書検索)に対応 検索した結果が、どの程度期待している結果であるかを示す、「スコア」の取得 という特徴があるようだ。NTTデータのLudiaのページを見てみると、他にも簡単な図画ある。形態素解析器としては mecab を、全文検索のインデックス作成には senna を使っていてって、んーなるほど、肝心なところはオープンソースですでに公開されているものを使って PostgreSQL に統合するところに専念しているということか。ダウンロードファイルを見ると、MeC