タグ

全文検索に関するkhiramatsuのブックマーク (3)

  • NTTデータの全文検索エンジン Ludia を調べてみる - 傀儡師の館.Python:楽天ブログ

    2006.10.14 NTTデータの全文検索エンジン Ludia を調べてみる カテゴリ:ことばの処理 全文検索エンジン「Ludia (TM)」の公開を開始 ~PostgreSQLに全文検索機能を提供~ 二種類の主要な全文検索インデックス方式(N-gram、形態素解析)を共にサポート 複数の検索方法(ブーリアン検索、近傍位置検索、類似文書検索)に対応 検索した結果が、どの程度期待している結果であるかを示す、「スコア」の取得 という特徴があるようだ。NTTデータのLudiaのページを見てみると、他にも簡単な図画ある。形態素解析器としては mecab を、全文検索のインデックス作成には senna を使っていてって、んーなるほど、肝心なところはオープンソースですでに公開されているものを使って PostgreSQL に統合するところに専念しているということか。ダウンロードファイルを見ると、MeC

  • ウェブリブログ:サービスは終了しました。

    「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧

    ウェブリブログ:サービスは終了しました。
  • [ThinkIT] 第1回:蓄積したデータを徹底活用〜全文検索 (1/3)

    現在では、商品の詳細な解説や購買者からの感想、顧客からのクレームや問い合わせ内容とその回答など、様々な情報が企業のデータベースに蓄積されています。ショッピングサイトの訪問者やコールセンターのオペレータは、これらの膨大なテキストデータから迅速に求めるデータを抽出したいと望んでいます。そして、この際に必要となるのが連載でとりあげる全文検索です。 連載では、全文検索を実現するソフトウェアのなかでもオープンソースである「Ludia」に焦点をあてて、全文検索の技術そのものからその導入ポイントまでを解説していきます。なおLudiaは、オープンソースRDBMSとして著名なPostgreSQLに対して高度な日語全文検索を実現するため、NTTデータが開発し、オープンソースとして公開しています。 ほとんどのインターネット利用者にとって、「検索」は日々利用する当たり前のサービスとなっています。ここで用いら

  • 1