「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
NTTデータは2006年10月11日、同社が開発した全文検索エンジン「Ludia」(ルディア)をオープンソースソフトウェアとして公開した。オープンソースDBMS「PostgreSQL」に全文検索機能を追加する。ライセンスはGNU Lesser General Public License(LGPL)を採用した。 Ludiaは、PostgreSQLデータベース内に、テーブル内テキストデータに対する全文検索インデックスを作成することで、商用のデータベース管理ソフトに匹敵する高速・高精度な全文検索機能を可能にする。また、SQLと親和性が高く、扱いやすいインタフェースも特徴。 インデックス作成にはオープンソース全文検索エンジン「Senna」を利用。「N-gram」と「形態素解析」のインデックス主要2方式に対応する。また、検索方法も「ブーリアン検索」「近傍位置検索」「類似文書検索」の複数の検索に対応
Ludiaは高速かつ高精度な全文検索インデックス機能をオープンソースのデータベース管理システムであるPostgreSQLに提供します。Ludiaは株式会社NTTデータにより開発され、2006年10月11日にLGPLライセンスのオープンソースソフトウェアとして公開されました。 ダウンロード 最新リリース ludia 1.5.2 (日付: 2009-03-27) ludia-withdeps 1.5.1 (日付: 2008-08-07) ludia 1.5.1 (日付: 2008-08-07) ludia-withdeps 1.5.0 (日付: 2008-03-25) ludia 1.5.0 (日付: 2008-03-25)
sillywalk曰く、"ITProの記事によれば、NTTデータは10月11日、同社が開発した全文検索エンジン「Ludia」をLGPLにより無償公開したと発表しました。PostgreSQLに格納されたテキストデータの全文検索が可能で、「オープンソースソフトウエアでは日本語の全文検索に対応した高速・高精度なものが存在せず、データベースからデータを取り出し別のシステムを構築する必要があった。Ludiaは商用のデータベース管理ソフトに匹敵する速度と精度を備える」(NTTデータ)としています。Ludiaは、N-gramと形態素解析の2種類の全文検索インデックス方式をサポートし、またブーリアン検索、近傍位置検索、類似文書検索といった検索が可能で、検索結果の合致度を示す「スコア」も提供するそうです。" バックエンドには組み込み用全文検索エンジンsennaを使っている様である。
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTデータは10月11日、オープンソースのデータベース管理システム(DBMS)「PostgreSQL」向けの全文検索エンジン「Ludia」(ルディア)を開発したことを発表した。 Ludiaは、PostgreSQLのテーブル内のテキストデータに対する全文検索インデックスを、PostgreSQLデータベース内に作成し、商用のデータベース管理ソフトに匹敵する高速かつ高精度な全文検索機能を、シンプルなインターフェースで提供するという。 Ludiaはオープンソースソフトウエア(OSS)として同日から公開されており、OSSのライセンスであるGNU Lesser General Public License(LGPL)の定める条件に従って利用できる
全文検索エンジン性能評価 (2006/08/19) 概要 弊社が開発致しました圧縮インデックス方式全文検索エンジン「Sedue」(Sedue 24やGenome Sedueで利用されているエンジンSedue コア)とオープンソースな全文検索エンジン(HyperEstraier, Lucene, Senna)との性能比較を行いました。検索サーバーにはマシン1台のみを使用しました。 更新履歴 2006/09/13 インデクシングの作成方法に関して分かりにくい表現を訂正 使用環境 ベンチマークを取るに際しまして以下のようなスペックのマシンを使用致しました。 CPU: AMD Athlon(tm) 64 Processor 3000+ Memory: 2GB OS: Linux pfidev1 2.6.16-1.2111_FC4 #1 Sat May 20 20:00:28 EDT 2006 x8
This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.
sennaのsen_symクラスは、common prefix searchが可能です。この機能を使って(今更なのですが)Dartsと同じ手法ではてなキーワードを高速に付与するプログラムを作ってみました。 hatenapo.c 以下のような特徴があります。 任意のタイミングで付与対象のキーワードをインデックスに追加/削除できる インデックスの作成/更新が高速 キーワード付与が高速 http://d.hatena.ne.jp/images/keyword/keywordlistの内容でインデックスを生成し、 350KB程度の日本語テキスト(EUC)にキーワードを付与した場合の処理速度を比較してみました。 Dartsを使ったインデックス作成 % time ./mkdarts keywordlist.sort keywordlist.da 2.010u 0.060s 0:02.74 75.5%
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く