Googleが「Cloud Search Connector SDK」をオープンソース化、企業内のあらゆるデータを検索可能に:企業内データを「Google検索」 Googleは、「Cloud Search Connector」の作成を支援する「Cloud Search Connector SDK」と、同社が作成したリファレンスコネクタをオープンソース化して公開した。企業内のユーザーが、企業内のさまざまなデータをGoogle検索のように調べることができるようになる。
2014年4月21日は、第4回Elasticsearch勉強会ですね! http://elasticsearch.doorkeeper.jp/events/8865 第4回Elasticsearch勉強会は、参加希望者が約200名の大反響なようです。 私は勉強会に参加できないので、C言語で書かれた国産の高速な全文検索エンジンGroongaと、Javaで書かれた世界的に勢いのあるElasticsearchについて性能の比較をしたいと思います。 注意事項 今回の検証では1台あたりの馬力を比較するためにサーバ1台での全文検索性能について比較しています。 私は、Groonga(Mroonga)の利用暦が約2年であるのに対し、Elasticsearchの利用暦は2日です。このため、Elasticsearchに対するチューニングの不備や公平な比較になっていない点が含まれている可能性があります。 Ela
(募集はダミーデータです) (参考: ドキュメント登録の流れについては Elasticsearch 入門 を参照すると良いです。) Analyzer 上記のデータを実際に入れる前に、index の作成と analyzer の設定をします。 以下のコマンドを実行することで analyzer の設定ができます。 下記で説明して行きます。 curl -XPUT 'http://localhost:9200/wantedly-demo' -d \ '{ "settings": { "analysis": { "filter": { "pos_filter": { "type": "kuromoji_part_of_speech", "stoptags": [ "助詞-格助詞-一般", "助詞-終助詞" ] }, "greek_lowercase_filter": { "type": "lowerc
メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
「情報検索:検索エンジンの実装と評価」が届きました 2010-09-27-2 [Book] アメリカのアマゾンから会社の人々と共同購入した「Information Retrieval: Implementing and Evaluating Search Engines」(情報検索:検索エンジンの実装と評価)が届きました。 ■Stefan Buettcher, Charles L. A. Clarke, Gordon V. Cormack / Information Retrieval: Implementing and Evaluating Search Engines しばらく読む余裕がなさげなのですが、そのうちじわじわと。 ref. - [を] メモ「情報検索:検索エンジンの実装と評価」[2010-05-20-8]
I'm Japanese, but I write a commit message in English at FLOSS project. Because most programmers can't read Japanese. English is the working language of the hacker culture and the Internet, and that you will need to know it to function in the hacker community. Eric S. Raymond "How To Become A Hacker" However, I'm not good at English. Sometimes, I googled how to describe this commit in English. It'
The FCC has proposed a $6 million fine for the scammer who used voice-cloning tech to impersonate President Biden in a series of illegal robocalls during a New Hampshire primary…
acts_as_searchable は、 HyperEstraier を使って簡単に全文検索を行うことができる、 非常に便利なRailsプラグインです。 しかし、HyperEstraierが提供する類似検索機能を使うインターフェイスが 用意されていないようだったので、類似検索機能を付け足しました。 acts_as_searchable_with_similarity オリジナルの acts_as_searchable に対する差分はこちらにあります。 with_similarity.diff 使い方 まずは、オリジナルと同様に検索対象のモデルに acts_as_searchableを書き加えます。 必要に応じて適切なオプションを指定してください。 app/models/article.rb
汎用連想計算エンジン(GETA) は、大量のデータを高速に処理可能な高性能連想検索エンジンである。これを BSD 風のライセンスで自由に使わせてくれている国立情報学研究所は太っ腹なのだが、どうも私にはインストールが敷居が高いように感じられた。最近、最新版である GETA 第3版の作者である西岡真吾特任教授と知己を得たので、突撃インタービューを行い、インストール方法を教わるという幸せな体験をした。 GETA は現在 FreeBSD / Linux / Solaris 等 UNIX 風 OS で動作可能である。MacOSX は?というと今のところはうまくコンパイルできないらしい。私が Linux ユーザーなので、今回のエントリでは主に Linux にインストールする方法を中心に考えてみる。 私がインストールの成功を確認した環境は、"Linux CentOS 4(Linux 2.6.9)" と
連想検索エンジンreflexa(リフレクサ)はコトバとコトバのつながりを元に未知の情報を探索していくための連想検索エンジンです。連想検索ならではの楽しい検索体験をお楽しみ下さい。
有志によって世界規模で運営されているウェブサイトのディレクトリ。サイトの登録申請を出すと、エディタと呼ばれるスタッフがサイトをチェックしてから登録される仕組みのため質の良いリンク集という扱いになっており、dmozに登録されることはSEO上大切なことだと認識されている。Googleは今もディレクトリ検索にdmozのデータを使っている。「Open Directory Project」という名称から「ODP」と呼ばれることもある。 dmozで、エディターのフォーラムを閲覧しようとすると、サイト登録についてや、登録サービス機能がいつ復活するかなどを訊かないよう具体的な指示がある。dmoz 2.0、その不条理の世界にようこそ。 幸いなるかな、そのことは大した問題じゃない。dmozは長い間、とてつもなくリンクを置く価値のある場所だった。その理由を並べてみよう。 dmoz登録ページは検索エンジンの上位ラ
国立福島工業高等専門学校の電気工学科4年生である大澤昇平氏は2月6日、FireFox用のブックマーク共有プラグイン「swimmie」を利用した検索エンジン「netPlant」を正式公開した。 swimmieは大澤氏が1月23日に発表したFireFox用のブックマーク共有プラグインだ。これは、不特定多数のユーザーとブックマークを共有できるというもの。netPlantではswimmieのユーザーからブックマークのデータを収集し、検索インデックスとして利用する。netPlantのサービスはInternet ExplorerなどFireFox以外のウェブブラウザからも利用できる。 「ブックマークという、ユーザーの趣向を純粋に反映した物で、Googleのページランクでは実現されていない、ユーザー視点による検索結果が得られると考えている」(大澤氏) netPlantでは、任意のキーワードを入力して検索
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く