並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 140件

新着順 人気順

sennaの検索結果1 - 40 件 / 140件

  • Senna 組み込み型全文検索エンジン - Senna 組み込み型全文検索エンジン

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

    • Tritonnプロジェクト MySQL Sennaによる全文検索 〜

      This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

      • MySQL/PostgreSQL+Sennaで行うラクラク全文検索……Tritonn&Ludia導入のポイント | gihyo.jp

        Tritonn、Ludia、そしてSennaとは…… 昨今のWeb 2.0と呼ばれるようなWebシステムでは、一般的に大量のコンテンツデータを内部に保有しているのではないでしょうか。大量のコンテンツから目的のコンテンツをユーザが選び取る手段の一つとして全文検索が挙げられます。全文検索とは、検索対象コンテンツの中身すべてに対して検索を行うことを指します。たとえば、タグやタイトルを対象にした検索だけでは、目的のコンテンツを発見できないような場合に有効な検索です。 データベースに保持された大量のデータを簡単に全文検索したい、という場合も多いことでしょう。本稿では、それを実現にする全文検索システムとして、次の2つを取り上げて紹介します。 Tritonn Ludia これらはそれぞれ、Tritonnは「MySQL⁠」⁠、Ludiaは「PostgreSQL」という、Webシステムを開発する上で人気の高

          MySQL/PostgreSQL+Sennaで行うラクラク全文検索……Tritonn&Ludia導入のポイント | gihyo.jp
        • Sound of Honda - Ayrton Senna 1989 -

          アイルトン・セナが残した走行データから、24年前のエンジン音が甦る。 ■メイキングムービー http://youtu.be/RVeSYyYzjhY ■「dots lab by internavi」 http://www.honda.co.jp/internavi-dots/dots-lab/senna1989/

          • Tritonn(MySQL+Senna)+Mecab+Apahce+PHP5.2(with APC & imagick)をCentOS5にインストールする : akiyan.com

            Tritonn(MySQL+Senna)+Mecab+Apahce+PHP5.2(with APC & imagick)をCentOS5にインストールする 2008-09-12 バージョン等の最終更新:2009-10-24 PHPからTritonn(MySQL+Senna)を使うためのセットアップに若干ハマったので、メモ的にエントリー。 Tritonn(MySQL+Senna)だけでPHPからMySQLに接続するときは、Tritonnをソースからインストールしなくてはなりません。というのも、Tritonnプロジェクトではコンパイル済みのrpmをリリースしていますが、このrpmにはmysql-devel的なライブラリが同梱されていません。Tritonnだけをrpmからインストールした場合、PHPの./configure時にlibmysqlclient.soが見つからず、PHPのインストールを

            • Tritonnとは - Tritonnプロジェクト ~ MySQL+Sennaによる全文検索 ~

              This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

              • 末永匡――Sennaとニコニコ大百科を作る偽プログラマ - @IT自分戦略研究所

                エンジニアにとって仲間とはどういう存在なのだろうか。極端なことをいえば、自分1人で作業が完結できてしまうエンジニアにとって、仲間とのコミュニケーションにはどんな意味があるのか。エンジニア同士のネットワークを通じて、エンジニアにとっての仲間とは何かを探る。 第7回|1 2|次のページ コミュニティで活躍するエンジニアたちの輪。8人目は、前回の溝口浩二氏(参考:溝口浩二――コードを愛する「動画中継職人」)から紹介された、未来検索ブラジルの末永匡(たすく)氏だ。 「グニャラくん」の相性で親しまれている末永氏。「ニコニコ動画版Wikipedia」「ニコニコ大百科」の開発者としての顔が最も有名だろう。 オープンソースの全文検索エンジン「Senna」(セナ)の開発に携わる末永氏。彼にとって、コミュニティとはどんな存在なのだろうか。 ■オープンソース活動が生んだ転職 末永氏が開発を担当するニコニコ大百科

                • YappoLogs: Senna+MySQLをより超高速にするパッチ

                  Senna+MySQLをより超高速にするパッチ 当者比50~100倍程のスピードアップ(クエリ/テーブル構造による)のパッチです。 MySQL(特にFullText boolean mode)のlimitの実装はある意味効率の悪い実装になっている。 例えば、limit 100000,100といったクエリを投げると100100行分のデータをディスクから読み込むのである。 まぁ、whereなどの条件に一致する100000件のレコードを先に確定させなければいけない訳で当然といえば当然である。 order byとか使ってたらなおさら。 無論SQL_CALC_FOUND_ROWSなんか使ってると全件確定させなきゃいけないから大変。 当然これらはindexを使用していない時の挙動だと思う。 indexのみが使われたクエリの挙動は未確認だけど。 さて、ここから本題。 では、Senna+MySQLの挙動は

                  • Ruby on Rails Tritonnによるらくらく全文検索 KWIC表示のチュートリアル - Tritonnプロジェクト 〜 MySQL Sennaによる全文検索 〜

                    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

                    • Kazuho@Cybozu Labs: Tritonn (MySQL+Senna) の join を高速化

                      « setlock を使って cron をぶんまわす方法 | メイン | Range Coder の終了処理 » 2008年02月05日 Tritonn (MySQL+Senna) の join を高速化 自分の利用形態において、Tritonn の処理を最適化するパッチを書きました。具体的には、2種類の最適化を行いました。ひょっとするとバグがあるかもしれませんが、興味がある方は、以下のパッチ (tritonn-1.0.9用) とあわせてごらんください。 1. 全文索引内にプライマリキーを格納 SQL クエリを最適化する際、アクセスしたい全カラムを格納したインデックスを作成することで行データへのアクセスを抑止して速度を稼ぐ、というのは定石のひとつです。しかし、MySQL の全文索引 (フルテキストインデックス) では、他のカラムと組み合わせた複合キーを作成することができません。このことが、T

                      • Senna 組み込み型全文検索エンジン - Senna: An Embeddable Fulltext Search Engine

                        This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

                        • 組み込み型全文検索エンジン Senna : NDO::Weblog

                          naoya.dyndns.org is currently offline. Please try again later. Questions about our services? Learn more at Dyn.com.

                          • CentOSにMeCab+Senna+MySQLを入れる

                            日本語で全文検索をするために MySQL に Senna を組み込むメモ。少し前は個人ニュースサイトめぐり→日記書きに数時間を要していた私が次に目をつけたのがRSSめぐり→はてブ登録なのだがそれでも依然として数時間かかる。そんなあなた (私) に朗報です。私の代わりにブックマークしてくれるエージェントを作ればいいのです。そしてそのエージェントが今日よく使われていた単語やタグとか出してくれて、1次ソースAについてBさんとCさんとDさんがそれぞれの立場でこんなことを書いているとかいうのが俯瞰できて、さらにあとから検索とかができればいいのです。いまホッテントリを見なくてもいいのです。あとで検索できればいいのです。Googleが拾ってくる量は莫大過ぎるし個人で把握できる範囲にも限度がある。ユーザの皆さんが勝手に重み付けしてくれるならそれを使ったらいい。先週の週刊東洋経済を読んで悟った。いやなんか変

                            • ツッコめ!全文検索エンジンSennaの新しいAPIについての素案。 - グニャラくんのグニャグニャ備忘録@はてな

                              みんな、[Senna-dev 884]のメールは読んだかな!? 全文検索エンジンSennaの新しいAPIについての素案がついに公開されました。 今までのAPIのほとんどを刷新するという 大改造!劇的ビフォーアフター的API群です(APIの匠)。 んで、この新しいAPI群で何ができるようになるのでしょうか。 簡単に言うと、 「Sennaは、データベースになります!」 といいつつも、全文検索機能を充実させるために、 データベース的機能を強化した、という感じになっておりますぞ。 データベース機能 新しいSennaでは、複数のテーブルというものを持つことができます。 テーブルは、複数のレコードを持つことができます。 レコードは、複数のカラムを持つことができます。 カラムは、ある型のデータを保持します。 一般的なRDBMSの2次元表をまずはイメージしてください。 ポイント1. レコードごとにカラムが

                                ツッコめ!全文検索エンジンSennaの新しいAPIについての素案。 - グニャラくんのグニャグニャ備忘録@はてな
                              • MySQL or PostgreSQL + Sennaのオススメ構成 - グニャラくんのグニャグニャ備忘録@はてな

                                Sennaの主な利用用途であると考えられる、 データベース組み込み用途。 ブラジル内部でもSennaを用いたサービスを運用していますが、 その運用ノウハウの一部をメモ。 Sennaはメモリ食い Sennaはインデックスをメモリにマップすることによって 高速な追加・更新・削除を実現しています。 よって、メモリ使用量が多くなっています。 INITIAL_N_SEGMENTSを減らすことによって、 メモリ使用量を下げることができますが、 特に追加・更新においてパフォーマンスが低下します。 また、Linuxの場合、 空きメモリはI/Oキャッシュに割り当てられます。 Sennaのメモリ使用量が多いため、 I/Oキャッシュとして用いられるメモリ容量が減り、 結果としてシステム全体のパフォーマンスが落ちる場合があります。 MySQLのkey_buffer_sizeは、 Sennaと他のインデックスを組み

                                  MySQL or PostgreSQL + Sennaのオススメ構成 - グニャラくんのグニャグニャ備忘録@はてな
                                • Senna 組み込み型全文検索エンジン - Senna2.0がやってくる!

                                  This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

                                  • MySQLを通じた全文検索エンジンSenna/groongaの利用について

                                    ドワンゴ技術勉強会で発表した際の資料です。 詳細は、ドワンゴ研究開発ブログ( http://info.dwango.co.jp/rd/ )を参照ください。Read less

                                      MySQLを通じた全文検索エンジンSenna/groongaの利用について
                                    • Senna.js

                                      FeaturesSenna.js is a blazing-fast single page application engine that provides several low-level APIs that allows you to build modern web-based applications with only ~8KB of JavaScript without any dependency. Bookmarkability & SEOWhen using a single page app, sending a link to a friend should get them where we were. More than that, a search engine spider should be able to index that same content

                                        Senna.js
                                      • 多目的かつ高速軽量な自然言語処理ツールSENNA - 自然言語処理 on Mac

                                        昨年米国で開催されたTAC 2011 RTE-7では、NECのシステムが第一位を獲得したそうです: NECのテキスト含意認識技術がNIST主催の評価タスクで第一位を獲得(2012年4月13日): プレスリリース | NEC IKOMA at TAC2011: A Method for Recognizing Textual Entailment using Lexical-level and Sentence Structure-level features このシステムのテキスト解析にはSENNA (Semantic/syntactic Extraction using a Neural Network Architecture) というツールが利用されています。SENNAは、多層ニューラルネットに基づいて、品詞タグ付け、チャンキング、固有名抽出、意味役割ラベリング、構文解析といった様々

                                          多目的かつ高速軽量な自然言語処理ツールSENNA - 自然言語処理 on Mac
                                        • Senna - Wikipedia

                                          Senna(せな、Senna: An Embeddable Fulltext Search Engine)は、未来検索ブラジルによって開発されているオープンソースの全文検索エンジンである。検索速度が高速なことから、「音速の貴公子」と呼ばれたアイルトン・セナにちなんで名づけられた。 概要[編集] MeCabによる形態素解析の結果を用いた単語ベースのインデックスと、N-gramによるトークン抽出を用いたインデックスの両方を作成することができる。 ライセンスはLGPL。UNIX系OS及びWindowsで動作する。 バグフィックスを除いた新たな開発は事実上終了しており、開発元の未来検索ブラジルでは、後継となる検索エンジンとして『groonga』(ぐるんが)の開発を進めている。 特徴[編集] 高速なインデックスの更新 一般的に、作成済みの全文検索インデックスに対する新たなレコードの追加は負荷がかかる

                                          • YappoLogs: Tagの検索をSenna+MySQLで

                                            Tagの検索をSenna+MySQLで kazeburoさんの所でfulltext使ってtagを実装するネタがアツめなのでちょろっと書いてみる。 SennaのMySQL 2indパッチを使うと、既存のindexとSennaのindex両方を同時に使うことが出来ます。 それが出来ると何が良いと言うと、user idで絞り込みつつtag検索が可能になります。 create table ft_tags( id int unsigned not null auto_increment primary key, user_id int unsigned not null, tags text, index user_id(user_id), fulltext tags(tags) )というテーブルを用意しておき。 user idが2の人のタグ検索をするときにselect id from ft_tag

                                            • 全文検索エンジンSenna 1.0.0 リリース | スラド デベロッパー

                                              全文検索エンジンSennaのバージョン1.0.0がリリースされた。 Sennaは、2ちゃんねる検索での利用を目的として、未来検索ブラジルによって開発された検索エンジンである。2004年から開発が始まったようで、ようやくの正式版リリースである。以下のような特徴を持つ。 MySQLやPostgreSQL組み込みでの全文検索 検索漏れを抑えた、独自形式の単語単位でのインデックス N-gram方式のインデックスも選択可能 インクリメンタルな文書の追加・変更・削除が高速 Hyper EstraierやLuceneなど、他のオープンソース検索エンジンとの競争が楽しみだ。

                                              • Senna 2.0の展望と、Tritonnで問題が発生している人向け情報 - グニャラくんのグニャグニャ備忘録@はてな

                                                Senna 2.0βのリリースが見えてきました。 去年の夏に出すと言っていましたが、紆余曲折あっての現状です。 ライバルのTokyo Cabinet/Tokyo Dystopiaについては、 ストレージと全文検索インデックスを分割する方向性です。 mixi engineer blog 今までのSennaはTokyo Dystopiaに近いものでしたが、 Senna 2.0では逆にHyper Estraierのほうに近づく感じになっています。 それぞれ特色が出て面白いですねー。 今回は転置インデックス部分にもかなり手が入っているので、 Senna/Lucene/Tokyo Dystopiaのパフォーマンス比較もやってみたいと思います。 (とはいえ、パフォーマンス比較はそれぞれのライブラリに精通しないと意味のある情報が出せないので、大変ではありますね…) Senna 2.0 + MySQL 5

                                                  Senna 2.0の展望と、Tritonnで問題が発生している人向け情報 - グニャラくんのグニャグニャ備忘録@はてな
                                                • 【メイキング】Sound of Honda - Ayrton Senna 1989 -

                                                  プロジェクトの実現に関わった人々の証言を通じて、"Sound of Honda - Ayrton Senna 1989-"の全貌を紹介。 ■Sound of Honda - Ayrton Senna 1989 - http://youtu.be/oeO2q8FzcnM ■「dots lab by internavi」 http://www.honda.co.jp/internavi-dots/dots-lab/senna1989/

                                                  • Tritonnプロジェクト 〜 MySQL+Sennaによる全文検索 〜 - Tritonnプロジェクト

                                                    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

                                                    • Sennaのマルチセクション機能に対応 - mir the developer

                                                      Sennaのマルチセクション機能に対応しました! 次回のTritonnリリース(ver1.0.3)から利用可能になる予定です! Tritonn 1.0.3は来月あたりにリリースする予定です。 マルチセクション機能とは? マルチセクション機能とはテーブルに全文検索対象のカラムが複数あるような場合に、非常に便利使える機能です。 以下のようなテーブルがあって、c2/c3/c4の3つのカラムで全文検索をしたい、という場合を想定します。 CREATE TABLE t1 (c1 INT PRIMARY KEY, c2 TEXT, c3 TEXT, c4 TEXT) DEFAULT CHARSET utf8;このとき、これまでは以下のように複合キーとしてFULLTEXTインデックスを作成することで、1度のMATCH検索でc2/c3/c4の何れかにキーワードを含むレコードを探すことができましたが、、、問題

                                                        Sennaのマルチセクション機能に対応 - mir the developer
                                                      • SENNA

                                                        SENNA is a software distributed under a non-commercial license, which outputs a host of Natural Language Processing (NLP) predictions: part-of-speech (POS) tags, chunking (CHK), name entity recognition (NER) and semantic role labeling (SRL). SENNA is fast because it uses a simple architecture, self-contained because it does not rely on the output of existing NLP system, and accurate because it off

                                                        • textsearch_senna

                                                          N-gram を使用した、組み込み型の日本語全文検索です。 ダウンロード : ソースコードのほか、Windows 用バイナリもダウンロードできます。 バグレポート メーリングリスト への参加 概要 インストール テキスト検索機能 %% 演算子 @@ 演算子 インデックス (senna) インデックス・オプション (WITH) インデックスのメンテナンス senna.drop_index() senna.reindex_index() 不要ファイルの調査 TODO 概要 日本語テキストの全文検索を行います。 形態素解析ベースである textsearch-ja とは異なり、textsearch_senna では N-gram ベースの全文検索を行います。 検索には、全文検索エンジン Senna を使用しています。 利点として、文字すべてをインデックス化するため LIKE 中間一致検索に近い結果

                                                          • たけまる / Senna - 2ind 機能の奇妙なノウハウ

                                                            _ Senna - 2ind 機能の奇妙なノウハウ [senna] MoSQL [2007-07-04-1] をインストールしてから,全文検索エンジンの Senna を使っています. 2ind 機能とは, MySQLではクエリを実行する際、1つのテーブルに対してFULLTEXTインデッ クスと他のインデックスを組み合わせて利用(インデックスマージ)する ための機能です.2種類のインデックスを利用するので,"2ind(ex)" とい うようです.たとえば,全文検索結果を日時でソートするときなどに使え て便利です. ところが,まだβ版ということで,奇妙な振る舞いをすることがあります. それを解決するためのノウハウを紹介します. 以下,Senna のインデックスを FULLTEXT インデックス,他のインデック スを Normal インデックスと呼びます. 目次 - テストした環境 - 2ind

                                                            • 未来検索ブラジル、全文検索エンジン「Senna」をメジャーリリース

                                                              Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

                                                              • やすみやすみ 技術編: Tritonn (MySQL with Senna, MeCab) を CentOS 5.2 にインストール

                                                                Tritonn (MySQL with Senna, MeCab) を CentOS 5.2 にインストール 久々に技術的な話。 自宅サーバ(CentOS 5.2 / i386)の MySQL を Tritonn (MySQL + Senna + Mecab) に差し替えた。 そのときのメモ。 (Tritonn を rpm でインストールした人の記録って検索してもあまり出てこないね。) http://qwik.jp/tritonn/installrpm.html 公式のTritonnインストール方法を参考にして次の6ファイルをダウンロード。 MySQL-client-5.0.45-tritonn.1.0.7.i386.rpm MySQL-server-5.0.45-tritonn.1.0.7.i386.rpm MySQL-shared-5.0.45-tritonn.1.0.7.i386.r

                                                                  やすみやすみ 技術編: Tritonn (MySQL with Senna, MeCab) を CentOS 5.2 にインストール
                                                                • Ludia (PostgreSQL + Senna) で全文検索

                                                                  PostgreSQL: CREATE TABLE ludia_test ( id serial primary key, name text, contents text ); CREATE INDEX fulltext_contents_index ON ludia_test USING fulltext(contents); MySQL: CREATE TABLE ludia_test ( id integer not null auto_increment primary key, name text, contents longtext ); CREATE FULLTEXT INDEX fulltext_contents_index ON ludia_test(contents); MySQLでは、text型ではおさまりきらない作品もあったので、contentsをlongtext型

                                                                    Ludia (PostgreSQL + Senna) で全文検索
                                                                  • Sennaではてなキーワード自動リンクを実装する - グニャラくんのグニャグニャ備忘録@はてな

                                                                    [注意]このエントリはPHPとMecabでキーワード自動リンクを実装するのパクリです。 こんにちは、末永です。 今年もどうぞよろしくお願い致します。 Webサービスを開発していると、特定のキーワードを自動でURLリンクにする処理が必要になることがあると思います。今回は、このキーワード自動リンク機能を全文検索エンジンSennaを使って実装する方法を紹介したいと思います。 1. Sennaインストール MeCabのインストールは必要ないので、こんな感じでインストールしてください。 $ ./configure --prefix=/usr --without-mecab $ make $ sudo make install 2. 辞書を作る テキストファイルに、改行区切りでキーワードを記述したファイルkeyword.txtを作成します。 ただし、文字コードはEUC限定ですぞ。 Wikipediaの

                                                                      Sennaではてなキーワード自動リンクを実装する - グニャラくんのグニャグニャ備忘録@はてな
                                                                    • SennaによるN-gramインデックスで注意すべき挙動 - グニャラくんのグニャグニャ備忘録@はてな

                                                                      追記:以下の文書について 現在リリースされているSenna 1.0.7では、 N-gramで1文字の日本語を検索する場合は 直接部分一致検索を動作させるようにしました。 というわけで、以下で説明している挙動は今現在当てはまりません。 1文字の単語について uchiuchiyamaさんのブログにあった、Sennaのクエリ書式に対する質問 http://d.hatena.ne.jp/uchiuchiyama/20070317/senna_query_problem この問題ですが、 おそらくN-gramでインデックスを作成している場合に起こっていると考えられます。 SennaのN-gramインデックスはbi-gram、 すなわち2文字を1つのトークンとみなし、 インデックスへの登録を行っています。 ということは、文書の末尾を除いて、 すべてのトークンは2文字となり、 1文字のトークンで検索をし

                                                                        SennaによるN-gramインデックスで注意すべき挙動 - グニャラくんのグニャグニャ備忘録@はてな
                                                                      • Sennaのインストール : blog.nomadscafe.jp

                                                                        Sennaのインストール Rastにつづいて、Sennaを試してみる。 Sennaは、組み込み型の全文検索エンジンで、データベースなどと一緒に使えて、しかもN-gramインデックスを備えてます。インストールは開発者やPatchの作成者のおかげで思ったより楽でした。 OSは今回はCentOS4.0。何も使ってないマシンにいれました。 MySQLが動いているマシンだとさすがに怖い。 MecabにPatchをあててインストール # wget http://dev.razil.jp/archive/mecab-0.81.mte.patch.20050423 # tar zxf mecab-0.81.tar.gz # cp ipadic-2.5.1.tar.gz mecab-0.81/dic/ # cd mecab-0.81/dic/ # tar zxf ipadic-2.5.1.tar.gz #

                                                                        • LuceneとSennaの比較:スコア計算 | 関口宏司のLuceneブログ

                                                                          一定期間更新がないため広告を表示しています

                                                                          • Sennaによる部分一致検索の挙動について - グニャラくんのグニャグニャ備忘録@はてな

                                                                            Sennaの部分一致検索時の挙動について、 ACM SIGMOD日本支部大会で質問が出ました。 傀儡師の館 - 組み込み型全文検索エンジン Senna を使ってみる http://plaza.rakuten.co.jp/kugutsushi/diary/200611120002/ のエントリでも、部分一致検索の挙動についてツッコミが入っています。 というわけで、Sennaの部分一致検索の挙動について説明。 デフォルトでは、以下のような検索処理が行われます。 クエリを形態素解析する (A) それぞれの形態素が、指定された順番で出現する文書を検索 1件でもヒットすれば、終了 (B) クエリを形態素解析せずに1つの語として扱い、その語が出現する文書を検索 1件でもヒットすれば、終了 クエリを形態素解析する。 複数の形態素が取り出された場合… 最初の形態素と後方一致する登録語のリストを作る。リスト

                                                                              Sennaによる部分一致検索の挙動について - グニャラくんのグニャグニャ備忘録@はてな
                                                                            • 全文検索エンジンSennaの設計と実装

                                                                              This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

                                                                              • MySQL + Sennaで日本語全文検索をやってみた - サラリーマンから起業するリアル

                                                                                以前の記事(MySQLで全文検索できるって!?)で、id:tomyheroさんからMySQLの日本語全文検索は無理だからSennaで出来るよと教えてもらったので、やってみた。 基本的に構築系の作業は、自分の作業ログをメモ帳に記入しているんだけど、まとめるのが面倒でブログにそれを投稿してこなかったけど、これからは少しずつ溜まっているメモ書きをブログにアップしよう。 Sennaは日本語の字句解析のmecabを使って単語に分けて登録し、それを元に全文検索を行う。MySQLにsennaを組み込み、MySQLの関数をラッピングするのにtritonというものを使う。これはMySQLにパッチを当てたものです。 今回は、自分のホームディレクトリにsenna、mecab、mecab辞書、tritonをインストールしてみました。MySQLは元々動いているものがあったので、別ポートで動くようにインストールしてま

                                                                                  MySQL + Sennaで日本語全文検索をやってみた - サラリーマンから起業するリアル
                                                                                • YappoLogs: Senna 1.0.0がリリースされたよ!

                                                                                  Senna 1.0.0がリリースされたよ! 遂にSennaの1.0.0が出ましたよ! プレスリリースによると ●メジャーバージョン(1.0.0)リリースについて Senna1.0.0では転置インデックスの格納形式を改善し、更新/検索速度を損ねる ことなくサイズを最大で従来比70%程度まで圧縮することに成功しました。この ため、従来よりも大規模な文書を1台のサーバで管理することが可能となりました。 という事なので早速wktkしながらinstallしました。 色々考えるのがめんどくさかったので、動いてる環境にsennaとmysqlを順番にmake installしてmysql restartです。 早速indexを作り直してみると。。。。 -rw-rw---- 1 mysql mysql 1.0K 21:05 SEARCH_DATA.MYI -rw-rw---- 1 mysql mysql 2