タグ

searchと全文検索に関するkiyo_hikoのブックマーク (1)

  • pure perlで文書検索のアルゴリズムを考える - OKWAVE

    (モジュールは別として)pure perl で文書検索のアルゴリズムを考えています。 このアルゴリズムが頭良いか、悪いかのツッコミをお願いします。 1.前提 mecabを使用 2.文書を書き込むとき mecabで全文書を解析して、単語ごとにデータベースに入力する。 キー:単語 中身:そのページ名がたくさんはいったもの 3.文書を削除するとき mecabで全文書を解析して、単語ごとにデータベースに入力されたものを削除する 4.文書が変更になったとき 3→2を行なう 5.検索するとき 検索キーワードをmecabで解析する 分割されたワードごとに、結果を表示する。 たとえば・・・ 1.txt が 愛 植尾 かきくけこ 会社 であれば 愛 植尾 カキクケコ 会社 に、1.txtが登録される 2.txt が 哀 植 尾 かきくけこ 会社 であれば 哀 植 尾 カキクケコ 会社 に、2.txtが登録さ

    pure perlで文書検索のアルゴリズムを考える - OKWAVE
  • 1