You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの本文抽出がひとつの鍵になっています。今回はその本文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 本モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。本モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont
URL: http://www.cozmixng.org/~rwiki/?cmd=view;name=RSS Parser 最終更新日時: Fri, 28 Dec 2007 13:42:26 JST (282d) リンク: [kou (124d)] [RSS Parser::README.en (282d)] [RSS Parser::README.ja (282d)] [RSS Parser::Reference.ja (307d)] [RSS Parser::Reference.en (307d)] [RSS Parser::Tutorial.en (1y(385d))] [RSS Parser::Tutorial.ja (1y(385d))] [RSS Parser::ToDo.ja (1y(567d))] [連絡先 (2y(877d))] [... (もっと表示)]
RubyForge is a home for open source Ruby projects; thanks to the folks who make it possible! Searchgasm 1.2.1 Ben Johnson - 2008-09-29 13:41 - Searchgasm Searchgasm has been updated to 1.2.1. Searchgasm is object based ActiveRecord searching, ordering, pagination, and more! More information is available at http://github.com/binarylogic/searchgasm . Searchgasm 0.9.6 Ben Johnson - 2008-09-04
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く