タグ

RubyとHTMLに関するt_43zのブックマーク (3)

  • それrubyなら2行で出来るよ! - 狐の王国

    HTMLのタグを除去するのは出来るんだけど、その後、それぞれの要素を整理して、あらためてHTMLのテンプレートに流し込むのができない><という記事。 せっかくRubyを使ってるんだからHpricotとERBを使いましょう。簡単に出来ます。 #!/usr/bin/ruby require 'rubygems' require 'hpricot' require 'erb' require 'kconv' table = Hpricot(STDIN.read.toutf8).search('.section table tbody tr') puts ERB.new(DATA.read).result(binding) __END__ <dl> <% table.each do |tr| %> <dt><%= (tr/'td[2] a').inner_html %></dt> <dd><%=

    それrubyなら2行で出来るよ! - 狐の王国
  • RubyのHpricotも便利さでは負けていないの巻 (CodeZine編集部ブログ)

    iioka@見習いスクレイパー です。 うちの編集部の久次が書いたエントリーが CodeZine編集部ブログ史上、最大のはてなブックマークを集めたのですよ。 ・Web::Scraperが便利すぎて困るの巻 Perlのモジュールを使って、スクレイピング(Webサイトから任意の情報を抜き出す)やり方です。 しかし、Rubyにも「Hpricot」という同じようなモジュールがあり、便利さでは負けていません。 ということで、カッとなって組んでみました。 参考: ・[ruby] RubyHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize - Greenbear Diary (2007-02-05) require 'hpricot' require 'open-uri' require 'kconv' # CodeZineからみだしを取り出す doc = Hpr

  • MapDN レビュー MOONGIFT

    特集「オープンソース×10年」 予算ゼロからのIT環境整備2014/01/30 特別寄稿:センチメンタル・ジャーニー ~OSSはまだ16だから~2014/01/30 EC-CUBE – オープンソース・Eコマースの雄の進化を見る!2014/01/30 Zabbix Japanに聞いたオープンソース×ビジネスを成功させるための3つの基2014/01/30 MOONGIFTの運営で大事にしている3つのこと2014/01/30 2007〜8年の大きな変動まとめ!2014/01/30 なぜプレミアム?そこから得られた経験教えます2014/01/30 2006〜09年、各年の人気オープンソース・ソフトウェアベスト52014/01/30 狙われやすいサイトはどんなサイト?オープンソース×セキュリティについてペンタセキュリティシステムズに聞く2014/01/30 aegifが考える企業でOSSを開発す

    MapDN レビュー MOONGIFT
    t_43z
    t_43z 2007/02/22
    HTML⇒XMLに変換。API公開してないサイトのデータを扱いやすく。
  • 1