タグ

ブックマーク / hoge.sub.jp (1)

  • 初めてのWeb Scraping - Lyo.blog

    バイト先でスクレイピングをすることになりそうだ。 Javaでwebページの解析をしたら日が何回も沈みそうだし(というか、解析元のhtmlが汚くて読めねぇ( つД`))、言語は何でもいいらしいので、最近やたら見かけるperlのWeb::Scraper(ドキュメント)を使ってみることにした。 今日はそれのメモ。 まず、Web::Scraperに慣れるために題材はオレのソーシャルブックマーク一覧のページに右あるtagの名前と数を抜き出すことにする。 とりあえず、htmlの該当箇所の <div id="sidebar" class="list"><div class="sidebar-inner"> <ul class="bundles"> <li class="bundle fold"><h3 class="label"><span>tags</span></h3> <ul> <li><span

    shidho
    shidho 2007/12/12
    入れ子な構造の場合はこうするのか。
  • 1