samu_iのブックマーク - はてなブックマーク

samu_i id:samu_i

ブックマーク / ymotongpoo.hatenablog.com (1)

HTMLParserでHTMLを解析する - YAMAGUCHI::weblog
動機そういえばXMLだけじゃなくてHTMLの解析もやってみたくなったから。方法 HTMLもXML系のパーサ使えばいいんだろうけど、HTMLParserってのがあるので使ってみました。使い方としてはざっくり下のコードみたいな感じ。 from HTMLParser import HTMLParser, HTMLParseError class TestHTMLParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) def handle_starttag(self, tag, attrs): attrs = dict(attrs) # タプルだと扱いにくいので辞書にする print 'start', tag if 'div' == tag and 'class' in attrs: print '-->', attr
samu_i 2010/08/22
Python
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx