タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

xpathに関するallegroのブックマーク (2)

  • Gentleちゃれんじ Tips -lxmlでhtmlを処理する-

    lxmlでhtmlを処理する Pythonhtmlを取り扱う際は、「htmllib(標準モジュール)」や 「Beautiful Soup」 といったモジュールがあります。 しかし、高速で柔軟な操作がしたい場合は、 「lxml」がいいということなので、 今回はlxmlでhtmlを操作する方法をメモしたいと思います。 lxmlは、Beautiful Soupより高速で、htmllibより柔軟なhtml(xml)操作を可能にするのですが、 日語資料が少ないと言うのが難点でした。最低限のことならば、ちょっと英語を読めば、 何とかなりますが、ちょっと凝ったことをしようと思うと英語力がネックでつまづいてしまいました…。 そこで、今回は、自分がつまづいた所を中心に紹介したいと思います。 目次 htmlから情報を抽出する htmlソースを改変する まとめと補足 1. htmlから情報を抽出する htm

    allegro
    allegro 2009/09/07
    xpathの便利さにしびれた。正規表現マッチングなんて20世紀の手法だった…!
  • XML/XPath/XPathの書き方 - 俺の基地

    XMLでの要素の位置特定の記述XPathに関してです ってか、これってXMLに対するSQLみたいなもんだね。 XPathの発展系としてXQueryなんてものも出てきてるみたいだし ・・・はーんjQueryは$関数にXPath記述がサポートされるんだが・・・この名前って実はここから来てたりして・・・勝手に納得 目次

  • 1