タグ

htmlとmoduleに関するtyruのブックマーク (5)

  • ある日 XML::Simple がいきなりこけて泣かないために - 酒日記 はてな支店

    ちゃんと PREFERRED_PARSER を指定すること。 $XML::Simple::PREFERRED_PARSER = 'XML::Parser'; なにかこう、2005年ぐらいにみた感じの話題で恐縮なのですが。 XML::SAX をインストールしたら、いきなり XML::Simple を使ってたコードが Cannot decode string with wide charactersって言ってコケ始めた。しかし、アプリケーションを再起動してみたらなぜか再現しない。 結論としては、XML::SAX::PurePerl が使われる状態で、XMLin() に utf8 flagged な文字列を渡すと死ぬ。 use XML::Simple; use utf8; $XML::Simple::PREFERRED_PARSER = 'XML::SAX::PurePerl'; $xml =

    ある日 XML::Simple がいきなりこけて泣かないために - 酒日記 はてな支店
  • 汎用的なXMLSocketサーバを書いた - download_takeshi’s diary

    FlashのXMLSocketサーバ「Hoppy」をリリースしました。 Hoppy - Flash XMLSocket Server http://github.com/miki/Hoppy/tree/master githubにあげてあります。そのうちCPANにも反映されると思います。 HoppyはFlashのXMLSocketサーバのperl実装です。いわゆるプッシュ型のwebアプリケーションを簡単に実装することを目標としたTCPサーバです。 内部はperlのPOEによるイベントドリブンな実装なので、POEの知識がある方であれば、かなり柔軟にサーバの振る舞い自体を変更したり拡張したりすることができます。逆にPOEを知らない人でも、いくつかの決めごとに従うだけで、簡単に機能を搭載していく事ができます。 基的な決めごと Hoppyはある程度の「決めごと」を前提とした、汎用的で拡張可能なX

    汎用的なXMLSocketサーバを書いた - download_takeshi’s diary
  • XML::Simple の処理はとても遅い :: Drk7jp

    XML::Simple の処理はとても遅い 最近 Perl で XML を処理することがとっても多いですね。Amazon Search の高速化のためいろいろデータを取得してみたら、XML::Simple の部分で異様に時間を喰っていることが判明。いろいろググッってみたら、「Perl で XML の処理はどれが速いかベンチ : NDO::Weblog」という記事を見つけました。 なるほど、XML::Simple と XML::LibXML では実に 200 倍以上の速度の差があることが判明しました。正規表現との比較では、実に 2500 倍以上の速度差。XML::Simple を使って記述してるプログラムを全てリプレースしようと思います。大量のリクエストが来るので、正規表現を使うしかなさそうだなぁ・・・ スポンサード リンク Trackback : Posted by drk at 20

  • perl html パース hPod: use HTML::TreeBuilder

    Excite ブログから Seesaa ブログへの移行:その2 次に、 Excite ブログのドキュメント構造を調べる。ドキュメント構造なんて言うと小難しいことをやりそうだけれど、単に HTML を、目で、パースしてみたにすぎない。この HTML から、各要素を抜き出して、 Seesaa ブログの(エクスポートしたデータの)書式に合わせて整えればよいのだけれど、 Excite ブログのそれは、ちょっと酷い内容。あまり長く眺めていると、気絶しそう。 一見、たくさんのスタイルの指定がしてあるので、データもそれなりに括られているのかと思われど、要素としては意識されておらず、 HTML デザインの延長として(だけに)スタイルを作っているように思われる。でも、ほかに手がかりもないのでそれを頼りにするしかない。 DIV タグと、その要素 class の値。でもそれらを取り出せば、記事の構成要素を抽出し

  • HTMLから本文を抜き出せるモジュールHTML::ExtractContent - perl-mongers.org

    This domain may be for sale!

  • 1