エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例 読んだ - hitode909の日記
Rubyでインターネットを巡回する本. いちばん簡単なのだと,Wgetで再帰的にダウンロードしてみましょう... Rubyでインターネットを巡回する本. いちばん簡単なのだと,Wgetで再帰的にダウンロードしてみましょうとか,Anemoneっていうクローラ作るためのライブラリとか,ThreadやEventMachineで並列に動かすとか. あとは,Rubyだからgemの便利グッズが紹介されていて,一番よかったのは,koalaっていうfacebookにアクセスするためのライブラリで,キラキラネームでまぶしい. 気になったのは,けっこうHTMLをXPathとかで取り出してスクレイピングしていることで,こういう方法だとしばらくすれば壊れそう.壊れたときに気付けるように結果もバリデーションしましょう,とか書いてあったけど,メンテナンスできるのか.それか,意外とマークアップ変わらなくて壊れないもの? スクレイピングというと2007年くらいにPerlの人たちがCPANでYoutubeをダウンロードとかいって喜んで
2014/12/07 リンク