[B! scraping] terepandaのブックマーク

Import.io

Custom Web Data ExtractionMake market intelligence your unfair advantage, better understand your customers, and go a level deeper to make the right data driven decisions. Get a demo

terepanda 2015/06/02

リンク

ParseHub | Free web scraping - The most powerful web scraper

terepanda 2015/06/02

scraping

リンク

require 'yasuri' # "Rubyに関する新着投稿 - Qiita" を起点にする agent = Mechanize.new page = agent.get('http://qiita.com/tags/Ruby/it ems') # 最新3ページをスクレイピングする init_page = Yasuri.pages_init '//*[@id="main"]/div/div/div[1]/section/div[2]/ul/li[7]/a', limit:3 do # 現在のページ数 text_page_idx '//*[@id="main"]/div/div/div[1]/section/div[2]/ul/li[@class="active"]/a', proc: :to_i # 各エントリをスクレイピング struct_entries '//*[@id="main"

terepanda 2015/05/08

リンク

Webスクレイピングライブラリ "Yasuri" をリリースしました - Qiita

はじめにこんにちは．私はWebスクレイピングが大好きなのですが、Rubyでもっと簡単にスクレイピングができればと思い、ライブラリを書いてみました．ようやくREADMEとUSAGEが書けたので公開しようと思います．ソースはGithubで公開しています．特にドキュメントの英語が大変怪しいので、つっこみいただけると喜びます． tac0x2a/yasuri gemでも公開しているので、以下のコマンドで簡単にお試しできます．簡単なサンプルと解説を書いてみました． Yasuriでお手軽スクレイピングよろしければ使ってみてください＞＜ Yasuri とは Yasuri (鑢) は簡単にWebスクレイピングを行うための、"Mechanize" をサポートするライブラリです． Yasuriは、スクレイピングにおける、よくある処理を簡単に記述することができます．例えば、ページ内の複数のリンクを

terepanda 2015/05/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

scrapingに関するterepandaのブックマーク (4)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (2)

scrapingに関するterepandaのブックマーク (4)

Import.io

ParseHub | Free web scraping - The most powerful web scraper

Yasuriでお手軽スクレイピング - Qiita

Webスクレイピングライブラリ "Yasuri" をリリースしました - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス