タグ

webサービスとスクレイピングに関するtm_universalのブックマーク (2)

  • Chrome拡張「Scraper」でWEBページ情報を手軽にスクレイピングしてデータ化する方法

    Scraperとは Scraperは、WEBページ上の規則性のあるデータを手軽に取得することができるChrome拡張です。 例えば、テーブルデータや、Aリンクデータ、のような特定のHTML要素に入っている情報を、片っ端から取得してテーブルデータ化することができます。 また、その取得したデータをワンクリックでGoogleスプレッドシートに保存することができます。 テーブルデータのスクレイピングは以下の動画を見た方が分かりやすいかも。 以下では、その使い道などをいくつか考えてみました。 テーブルデータの取得 最もオーソドックスな使い方と言えば、動画にも出てきたテーブルデータの取得です。 例えば、信長の野望の以下のような武将データテーブルがあったとします。 これを、以下のように選択して、Chromeの右クリックメニューから「Scrape similar(似たものをスクレイプ)」を選択します。 す

    Chrome拡張「Scraper」でWEBページ情報を手軽にスクレイピングしてデータ化する方法
    tm_universal
    tm_universal 2020/06/13
    Chrome拡張「Scraper」でWEBページ情報を手軽にスクレイピングしてデータ化する方法
  • 無料で使えるスクレイピングツール「Octoparse」の使い方。コードを書くことなく自由度の高いデータ収集が可能。

    Octoparseとは Octoparseは、どんなWEBサイト上のデータも手軽に抽出することができる無料スクレイピングツールです。 無料版だと、一部機能に制限がありますが、ヘビーユーズでもしない限りは、十分すぎるくらいの機能があります。無料版と有料版の違いについては、Pricingを参照してみてください。有料版だと、タスクの登録数や自動実行数が多くなり、クラウド上で動作させることもできます。 実際に使ってみた感じでは、視覚的に分かりやすくデータ抽出箇所を設定することができ、実行することができるツールになっています。 例えば以下のようなデータ抽出なら簡単にできてしまいます。 単一ページ上のデータを抽出する ページネーションを移動しながらリストデータを取得する リストのリンク先もたどって取得する URLを複数指定して全てのページから指定したデータを取得する Octoparseは、上記のように

    無料で使えるスクレイピングツール「Octoparse」の使い方。コードを書くことなく自由度の高いデータ収集が可能。
    tm_universal
    tm_universal 2017/01/22
    無料で使えるスクレイピングツール「Octoparse」の使い方。コードを書くことなく自由度の高いデータ収集が可能
  • 1