タグ

webサービスとPythonとSEOに関するkns_1234のブックマーク (1)

  • goop - Google検索結果をスクレイピング

    Googleの検索結果を取得して分析に使いたいと考える人は大勢います。しかし機械的に収集しようとすると、GoogleからCAPTCHA入力が求められます。そのため自動化しづらく、手作業で収集している人も多いでしょう。 しかし裏道がありそうです。Facebookを経由するとそのトラップに引っかからないようです。その実証として作られたのがgoopです。 goopの使い方 goopで検索を行います。その際、Facebookのクッキーを適用するのがコツです。 from goop import goop page_1 = goop.search('open source', '<facebook cookie>') print(page_1) ちゃんと検索結果が返ってきます。 {0: { 'url': 'https://opensource.org/osd-annotated', 'text': '

    goop - Google検索結果をスクレイピング
    kns_1234
    kns_1234 2019/10/22
    "goopはFacebook Debuggerを経由してGoogleにアクセスします。この時、FacebookとGoogleとで契約が結ばれているのか、CAPTCHAに移動しないようです"
  • 1