タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

GoogleRefineに関するkitoneのブックマーク (3)

  • 大相撲のアノーマリー (1)

    大相撲の勝敗結果を分析すると、ちょっとした不自然さが見つかります。今回は、ベストセラーとなった書籍「ヤバい経済学」でも紹介されていた論文を元ネタにネット上のデータを利用して解析を試みます。 今回の前口上 諸事情により2カ月の間連載を空けてしまいました。申し訳ございませんでした。実は10月、11月に用意した時事ネタがいろいろあるのですが、こちらは少しタイミングを逸して旬が過ぎたので、もう少し寝かせてから提示したいと思います。また、何人かの読者の方から励ましのお言葉を戴きまして大変感謝しています。当に励みになります。ありがとうございました。もしもこの連載で取り上げてほしい問題やネタ、改善点などがありましたら、遠慮なく以下のメールアドレスにリクエストやご意見をお送りください。 knife@bakfoo.com 今回から数回は、大相撲の統計データをネタにして、「公になっているが混乱しているデータ

    大相撲のアノーマリー (1)
    kitone
    kitone 2011/05/10
    Google Refineを使ったスクレイピング
  • Google Refineは神ツールである | wrong, rogue and log

    Google Refine 2.0 http://code.google.com/p/google-refine/ Googleのデータクレンジングツール。ローカルwebサーバーで動作するアプリである。なぜローカルで動作するwebサーバにしているかというと、それには理由があるのだ。ほんと、ビックリ。 公開しているデータはタイトルやデータ形式がマチマチで、それを自分のところで統計解析するには、データレンジングをかなりやらなければいけなかった。そのためには、いままでgrepだとかfindだとかのコマンドやPythonスクリプトで半狂乱になって汚れ落としをしていたけれど、このGoogle Refineを使うとそういう問題がアホみたいに簡単に解決する。 例えば、カテゴリカルデータがセルに割り当てられているとする。記入者によってそれが略語だったりフルの名称だったりマチマチである。これを全て一つの文字

    Google Refineは神ツールである | wrong, rogue and log
  • google-refine - Project Hosting on Google Code

    Code Archive Skip to content Google About Google Privacy Terms

  • 1