Kaggleでは世界トップクラスのデータサイエンティストが集まり,しのぎを削りながら賞金を狙って日々データを分析しています. これは意外と知られていないのですが,Kaggleはただ単にみんなが競争しているだけでなく,かなり活発なフォーラムがあり,そこでcompetitionが終わった時に優れた結果を残したmasterたちが自分の手法を紹介することが通例となっています. この記事では,先日終了したKaggle TalkingData Competitionで3000以上の参加者の中で特に優れた結果を残した一部の参加者の用いた手法とそこから学べることについて分析・紹介していきます. Competitionの趣旨 Kaggle TalkingData Competitionは大量のクリックデータを元にアプリがダウンロードされるかどうかを予測するという趣旨のcompetitionでした. 用いる特