2013/03/28 PFIセミナー「(道具としての)データサイエンティストのつかい方」資料 Ustreamの録画はこちらです→http://www.ustream.tv/recorded/37645309
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
June 17, 200904:19 カテゴリ広告と正義と数字の話統計 検索流入率とRPMが相関関係にあるコンテンツと,逆相関になるコンテンツとがあるっぽい事 「検索エンジンからの流入率と、コンテンツマッチ広告の RPM (revenue per mille ... 1000PVあたりの収益) との間に相関関係がある」 かどうかが、ときどき話題にのぼります。 検索エンジンと広告の精度が共に十分高ければ、 そのページの内容は、検索エンジン経由でたどり着いた人がまさに探していた内容であり、 そのページに表示される広告もまた、訪問者が求めている情報に近い という状況が成り立つはずで、そういう理想的な状態では、検索流入率とRPMとが高い相関を示す (= 検索エンジン経由でやってきた訪問者は、広告をより高い確率でクリックする) はずなのです。 このことが実際の数値でも示せれば、例えば 検索エンジンか
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く