[B! データマイニング] y_makiのブックマーク

y_maki id:y_maki

データマイニングに関するy_makiのブックマーク (3)

Webデータ分析＆データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。主に自分向けのまとめという意味合いが強いんですが（笑）、僕が実際に2013年6月現在webデータ分析＆データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。追記回帰分析（特に線形重回帰分析）独立性の検定（カイ二乗検定・フィッシャーの正確確率検定）主成分分析(PCA) / 因子分析クラスタリング決定木 / 回帰木サポートベクターマシン(SVM) ロジスティック回帰ランダムフォレストアソシエーション分析（バスケット分析・相関ルール抽出）計量時系列分析おわりにおまけ1：「素性ベクトル＋分類ラベル」なるデータ前処理おまけ2：グラフ理論*10 {igraph}パッケージでグラ
y_maki 2013/06/11
データ分析

統計学

機械学習

主成分分析

統計

データマイニング
リンク
第1回　機械学習を実践する前の基礎知識 | gihyo.jp
みなさん、次のようなことができたらいいと思ったことはありませんか？「顧客ごとに、適したタイミングと内容で、DMを送信できたら……」「CGM系サイトへの誹謗中傷なんかのスパム投稿を自動識別できたら……」「サーバの負荷が高まるタイミングを事前に予測できたら……」一見するとこれらは実現していることがまったく異なりますが、じつはある共通点があります。それは「データを分析し、その結果を活用している」という点です。 Data is Kingの考えから得られるメリットかつてAmazonに在籍していたRonny Kohaviは「Data is King at Amazon」と言い、データの重要性を説きました。事実、Amazonはユーザの購買履歴から商品のレコメンデーションを行い、ユーザのサイト内の遷移履歴やクリック率からサイト構造の改善を行うなど、データを徹底的に活用していることで知られています
y_maki 2013/01/31
機械学習

mahout

プログラミング

統計

データ分析

データマイニング
リンク
多変量解析
データの中には、多くのトレンド（傾向）が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。ことわざで「木を見て森を見ず（You can't see the forest wood for the trees. ）」といわれるように、データマイニングの分野ではマクロ（巨視的）な視点で全体を捉える能力が求められます。とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。例をあげて解説します。左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全
y_maki 2012/09/10
多変量解析

データマイニング

R

勉強

データ

統計

統計学

主成分分析

研究
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx