タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

statisticsに関するlenoreのブックマーク (7)

  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
    lenore
    lenore 2013/06/11
    Rのサンプル付
  • R: The R Project for Statistical Computing

    Getting Started R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. To download R, please choose your preferred CRAN mirror. If you have questions about R like how to download and install the software, or what the license terms are, please read our answers to frequently asked questions before you send

    lenore
    lenore 2013/06/11
    統計処理とグラフィック処理を行う言語と環境「R」
  • 犯罪の九割は失業率で説明がつく

    松尾匡のページ  08年1月14日 犯罪の九割は失業率で説明がつく (追記:1月16日, 再追記:1月17日) 続報あり。以下の分析結果には「誤差の系列相関」という問題がありました。続報ではその解決に取り組んでいます。 再追記:08年1月17日  下の方の昨日書いた追記で、管賀江留郎さんからいただいた批判のエントリーの中で言われていた、「警察がデータを操作したため相関する」という「説」について、管賀さんご自身の説であるように表現した一文がありました。私自身、気で言われていることかどうかは疑わしいと思っていましたが、ネタと断定することもできず、ああいう表現になりました。  このたび管賀さんとのやりとりの中で、これが管賀さんご自身信じておられない、いわゆる「釣り」のネタであることが明らかになりましたので、当該の表現を削除して訂正します。管賀さんはこれがひとつの積極的主張として一人歩

  • 流入キーワードもベキ分布だった!: DESIGN IT! w/LOVE

    不確実な時代をクネクネ蛇行しながら道を切りひらく非線形型ブログ。人間の思考の形の変遷を探求することをライフワークに。 高安秀樹さんの『経済物理学の発見』を読んで、ベキ分布にちょっと興味をもったので、手近なデータでそういう傾向を示すものがないか調べてみました。 調べてみたのは、Webサイトの検索エンジン経由の流入キーワード別アクセス数です。 流入キーワードにはフラクタル性が見られる「ロングテールと物理的制約」でも紹介しましたが、多くのWebサイトの検索エンジン経由の流入キーワードは単純に集計すると、たいていはロングテールみたいなグラフになります。 また、高安さんのにあった「一般に、ベキ分布にしたがうような現象にはフラクタル性があります」という言葉の通り、検索エンジン経由の流入キーワード数の上位20%が全体の約80%を占め、さらに上位20%のうちの上位20%(つまり全体の4%)も上位20%の

  • 統計学自習ノート

    多変量解析 回帰分析(あてはめ),判別分析,主成分分析,因子分析, SEM 数量化 I 類,数量化 II 類,数量化 III 類,数量化 IV 類 正準相関分析,クラスター分析,主座標分析 クロンバックの $\alpha$ 信頼性係数 生存率解析 Cutler-Ederer 法による生命表,Kaplan-Meier 法による生命表 多重ロジスティックモデル,Cox の比例ハザードモデル

  • http://case.f7.ems.okayama-u.ac.jp/statedu/term/

  • EXCELを使った多変量解析

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 1