タグ

多変量解析に関するbabydaemonsのブックマーク (19)

  • テストの実行 - C# を使用した線形判別分析

    このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。 October 2015 Volume 30 Number 10 テストの実行 - C# を使用した線形判別分析 James McCaffrey 二項分類の問題は、変数が取り得る 2 つの値のうち、どちらになるかを予測することを目指します。たとえば、株の平均販売数、インサイダー取引の数、株価の収益率などの予測変数に基づいて、ある企業の株価の変動 (増減) を予測します。あるいは、年齢、年収学歴などに基づいて、政治的傾向 (リベラル派か保守派か) を予測します。 二項分類に使われる主要アルゴリズムは 10 個以上あります。線形判別分析 (LDA: Linear Discriminate Analysis) は

    テストの実行 - C# を使用した線形判別分析
  • 多変量解析

    データの中には、多くのトレンド(傾向)が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。 このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。 ことわざで「木を見て森を見ず(You can't see the forest wood for the trees. )」といわれるように、データマイニングの分野ではマクロ(巨視的)な視点で全体を捉える能力が求められます。 とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。 コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。 例をあげて解説します。 左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全

  • http://www2.ee.knct.ac.jp/el/E4/H15-E406/eigenvalue.html

    固有値と固有ベクトル(1) nXn行列Aにおいて、あるスカラー量λが0ベクトルでないn次元列ベクトルxと共に を満たすとき、λをAの固有値、xをAのλに対する固有ベクトルという。 固有値を求める数値的方法としてはn≧5の時は(5次式以上)反復法で求める事になる。 固有値を求める方法としては種々の方法があり、計算パッケージとしてライブラリ化してある場合があり、それを用いる方がよい。 ここでは、次数の低い場合に用いることのできる簡単な解法べき乗法、逆反復法を解説する。 べき乗法 nXn行列Aの固有値がλ1,λ2,....λnと全て異なる場合で、絶対値の大きい順に並べたとする。これに対する正規直交固有ベクトルをそれぞれx1,x2,....xnとする。任意のn次元ベクトルuは{xn}を使って次のように表される。 両辺に行列Aを作用させると 更に次々とk回Aを作用させた結果を

  • http://www2.ee.knct.ac.jp/el/E4/H15-E406/lu1.html

    /* LU分解による連立一次方程式の解法を用いたプログラム例 */ /* Lの対角要素は1とする。 */ #include <iostream.h> #include <iomanip.h> #include <math.h> const int N=3; /* 変数の数 */ const double Eps=1e-10; /* Pivotの最低値を規定する小さい数 */ /* ユーザー定義の型Matrixの定義 */ typedef double Matrix[N+1][N+1]; /* ユーザー定義の型Vectorの定義 */ typedef double Vector[N+1]; /* LU分解を行う関数の定義 */ int lu_decomposition( Matrix a,int n ) { int i,j,t; for ( t=1; t <=

  • データの特性と X-means on Weka の振る舞い - (主に)プログラミングのメモ

    2次元,2個/クラスのサンプルを与えた場合 4クラスのデータを想定. x-means のオプション設定は kMin=2, kMax=5. データ: 1.0,1.0,label1 1.1,1.0,label1 4.0,1.0,label2 4.1,1.0,label2 1.0,4.0,label3 1.0,4.1,label3 4.0,4.0,label4 4.1,4.0,label4結果は,2個のクラスタと認識.クラスあたりのサンプルが少ないため,クラス内分散が大きめに評価されたのか? Cluster centers : 2 centers Cluster 0 3.033333333333333 3.016666666666667 Cluster 1 1.05 1.0 Distortion: 3.874189 BIC-Value : -13.679484 Clustered Instanc

    データの特性と X-means on Weka の振る舞い - (主に)プログラミングのメモ
  • 文系のための「多次元データ解析」

    まずは、基的な用語と、Rでの基的なコマンドをここで学ぶ。何も知らずに、回帰分析や主成分分析、クラスター分析をするのは「無謀」というもの。気持ちは理解できなくは無いのだが。以下のトピックを見て、一つでも知らない用語があるならば、先に進まずに、最初から順にチュートリアルをこなした方が良い。また、理解できている人も、一般的な教科書とは異なった説明もある。軽く目を通した方が良いかもしれない。 文系のための「行列の構造」 文系のための「行列」(1):行列データの構造について 文系のための「行列」(2):多次元データについて 文系のための「行列」(3):行列の種類について 文系のための「行列」(4):「変数」と「添字」について 文系のための「行列の演算」 文系のための「行列の演算」:行列の「足し算」と「引き算」 文系のための「内積」(1):行列の「掛け算」の方法 文系のための「内積」(2):行列の

    文系のための「多次元データ解析」
  • (2) 標準化ユークリッド平方距離(standardized squared Euclidean distance)

    babydaemons
    babydaemons 2013/10/11
    分散共分散行列の逆行列が求められなくてマハラノビス汎距離が使えないときでも使えるw
  • PCA(Principal Component Analysis)を具体的に計算する - minus9d's diary

    (2013/6/18修正) PCAの計算方法を天下り的に説明します。専門家ではないので誤りが含まれる可能性があることをあらかじめご了承ください。データの例はExample of Principal Component Analysis (PCA).mp4 - YouTubeで使われているものをそのまま流用しています。というか、このあやしい説明を読むよりかこの動画を見た方がいいかもしれません。 PCAの目的 ベクトル基底を変換することにより、できるだけ情報を失うことなく次元を削減すること。 データの例 2つの独立変数X, Yを持つ10組のデータがあるとする。 X Y 1.4 1.65 1.6 1.975 -1.4 -1.775 -2.0 -2.525 -3.0 -3.95 2.4 3.075 1.5 2.025 2.3 2.75 -3.2 -4.05 -4.1 -4.85 プロットするとこん

    PCA(Principal Component Analysis)を具体的に計算する - minus9d's diary
    babydaemons
    babydaemons 2013/10/10
    懐かしい。。。
  • マハラノビス距離を学んだ - 元データ分析の会社で働いていた人の四方山話

    判別分析に用いられる二つの尺度のうち、線形判別関数でない方がマハラノビス距離である。 ということで、調べてみたけどなんだか難しめな感じ。 マハラノビス距離 - Wikipedia でもそんなに難しくなかった。 マハラノビス距離とは データ分布の広がりを加味した距離のことです。 この辺がユークリッド距離との違いです。 前提条件 マハラノビス距離では、各グループのデータが正規分布に従って存在していると仮定します。 なので、正規分布に従わないデータについてはどうなるんでしょう?って感じですね。 求め方 データの平均との偏差の絶対値を標準偏差で割ります。 標準偏差で割ることで、分布の幅を考慮した距離が求まります。 ただし、これは一変数のときだけです。 マハラノビス距離の意味 マハラノビス距離が大きいということは、正規分布の中心付近から離れているということになります。 なので、マハラノビス距離が大き

    マハラノビス距離を学んだ - 元データ分析の会社で働いていた人の四方山話
  • 数理計画法

    babydaemons
    babydaemons 2013/09/28
    準ニュートン法
  • リダイレクト

    こちらのページのURLは変更されました。 5秒後に転送されます。

    babydaemons
    babydaemons 2013/09/28
    準ニュートン法のBFGS公式
  • LAPACK — Linear Algebra PACKage

    LAPACK is a software package provided by Univ. of Tennessee; Univ. of California, Berkeley; Univ. of Colorado Denver; and NAG Ltd.. LAPACK is written in Fortran 90 and provides routines for solving systems of simultaneous linear equations, least-squares solutions of linear systems of equations, eigenvalue problems, and singular value problems. The associated matrix factorizations (LU, Cholesky, QR

  • C++ による準ニュートン法の実装 1 - 第二宇宙速度

    babydaemons
    babydaemons 2013/09/26
    ここのソースは追っかける気力が維持出来るw
  • 微分積分

    静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです.主として,プログラミング言語( HTML,C/C++, Java, JavaScript, PHP, HTML,VB,C# ),及び,システムエンジニアとしての基礎知識(数学,オペレーションズ・リサーチやシステム工学関連の手法)を扱っています.

    babydaemons
    babydaemons 2013/09/26
    準Newton法:“初期点 x(0) を与え,k = 0,H(0) = I (単位行列)とします.”
  • 東京工業大学 情報理工学院 数理・計算科学系

    大岡山地区の建物 大学正門より,桜並木のウッドデッキを通り,右手の芝生をつっきる小径が西8号館,西7号館に続くみちです. 大岡山西8号館(E棟,W棟): キャンパスマップの18, 19番の建物にあたります.館の西隣りに位置しています.正面玄関をはいったところは3階です. E棟においでの方は廊下をはいってすぐ左手のエレベータをご利用下さい. W棟にはじめておいでの方は十分に注意して下さい.E棟とW棟を繋いでいる通路は3階と10階にしかありません.E棟のエレベータを利用すると迷子になります.正面玄関から廊下をまっすぐにおいでになり,奥の右手にあるエレベータをご利用下さい. 西7号館:キャンパスマップの17番の建物にあたります.西8号館から,建物を二つ挟んだ並びにあります.芝生から向う場合,左手に館を見ながら進み,館がとぎれたあたりの右手にある小さな建物が西7号館です.橋を渡ってはいったと

    babydaemons
    babydaemons 2013/09/26
    準ニュートン法(BFGS 公式)が良さげw 東工大学部生の卒論にしてはマニアックじゃないw 最適化実行時間と誤差の考察が便利
  • 反復法による多変数の最適化問題(制約なし)の簡易まとめ - 大人になってからの再学習

    反復法については複数のアプローチがあるけど、わかりやすくまとめたものがあまり無いなぁ、と思って検索していたら、 次の東工大の卒業論文が簡潔でわかりやすかった。 ■「無制約非線形最適化問題に対するアルゴリズムの比較」 http://www.is.titech.ac.jp/~kojima/lab/thesis/2007/0211889.pdf 反復法による解法は、「探索ベクトル」の決定方法と「ステップ幅」の決定方法で大きくわけることができる。 ■探索方向ベクトルの決定 最急降下法 目的関数の勾配ベクトルの逆方向に探索方向ベクトルを取る。実装が簡単。収束が遅い。 ニュートン法 目的関数を局所的に2次近似して、探索方向ベクトルを決める。少ない反復回数で収束する。探索方向を決めるためにヘッセ行列の計算が必要。ヘッセ行列が正定値であることが前提。 レーベンバーグ・マーカート法(修正ニュートン法) ヘッ

    反復法による多変数の最適化問題(制約なし)の簡易まとめ - 大人になってからの再学習
  • class Matrix (Ruby 1.8.7)

    クラスの継承リスト: Matrix < Object < Kernel 要約 数Numericを要素とする行列を扱うクラスです。 行列 m * n 個の数a(i,j)を [ a(0,0) a(0,1) a(0,2) a(0,3) ... a(0,n-1) ] [ a(1,0) a(1,1) a(1,2) a(1,3) ... a(1,n-1) ] [ a(2,0) a(2,1) a(2,2) a(2,3) ... a(2,n-1) ] [ ] [ a(m-1,0) a(m-1,n-1) ] のように、縦横の表にあらわしたものを(m,n)型の行列といいます。 m=nの行列をm次の正方行列(square matrix)といいます。 インデックスは 0 から始まることに注意してください。 上からi番目の横の数の並びを第i行(the i-th row)、 左からj番目の縦の数の並びを第j列(the

    babydaemons
    babydaemons 2013/06/12
    あぁ、Matz先生、偉大だわ
  • 最小二乗法近似

    最小二乗法で 実験データを持っていて、折線グラフを作ったときに、できれば近似式を作ってみたいものです。 グラフから見て、3次式になりそうです。 最小二乗法で、3次元近似の例をやってみましょう。 (このページは、カルキングのサンプル集(統計\回帰分析2.clk)から計算式を借用しています。実際に作業をする場合には、手持ちのサンプルファイルから欲しい式を探して、そのコピーを使うのが賢明です) 実験データから近似式を求めるには、行列で「正規方程式」を作り、それを解いて近似式の係数を求めます。 これだけで、数学が良く分らないと、パニックになります。 正規方程式を解くといっても、「逆行列」を使って組み替えた定義通りの計算をさせるだけです。 正規方程式というのは、次のような行列です。統計の授業を受けたから覚えているという人もあるのではないでしょうか。

  • akita-nct.jp - このウェブサイトは販売用です! - 高専 秋田 ロボコン 機械 電気情報 リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • 1