[B! 多変量解析] babydaemonsのブックマーク

テストの実行 - C# を使用した線形判別分析

このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカルサポートを利用できます。 October 2015 Volume 30 Number 10 テストの実行 - C# を使用した線形判別分析 James McCaffrey 二項分類の問題は、変数が取り得る 2 つの値のうち、どちらになるかを予測することを目指します。たとえば、株の平均販売数、インサイダー取引の数、株価の収益率などの予測変数に基づいて、ある企業の株価の変動 (増減) を予測します。あるいは、年齢、年収、学歴などに基づいて、政治的傾向 (リベラル派か保守派か) を予測します。二項分類に使われる主要アルゴリズムは 10 個以上あります。線形判別分析 (LDA: Linear Discriminate Analysis) は

babydaemons 2015/12/10

リンク

多変量解析

データの中には、多くのトレンド（傾向）が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。ことわざで「木を見て森を見ず（You can't see the forest wood for the trees. ）」といわれるように、データマイニングの分野ではマクロ（巨視的）な視点で全体を捉える能力が求められます。とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。例をあげて解説します。左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全

babydaemons 2013/10/19

リンク

http://www2.ee.knct.ac.jp/el/E4/H15-E406/eigenvalue.html

固有値と固有ベクトル（１）ｎXｎ行列Aにおいて、あるスカラー量λが0ベクトルでないｎ次元列ベクトルｘと共にを満たすとき、λをAの固有値、ｘをAのλに対する固有ベクトルという。固有値を求める数値的方法としてはn≧５の時は（5次式以上）反復法で求める事になる。固有値を求める方法としては種々の方法があり、計算パッケージとしてライブラリ化してある場合があり、それを用いる方がよい。ここでは、次数の低い場合に用いることのできる簡単な解法べき乗法、逆反復法を解説する。べき乗法 nXn行列Aの固有値がλ1,λ2,....λnと全て異なる場合で、絶対値の大きい順に並べたとする。これに対する正規直交固有ベクトルをそれぞれx1,x2,....xnとする。任意のn次元ベクトルuは{xn}を使って次のように表される。両辺に行列Aを作用させると更に次々とｋ回Aを作用させた結果を

babydaemons 2013/10/18

リンク

http://www2.ee.knct.ac.jp/el/E4/H15-E406/lu1.html

/* LU分解による連立一次方程式の解法を用いたプログラム例 */ /* Lの対角要素は１とする。 */ #include <iostream.h> #include <iomanip.h> #include <math.h> const int N=3; /* 変数の数 */ const double Eps=1e-10; /* Pivotの最低値を規定する小さい数 */ /* ユーザー定義の型Matrixの定義 */ typedef double Matrix[N+1][N+1]; /* ユーザー定義の型Vectorの定義 */ typedef double Vector[N+1]; /* LU分解を行う関数の定義 */ int lu_decomposition( Matrix a,int n ) { int i,j,t; for ( t=1; t <=

babydaemons 2013/10/18

リンク

データの特性と X-means on Weka の振る舞い - (主に)プログラミングのメモ

２次元，２個／クラスのサンプルを与えた場合４クラスのデータを想定． x-means のオプション設定は kMin=2, kMax=5．データ： 1.0,1.0,label1 1.1,1.0,label1 4.0,1.0,label2 4.1,1.0,label2 1.0,4.0,label3 1.0,4.1,label3 4.0,4.0,label4 4.1,4.0,label4結果は，２個のクラスタと認識．クラスあたりのサンプルが少ないため，クラス内分散が大きめに評価されたのか？ Cluster centers : 2 centers Cluster 0 3.033333333333333 3.016666666666667 Cluster 1 1.05 1.0 Distortion: 3.874189 BIC-Value : -13.679484 Clustered Instanc

babydaemons 2013/10/15

多変量解析

リンク

文系のための「多次元データ解析」

まずは、基本的な用語と、Rでの基本的なコマンドをここで学ぶ。何も知らずに、回帰分析や主成分分析、クラスター分析をするのは「無謀」というもの。気持ちは理解できなくは無いのだが。以下のトピックを見て、一つでも知らない用語があるならば、先に進まずに、最初から順にチュートリアルをこなした方が良い。また、理解できている人も、一般的な教科書とは異なった説明もある。軽く目を通した方が良いかもしれない。文系のための「行列の構造」文系のための「行列」（１）：行列データの構造について文系のための「行列」（２）：多次元データについて文系のための「行列」（３）：行列の種類について文系のための「行列」（４）：「変数」と「添字」について文系のための「行列の演算」文系のための「行列の演算」：行列の「足し算」と「引き算」文系のための「内積」（１）：行列の「掛け算」の方法文系のための「内積」（２）：行列の

babydaemons 2013/10/13

リンク

(2) 標準化ユークリッド平方距離(standardized squared Euclidean distance)

babydaemons 2013/10/11

分散共分散行列の逆行列が求められなくてマハラノビス汎距離が使えないときでも使えるw

多変量解析

リンク

PCA(Principal Component Analysis)を具体的に計算する - minus9d's diary

(2013/6/18修正) PCAの計算方法を天下り的に説明します。専門家ではないので誤りが含まれる可能性があることをあらかじめご了承ください。データの例はExample of Principal Component Analysis (PCA).mp4 - YouTubeで使われているものをそのまま流用しています。というか、このあやしい説明を読むよりかこの動画を見た方がいいかもしれません。 PCAの目的ベクトル基底を変換することにより、できるだけ情報を失うことなく次元を削減すること。データの例 2つの独立変数X, Yを持つ10組のデータがあるとする。 X Y 1.4 1.65 1.6 1.975 -1.4 -1.775 -2.0 -2.525 -3.0 -3.95 2.4 3.075 1.5 2.025 2.3 2.75 -3.2 -4.05 -4.1 -4.85 プロットするとこん

babydaemons 2013/10/10

懐かしい。。。

リンク

マハラノビス距離を学んだ - 元データ分析の会社で働いていた人の四方山話

判別分析に用いられる二つの尺度のうち、線形判別関数でない方がマハラノビス距離である。ということで、調べてみたけどなんだか難しめな感じ。マハラノビス距離 - Wikipedia でもそんなに難しくなかった。マハラノビス距離とはデータ分布の広がりを加味した距離のことです。この辺がユークリッド距離との違いです。前提条件マハラノビス距離では、各グループのデータが正規分布に従って存在していると仮定します。なので、正規分布に従わないデータについてはどうなるんでしょう？って感じですね。求め方データの平均との偏差の絶対値を標準偏差で割ります。標準偏差で割ることで、分布の幅を考慮した距離が求まります。ただし、これは一変数のときだけです。マハラノビス距離の意味マハラノビス距離が大きいということは、正規分布の中心付近から離れているということになります。なので、マハラノビス距離が大き

babydaemons 2013/10/10

リンク

数理計画法

babydaemons 2013/09/28

準ニュートン法

多変量解析

リンク

リダイレクト

こちらのページのURLは変更されました。 5秒後に転送されます。

babydaemons 2013/09/28

準ニュートン法のBFGS公式

多変量解析

リンク

LAPACK — Linear Algebra PACKage

LAPACK is a software package provided by Univ. of Tennessee; Univ. of California, Berkeley; Univ. of Colorado Denver; and NAG Ltd.. LAPACK is written in Fortran 90 and provides routines for solving systems of simultaneous linear equations, least-squares solutions of linear systems of equations, eigenvalue probl ems, and singular value probl ems. The associated matrix factorizations (LU, Cholesky, QR

babydaemons 2013/09/27

リンク

C++ による準ニュートン法の実装 1 - 第二宇宙速度

babydaemons 2013/09/26

ここのソースは追っかける気力が維持出来るw

リンク

微分積分

静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです．主として，プログラミング言語（ HTML，C/C++, Java, JavaScript, PHP, HTML，VB，C# ），及び，システムエンジニアとしての基礎知識（数学，オペレーションズ・リサーチやシステム工学関連の手法）を扱っています．

babydaemons 2013/09/26

準Newton法：“初期点 x(0) を与え，k = 0，H(0) = I （単位行列）とします．”

リンク

東京工業大学情報理工学院数理・計算科学系

大岡山地区の建物大学正門より，桜並木のウッドデッキを通り，右手の芝生をつっきる小径が西8号館，西7号館に続くみちです．大岡山西8号館（Ｅ棟，Ｗ棟）: キャンパスマップの18, 19番の建物にあたります．本館の西隣りに位置しています．正面玄関をはいったところは３階です．Ｅ棟においでの方は廊下をはいってすぐ左手のエレベータをご利用下さい．Ｗ棟にはじめておいでの方は十分に注意して下さい．Ｅ棟とＷ棟を繋いでいる通路は３階と１０階にしかありません．Ｅ棟のエレベータを利用すると迷子になります．正面玄関から廊下をまっすぐにおいでになり，奥の右手にあるエレベータをご利用下さい．西7号館：キャンパスマップの17番の建物にあたります．西8号館から，建物を二つ挟んだ並びにあります．芝生から向う場合，左手に本館を見ながら進み，本館がとぎれたあたりの右手にある小さな建物が西7号館です．橋を渡ってはいったと

babydaemons 2013/09/26

準ニュートン法（BFGS 公式）が良さげw 東工大学部生の卒論にしてはマニアックじゃないw 最適化実行時間と誤差の考察が便利

リンク

反復法による多変数の最適化問題（制約なし）の簡易まとめ - 大人になってからの再学習

反復法については複数のアプローチがあるけど、わかりやすくまとめたものがあまり無いなぁ、と思って検索していたら、次の東工大の卒業論文が簡潔でわかりやすかった。 ■「無制約非線形最適化問題に対するアルゴリズムの比較」 http://www.is.titech.ac.jp/~kojima/lab/thesis/2007/0211889.pdf 反復法による解法は、「探索ベクトル」の決定方法と「ステップ幅」の決定方法で大きくわけることができる。 ■探索方向ベクトルの決定最急降下法目的関数の勾配ベクトルの逆方向に探索方向ベクトルを取る。実装が簡単。収束が遅い。ニュートン法目的関数を局所的に2次近似して、探索方向ベクトルを決める。少ない反復回数で収束する。探索方向を決めるためにヘッセ行列の計算が必要。ヘッセ行列が正定値であることが前提。レーベンバーグ・マーカート法（修正ニュートン法）ヘッ

babydaemons 2013/09/26

リンク

class Matrix (Ruby 1.8.7)

クラスの継承リスト: Matrix < Object < Kernel 要約数Numericを要素とする行列を扱うクラスです。行列 m * n 個の数a(i,j)を [ a(0,0) a(0,1) a(0,2) a(0,3) ... a(0,n-1) ] [ a(1,0) a(1,1) a(1,2) a(1,3) ... a(1,n-1) ] [ a(2,0) a(2,1) a(2,2) a(2,3) ... a(2,n-1) ] [ ] [ a(m-1,0) a(m-1,n-1) ] のように、縦横の表にあらわしたものを(m,n)型の行列といいます。 m=nの行列をm次の正方行列(square matrix)といいます。インデックスは 0 から始まることに注意してください。上からi番目の横の数の並びを第i行(the i-th row)、左からj番目の縦の数の並びを第j列(the

babydaemons 2013/06/12

あぁ、Matz先生、偉大だわ

リンク

最小二乗法近似

最小二乗法で実験データを持っていて、折線グラフを作ったときに、できれば近似式を作ってみたいものです。　グラフから見て、3次式になりそうです。　最小二乗法で、3次元近似の例をやってみましょう。（このページは、カルキングのサンプル集(統計\回帰分析2.ｃｌｋ)から計算式を借用しています。実際に作業をする場合には、手持ちのサンプルファイルから欲しい式を探して、そのコピーを使うのが賢明です) 実験データから近似式を求めるには、行列で｢正規方程式｣を作り、それを解いて近似式の係数を求めます。　これだけで、数学が良く分らないと、パニックになります。　正規方程式を解くといっても、「逆行列｣を使って組み替えた定義通りの計算をさせるだけです。正規方程式というのは、次のような行列です。統計の授業を受けたから覚えているという人もあるのではないでしょうか。

babydaemons 2013/06/07

多変量解析

リンク

akita-nct.jp - このウェブサイトは販売用です！ - 高専秋田ロボコン機械電気情報リソースおよび情報

This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

babydaemons 2013/06/07

多変量解析

リンク

はてなブックマーク

タグ

関連タグで絞り込む (13)

多変量解析に関するbabydaemonsのブックマーク (19)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス