統計に関するgnufrfrのブックマーク (2)

  • 相関係数 - Wikipedia

    散布図とその相関係数の一覧。相関は非線形性および直線関係の向きを反映するが(上段)、その関係の傾きや(中段)、非直線関係の多くの面も反映しない(下段)。中央の図の傾きは0であるが、この場合はYの分散が0であるため相関係数は定義されない。 相関係数(そうかんけいすう、英: correlation coefficient)とは、2つのデータまたは確率変数の間にある線形な関係の強弱を測る指標である[1][2]。相関係数は無次元量で、−1以上1以下の実数に値をとる。相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるという[3][4]。 たとえば、先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば−1に近い数字になる。 相関係数が ±1 に値をとることは、2つのデータ(確率変数)が線形の関係にある

    相関係数 - Wikipedia
  • 分散共分散行列 - 大人になってからの再学習

    まずは復習。 分散とは「各データが平均値からどれだけ離れているか」という、データの散らばり具合を表す。 具体的には、分散は「(各データの平均値からの距離)の2乗の平均」。 分散は2乗であることに注意。単位をそろえるために、分散の平方根を取ったものが標準偏差。 標準偏差をσで表すと、分散はσ^2で表される。 式で表すと次のようになる。 ここで、次のようなベクトルを導入する。(なぜ? あとで値を複数持つデータに拡張するのに便利だから) すると、さきほどの分散の式は、次のような縦ベクトルと横ベクトルの積の形で書くことができる。 (’は転置を表す) これまでの話で、たとえば、数学のテストの点数がどれくら散らばっているか、ということを知ることができる。 ここで、英語のテストも行った場合、数学英語の点数の関係を知りたい、という場合には、複数のデータ群を扱う必要がある。 例えば、生徒の「数学の点数」と

  • 1