タグ

か回帰分析に関するmidnightseminarのブックマーク (16)

  • Rで非線形制約条件付非線形最適化を行う方法 by Rsolnp −2 - My Life as a Mock Quant

    ↓導入の記事はこちら http://d.hatena.ne.jp/teramonagi/20091217/1261048574 簡単な例題を通して動作を確かめんとす。 library(Rsolnp) #(x,y)=(1,2)で最小値をとるような凸関数 objectiveFunc <- function(x_) { return(sum((x_-c(1,2))^2)) } #決定変数のスタート値 x0 <- c(100,100) #最適化 solution <- solnp(x0,fun = objectiveFunc) #結果出力 print(solution) これを走らせると最後のprint分から > print(solution) $pars [1] 1 2 $convergence [1] 0 $values [1] 1.940500e+04 4.909325e-11 1.1498

    Rで非線形制約条件付非線形最適化を行う方法 by Rsolnp −2 - My Life as a Mock Quant
  • Rでパラメータ制約付き非線形最適化とパラメータ制約付の最小二乗法とロジスティック回帰(カテゴリカルデータ、質的データ) - arupaka-_-arupakaの日記

    Rでパラメータ制約付非線形最適化 Rsolnpパッケージをもちいる。 Rで非線形制約条件付非線形最適化を行う方法 by Rsolnp http://d.hatena.ne.jp/teramonagi/20091217/1261048574を参考に とりあえず最小二乗法でためす. library(Rsolnp) #答えと問題のデータを作成 #y=5*x1-8*x2-3*x3 a1<-5 a2<--8 a3<--3 x1<-rnorm(1000,mean=0,sd=1) x2<-rnorm(1000,mean=0,sd=1) x3<-rnorm(1000,mean=0,sd=1) y<-a1*x1+a2*x2+a3*x3+1*rnorm(1000,mean=0,sd=1) ###最小二乗法の目的関数 eq1 <- function(x) { a1<-x[1] a2<-x[2] a3<-x[3]

    Rでパラメータ制約付き非線形最適化とパラメータ制約付の最小二乗法とロジスティック回帰(カテゴリカルデータ、質的データ) - arupaka-_-arupakaの日記
  • 重回帰分析で標準化回帰係数βを出力するR関数 - こにしき(言葉・日本社会・教育)

    今回のRに関する記事はマジメです。役に立つ人には多少は役に立つかもしれません。 Rのデフォルト関数で、標準化回帰係数を出力してくれるものはないよう。 独立変数がすべて量的変数ならたとえば、scale() などを介すことで簡単に計算できます。 しかし問題になるのは、名義尺度などの変数です。Rの lm(), glm() では名義尺度が含まれていた場合、自動的にダミー変数化して計算してくれますが、標準化回帰係数を計算するうえでは問題が起こります。 たとえば、標準化回帰係数を出力するとうたう lm.beta()関数が {QuantPsyc}パッケージにありますが*1、僕の理解が間違っていなければ、プログラムにミスがあります。これを名義尺度が含まれる回帰分析に適用すると、おそらく計算がおかしくなるはず(理由は後述)。 lm.Beta() とまれ修正版をつくってみました。 lm.Beta <- fun

    重回帰分析で標準化回帰係数βを出力するR関数 - こにしき(言葉・日本社会・教育)
  •  回帰診断ってみんな何使ってる?不均一分散(heteroscedasticity)の話 - kingqwertの覚書

    統計, 研究, R 回帰をした後、どのようにしてその回帰の正当性などを診断していますか?まぁ、普通は修正R^2やAICみたいなものでその当てはまり具合なんかを見ますよね? 今回は、不均一分散の診断の話をしようと思っています。不均一分散が存在する場合にもOLS推定量は最良ではないが線形かつ不偏ですよね。したがって、OLSするのは最良ではないにしてもまぁOKなんじゃない?一次接近としてOLS扱えばいいんじゃね?ってことはたまにあります。決して悪いアイディアではないと思います。 しかし!不均一分散を無視して誤差の分散や残差二乗和などを計算するなら、当然間違った帰結が得られる可能性があります。特に、OLSによる係数の標準誤差は過小評価される場合が多くなり、その結果、係数のt検定を行うと来有意でないものも有意としてします傾向があることがあります。 以上より、自分のモデルが不均一分散かどうかを確認す

  • [PDF]回帰分析のモデル検査

    2011/6/22 M2   “ 1* 1+ 2* 2 ”        7 9             2 F        1.0 1.5 2.0 2.5 3.0 3.5 4.0 0.0 0.2 0.4 0.6 0.8 Y 0 50 100 150 200 250 0.000 0.002 0.004 0.006 0.008 0.010 0.012 YY -5 0 5 10 0.00 0.05 0.10 0.15 X Y YY X A (Y = X + eA) B (YY = X + eB)  A (Y = X + eA) B (YY = X + eB) -5 0 5 10 0 50 100 150 200 250 X YY -5 0 5 10 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X Y     0 (

    midnightseminar
    midnightseminar 2013/12/30
    回帰分析の前提が満たされているかどうかの検査方法。
  • パッケージユーザーのための機械学習(2):ロジスティック回帰 - 渋谷駅前で働くデータサイエンティストのブログ

    (※はてなフォトライフの不具合で正しくない順番で画像が表示されている可能性があります) だらだらと機械学習をパッケージで回していく様子を眺めるこのシリーズ、今回はロジスティック回帰をやってみようと思います。ロジスティック回帰はどちらかというとGLM(一般化線形モデル)なんですが、はじパタでもPRMLでも線形識別関数の1カテゴリとして取り上げているので、一応取り上げることに。 今回はごくごくありふれた機械学習と等価なGLMとしてのロジスティック回帰ということで、二値及び多項分類の場合のみ取り上げます。なお、ロジスティック回帰を含むGLMそのものについてはこの辺の過去記事を参照のこと。 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 東京で働くデータサイエンティストのブログ*1 「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 東京で働く

    パッケージユーザーのための機械学習(2):ロジスティック回帰 - 渋谷駅前で働くデータサイエンティストのブログ
    midnightseminar
    midnightseminar 2013/12/07
    Rでロジスティック回帰
  • http://cse.niaes.affrc.go.jp/kadosawa/stat/text/kadosawa_07.pdf

  • 単回帰分析

    ★新サイト完成しました! 3秒後に自動的に移動します 変わらない方は こちらからどうぞ http://logics-of-blue.com/%E5%8D%98%E5%9B%9E%E5%B8%B0/ 単回帰モデルを使った簡単な予測モデルのプログラ ムソースコードを展示しています。 回帰 モデルの組み立て方から信頼区間や予測区間の求め方まで。 回帰分析って線を引っ張る以外のこともできるんですね。 単回帰分析とは 回帰分 析とは、一言で言ってしまうとデータの散布図に線を引っ張るメソッドですね。Excelなどでもやったことのある方は多いはず。 しかし、信頼区間を求めようと思ったら、Excelではとたんに面倒な計算をする羽目になってしまいます。Excelでは線を引っ張っておしまいなとこ ろを、Rをつかってもうちょっとマシな予測を出してみます。 サンプルデータ 下手に物のデータを使うと著作権が怖いの

    midnightseminar
    midnightseminar 2013/11/29
    Rの単回帰分析の基本の説明としては実はすごく分かりやすい。信頼区間、予測区間の推定も。
  • エクセルを利用した回帰分析の手順

    4.回帰係数の95%信頼区間は 0.094825~0.390375 となりました。 回帰係数の検定はt値が3.368458なので、回帰を求めるために使用したデータ数が29から、自由度は27、t(27, 0.01)=2.771なので、1%水準で回帰係数は有意であることがわかりました。P-値をみても0.002287と0.01より小さいので同じことがいえます。 5.回帰分析による区間推定 1月の気温として5℃を与えたときに、7月の平均気温はどうなるかは、回帰式に代入すると求められます。 22.42356+0.2426×5=23.63656 計算結果から23.6℃となりました。 95%信頼区間を求めてみましょう。まず分散分析の結果から残差の分散をみつけます。17.4724とあります。これが誤差分散Veとなります。回帰を求めるのに使ったデータ数は29、誤差の自由度は29-2=27となります。Sxxは

    midnightseminar
    midnightseminar 2013/11/29
    区間推定のやり方の基本的な式が乗っている。
  • R-Source

    回帰分析を行なうために以下の関数が用意されている. lsfit() : 最小二乗法による回帰を行う. lm() : 線形モデルによる回帰を行う glm() : 一般線形モデルによる回帰を行う ここで対象となるモデルは以下のような線形モデルである. 上式をベクトル表記すると y = Xb + e となる.このときの y は応答ベクトル,X は説明変数のベクトル(モデル行列)で,x0 は切片項(要素が全て 1 である列ベクトル)となっている. 回帰分析と重回帰分析 関数 lm() により線形モデルの当てはめを行うことが出来る.この関数により,回帰分析や分散分析,そして共分散分析を行うことが出来る. 詳しい解説は『工学のためのデータサイエンス入門』(間瀬・神保・鎌倉・金藤 共著,数理工学社) を参照のこと.分散分析や非線形回帰についても詳しい解説が載っている. 関数 lm() の書式と引数 書式

  • Rで線形単回帰分析 - matsuou1の日記

    次回のTokyo.Rの開催が近づいてきたので、前回の復習を兼ねてRで回帰分析をやってみます。 今回は最も単純な線形単回帰分析を行います。 回帰分析の流れ 回帰式を求める意義があるか検討する(説明変数と目的変数のグラフを作成する等) 回帰式を求める 回帰式の精度を確認する 回帰係数の検定を行う 信頼区間と予測区間を求める 回帰式を求める意義があるか検討 無相関なデータに対しても、数学的には回帰式が求められるため、検討しておくことは重要です。 データはマンガでわかる統計学 回帰分析編のデータを使用してみます。 ある喫茶店のアイスティーの売り上げとその日の最高気温についてのデータです。 > norns temperture icetea 8/22 29 77 8/23 28 62 8/24 34 93 8/25 31 84 8/26 25 59 8/27 29 64 8/28 32 80 8/2

    Rで線形単回帰分析 - matsuou1の日記
    midnightseminar
    midnightseminar 2013/11/29
    分かりやすい。
  • Rと重回帰分析

    まず、次のようにR上でデータセットを作成する。もちろん、単回帰で用いたデータセットに1列(ウエスト)を付け加える方法で作成することもできる。 >体重<-c(50,60,65,65,70,75,80,85,90,95) >身長<-c(165,170,172,175,170,172,183,187,180,185) >ウエスト<-c(65,68,70,65,80,85,78,79,95,97) > taikei2<-data.frame(体重,身長,ウエスト) > taikei2 体重 身長  ウエスト 1    50  165       65 2    60  170       68 <後略> まず、データの変数間の関係を考察するため、相関行列と対散布図を求める。相関は関数corを用いて求める。 > round(cor(taikei2),4) 体重   身長 ウエスト 体重     1.

    Rと重回帰分析
    midnightseminar
    midnightseminar 2013/11/28
    Rでの重回帰分析
  • 単回帰出力結果の読み方 - hnami.net_Pukiwiki

    2014-06-19 SandBox 2014-04-15 microexam 2013-05-11 DCIO 2013-03-15 game2013 2013-03-08 MCmicro 2012-09-18 game2010 2012-02-17 microexamold microexam2010 2011-04-19 appmicro 2011-01-04 semielemental2 2010-04-01 kihonmicro 2009-06-01 radvance 2009-05-17 AICを使った変数選択 step02 step01 stepaiccsv FrontPage 2009-05-13 ロジット分析とプロビット分析 2009-05-10 赤池の情報量基準 2009-05-05 時系列データ分析(2) 単回帰の出力結果 † 次のスクリプトを実行してみましょう。これは

    midnightseminar
    midnightseminar 2013/11/28
    Rでの単回帰分析のやり方。
  • http://hnami.or.tv/d/index.php?%C3%B1%EF%BF%BD%F3%B5%A2%BD%EF%BF%BD%EF%BF%BD%CF%B7%EF%BF%BD%EF%BF%BD%CC%A4%EF%BF%BD%EF%BF%BD%C9%A4%EF%BF%BD%EF%BF%BD%EF%BF%BD

    midnightseminar
    midnightseminar 2013/11/28
    Rでの単回帰分析
  • 心理統計の注意点:重回帰分析についての注意点

    重回帰分析について 1.単回帰・重回帰分析における基的な注意点 単回帰分析とは,ある従属変数を1つの独立変数で予測するための分析で,独立変数が2つ以上の場合は重回帰分析となります.以下両者を回帰分析と呼びます.具体的にどのような数式で求められるかなどに関しては,ある程度分かっているものとして,この節ではその使用上の実際的な注意点などに触れていきたいと思います. 回帰分析で最も押さえておかなければならないポイントは,変数間の「相関関係」(正確には分散と共分散)によって回帰係数が決定されているという事実です.つまり質は「相関係数(の関数)」なのです.独立変数,従属変数を標準化した上で算出される回帰係数を標準回帰係数といいますが,単回帰分析の場合,これはまさに独立変数と従属変数の相関係数そのものです.重回帰分析によって算出される(標準)偏回帰係数も,独立変数と従属変数,そして独立変数間の相

    midnightseminar
    midnightseminar 2013/11/10
    重回帰分析の性質の解説として分かりやすい。交互作用を検討する場合の問題についても書いてある。
  • 1.重回帰分析で交互作用? - kazutan on web 前田和寛のウェブサイト

    midnightseminar
    midnightseminar 2013/11/10
    重回帰分析で、交互作用項を設ける方法。
  • 1