タグ

statisticsに関するsatzzのブックマーク (35)

  • 確率分布曼荼羅 - archief voor stambomen

    Lawrence M. Leemis〈Univariate Distribution Relationships〉 http://www.math.wm.edu/~leemis/chart/UDR/UDR.html 有名な確率分布曼荼羅論文:Lawrence M. Leemis and Jacquelyn T. McQueston 2008. Univariate Distribution Relationships. The American Statistician, Vol. 62, No. 1, pp. 45-53, February 2008 DOI:10.1198/000313008X270448 → pdf に関わる情報は以前に拾い集めた(→「「Univariate Distribution Relationships」- 確率分布曼荼羅」).しかし,元の Lawren

    確率分布曼荼羅 - archief voor stambomen
    satzz
    satzz 2013/06/27
    すごい
  • はてなブログ | 無料ブログを作成しよう

    うめぇヨーグルトソースでもいかがですか。個人差にもよりますが。もしよろしければ。 お久しぶりです。 最近うんめぇ〜と思ってるヨーグルトソースがあるので、書いていこうと思います。 ヨーグルトとハーブ類をもりもり使うので、そういうのがべられない方にはうんめぇソースではないです。ごめんなさい…。もしよろしければお茶だけも…旦~ 【用意する…

    はてなブログ | 無料ブログを作成しよう
  • partial correlation

    偏相関分析について Partial Correlation 兵庫教育大学 成田 滋 updated December 8, 1997 心理・教育のための統計の初歩 データの性質を知ろう データの標準化 母集団の平均値の推定 直線的関連: Correlation 論文の書き方 データの性質と反復測定データ: Repeated Mesurement 共分散分析について 因子分析: Factor Analysis クラスター分析: Cluster Analysis 重回帰分析: Multiple Regression Analysis 偏相関の考え方  実験や調査では、2つの変数間の関係を調べることがしばしばあります。このとき、注目する変数に他の変数がなんらかの影響を与えているのではないか、と考えることが大事です。たとえば、家庭のパ

    satzz
    satzz 2010/10/31
    偏相関分析
  • 計量経済学 - Wikipedia

    また、多次式、指数、対数、ロジスティック方程式は、変数を1次に変形した回帰方程式で表せる。 単係数の有意性[編集] 最後に、単回帰分析によって得られた最小二乗推定量の棄却可否は、最小二乗推定量が定数項と説明変数の数の和を自由度とするt分布に従うことから、T検定によって検定される。帰無仮説で係数を0とするt値が高いほど有意である確率、つまりモデルが棄却される確率であるP値が低くなる。 統計的仮説検定の論理を厳密に辿るなれば、この検定では係数が0か否かを検定しているに過ぎず、たとえ帰無仮説を採択できなくなったとしても、それが係数が他の特定の値であることを支持している訳ではない。対立仮説の設定いかんにより、片側検定・両側検定の違いはあっても、検定していることは0かどうかということだけである。 多重回帰[編集] 説明変数を2つ以上にする場合を多重回帰または重回帰という。 推定量の導出[編集] 重回

    計量経済学 - Wikipedia
    satzz
    satzz 2010/10/25
    同時方程式モデルと連立方程式モデル(SEM)、一般化モーメント法(GMM)
  • SPSエンタープライズ株式会社

    お客様に最大の顧客満足を感じて頂けるよう、最高品質のサービスをご提供致します。常にお客様のニーズに合わせたご提案ができる体制を整えております。他社が実現できないようなお仕事でも、是非一度ご相談下さい。 業務の効率化および無駄な中間マージンを排除することにより、常に業界最安値を実現する仕組みを構築しております。高い品質と安さで、費用対効果の高いサービスをご提供することをお約束いたします。

  • メトロポリス・ヘイスティングス法 - Wikipedia

    出典は列挙するだけでなく、脚注などを用いてどの記述の情報源であるかを明記してください。記事の信頼性向上にご協力をお願いいたします。(2018年12月) 提案分布 Q はランダムウォークの粒子が次に移動する候補点を提案する。 数学や物理において、メトロポリス・ヘイスティングス法(もしくは M-H アルゴリズム)(メトロポリス・ヘイスティングスほう、Metropolis-Hastings algorithm) はマルコフ連鎖モンテカルロ法の一つで、直接的に乱数の生成が難しい確率分布に対し、その確率分布に収束するマルコフ連鎖を生成する手法である。生成されたマルコフ連鎖は、確率分布の近似(ヒストグラム)などの期待値、すなわち積分の近似計算に用いられる。 歴史[編集] このアルゴリズムは1953年にボルツマン分布のための特殊形で発表したニコラス・メトロポリスらによって提案され.[1] 、1970年に

    メトロポリス・ヘイスティングス法 - Wikipedia
  • 生還した戦闘機:シロクマ日報:オルタナティブ・ブログ

    統計の世界では有名な話、らしいのですが、面白いエピソードなのでちょっと。ご存知の方はご勘弁を。 積ん読していた『組織行動論の実学―心理学で経営課題を解明する』を読み終えつつあるのですが、第12章にこんな話が紹介されていました: 第2次世界大戦中、統計学者のエイブラハム・ワルドは、敵からの攻撃に対する戦闘機の脆弱性について調査していた。入手したデータはいずれも、ある部分の被弾頻度が他の部分のそれより過度に多いことを示していた。 当然、軍関係者は、この頻度の多い部分を補強すべきであると結論した。しかし、ワルドのそれはまったく正反対のものだった。いわく、最も被弾の少ない部分を補強すべきである。 彼の意見は、データに内在する選択バイアスを踏まえたものだった。得られたデータは帰還した戦闘機のものばかりである。ワルドは次のように推論した。 致命的な部位に被弾した場合、帰還できる可能性は低くなる。逆に、

    生還した戦闘機:シロクマ日報:オルタナティブ・ブログ
    satzz
    satzz 2010/09/26
    選択バイアスの罠
  • 共分散構造分析

    上のような相関行列をデータとして読み込むための read.moments 関数が、sem パッケージの中に含まれていますので、これを利用します。Rエディタを起動して下のようにデータを入れます。下では、「"酒類"」の次で改行していますが、必ずしも改行の必要ありません。コンパクトな画面で納まるように改行してあるだけです。なお、タブで相関係数間のスペースを開けるとうまく読み込めませんので、スペースキーを押下してスペースを入れるようにします。 「diag=TRUE」は、これがデフォルトになっていますので、なくてもよいのですが、相関行列に対角要素(同じ変数間の相関、つまり1.00ですね)を含んでいることを指定しています。相関行列に対角要素を含めない場合は「diag=FALSE」としておくと、自動的に対角要素が追記されます。 ガン R エディタに入力したら、分析を実行してみましょう(Ctrl+A

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • バランスト・スコアカード - Wikipedia

    バランスト・スコアカード(英: balanced scorecard, BSC、バランス・スコアカードとも)は、ロバート・S・キャプラン(ハーバード・ビジネス・スクール教授)とデビッド・ノートン(コンサルタント会社社長)が1992年に「Harvard Business Review」誌上に発表した業績評価システムである。 概要[編集] この概念は、従来の財務的指標中心の業績管理手法の欠点を補うものであり、戦略・ビジョンを4つの視点(財務の視点・顧客の視点・業務プロセスの視点・学習と成長の視点)で分類し、その企業の持つ戦略やビジョンと連鎖された財務的指標、及び非財務的指標を設定する必要がある。 なお、このバランスト・スコアカード(BSC)の概念は、業績評価システムから出発し、経営者情報システムとして発展した後、キャプラン/ノートンの最新著作においては、戦略的経営システムとして位置付けられてい

  • Rで共分散構造分析・構造方程式モデル - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですgraphviz による出力 † path.diagramコマンドの出力したGraphviz用シンタックスを読み込んで描画。 ↑ Macintoshでの実行例 † 小島隆矢 「Excel で学ぶ共分散構造分析とグラフィカルモデリング」 Ohmsha の第4,5章で取り上げられているカメラの満足度についてのデータを分析してみた。 図を日語で描くことにする。 camera <- structure(list(小型軽量 = c(3, 5, 2, 4, 4, 5, 1, 1, 4, 4, 5, 2, 5, 1, 2, 4, 1, 5, 2, 2, 4, 3, 5, 5, 4, 3, 2, 1, 3, 2, 4, 4, 2, 5, 2, 1, 1, 2, 2, 2, 2, 3, 2, 4,

  • リサーチソリューション:SEM(共分散構造分析) - Yahoo!リサーチのヤフー・バリューインサイト

    多くのマーケティング担当者は「自社の商品が売れていない」「他社の商品が売れている」などの場合に、その原因をロジックとして整理し、それをツリーなどの形状にまとめあげたことがあるはずです。モノが売れる仕組みは通常それほど単純なものではありませんから、時にそのようなロジックはさまざまな要因を含んだ複雑なものになってしまうかもしれません。 しかし、そのようにして組み立てたロジックは1つの仮説に過ぎません。企業の意思決定を促すには、組み立てた仮説を客観的に検証する必要があるでしょう。従来の分析では「AならばBである」というシンプルなロジックを検証することは可能でしたが、さらに複雑な要因を持ったロジック、例えば「Aの原因としてBとCの2つがある。BはさらにDとEに影響し、CはFとGに影響する。さらにFとGがCより影響を与えられる度合いには男女間で差がある」といった複雑な関係を検証したい場合には、従来

  • K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

    K-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点で、不適切な初期値選択をすると間違った解に収束してしまいます。 以下は、Introduction to Information Retrievalの16章に出てくる例です。 {d1, d2, ..., d6}をK=2でクラスタリングする場合、{{d1, d2, d4, d5}, {d3, d6}}が大域最適解ですが、初期クラスタの中心をd2, d5で与えると、{{d1, d2, d3}, {d4, d5, d6}}という誤った解に収束してしまいます。 この問題を改善するK-means++という手法を見つけたので、試してみました。 K-means+

    K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ
  • Rを使って植生調査のデータを分類する方法 - 自然環境保全のための周辺技術

    植生調査のデータを組成表としてまとめ、Rを使って組みかえて、 植物群落と標徴種を見つける方法を紹介します。 ※実際には、植物の性質を基に、手作業で再調整する必要があります。あくまで、その手助けということで。 データの準備 地点名と出現種と、その優占度(被度など)の一覧表を用意しておきます。(EXCELとかで作業) 複数の層で出現する種は、その最大値、合計、平均とかを採用する。(自分で決めて下さい) 被度を、r,+,1〜5で記録している場合は、rと+→0.1,1→2.5,2→15,3→37.5,4→62.5,5→87.5に変換する。(被度の百分率表示) 例 "組成表.csv" st1 st2 st3 st4 st5 st6 st7 st8 st9 st10 ヒメヒラテンツキ 62.5 87.5 イネ 62.5 87.5 ダンドボロギク 37.5 15 ヒメヘビイチゴ 2.5 2.5 0.1

    Rを使って植生調査のデータを分類する方法 - 自然環境保全のための周辺技術
  • 平成18年社会生活基本調査(総務省統計局)

    社会生活基調査は,日々の生活における「時間のすごし方」と1年間の「余暇活動」の状況など,国民の暮らしぶりを調査(5年ごと)し,高齢社会対策,少子化対策,男女共同参画に関する施策等の基礎資料として利用されています。 の項目は,政府統計の総合窓口「e-Stat」掲載の統計表です。 ※ 『e-Stat』とは? 調査の概要

  • Rの基本パッケージ中の多変量解析関数一覧 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですR の多変量解析オブジェクトの簡易説明 R の基パッケージ stats には、階層的クラスタリング、 主成分分析、因子分析、正準相関、多次元尺度法等の古典的多変量解析手法用の関数がある。 もう一つの代表的手法である判別分析用の関数は、代表的なアドオンパッケージである VR 中に含まれる MASS パッケージに、線形判別分析、二次判別分析用の関数がある。 VR パッケージは R には標準では含まれていないので、ネット経由 でダウンロードし、 独自にインストールする必要がある。

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • 外的基準のある多変量解析

    2つ以上の説明変数の1次式によって1つの基準変数の値を予測する際に用いられる統計手法。 説明変数も基準変数も量的変数である場合に用いられる。

  • 重回帰分析について質問です。 基本的には、R^2(決定係数)が高くなるように独立変数をどんどん追加していくべきなのでしょうか?…

    重回帰分析について質問です。 基的には、R^2(決定係数)が高くなるように独立変数をどんどん追加していくべきなのでしょうか? 独立変数を増やしすぎると、分析に使用しているデータに対しての当てはまり度合いは高くなるけれども、特定データの特徴を反映しすぎるので、他のデータに対しての当てはまり度合いが逆に低下してしまうと聞いたことがあります。 R^2がどれくらいの値になればよいのでしょうか?

  • R: Plot the Mallows Cp