タグ

統計に関するstranger2exのブックマーク (27)

  • 統計ソフトRの「困った」を解決する12(+α)の方法|Colorless Green Ideas

    はじめに Rの「困った」 現在、統計処理ではRというソフトがよく使われている。Rは高機能であり、初心者から上級者まで使うことができる。とは言っても、Rに取りかかるのはなかなか難しい。テレビ洗濯機といった家電製品を買ったならば、紙の説明書が付いてくるので、とりあえずそれを見れば、最初の使い方も分かるし、困ったときにどうすれば良いか分かる。Rのようなソフトウェアではそうはいかない。「困った」を解決してくれる紙の虎の巻 [1] は付いてこない。また、メーカーのサポートが付いた商品なら、メーカーに問い合わせるという手段もあるが、フリーソフトのRではそうもいかない。 結局、Rで何か「困った」ことが起きた場合、自分で色々と調べなくてはならない。こう言うと、Rは大変そうだと思う人もいるかもしれない。だが、主にインターネットを通じて、Rの説明書代わりのさまざまな情報が提供されている。 この記事では、「コ

  • CatTail Wiki*

    2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0  ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x

    CatTail Wiki*
  • R: Kruskal's Non-metric Multidimensional Scaling

  • http://www.okada.jp.org/RWiki/?%BD%E9%B5%E9%A3%D1%A1%F5%A3%C1%20%A5%A2%A1%BC%A5%AB%A5%A4%A5%D6(7)

  • 主座標分析について簡単に紹介するよ! - ほくそ笑む

    今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです

    主座標分析について簡単に紹介するよ! - ほくそ笑む
  • 多次元尺度構成法

    

  • 多次元尺度構成法イントロダクション - kohta blog

    ちょっと多次元尺度構成法について理解する必要があったので簡単なまとめです。 多次元尺度構成法とは、多数の多次元点間の距離データのみが与えられたときに、その距離を再現するような空間(座標系)を逆算する手法です。(多次元)座標値が与えられれば距離は自由に計算できますが、距離だけが与えられた場合に座標値を計算するのは直感的には中々できません。 今、n個の点がありそれぞれの点間の個の距離がデータとして与えられたとします(はゼロです)。空間の次元をqとし、未知のn個の座標ベクトルを、それらを縦に並べた行列を とします(tは転地記号)。また、点間の距離はユークリッド距離 とします。 ここで という行列を考えます。もし何らかの形で距離データからBを求めることができれば、Bを対角化し固有値の平方根をとることで、を求めることができます。の成分は (a) であり、距離行列の成分と比べて次のような関係にあること

    多次元尺度構成法イントロダクション - kohta blog
    stranger2ex
    stranger2ex 2012/10/11
    この手法の数学的に理解したい人向け.データの相関する様子が見れる空間を近似するための,プロセスを理解するには実際に手を動かす必要がある. Rでの簡単な実行法もかいてる.
  • MDS PAGE

    MDS (Multi Dimensional Scaling) page Welcome to MDS page! MDS page is the place where researchers who are interested in research of MDS can exchange their informations, e.g., paper, home page, and, addresses. You can join us if you are interested in research of MDS! Our NMDS module You can freely download our NMDS module. It is written with Fortran code. See README for detail. Source code is avail

    stranger2ex
    stranger2ex 2012/10/11
    多次元データの可視化のページ
  • 多次元尺度構成法 - Wikipedia

    多次元尺度構成法(たじげんしゃくどこうせいほう、MDS:Multi Dimensional Scaling)は多変量解析の一手法である。主成分分析の様に分類対象物の関係を低次元空間における点の布置で表現する手法である(似たものは近くに、異なったものは遠くに配置する)。古典的MDSは主座標分析 (Principal Coordinate Analysis; PCoA) とも呼ばれ、さらに主座標分析において距離にユークリッド距離を用いた場合は主成分分析と等価になる。 例 - 1973年のアメリカ50州の人口10万人あたりの殺人、暴行、レイプの犯罪数、及び、都市人口の割合[%]の4つの要素から似た州は近くに置くように2次元空間に配置した結果。

    多次元尺度構成法 - Wikipedia
  • 統計WEB - 統計学、調べる、学べる、BellCurve(ベルカーブ)

    ブログ 2023/12/8 【2023年版】プロ野球のドラフト会議で最もくじ運のいい球団は? 2023年のドラフト会議が2023年10月26日に行われ、1位指名する選手を巡ってくじ引きが行われました。 2023年は4年ぶりの有... 詳しく見る ブログ 2023/12/4 2023年11月の統計WEBのページビュー数 2023年11月は、144万PVとなりました。昨年同月比で 93.0% となっています。 2021年12月から2023年11月までの2年間について... 詳しく見る 書籍紹介 2023/3/29 文系の私に超わかりやすく統計学を教えてください! 『マンガでわかる統計学』シリーズの著者、高橋信先生が執筆した教養書です。 リスキリングの潮流の中で、教養のひとつとし... 詳しく見る 書籍紹介 2023/2/9 マンガでわかる統計学 統計学を勉強するための取っ掛かりとしてはとても良

    統計WEB - 統計学、調べる、学べる、BellCurve(ベルカーブ)
    stranger2ex
    stranger2ex 2012/07/06
    検定に困ったらココ
  • 2行2列クロス集計表の統計量の計算フォーム | ブログ | 統計WEB

    関連記事 カッパ係数─エクセル統計による解析事例 2017/04/19 ※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図は、ある製品につい... 続きを読む m行n列クロス集計表の統計量の計算フォーム 2017/08/08 m行×n列のクロス集計表について、クロス集計表の行と列の関連の程度を表す統計量を計算します。クロス集計表の各セルに度数を... 続きを読む カテゴリー 統計検定 Tips 解析事例 エクセル統計 公認会計士(統計学) スポーツ エンタメ 統計調査 数理統計 コラム「統計備忘録」 アクセス解析 修正履歴・追加履歴 お知らせ

    stranger2ex
    stranger2ex 2012/07/06
    Cohen's Kappa の計算できるWeb Form
  • 統計備忘録 | ブログ | 統計WEB

    ※コラム「統計備忘録」の記事一覧はこちら※ Wikipediaによると、変数の尺度を名義、順序、間隔、比例の4つに分けようと提案したのはスタンレー・スティーブンズ(Stanley Smith Stevens)。1946年にサイエンス誌に発表された"On the theory of scales of measurement"という論文でとのことです。 尺度の違いは当サイトの統計用語集でも読んでいただ... ※コラム「統計備忘録」の記事一覧はこちら※ 統計学のを読んでいると、によって、「変量」という語を使っていたり、「変数」を使っていたりする。文脈からすると同じ意味として使われているようなので、以前はどちらも variable の訳語かと思っていた。このようなコラムを書いていることから気になって調べてみると、竹内啓先生が編集委員代表を務... ※コラム「統計備忘録」の記事一覧はこちら※

    stranger2ex
    stranger2ex 2012/07/06
    第53話   「2人の鑑定結果 - カッパ係数による一致度の計算」第54話   「重み付きカッパ係数 - 順序尺度の場合のカッパ係数」
  • カッパ係数

    カッパ係数 (自由回答,インタビューなどの分類の信頼性,一致度) ファイルは,www.mizumot.com/stats/kappa.xlsにあるので計算式を確認してください。 【例】 3クラス(80人)で中間テスト2週間前から,生徒に学習日記をつけるように指示しました。 その日記の自由記述で自宅での学習に関する内容は,以下の3つに分類できると考えられました。 A - テスト以外の目的のための学習 B - どちらにも当てはまらない C - テストのための学習 この分類を確認するために,25%*の生徒(n = 20)の日記をランダムに選択し, この分類の一致度を確認するための信頼性を計算するにはどうしたら良いでしょうか? 以下の形でデータを入力します。 このような信頼性は,単純に分類を行った2人の分類の一致度を報告する場合も多いですが, Cohen’s Kappa(カッパ係数)と呼ばれるもの

  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
  • Rを使って統計学をより快適なものに!!

    ■入門編 ☆初心者のためのRの超簡単な使い方 ☆データを用意する ― 外部データの読み込み・ベクトルと行列の操作を覚えましょう ☆自分で関数を作ってみる ― 簡単なプログラミングのルールを学びましょう ☆ExcelとRの間でデータのやり取りをするときに便利なテクニック ☆データフレームの作成と編集 ■推定・検定・多変量解析 Rについて データの標準化 カイ二乗検定 t検定 分散分析 相関係数 回帰分析 判別分析 正準相関分析 主成分分析 因子分析 クラスター分析 非階層的クラスター分析 数量化�T類 母分散の区間推定 ロジスティック回帰分析 ロジスティック回帰分析(説明変数が2個以上) 多項式モデルの回帰分析 対数線形モデルの回帰分析 2の回帰直線の比較(傾きの検定) ■グラフィックス関連 正規分布のグラフ カイ二乗分布のグラフ F分布のグラフ t分布のグラフ いろいろな棒グラフ 5 e

  • コレスポンデンス分析とは|市場調査・アンケート調査のマクロミル

    コレスポンデンス分析 コレスポンデンス分析(対応分析、コレポンと短縮して呼ばれることもあります)は、数量化3類と同様の手法です。 ただし、その歴史と背景が異なります。数量化3類は林知己夫氏によって1952年に着想されましたが、コレスポンデンス分析は、その10数年後に、フランスのベンゼクリ氏によって提案されました。また、1980年代に西里静彦氏によって双対尺度法が提案されていますが、こちらも同様の手法です。 以上の手法は、その発展過程や適用分野の違いなどのため、対象とするデータの形に若干の違いがあります(多変量解析の基礎知識2-3.参照)が、基の考え方は同じです。 コレスポンデンス分析の基の考え方は、行列(分割表)において、行項目と列項目の相関が最大になるように、行と列の双方を並び替えることです。この場合の行列は、データシート、クロス集計表など、第1行(表頭)と第1列(表側)に注目す

    stranger2ex
    stranger2ex 2012/05/10
    コレスポンデンス分析
  • 多変量解析の基礎知識:リサーチソリューション | マクロミル

    アンケートの作り方|5つの作成ステップやサービスの改善につなげるコツも解説 アンケートは顧客や消費者の率直な意見が得られるため、商品やサービスの質の向上や改善につなげられます。目的やターゲットなどに応じてアンケートを作り、回答の質を高める工夫を行いましょう。この記事では、アンケートの作成方法や回 […] エントリーコラム お客様アンケートで顧客満足度を上げるには?アンケートの手法や目的についても解説 お客様アンケートを実施すると、顧客満足度の向上や品質改善が期待できます。この記事では、顧客満足度を上げたい人のために、お客様アンケートのポイントや回答率を上げるための方法を解説します。顧客満足度の向上が期待できるお客様ア […] エントリーコラム

    多変量解析の基礎知識:リサーチソリューション | マクロミル
    stranger2ex
    stranger2ex 2012/05/10
    多変量解析,コレスポンデンス分析
  • 次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる

    The Top Three hottest new majors for a career in technology : Microsoft JobsBlog マイクロソフトの採用活動などを記しているブログ「Microsoft JobsBlog」に8月23日付けでポストされたエントリ「The Top Three hottest new majors for a career in technology」(テクノロジー分野でもっとも熱い、3つの専門性とは)では、長期的に見て次の3つがホットな分野だと挙げられています。 Data Mining/Machine Learning/AI/Natural Language Processing (データマイニング/機械学習人工知能/自然言語処理) Business Intelligence/Competitive Intelligence (ビジ

    次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • WIKIWI

    Wikiwiの使い方 Developed by Minoru Yoshida Research by Minoru Yoshida, Takashi Ichii, Takashi Kawachi, and Hiroshi Nakagawa このシステムは以下のデータを利用して構築されています。 ■日語版ウィキペディア Text is available under GNU Free Documentation License.