サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
中東情勢
bellcurve.jp
統計学の時間 統計学の基礎から応用までを丁寧に解説しています。「Step1. 基礎編」は、大学で学ぶ統計学の基礎レベルである統計検定®2級の範囲をほぼ全てカバーする内容となっています。最後まで読み進めることで、統計検定®2級に合格できる力がつくことを目標にしています。 学習ページは、数式ばかりではなく具体例を多数掲載し、はじめて統計学を学ぶ方にもイメージしやすい内容になっています。学習ページで勉強した後は、練習問題で腕試しができます。練習問題のすぐ下に解説を掲載していますので、理解度をすぐに確認することができます。 一通り勉強して知識が身に着いたら、実際に統計検定®を受験するのがオススメです。 統計WEBでは、統計検定®の受験者を応援しています! ※統計WEBを使って統計検定®に合格された方の『合格者の声』をブログに掲載しています。こちらからご覧ください。 Step0. 初級編 1. デー
ブログ 2023/12/8 【2023年版】プロ野球のドラフト会議で最もくじ運のいい球団は? 2023年のドラフト会議が2023年10月26日に行われ、1位指名する選手を巡ってくじ引きが行われました。 2023年は4年ぶりの有... 詳しく見る ブログ 2023/12/4 2023年11月の統計WEBのページビュー数 2023年11月は、144万PVとなりました。昨年同月比で 93.0% となっています。 2021年12月から2023年11月までの2年間について... 詳しく見る 書籍紹介 2023/3/29 文系の私に超わかりやすく統計学を教えてください! 『マンガでわかる統計学』シリーズの著者、高橋信先生が執筆した教養書です。 リスキリングの潮流の中で、教養のひとつとし... 詳しく見る 書籍紹介 2023/2/9 マンガでわかる統計学 統計学を勉強するための取っ掛かりとしてはとても良
Excelを用いて統計グラフを作成する手順や統計量を計算する手順、ブラウザ上で値を入力して統計量を出力する自動計算フォームを掲載しています。 統計グラフ自動作成Excelシート 箱ひげ図自動作成Excelシート Excelによる統計グラフの作り方 正規分布曲線のグラフの作り方 カイ二乗分布曲線のグラフの作り方 箱ひげ図の作り方(棒グラフ編) ヒストグラムの作り方 人口ピラミッドグラフの作り方 ラベル付き散布図の作り方 縦方向の折れ線グラフの作り方 正規確率プロットの作り方 エラーバー(誤差範囲)付き棒グラフの作り方 エラーバー(高低線)付き折れ線グラフの作り方 Excel関数の使い方 行列の転置・積・逆行列・行列式の計算方法 重複を除いてデータの件数を求める方法 複数の条件を満たすデータの件数を求める方法 必要なサンプルサイズの計算フォーム 母比率の区間推定 母平均の区間推定 Excelに
Excel の棒グラフを用いて箱ひげ図を作成する方法を紹介します。 棒グラフを用いて箱ひげ図を自動作成するExcel シートのダウンロードはこちら → 箱ひげ図自動作成Excelシート 概要 箱ひげ図とは、データの分布やばらつきをわかりやすく表現するための統計学的グラフです。長方形の箱とその両端から伸びるひげで表現されることからこのような名前が付けられています。 箱ひげ図は、データの母集団の確率分布のタイプに関わらず、データの分布を表現することができます。 このページでは、最小値、第1四分点、中央値、第3四分点、最大値を用いて下図のような箱ひげ図を作成します。手順は1から15まであります。 データの作成 1. 下図のデータは、2010年のセ・リーグの6球団の100打席以上の選手の打率です。このデータを用いて箱ひげ図を作成します。 ※ 参照:プロ野球データFreak 箱ひげ図データの作成 2
Excel のグラフを用いて正規分布曲線を作成する方法を紹介します。 概要 正規分布曲線は次の式で表されます。 ここで、は平均、は標準偏差を表しています。(は「ミュー」、は「シグマ」と読みます。)正規分布曲線の形は平均と分散の値によって変わります。 また、平均が0、分散が1の正規分布を特に標準正規分布と言います。標準正規分布は以下の式で表されます。
Excel のグラフを用いて人口ピラミッドグラフを作成する方法を紹介します。 概要 人口ピラミッドグラフは、各国の人口構成を表すのに用いられるグラフです。これから紹介する方法を用いて下図のような人口ピラミッドグラフを作成します。手順は1から15まであります。 データの作成 1. 下図のデータは、統計局ホームページ/人口推計に掲載されている平成20年3月時点での日本人の人口構成です。このデータを用いて人口ピラミッドグラフを作成します。
「95%信頼区間」とは、「正規分布に従う母集団から標本を取ってきてその平均から95%信頼区間を求めた時に、その区間の中に95%の確率で母平均が含まれる」という意味だと思う人がいるかもしれませんが、これは間違いです。 母平均は決まった値(定数)であり、確率的に変化することはありません。つまり、算出された信頼区間に母平均が「含まれる」か「含まれない」かのどちらかしかありえません。したがって、「母平均が、95%の"確率"で推定した信頼区間に含まれる」と言うことはできません。 正しくは、「母集団から標本を取ってきて、その平均から95%信頼区間を求める、という作業を100回やったときに、95回はその区間の中に母平均が含まれる」という"頻度"もしくは"割合"を意味します。 例えば日本人全員の平均身長(=母平均)が170cmであるとします。このときに、ランダムに選ばれた100人の身長から95%信頼区間を
重複を除いてデータの件数、すなわちデータの種類を、Excel の関数を用いて求める方法を紹介します。 概要 ここでは、以下のような動物の名前が入力されたセル範囲を対象に、動物が何種類含まれるかを調べます。 「データの種類を求める」という関数そのものはありませんが、複数の関数を組み合わせることでデータの種類を求めることができます。その方法として2つの方法を紹介します。 方法1 SUMPRODUCT関数とCOUNTIF関数を用いて求めます。
誤差(:デルタ) サンプル比率が母比率に対して上下何%の範囲内に収まって欲しいかを表します。 信頼度() 例えば、誤差を5%、信頼度を90%としたとき、これは100回中90回は サンプル比率と母比率との差が±5%の範囲内に収まることを意味します。 母比率() 母集団に含まれる、ある条件を満たす対象の比率です。母比率の予測が困難な場合は50%とすると最も安全なサンプルサイズを求めることができます。 サンプルサイズ 母比率の区間推定は以下の式で行われます。
統計用語集 約600個の統計学に関する用語を説明しています。用語の説明に加え、数式や図表を掲載し、わかりやすさを重視しています。PCで表示した場合には、数式のLaTexのソースコードを確認することができます。また、関連するExcel関数や弊社製品への搭載状況も確認できます。統計学のポータブル辞書としてご活用ください。 以下の索引をクリックするとその行の用語とその説明が表示されます。 ア行カ行サ行タ行ナ行ハ行マ行ヤ行ラ行ワ行英字記号 ア行 (ア) 赤池情報量規準 アドホック調査 アフター・コーディング アンケート (イ) イェーツの補正 / イェーツの連続修正 異常値 一元配置分散分析 一元配置変量モデル 一次関数変換 一様分布 一致性 一対比較 一般化Wilcoxon検定 一般化線形モデル 一般線形モデル 移動平均法 因子得点 因子の回転 因子負荷量 因子分析 陰性的中率 / 陰性的中度
Excel のグラフを用いてラベル付き散布図を作成する方法を紹介します。 概要 ラベル付き散布図は、各プロットに名前などのラベルを配置した散布図です。これから紹介する方法を用いて下図のようなラベル付き散布図を作成します。手順は1から8まであります。
Excel の関数を用いて複数回答を集計する方法を紹介します。なお、ページ下部で解説に用いたExcel ファイルをダウンロードすることができます。 概要 複数回答形式の質問では、回答者があてはまると思う選択肢が複数選ばれます。回答データは、選択肢と同じ数の列数とサンプルサイズと同じ数の行数のセル範囲に0または1で入力されます。0は回答者がその選択肢を選ばなかったことを、1は選んだことを表します。各選択肢の該当者数は、各列の数値の合計を求めることで集計できます。 集計に用いるデータ 回答データの例として、「高校生の生活調査」を200人を対象に行った結果を用います。なお、データは架空の値です。 ここでは、上図の「Q3-SQ.朝食を摂らない理由は何ですか?」の回答データをExcel 2010を用いて集計します。この設問は、「Q3.平日は、毎日、朝食を摂っていますか?」で「いいえ」と回答した人のみ
【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中! 統計検定®2級 模擬問題集1 500円(税込) 統計検定®2級 模擬問題集2 500円(税込) 統計検定®2級 模擬問題集3 500円(税込)
Excel のグラフを用いてヒストグラムを作成する方法を紹介します。 概要 ヒストグラムとは、データの度数分布をグラフにしたものです。 データがどのような分布をしているかを知るためのもっとも簡便でわかりやすいグラフです。これから紹介する方法を用いて下図のようなヒストグラムを作成します。手順は1から17まであります。
Excel 関数による行列の転置・積・逆行列・行列式の計算方法を紹介します。 概要 Excel には行列の転置や積、逆行列の計算を行う関数が用意されています。行列の計算を行う関数は、引数と戻り値が配列(複数のセルからなる範囲)であり、配列数式と呼ばれます。 行列の転置 行列の転置(行列の入れ替え)を行う関数はTRANSPOSE関数です。元の行列の大きさが3行2列の場合、2行3列のセル範囲を選択した状態で下記のように数式を入力し、[Ctrl]+[Shift]+[Enter]を押すと結果が得られます。 行列の積 行列の積を計算する関数はMMULT関数です。2つの行列の積で求まる行列の大きさに等しいセル範囲を選択した状態で下記のように数式を入力し、[Ctrl]+[Shift]+[Enter]を押すと結果が得られます。 逆行列 逆行列を計算する関数はMINVERSE関数です。求まる逆行列の大きさに
「エクセル統計でコンジョイント分析はできますか?」というお問い合わせをいただくことがあります。 残念ながら、2018年現在、エクセル統計には「コンジョイント分析」というメニューはありません。しかし、最もベーシックな方法で行うコンジョイント分析は、エクセル統計の機能を組み合わせることで実行できます。 以下では、エクセル統計でコンジョイン...
※コラム「統計備忘録」の記事一覧はこちら※ Wikipediaによると、変数の尺度を名義、順序、間隔、比例の4つに分けようと提案したのはスタンレー・スティーブンズ(Stanley Smith Stevens)。1946年にサイエンス誌に発表された"On the theory of scales of measurement"という論文でとのことです。 尺度の違いは当サイトの統計用語集でも読んでいただ... ※コラム「統計備忘録」の記事一覧はこちら※ 統計学の本を読んでいると、本によって、「変量」という語を使っていたり、「変数」を使っていたりする。文脈からすると同じ意味として使われているようなので、以前はどちらも variable の訳語かと思っていた。このようなコラムを書いていることから気になって調べてみると、竹内啓先生が編集委員代表を務... ※コラム「統計備忘録」の記事一覧はこちら※
[難易度]初学者レベル [数学レベル]★☆☆☆☆ 統計学を拓いた異才たち 2016/08/31 フィッシャー、ネイマン、チューキー、コックスら、この本に取り上げられている人物は、日常的に統計を使う者にとって馴染... 詳しく見る [難易度]基礎レベル [数学レベル]★★☆☆☆ 実践的データサイエンス&機械学習 2021/06/22 データ分析の教科書の多くは、あらかじめ用意された「分析のためのデータ」を使って説明がなされます。一方で、実際の分析の... 詳しく見る [難易度]初学者レベル [数学レベル]★☆☆☆☆ 文系の私に超わかりやすく統計学を教えてください! 2023/03/29 『マンガでわかる統計学』シリーズの著者、高橋信先生が執筆した教養書です。 リスキリングの潮流の中で、教養のひとつとし... 詳しく見る [難易度]初学者レベル [数学レベル]★☆☆☆☆ マンガでわかる統計学
Excel を用いてエラーバー(誤差範囲)付き棒グラフを作成する方法を紹介します。 概要 論文などで棒グラフにエラーバーを付け加えたグラフをよく見かけます。このグラフは、棒グラフで平均値を、エラーバーで標準誤差や標準偏差、平均値の信頼区間などを表します。ここでは、平均値に標準誤差のエラーバーを付けた下図のようなグラフを作成します。手順は1から12まであり、Excel 2016を用いて作成します。
※コラム「統計備忘録」の記事一覧はこちら※ 相関係数の統計的有意性の検定は「無相関の検定」と呼ばれています。相関係数がゼロである(=無相関)ことを帰無仮説としていることからこの名前が付いています。この検定についても、必要なサンプルサイズ(n)をざっくり計算できます。式は次の通りです。 r は相関係数です。|r| は相関... ※コラム「統計備忘録」の記事一覧はこちら※ 「幾つデータが必要か?」の記事で、2群の平均値の差の検定についてサンプルサイズ(n)を幾つにするか計算式を紹介しましたが、今回は比率の差の検定のときに n を幾つ以上にしたらよいかを求めてみましょう。 計算式は次の通りです。この式も、有意水準を5%としたときに、対立仮説が正しい(2群の比率... ※コラム「統計備忘録」の記事一覧はこちら※ t検定で有意差検定を行う場合、2群間で僅かでも差があるなら、データの個数をどんどん増や
※コラム「統計備忘録」の記事一覧はこちら※ クロス集計表の分析というと、カイ二乗検定しか思い浮かばない人も多いかと思いますが、私が知っているだけでも、20種類を超える統計量や多変量解析があります。この統計WEBのメインページにも、2×2のクロス集計表から計算可能な各種の検定や統計量が全部で12個載っており、入力フォームの集計表の各セルに任... ※コラム「統計備忘録」の記事一覧はこちら※ 集計ソフトの特徴が最も顕れるのは多重回答の扱いです。多重回答とは、アンケートで「この中から、あてはまるものをすべてに〇を付けてください」という質問に対する回答です。複数回答とも言います。英語ではMultiple answerですから、略してMAと言います。これに対し、「1つだけ〇を付けてください」とい... ※コラム「統計備忘録」の記事一覧はこちら※ 統計ソフトでも集計ソフトでもスプレッドシート状のウィン
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図は、2008年8月に行われた北京五輪における陸上10種競技の結果から4種目だけ抜き出したものです。26選手について10種の競技(100m、走り幅跳び、砲丸投げ、走り高跳び、400m、110m障害、円盤投げ、棒高跳び、やり投げ、1500m)のデータが得られましたが、サンプルサイズに対して変数の数が多い場合は解析に注意が必要なため、100m、400m、110m障害、1500mの4種目のデータを抜き出しました。データは各選手の競技別の得点そのもので、10種目の合計得点の高い順に並べられています。 ダイアログの設定 まず、データ範囲のラベルを選択します。データラベルのラベル「選手」(C3)を選択後、[Ctrl]キーを押しながら4種目のラベル「100m」「400m」「110m障害」「
例題: 日本人の0.01%が罹患しているある病気について考えます。この病気の検査方法では、実際に病気に罹患している人が陽性と判定される確率が95%、逆に罹患していない人が陰性と判定される確率は80%であると言われています。 ある人がこの病気の検査を受けて陽性という判定を受けた時、本当にこの病気に罹患している確率はいくらでしょうか。 検査で陽性になる事象を事象、検査で陰性になる事象を事象(事象Aの余事象)、実際に病気に罹患している事象を事象、罹患していない事象を事象とします。ベイズの定理を使うと、求める確率はとなります。 問題文から、それぞれの確率は次のようになります。 病気に罹患している確率: 病気に罹患していない確率: 実際に罹患している人が検査で陽性となる確率: 実際に罹患していない人が検査で陰性となる確率: 実際に罹患していない人が検査で陽性となる確率: これらの値を①の式に当てはめ
統計学では、「説明変数」という言葉と「目的変数」という言葉が頻繁に出てきます。 例えば、バネにおもりを付けてバネがどのくらい伸びたかをグラフにプロットすると次のようになりました。横軸はおもりの重さ、縦軸はバネの伸びた長さを表します。 このときの横軸の「おもりの重さ」が「説明変数」、縦軸の「バネの伸びの長さ」が「目的変数」です。説明変数を、目的変数をとするとのような形で表すことができます。 別の表現をすると、説明変数は「何かの原因となっている変数」のことで、目的変数は「その原因を受けて発生した結果となっている変数」のことです。 説明変数と目的変数には下記のようないくつかの表現があります。 ■説明変数 x 説明変数 explanatory variable 予測変数 predictor variable 独立変数 independent variable ■目的変数 y 目的変数、応答変数、反
※コラム「統計備忘録」の記事一覧はこちら※ ジーニアス英和大辞典によると sample の語源は、中世にイングランドを征服したノルマン人が使っていたアングロノルマン語の assample (見本 = example)。のちに、頭の as が消えて sample になったそうです。さらに遡ると、ラテン語の exemplum に行き着きます。example の原義は、「ex(外へ)+ample(広... ※コラム「統計備忘録」の記事一覧はこちら※ Excelのヘルプから標準偏差を計算する関数を調べると、6つもの関数が見つかります。 STDEV、DSTDEV、STDEVA、 STDEVP、DSTDEVP、STDEVPA 頭にDが付く2つの関数はデータベース関数、末尾にAが付くのは文字列や論理値を含むデータを計算するための関数です。したがって、この6つの関数はSTDEV系とSTDEVP... ※コ
■パーセンタイル 箱ひげ図の見方を説明する前に、「パーセンタイル」について触れます。パーセンタイルは「データを小さい順で並べたとき、ある数値がデータの小さい方から見て何%の位置にあるかを表すもの」です。0パーセンタイルは最小値を、100パーセンタイルは最大値を表します。Nパーセンタイルは、データ全体をN%と100-N%で分割する値です。 例えば、4‐1章の15人分の体重のデータを用いて30パーセンタイルを表すと、次のようになります。 ■四分位数 箱ひげ図には最大値、最小値に加えて「四分位数」の情報が含まれています。四分位数はデータを小さい順に並べて、小さいものから順位を付けた時に、 25%(全体の1/4の部分)=25パーセンタイル 50%(全体の2/4=1/2の部分)=50パーセンタイル 75%(全体の3/4の部分)=75パーセンタイル に該当する値のことです。
※コラム「統計備忘録」の記事一覧はこちら※ 外れ値と異常値、どちらも英語の outlier の訳語として用いられています。外れ値とは、実験や調査で観測された値の中で、真の値の推定値*1からの残差*2が異常に大きい観測値のことです。同じ本の中で、外れ値と異常値を使い分けていることがありますが、この場合、外れ値の中でも外れ値となった理由があるものを異常値としています。例えば、子供の平熱を調べていたら風邪で熱を出している子が紛れ込んでしまったような場合です。 さて、どれくらいだと異常に大きいとみなすのかというと、正規分布するような値であれば、残差が標準偏差の 2倍から3倍以上あるときとすることが多いですね。確率的には、残差が標準偏差の 2倍以上とするなら4.6%程度、3倍以上とするなら 0.3%程度の出現率ということになります。エクセル統計では外れ値検定に含まれる「スミルノフ・グラブス検定」とい
いくつかの袋の中に赤い玉と白い玉がいくつか入っています。これらの袋のうちどれか1つの袋から、いくつかの玉を取り出したとします。この取り出された玉の色(結果)から、どの袋から取り出されたものか(原因)を推定することを考えます。ここで用いるのが「ベイズの定理」です。 事象Aが起こるという条件のもとで、k種類の事象:ただしこれらは互いに排反とするが起こるとします。このとき、事象Aが起こるという条件のもとで、事象が起こる条件付き確率は次の式から求められます。
次のページ
このページを最初にブックマークしてみませんか?
『BellCurve(ベルカーブ)─統計解析ソフト・アンケート集計ソフト』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く