タグ

関連タグで絞り込む (173)

タグの絞り込みを解除

統計に関するpeketaminのブックマーク (154)

  • 14-1. 正規分布 | 統計学の時間 | 統計WEB

    ■正規分布 正規分布は統計学における検定や推定、モデルの作成など様々な場面で活用される連続型確率分布です。多くの統計的手法において、データが正規分布に従うことを仮定します。正規分布は次の図のように左右対称の形をしており、横軸は確率変数を、縦軸はそのときの確率密度を表します。

  • 職業別のIQの分布はどうなっているのか

    医者や弁護士は頭が良いというイメージから、患者や依頼人の方が低姿勢になりがちだったり、逆に進学校の生徒は教師のことを自分よりIQが低いはずだと侮っている場合もありますが、実際にIQが高い人が多いのはどのような職業なのでしょうか。 詳細は以下から。Modern IQ ranges for various occupations ちなみにこのグラフの見方は、その職業の人が100人いるとすると、IQの高い順に並べて11位から25位の人は黒い棒の右端から最初の白い仕切りまでの範囲に、26位から50位はそこから次の白い仕切りの間、同様に51位から75位、76位から90位(黒棒の左端)というように分布している、と考えると良いようです。 職業リストは以下のとおり。 Janitors and sextons:建物の管理人、教会の管理人 Precision machine operatives:精密機械工

    職業別のIQの分布はどうなっているのか
    peketamin
    peketamin 2022/02/02
    バンドが広い
  • 相関関係と因果関係 - Wikipedia

    相関関係と因果関係(そうかんかんけいといんがかんけい)では、相関関係と因果関係の違いおよび関係について解説する。 概要[編集] 因果関係は相関関係を含意するが、相関関係は因果関係を含意しない。 相関関係と因果関係の関係は、以下のようにも説明される。 因果は相関の十分条件である。 相関は因果の必要条件である。 相関は因果の十分条件でない。 因果は相関の必要条件でない。 「相関関係は因果関係を含意しない」[注 1]は、科学や統計学で使われる語句で、2つの変数の相関が自動的に一方がもう一方の原因を意味するというわけではないことを強調したものである(もちろん、そのような関係がある場合を完全に否定するものではない)[1][2]。全く逆の言葉である「相関関係は因果関係を証明する」は、同時または前後に生じた二事象間の因果関係を主張するが、これは誤謬である。このような誤謬は虚偽の原因の誤謬[注 2]という

  • 2021年M1、オズワルド前後問題、上沼恵美子さん採点暴走問題、塙どうした問題をデータで確認する|松本健太郎

    錦鯉優勝の瞬間、抱き合っているおっさん2人の姿を見て、こちら側も貰い泣きしてしまいました。錦鯉さん、優勝おめでとうございます。 前評判では、昨年のマヂカルラブリーみたく「漫才か漫才じゃないか論争」が巻き起こるのではないかと言われていましたが、蓋を明ければ錦鯉・インディアンスによるバカボケ大戦、オズワルドによる正統派漫才が決勝に駒を進めました。 特に、錦鯉・長谷川さんの「口を開くだけで面白い」は、私にとってジミー大西さん以来です。一番最後に遅れてやってきたお笑い第5世代の逆襲に胸が熱くなります。当におめでとうございます&お疲れ様でした。 それでは、2021年のM1を各審査員の採点傾向と共に、様々な観点から振り返りましょう。 今年も過去3年間と顔ぶれが変わらず、逆に過去比較がし易くなっています。あと1年は同じ体制で続けて欲しいですね。日ハムの栗山監督だって10年やったんですから、その半分は続

    2021年M1、オズワルド前後問題、上沼恵美子さん採点暴走問題、塙どうした問題をデータで確認する|松本健太郎
    peketamin
    peketamin 2021/12/21
    “「真空ジェシカは後半だったら伸びた」という説もありますが、2019年にかまいたちが2組目に出場して一気に雰囲気を変えたように、本当に面白い漫才師は何番目であろうと関係無いのだと思います。”
  • アンケートを舐めてかかると死ぬ - Gunosyデータ分析ブログ

    はじめに アンケートにおける注意点 「何のためにこの質問をするのか」を明確にする できる限りバイアスを排除する 質問文はわかりやすく、誤解のないように よく使う統計手法 母比率に関する検定 適合度の検定 独立性の検定 マン・ホイットニーのU検定(ウィルコクソンの順位和検定) おわりに はじめに おはようございます。BIチームの齊藤です。 サンタさんには善玉コレステロールと来年1月末の某ライブのチケットをお願いしようと思います。マジで頼む。 こちらの記事は Gunosy Advent Calendar 2021 の18日目の記事です。 昨日の記事は同じくBIチームの田辺さんの「オンラインホワイトボードを使った振り返りで数値意識が向上した話」でした。Good Article! さて、みなさんは仕事でアンケートをとったことはありますか? Webサービスでユーザー行動を分析する際には、各種の行動ロ

    アンケートを舐めてかかると死ぬ - Gunosyデータ分析ブログ
    peketamin
    peketamin 2021/12/18
    カッコいい…
  • 海外諸国の非実在ポルノ規制と性犯罪率|機械学習をするおによめ

    背景 非実在の表現に対する規制が懸念されています。表現規制派は、非実在児童ポルノによって、「未成年に対して性的な犯罪をしてもよい」という社会通念の形成を懸念しているようです。実際に先進国における非実在児童ポルノの規制と性犯罪率の関係を調べてみました。なお、国別の児童の性的虐待のデータの取得が難しかったため、性犯罪率で代用しています。 検証方法 「ポルノと性犯罪の関係」については、すでにいくつも論文があります。ポルノと性犯罪については、関係がある派とない派はどちらも存在します。 しかし、「非実在児童ポルノの規制と性犯罪率の関係」については、検証されている論文が見つからなかったため、今回簡単な検証をすることにしました(見つけられなかっただけかも)。 いくつかの先進国から、非実在児童ポルノの規制について「制作」「配布」「所持」の観点から表現の自由度を算出し、性犯罪率との比較を行いました。表現の自

    海外諸国の非実在ポルノ規制と性犯罪率|機械学習をするおによめ
  • Daichi Mochihashi on Twitter: "河東先生にご招待いただいたSummer School数理物理2021 https://t.co/Ipr0wKW6Kaが無事終わり、450〜250人くらいの方に聞いていただきました。三日間の資料を下に公開しておきます。 1日目:… https://t.co/2C4n5u9Yp0"

    河東先生にご招待いただいたSummer School数理物理2021 https://t.co/Ipr0wKW6Kaが無事終わり、450〜250人くらいの方に聞いていただきました。三日間の資料を下に公開しておきます。 1日目:… https://t.co/2C4n5u9Yp0

    Daichi Mochihashi on Twitter: "河東先生にご招待いただいたSummer School数理物理2021 https://t.co/Ipr0wKW6Kaが無事終わり、450〜250人くらいの方に聞いていただきました。三日間の資料を下に公開しておきます。 1日目:… https://t.co/2C4n5u9Yp0"
  • KRSK on Twitter: "誤った統計手法の扱いに対抗するための引用文献リスト。査読者との戦いの武器になりそう。 ・Table 1にp値のっけろ ・RCTでは共変量調整しなくてよい ・アウトカムが正規分布しているかチェック、検定しろ ・検出力計算しろ な… https://t.co/gthofFbvlu"

    誤った統計手法の扱いに対抗するための引用文献リスト。査読者との戦いの武器になりそう。 ・Table 1にp値のっけろ ・RCTでは共変量調整しなくてよい ・アウトカムが正規分布しているかチェック、検定しろ ・検出力計算しろ な… https://t.co/gthofFbvlu

    KRSK on Twitter: "誤った統計手法の扱いに対抗するための引用文献リスト。査読者との戦いの武器になりそう。 ・Table 1にp値のっけろ ・RCTでは共変量調整しなくてよい ・アウトカムが正規分布しているかチェック、検定しろ ・検出力計算しろ な… https://t.co/gthofFbvlu"
  • 有意 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "有意" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2013年5月) 統計学的有意(とうけいがくてきゆうい、英: statistical significance)は、確率論・統計学の用語で、「確率的に偶然とは考えにくく、意味があると考えられる」[1]ことを指す。科学分野での用語として、有意である(significant)とは「注目に値するほど大きい、ないしは重要である」という意味も持つ[2]。 P値[編集] 帰無仮説の下で実際にデータから計算された統計量よりも極端な(仮説に反する)統計量が観測される確率を、P値という。P値の利用に伴う

    peketamin
    peketamin 2021/07/09
    "有意であるからといって「偶然ではない」と断定できるわけではなく、「偶然とは考えにくい」という意味に過ぎない。"
  • 酷く質の悪いワクチン関連論文を元に、さらにネット上で誤解釈で大変なデマが出回る : やまもといちろう 公式ブログ

    ワクチン接種と国民の態度については、それ相応に各種の事前研究が進み、接種計画に反映されたりしています。なので、ある程度は関係者の間では「肌感」があるところなのですが、さっきTwitterを見ていたら「Facebookユーザーの大多数がワクチン接種を拒否」とか「18歳から29歳までの40%以上がワクチン接種に否定的」とかいう明らかなガセネタが出回っていたので(既に削除)、元論文を観に行きました。 そしたら、元ネタは独立行政法人産業経済研究所(RIETI)が発行したディスカッションペーパーのていをした調査報告書だったわけなんですが、流し読みして悶絶するような個所がいくつかあり、椅子から落ちそうになりました。 https://www.rieti.go.jp/jp/publications/dp/21j026.pdf 元データが開示されていないので検証のしようもないんですが、まず、18歳から29歳

    酷く質の悪いワクチン関連論文を元に、さらにネット上で誤解釈で大変なデマが出回る : やまもといちろう 公式ブログ
  • 国友直人のホームページ

    私のホーム・ページにようこそ 制作協力:福井崇人・一場知之/最後の訂正:2023年1月15日 [ 英語 | 日語 ] 研究・教育活動の主な分野 統計学、計量経済学、数理・計量ファイナンス、経済統計学、データサイエンス(統計科学) 最近の活動 社会協力活動 国土交通省第三者委員会委員(建設工事受注動態統計調査の不適切処理問題, 2021.12.23-2022.1.14) 報告書, 国土交通省 研究協力 経済時系列解析プログラム・季節調整法X12SIML(佐藤整尚先生, 2023.2.1) 日語解説, 英語解説 新刊 「データ分析のための統計学入門」("OpenIntro Statistics, 4th Edition" by D.Diez, M.Cetinkaya-Rundel and C.Barr, 日語印刷版(誤植訂正版), 日統計協会, 小暮厚之氏・吉田靖氏と共訳,2021年3

  • 「クリミアの天使」看護師ナイチンゲール!その裏の顔とは|マスログ

    ↓↓↓動画で見たい方はこちら↓↓↓ 日5/12はフローレンス・ナイチンゲール(1820-1910)の誕生日です。 皆さんはナイチンゲールと聞いて、どんな想像をされるでしょうか? 19世紀にヨーロッパで起きた悲惨なクリミア戦争の中で、野戦病院に日夜運ばれてくる患者を1日中癒し続けた看護師。戦争で傷ついた患者に何時間も包帯を巻き続ける彼女に、いつしか「クリミアの天使」と呼ばれるように…。 そんなイメージを持たれている方もいらっしゃるかもしれません。 死者数20万人以上とも言われる大戦争の最中、野戦病院で看護師として勤め、大きな活躍したのも事実ですが、実は、この人物、「統計学の母」とも呼ばれています。 今回は、ナイチンゲールのもう一つの顔、「統計学の母」の側面について、お話ししようと思います。 1. ナイチンゲールはどんな人? ナイチンゲールは1820年、両親の新婚旅行先であったイタリアのフィ

    「クリミアの天使」看護師ナイチンゲール!その裏の顔とは|マスログ
    peketamin
    peketamin 2021/02/04
  • https://manbowblog.com/spreadsheet/histogram

  • NORMDIST - Google ドキュメント エディタ ヘルプ

    指定した値、平均値、標準偏差に対する正規分布関数(または正規累積分布関数)の値を返します。 使用例 NORMDIST(2.4,1,4,FALSE) NORMDIST(A2,A3,A4,TRUE) 構文 NORMDIST(x, 平均, 標準偏差, 累積) x - 正規分布関数に代入する値です。 平均 - 正規分布関数の平均値(μ)です。 標準偏差 - 正規分布関数の標準偏差(σ)です。 累積 - 通常の分布関数ではなく正規累積分布関数を使用するかどうかを指定します。 関連項目 ZTEST: 標準偏差を使用して z 検定の両側 p 値を返します。 WEIBULL: 指定した形状や尺度について、ワイブル分布関数(またはワイブル累積分布関数)の値を返します。 POISSON: 指定した値と平均値に対するポアソン分布関数(またはポアソン累積分布関数)の値を返します。 NORMSINV: 指定した値に

  • 国際比較に使える唯一の指標「超過死亡」で明らかになる実態 - 新型コロナウイルス情報室 - Quora

    今回取り上げるのは、フィナンシャル・タイムズからの「死者数は報告されているよりも60%高い可能性がある」というレポートです。 Global coronavirus death toll could be 60% higher than reported | Free to read ここで、論に入る前に、少し前置きです。 アウトブレイクが現在進行形で起きているときに、異なる国での政策の良し悪しを議論するのに使える、信頼できる統計データとは何でしょうか? 感染者数は、検査の性能・件数・方針などに強く依存するため、もっとも信頼性の低い指標です。一方、死亡者数は、相対的には信頼できる指標ですが、検査を受けないままに死亡してしまったケースについてはアンダーレポート(過小報告)となります。 特にいったん医療崩壊を起こしてしまうとあらゆる報告が追いつかなくなり、感染者数も死亡者数もきちんと管理できな

    peketamin
    peketamin 2020/05/05
    そう、インフルの状況モニタリングにはこの指標を使うと聞いた時、COVIDの状況把握もこれでいいな、と思った
  • 見たら「ん?」となるエラーバーのグラフ - Qiita

    はじめに 実験でも数値計算でも、観測に誤差が伴うものをグラフにする時にはエラーバー(誤差棒)をつけると思います。エラーバーのつけ方には流儀がありますが、とりあえず1シグマ、つまり「誤差の乗り方がガウス分布だと仮定した時の標準偏差」をエラーバーとすることが多いです。 で、エラーバーは1シグマなので、「真の値をそのエラーバーの中に含む確率」が68%です。つまり観測点の3つに1つは「真の値」がエラーバーの範囲外にあることになります。なお、ここでは「真の値」を「観測を十分な回数繰り返した時に収束する値」のこととします。 さて、発表を見ていて、たまに「ん?」と思うようなグラフを見かけます。以下では、そんな「ん?」なグラフの実例と、その原因について見てみようと思います。 ケース1:正しい誤差棒 入力値$x$に対して、観測値$y$が$y=x$となる単純な系を考えましょう。ただし、観測するたびに誤差$\v

    見たら「ん?」となるエラーバーのグラフ - Qiita
  • 東京都のCOVID-19

    東京都の情報は2021-05-24以降は毎日16:45に東京都福祉保健局からPDFで発表されているが,手作業での更新のようで,うまくスクレープできないこともあった。そうこうしているうちに厚労省が16:00ごろ全国の都道府県についてオープンデータを更新することになったので、そちらを取得して COVID-tokyo.csv を作成し,自動ツイートしている(描画部分のコード:COVID-tokyo.py)。そのグラフ: 実効再生産数を,(直近7日間の陽性数/n日前7日間の陽性数)**(5/n)で近似したもの。東洋経済オンラインでは n=7 としているが,ここでは 1 から 7 までの7のグラフを示した。 全区間にわたってプロットしたもの: 縦軸を対数目盛にしたもの: 奥村 晴彦 Last modified: 2022-12-31 16:26:39 JST

    peketamin
    peketamin 2020/02/17
    奥村先生だ
  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

    総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門
  • いつまで若者は「海外離れ」をしているのか、あなたは何を捨てますか - ネットロアをめぐる冒険

    世の中うまくいかないことはたくさんありますが、調べかけていたことについて、先に記事を出されることほど悔しいことはありません(長めのマクラ)。 ハフポス(正確には新潮社フォーサイト)の以下の記事が話題になっていました。 最近では特に若者の「内向き志向」が指摘されている。海外に出かけることを好まないというのだ。(中略) 20代のパスポートの新規取得率は、1995年に9.5%だったものが、2003年には5%に落ち込み、その後、6%前後で推移。2017年には若干上昇したものの、6.9%だ。取得率で見れば、明らかに低迷している。 日の若者が気付けない自らの「貧困」。海外に出ない、その裏事情 | ハフポスト どこかで聞いたような若者の「内向き志向」を憂う記事なのですが、このパスポートの新規取得率についてツッコミを入れようかと思っていたところ、大変すばやく「More Access! More Fun」

    いつまで若者は「海外離れ」をしているのか、あなたは何を捨てますか - ネットロアをめぐる冒険
  • 赤池情報量規準 - Wikipedia

    赤池情報量規準(あかいけじょうほうりょうきじゅん; 元々は An Information Criterion, のちに Akaike's Information Criterionと呼ばれるようになる)は、統計モデルの良さを評価するための指標である。単にAICとも呼ばれ、この呼び方のほうが一般的である。統計学の世界では非常に有名な指標であり、多くの統計ソフトに備わっている。元統計数理研究所所長の赤池弘次が1971年に考案し1973年に発表した[1]。 AICは、「モデルの複雑さと、データとの適合度とのバランスを取る」ために使用される。例えば、ある測定データを統計的に説明するモデルを作成することを考える。この場合、パラメータの数や次数を増やせば増やすほど、その測定データとの適合度を高めることができる。しかし、その反面、ノイズなどの偶発的な(測定対象の構造と無関係な)変動にも無理にあわせてしま