タグ

関連タグで絞り込む (185)

タグの絞り込みを解除

統計に関するkoma_gのブックマーク (233)

  • 「平均値を過信するとこうなる」大谷翔平選手の大型契約により2013年の花巻東卒業生の平均年収が4,000万を超える

    夕燐 @yr_botwatch 平均値と中央値の違い、外れ値を弾く事の大切さ、最頻値と中央値と平均値の比較……この辺がなんで大事なのかよくわかる例がようやく健全な物で例えられるようになったのは大きい twitter.com/dh1uw6/status/… 2023-12-11 14:30:53 リンク スポーツ報知 大谷翔平がドジャースに10年1014億円で移籍 花巻東時代からの片思いがようやく実る : スポーツ報知 エンゼルスからフリーエージェント(FA)になっていた大谷翔平投手(29)が、ドジャースと契約合意したことが明らかになった。大谷は自身のインスタグラムで英語で「ドジャースを選ぶことにしました」などと報

    「平均値を過信するとこうなる」大谷翔平選手の大型契約により2013年の花巻東卒業生の平均年収が4,000万を超える
  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

    総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門
  • 統計学の講義資料(2022年度) | Logics of Blue

    帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 目次 資料について 統計学の講義資料 1.資料について 帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 もとの講義資料とは異なる点もあるのでご注意ください。 万が一何か問題があれば、当ブログにコメントをいただけますと幸いです。 スライドにも記載の通り、以下の利用を想定しています。 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する 基的には想定①ですが、文系の学生をメインターゲットとした統計学の格的入門資料は少ない印象です。 未受講者の方にも役に立つかもしれないと思いWeb上で公開することにしました。 資料は1年間にわたる講義資料となっています。数回

  • 【統計検定】自分のキャリアヤベェと絶望して奮起した40代が統計検定2級に合格するまで。 - Qiita

    突然ですが統計検定2級に合格しました! この記事は、"データサイエンスに興味がある"、"久しぶりに机に向かって手を動かす勉強をする"、"自分の仕事・スキルが組織に最適化しすぎていて焦燥感に苛まれる"、"試験勉強とか久々過ぎて何から始めていいかわからないよぅ"、"ほかに統計検定の記事あるけど、なんか専門的過ぎてよくわからん、もっと泥臭いのないの?"、"専門家でもないけど、かといってズブの素人でもない、そんなちょうど[興味あるしちょっとやる気になってるんだけど~]という層"に向けて書きました。 著者の属性 理系卒40代会社員 大学院時代 統計や数学が嫌いすぎて全く単位を取ってない(標準偏差すら理解していない状態) 修論で指導教官から「t検定やれ」っていわれたけど、言われたとおりにエクセルにピコピコ数字入れてクリックして出てきた数字をコピペしたそれっぽく書いただけ。で、なんで卒業できたのか、マジ

    【統計検定】自分のキャリアヤベェと絶望して奮起した40代が統計検定2級に合格するまで。 - Qiita
  • https://twitter.com/TomoCodeHQ/status/1595010452492197888?t=UCU0nB6-CpSM4l-awp3HvQ&s=09

  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
  • ゲームのネガティブレビュー騒動の経緯について|Splatoonブキ研究所

    こんにちは。 先日steamのネガティブレビューで日市場が軽視されているという調査記事を読んで、そこにあったデータが活用できそうだったので整形して検定しました。 有意差はあったよ、日人は世界よりも少しだけ渋い評価になりがちの傾向だったよ、日市場軽視になるかどうかはそこまでは確認できない。 それで話は終わりになると思ってました。 ところがこの話はだいぶ拗れた話になってたようです。 一連の流れを調べたので、日のゲーマーが混乱しないように整理した方が良さそうだと。 執筆段階での状況日のゲーマーはレビュー評価が厳しく低評価になりやすい 日市場が小さいので日語版がないなど軽視されやすい 日のゲーマーはレビュー評価が厳しく低評価になりやすく、日市場も小さいので日語版がないなど軽視されやすい こういった説が業界内外問わず通説になっています。 そして、この類の話が業界人側から度々言及さ

    ゲームのネガティブレビュー騒動の経緯について|Splatoonブキ研究所
  • Backblaze、自社データセンターにおけるSSDの使用統計レポートを発表

    Backblaze、自社データセンターにおけるSSDの使用統計レポートを発表:モデル別に年間平均故障率(AFR)を算出 Backblazeは、自社データセンターにおけるSSDの使用統計レポートを発表した。統計対象のSSDは全て、ストレージサーバの起動ドライブとして使われている。 クラウドストレージやクラウドバックアップサービスを提供するBackblazeは2022年3月3日(米国時間)、自社データセンターにおけるドライブ使用統計レポートの初のSSD版を発表した。 同社はこれまで、HDDに特化した使用統計の年次レポートと四半期レポートを発表してきた。今後はSSD版も年2回発表していく。HDD版は引き続き年4回発表する。 SSD版使用統計レポートでは、Backblazeが世界各地のデータセンターで使用する総計2200台のSSD(2021年12月末時点)の統計が報告されている。これらは全て、スト

    Backblaze、自社データセンターにおけるSSDの使用統計レポートを発表
  • 初中級プロマネはIPAデータ白書の統計情報を見積り、生産性、品質の観点で活用せよ - プログラマの思索

    初中級プロマネがIPAデータ白書の統計情報をどんな観点で活用できるか、説明した利用事例がとても良かった。 理解できた内容をラフなメモ。 【参考】 初中級プロマネのための 現場で活かせ!統計情報1 初中級プロマネのための 現場で活かせ!統計情報2 「ソフトウェア開発分析データ集2020」の発行:IPA 独立行政法人 情報処理推進機構 「ソフトウェア開発データ白書」のダウンロード:IPA 独立行政法人 情報処理推進機構 初中級プロマネのための現場で活かせ!統計情報  2019年4月19日| CITP Community CITPアニュアルレポート2018を公開しました | CITP Community 【0】「ソフトウェア開発分析データ集2020」をIPAデータ白書と呼ぶことにする。 【1】IPAのソフトウェア開発データ白書を使いたい動機は2つある。 1つ目は、プロマネとしてシステムの企画書や

    初中級プロマネはIPAデータ白書の統計情報を見積り、生産性、品質の観点で活用せよ - プログラマの思索
  • 「配信者は人気ゲームに乗り換えた方が視聴者数は増えるのか?」統計から分析する論文が公開。ゲーム論文大賞2022、優秀賞に選ばれる  - AUTOMATON

    ホーム ニュース 「配信者は人気ゲームに乗り換えた方が視聴者数は増えるのか?」統計から分析する論文が公開。ゲーム論文大賞2022、優秀賞に選ばれる 株式会社メディアクリエイトは4月18日、「ゲーム論文大賞 2022」の受賞者を発表した。優秀賞として、配信技術研究所株式会社(以下、配信技研)および中村鮎葉氏の共著「国内ゲーム実況ライブ配信におけるチャンネルのコミュニティ的性質の統計分析」が選ばれた。 ゲーム論文大賞 2022は、2021年8月から今年1月にかけて募集された懸賞論文募集。ゲーム産業に携わる個人・グループを対象に、コンシューマー、PC、モバイル、経営論、e スポーツ、ゲーム実況、社会経済への影響などを広くテーマとして募集した。結果として、今回の募集で大賞は該当作なし。優秀賞として、配信技研および中村鮎葉氏の論文が選ばれた。 配信技研は、インターネットライブ配信技術を開発する国内企

    「配信者は人気ゲームに乗り換えた方が視聴者数は増えるのか?」統計から分析する論文が公開。ゲーム論文大賞2022、優秀賞に選ばれる  - AUTOMATON
  • 統計的検定とか有意とか考えれば考えるほど何もわからない - と。

    統計学はやはり人類には早いと思う 仕事で数理統計学を勉強していて、趣味統計検定1級を取ろうとしているのですが、 今日は統計的検定の話をしようと思っています。 というのも、これが僕の無知によるものなのか、それとも世間一般に言われる誤解なのかはわからないんですが、 統計的検定ってそもそも一体何であるのかについて、よく理解できた形で 議論をしている場面に出会ったことがあまりないと思ったからです。 この記事ではどうにか「検定するには母集団に対する仮説を持つことが重要ですよ」とか「仮説がふんわりしたところで検定すると危ないですよ」とか話しますが、 具体的に「母集団に対する仮説を雑に決めたことで大きな損失を得た事例」をよく知らないので、 説得力に欠ける話になっています。大きな損失を得た事例持ってる方いたら教えてくだし。 どこまでを話すか? 実際、統計的検定や、その結果の判断軸などについては完成した合

    統計的検定とか有意とか考えれば考えるほど何もわからない - と。
  • エロマンガを定量分析した統計同人誌が、とにかくすごかった件

    【内容】 ○「年齢別の男女の主導権」「強姦/和姦とストーリー要素」「ストーリーパターン、ヒロイン性格・属性、主導権・動機・セリフの数量化分析」等々 ○数字から分析を引き出す構成など 【掲載画像所載】 続きを読む

    エロマンガを定量分析した統計同人誌が、とにかくすごかった件
  • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "確率・統計をわかりやすく解説した、200ページ超えの長編スライド。 図解や具体例をふんだんに盛り込んだ直感的説明が秀逸。 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://t.co/8mGWUd8f4D https://t.co/VkDWjFjfWR"

    確率・統計をわかりやすく解説した、200ページ超えの長編スライド。 図解や具体例をふんだんに盛り込んだ直感的説明が秀逸。 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://t.co/8mGWUd8f4D https://t.co/VkDWjFjfWR

    QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "確率・統計をわかりやすく解説した、200ページ超えの長編スライド。 図解や具体例をふんだんに盛り込んだ直感的説明が秀逸。 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://t.co/8mGWUd8f4D https://t.co/VkDWjFjfWR"
  • 【完全網羅】統計検定2級チートシート | とけたろうブログ

    統計検定2級に満点で合格するために必要な全知識を紹介します。試験範囲に含まれているようで実際には出題されていないものはバッサリとカットしています。 受検前の知識の確認に使ってください! 1変数,2変数の記述統計の分野 代表値 ヒストグラム…データをいくつかの階級に分けて,縦の長さが度数,横の長さが階級の幅に等しい長方形で表したグラフ データの範囲…最大値ー最小値 中央値…データを大きさの順に並べたときの中央の値です。データが偶数個のときは,中央に並ぶ2つの値の平均です。 四分位数…データを大きさの順に並べて中央値(第2四分位数)で2つに分けるとき,第1四分位数は値の小さいグループの中央値,第3四分位数は値の大きいグループの中央値 四分位範囲…第3四分位数ー第1四分位数 箱ひげ図…データの散らばりを,第1四分位数と第3四分位数を両端とする箱と,最大値,最小値を端とするひげで表した図 相対度数

    【完全網羅】統計検定2級チートシート | とけたろうブログ
  • 総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート

    総務省は1月11日、データサイエンスのオンライン講座「誰でも使える統計オープンデータ」を、MOOC講座プラットフォーム「gacco」で開講した。社会人・大学生に、統計オープンデータを活用したデータ分析の手法を解説する講座で、3月7日まで受講できる。 週約3時間×4週間の内容。政府統計の総合窓口「e-Stat」、総務省と統計センターが提供する統計GISAPI機能などを使い、データ分析の手法を学べる。 講師は「統計学が最強の学問である」の著書で知られる統計家の西内啓氏や、総務省統計局の担当者など。 2017年6月に初開講して以来、断続的に開講し、のべ約2万8000人が受講した講座。 関連記事 政府が「ワクチン接種状況ダッシュボード」公開 性別や都道府県別に可視化 政府が、全国の新型コロナワクチンの接種状況を一覧にまとめた「ワクチン接種状況ダッシュボード」を公開。統計情報をまとめたCSVやJS

    総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート
  • 国土交通省「建設工事受注動態統計」問題を紐解く(上) | 研究プログラム | 東京財団政策研究所

    Review 経済・財政、環境・資源・エネルギー 国土交通省「建設工事受注動態統計」問題を紐解く(上) December 16, 2021 EBPM 経済政策 リアルタイムデータ 経済データ:Review 問題について取り上げた、朝日新聞社「国土交通省による基幹統計の不正をめぐる一連のスクープと関連報道」が、2022年度日新聞協会賞に選ばれました。 ▼朝日新聞社・伊藤氏の受賞報告寄稿に、平田主席研究員のコメントが掲載されております。 https://www.pressnet.or.jp/journalism/award/2022/index_7.html (2022年10月11日) はじめに 12月15日の朝日新聞朝刊の報道によると、2019年の厚生労働省の毎月勤労統計(毎勤統計)の不正問題に続き、今度は国土交通省で不正が疑われる統計問題が発覚した。毎勤統計問題は政府からの給付金に影響

    国土交通省「建設工事受注動態統計」問題を紐解く(上) | 研究プログラム | 東京財団政策研究所
  • 国交省、基幹統計を無断書き換え 建設受注を二重計上、法違反の恐れ:朝日新聞デジタル

    建設業の受注実態を表す国の基幹統計の調査で、国土交通省が建設業者から提出された受注実績のデータを無断で書き換えていたことがわかった。回収を担う都道府県に書き換えさせるなどし、公表した統計には同じ業者の受注実績を「二重計上」したものが含まれていた。建設業の受注状況が8年前から実態より過大になっており、統計法違反に当たる恐れがある。 この統計は「建設工事受注動態統計」で、建設業者が公的機関や民間から受注した工事実績を集計したもの。2020年度は総額79兆5988億円。国内総生産(GDP)の算出に使われ、国交省の担当者は「理論上、上ぶれしていた可能性がある」としている。さらに、月例経済報告や中小企業支援などの基礎資料にもなっている。調査は、全国の業者から約1万2千社を抽出し、受注実績の報告を国交省が毎月受けて集計、公表する。 国交省によると、書き換えていたのは、業者が受注実績を毎月記し、提出する

    国交省、基幹統計を無断書き換え 建設受注を二重計上、法違反の恐れ:朝日新聞デジタル
  • 『データ分析のための統計学入門』無料PDF公開中 データサイエンティストら執筆 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    『データ分析のための統計学入門』無料PDF公開中 データサイエンティストら執筆 | Ledge.ai
  • 『データ分析のための統計学入門』pdf版が無料公開! 実際に読んだ感想は……?

    データ活用は過度な期待を超え、徐々にビジネスパーソンの基礎的なノウハウとして定着し始めています。データサイエンティストでなくとも、データ分析の基礎的な考え方やその手法について学びたいという方は多いはず。 皆さんは、2021年3月に初学者向けの入門書『データ分析のための統計学入門 原著第4版』日語版pdfが何と無料で公開されたのをご存じでしょうか? 同書籍は以下のリンクから、閲覧可能です。 http://www.kunitomo-lab.sakura.ne.jp/2021-3-3Open(S).pdf 記事では同書を書評し、データ活用・統計学初学者におすすめの使い方をレクチャーします。 『データ分析のための統計学入門』の内容は? 何が学べる? 『データ分析のための統計学入門』は米国のNPO OpenIntroが発行した書籍で、Mine Cetinkaya-Rundel、David M D

    『データ分析のための統計学入門』pdf版が無料公開! 実際に読んだ感想は……?
  • 統計調査データ:通信利用動向調査:報道発表資料

    当ホームページの一部にはPDFファイルを利用しております。ソフトが必要な場合は左記のボタンで「Acrobat Reader」をダウンロードしてください。 情報通信統計データベースについて 情報通信統計データベースは、総務省の実施する情報通信業に関わる産業の実態について、分野別データ、統計調査データ、関係情報の3項目に分けて掲載しています。 ○新着情報:情報通信統計データベースの更新状況等を掲載 ○情報通信統計データベースからのお知らせ:情報通信関連統計調査の実施状況等を掲載 ●情報通信統計データベース管理者: 総務省 情報流通行政局 情報通信政策課 情報通信経済室 統計企画係 TEL:03-5253-5744 ●分野別データ等に関しては、各ページにデータのお問い合わせ先を掲載しておりますので、データの詳細についてはこちらをご利用下さい。 情報通信統計データベース掲載データ等の取扱いについて