タグ

統計に関するnekonyantaroのブックマーク (21)

  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

    総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門
    nekonyantaro
    nekonyantaro 2023/06/05
    「あとでやる」
  • Twitter可視化システムを作ってみたら日本に笑顔が溢れていた話 - NTT Communications Engineers' Blog

    はじめに はじめまして。 プラットフォームサービス部 データプラットフォームサービス部門の森分です。 もともと私は、NTT Comのクラウドサービスをベースにした法人向けソリューションの個社別運用やインフラ関連のプロジェクトマネージャ業務を担当しておりました。 最近はSmart Data Platform(以下、SDPF)アーキテクトなる、お客様課題の解決やNTT Comのビジネスの中でSDPFの活用を推進する部隊に参画しています。 データ利活用を支えるSDPFのアーキテクトがデータ利活用に詳しくなければ立つ瀬がありません。 そうならないように日々研鑽を積んでいるわけですが、その中で作ったTwitter分析システムっぽいもののご紹介が稿の趣旨となります。 来のデータ利活用プロジェクトでは、課題および仮説をまず明確にして、それに応じたデータ解析を進めていくのですが、稿では堅苦しいもの

    Twitter可視化システムを作ってみたら日本に笑顔が溢れていた話 - NTT Communications Engineers' Blog
    nekonyantaro
    nekonyantaro 2022/06/21
    興味深い。たしかに最近のTwitterユーザーは絵文字多用する気はする。特に「にっこり」系は気軽に使われるからデータ抽出するといっぱい掛かるのは納得。
  • 厚労省が公式データ修正→「ワクチン有効」は嘘でした…の衝撃。|森田 洋之

    国の統計で未接種と比べ、接種済の方が陽性になる割合が低いことが示されています。未接種者と接種者では感染対策意識に差があるので割り引く必要がありますが、県の高齢者施設の調査でも、3回目接種済の高齢者の方が感染割合が低く、行動に差が無い層であることを考えると予防効果は実証されています https://t.co/2emNjdf0o2 pic.twitter.com/Ps3TlThLpB — 熊谷俊人(千葉県知事) (@kumagai_chiba) April 25, 2022 ということなのですが…なんと!このデータが「インチキ」だったと、厚労省が正式に公表したのです。 厚労省は毎週、ワクチンに関するデータを公開するのですが、さる5月11日の発表から重大なデータ修正。 で、その結果がこちら。 出典:第83回(令和4年5月11日) 新型コロナウイルス感染症対策 アドバイザリーボード https:/

    厚労省が公式データ修正→「ワクチン有効」は嘘でした…の衝撃。|森田 洋之
    nekonyantaro
    nekonyantaro 2022/05/18
    統計で「うそ」をつかなくても都合良くミスリードできる良い例。未接種、2回接種、3回接種の母数の違いを無視して全部「人口」を母数にしているあたりが謎。
  • じゅじゅ on Twitter: "ネット上にある、完全無料で勉強になる有益なコンテンツまとめました。 (お金/資産形成、Excel、仕事術、資料作成、英語、ファイナンス、統計・データ分析、プログラミング、ITなど) GWでなにか勉強したいな~、と思っていた方はぜ… https://t.co/wHbkKFUnFM"

    ネット上にある、完全無料で勉強になる有益なコンテンツまとめました。 (お金/資産形成、Excel仕事術、資料作成、英語、ファイナンス、統計・データ分析、プログラミング、ITなど) GWでなにか勉強したいな~、と思っていた方はぜ… https://t.co/wHbkKFUnFM

    じゅじゅ on Twitter: "ネット上にある、完全無料で勉強になる有益なコンテンツまとめました。 (お金/資産形成、Excel、仕事術、資料作成、英語、ファイナンス、統計・データ分析、プログラミング、ITなど) GWでなにか勉強したいな~、と思っていた方はぜ… https://t.co/wHbkKFUnFM"
    nekonyantaro
    nekonyantaro 2022/05/01
    フリーのリソースはたくさんあるが、自分のモチベーションが上げられない。
  • 「日本の犯罪が2002年から五分の一に。他の先進国は?」・・・経済発展でなく、近代文学の広まりと暴力・殺人の減少数が比例する!?

    浅井ラボ@されど罪人は竜と踊る24(2023年2月17日発売) @AsaiLabot2 日の犯罪が2002年から五分の一となったそうで、他の先進国はどうかなと法務省資料を見たら、件数は人口差があるにしても率がひでえ。アメリカにいたっては、日の百倍も強盗が発生。なおそのアメリカでも世界治安度ランキングだと真ん中より上という。人類っ! pic.twitter.com/0QiRD3l31G 2022-02-04 08:48:29

    「日本の犯罪が2002年から五分の一に。他の先進国は?」・・・経済発展でなく、近代文学の広まりと暴力・殺人の減少数が比例する!?
    nekonyantaro
    nekonyantaro 2022/02/06
    主観的な見解ですが、日本の犯罪って元々「万引」とか「自転車泥」などが多く、これらが「監視カメラ」の普及で捕まり易くなって「割に合わなくなった」ため減少したと推察。
  • 総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート

    総務省は1月11日、データサイエンスのオンライン講座「誰でも使える統計オープンデータ」を、MOOC講座プラットフォーム「gacco」で開講した。社会人・大学生に、統計オープンデータを活用したデータ分析の手法を解説する講座で、3月7日まで受講できる。 週約3時間×4週間の内容。政府統計の総合窓口「e-Stat」、総務省と統計センターが提供する統計GISAPI機能などを使い、データ分析の手法を学べる。 講師は「統計学が最強の学問である」の著書で知られる統計家の西内啓氏や、総務省統計局の担当者など。 2017年6月に初開講して以来、断続的に開講し、のべ約2万8000人が受講した講座。 関連記事 政府が「ワクチン接種状況ダッシュボード」公開 性別や都道府県別に可視化 政府が、全国の新型コロナワクチンの接種状況を一覧にまとめた「ワクチン接種状況ダッシュボード」を公開。統計情報をまとめたCSVやJS

    総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート
    nekonyantaro
    nekonyantaro 2022/01/12
    自分は年齢的に、若いときにきちんと学んでおくべきだったとは感じるが、今からでも遅くない。できことからやろう。
  • 自分がどのくらいエコーチェンバーの中にいるのか可視化するシステムを作ってみた|tori

    「ツイッターで見た」計算社会科学という学問があります.社会科学にコンピュータサイエンスを導入して,これまでにない分析を行おうという学問です.最近日でも計算社会科学会が発足するなど今盛り上がっている研究分野です. そんな計算社会科学の分野で扱われる課題の一つに,ソーシャルメディアによる社会の分断の分析があります.アメリカ大統領選や新型コロナ禍でフェイクニュースを目にする機会が多くなりましたが,フェイクニュースや偏った情報の取得は,人々を分断させ社会を混乱させると言われています. 分断を生み出す要因の一つが,エコーチェンバー現象にあると言われています.これは,ソーシャルメディアなどでは自分と似たような価値観を持つ人とつながりがちであり,自分の意見をいうと周りから「そうだそうだ」と同意を得られ,自分の意見が社会全体の意見のように見えてしまう現象をいいます.実際にはソーシャルメディアで可視化され

    自分がどのくらいエコーチェンバーの中にいるのか可視化するシステムを作ってみた|tori
    nekonyantaro
    nekonyantaro 2021/09/27
    エコーチャンバー化しないためには、科学的事実を否定する人とか、ヘイトをまき散らす人とか、史実を歪める人とかもフォローしなければならなくなるが、そんなTL見てたら気が滅入りそう。
  • 統計の入門

    この講座は『受講登録する(無料)』ボタンを押すと受講開始となる『開始日可変型講座』です。 『開始日可変型講座』とは、受講者個々の受講開始日に応じて進行する講座です。 ご自身のスケジュールは、以下の講座スケジュール(PDF)を参考にご確認ください。 講座内容 統計に関する知識は、実験、試験、調査などの結果を用いた実証研究を行う上でなくてはならないものである。生活に関わるさまざまな効果やリスクがデータとともに語られ、生活者としても統計に対するリテラシーが求められるようになった。企業活動では、情報技術の発展によって、日々膨大なデータが生成されており、その活用が求められるようになった。講座は、研究や、生活、社会・経済活動に不可欠な統計を、集計・分析し、理解する力を養うことを目的とした「統計入門」「続統計入門」を圧縮した内容になっている。これから統計を学ぼうとする初学者や、学び直しを目指す学生を主

    統計の入門
    nekonyantaro
    nekonyantaro 2021/09/13
    期限を区切らないと「そのうち勉強すれば良い」になりがちなので、この方法は動機付けに有効かも。
  • 拝啓 コロナに関わるみなさまへ

    溜まった思いを書き散らしました。 拝啓 すべてのみなさまへワクチンを打って安心するのは、まだ早いです さすがに1回目の接種の翌日からマスクを外して動き回るような人はいないと思いますが、効果が十分あらわれるとされる2回目の接種から2週間経ってもなお、安心しないでほしいという話をします。あなた自身の重症化の確率は小さくなりますが、あなたが感染しなくなるわけではありませんし、あなたを経由して周りの人に感染させる可能性は十分に残っています。特にデルタ株に対しては、ワクチン接種後に他人との接触機会を2倍にしたら、あなたが打ったせっかくのファイザー製ワクチンの効果も、あなたが疑問視している中国製のワクチンを打ったのと変わらないレベルになってしまいます。まして、接触機会を5倍にしたら、ワクチンを打っていないのと同じです。周りの人のことを思いやれるなら、羽を伸ばすのは周りの人も含めてワクチンが行き渡ってか

    拝啓 コロナに関わるみなさまへ
    nekonyantaro
    nekonyantaro 2021/07/13
    力作。増田で無くどこかに実名で発表してほしい内容。
  • 東京の感染者数を5週間ぶん予測した (6月28日版)

    (※ 新しい予測を公開しました→ 東京の感染者数を5週間ぶん予測した (7月5日版)) 東京の感染者数を5週間ぶん予測した (6月21日版) の続き。まえがきは前回の記事でご覧ください。 前回の予測はかなり高い精度で当てることができました。日曜までの週単位では 3368人 の予測に対して 3342人 の現実となりました。 今回は、宣言解除による~6月27日の週の人流増を反映し、~7月11日の週の予測を上振れさせました。2人での飲酒が解禁になった影響は、ある程度は人流の増加に織り込み済みとみなしています。ただし、「3週前の感染者数の最大値」を予測に用いている性質上、上振れした週の感染者数は都民を緊張させ、3週後のブレーキにつながるので、全体としての影響は限定的です。新たに追加した~8月01日の週では、5月の大阪並みの緊張感にワクチンの効果も加わって急減速するも、デルタ株を減らすにはまだ及ばな

    東京の感染者数を5週間ぶん予測した (6月28日版)
    nekonyantaro
    nekonyantaro 2021/06/29
    今は300人台だが、これが指数関数の恐ろしさと実感する。7月中にはほぼデルタに置き換わるのか。
  • Steamで配信されている作品に投稿されたレビューを1316作分調査し、本当に日本人が悪評をたくさんつけるクソマナー野郎なのか確かめました。|男鹿梨衣子

    Steamで配信されている作品に投稿されたレビューを1316作分調査し、当に日人が悪評をたくさんつけるクソマナー野郎なのか確かめました。 2021/06/16 04:23 自身の主張である「日人ゲーマーが悪評レビューを投稿しまくるマナーが悪い集団と糾弾するなら、ソースを出すべきだ」という部分が無視され、スマホ市場の話など論点をずらし炎上させられている状況に感情的になり冷静さを欠いていた部分を精査し、意見を正しく書き直しました。 前記事では「コミュニティを批判するならば、データを基にしてほしい」という趣旨のもと、Steam上での状況を軽く説明した。だが、「こんなデータではなにも言えない」「データを出せというが、コミュニティ擁護側のデータがこれでは信用に値しない」など数々のご指摘を頂いた。 そこで記事では前記事で行ったSteamのレビュー数とその不評率の調査を拡大し、Steamにて販売

    Steamで配信されている作品に投稿されたレビューを1316作分調査し、本当に日本人が悪評をたくさんつけるクソマナー野郎なのか確かめました。|男鹿梨衣子
    nekonyantaro
    nekonyantaro 2021/06/16
    これも要検証だが、「日本人は満足しなかったときは批判レビューをして、満足したときは黙っている」という傾向がある、という可能性もあるのでは。日本市場が小さくないのにレビュー数が少ないのが気になる。
  • 全国民に配るべき!総務省が示した「データ入力の統一ルール」|Excel医ブログ

    2020年12月、総務省より 【機械判読可能なデータの表記方法の統一ルール】が策定されました。 統計表における機械判読可能なデータの表記方法の統一ルールの策定 https://www.soumu.go.jp/menu_news/s-news/01toukatsu01_02000186.html 2020年11月に河野太郎 行政改革担当大臣のツイートが話題となりました。 その後正式に統一ルールが公開された形です。 各省庁がネット上で公開する統計を機械判読可能にするために、データの表記方法を統一させます。「政府統計の総合窓口(e-Stat)」で日から12月1日までの間、表記方法案に関する意見照会を行います。研究者をはじめ、皆様のご意見をお待ちしています。https://t.co/h07tCTDazc — 河野太郎 (@konotarogomame) November 25, 2020

    全国民に配るべき!総務省が示した「データ入力の統一ルール」|Excel医ブログ
    nekonyantaro
    nekonyantaro 2021/06/14
    「機械可読なデータ」を基に「人間に容易に可読な表」を作るという仕事の切り分けをしないと、やたら横に長くて直感的な理解が困難な表が出来てしまう。
  • はてなブックマーク経由PV黄金時代とFACTFULNESS - 本しゃぶり

    質問 はてなブックマーク経由のPV/ブクマ数の比率は、3年前と比べてどうなっているでしょう? A 減少している B 変わらない C 増加している 3年前はすごかった説 この記事に気になることが書いてあった。 それでも3年前なら150ブクマもついてたらさすがに5000pv~10000pvくらいは「はてブからだけで」流入があったりしたものです。 ところが、昨日書いた記事、内容の是非はともかくとして、はてなブックマークが150以上ついているのも関わらず、はてブ経由でのPVはわずか2000でした。 ブコメを見ても人が減っていることについて同意が多く、限界集落はてな村だから仕方ないといった雰囲気である。かつてあった、はてな黄金時代と比べて見る影もない、と。 黄金時代には、人間は神々と共に住み生きていた。「世の中」は調和と平和に満ち溢れて、争いも犯罪もなかった。あらゆるコンテンツが自動的に生成され、手

    はてなブックマーク経由PV黄金時代とFACTFULNESS - 本しゃぶり
    nekonyantaro
    nekonyantaro 2021/05/10
    いろいろな解釈が成り立つ。「2chまとめサイト全盛期」前後で何が変わった(変わってないか)についてだれか詳しく考察してほしい。
  • 積分とは・対数とは・微分とは〜「分かる」とはどういうことか〜

    文系向け「統計学」の授業で、積分・対数・微分を復習する機会があった。その時の「1枚スライド」を公開した。この図をめぐって、「分かる」とはどういうことか、について多くのコメントをいただいた。それを、まとめました。(話が同時並行で進行するので、スレッド風の「まとめ」です。) 注意:積分は、統計学の場合、正規分布表を見るために必要。対数の必要性は、尤度関数(尤もらしさ)の対数をとって計算を簡単にする式変形で使うため。微分の必要性は、確率密度関数の最大値(尤度最大の条件)を求めるため。どれも統計学で必須の内容。 注意2:(追記8/6)ここに出てくる「指数、対数、微分、積分」は「感染症の数理モデル」の基礎となっている。 注意3:(追記8月9日)番外編『「積分」と「源氏物語」〜「晩年の清少納言」から「京都女子大」まで』へのリンクはこちらです。https://togetter.com/li/157284

    積分とは・対数とは・微分とは〜「分かる」とはどういうことか〜
    nekonyantaro
    nekonyantaro 2020/08/09
    1枚に収めるため仕方がなかったのだろうが、いきなりn等分から始めるのは文系向きでない。台形近似から、2等分、4等分、8等分……と進める方が取っつき易いと思うのだが、何でも一般化したがるのは理系の宿痾か。
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
    nekonyantaro
    nekonyantaro 2019/10/09
    「データを操作すると往々にしてヒストグラムが歪む」というのは知識として知っていて損は無い。
  • うなぎは誰が買っているのか…うなぎの購入性向をさぐる(不破雷蔵) - エキスパート - Yahoo!ニュース

    土用の丑の日に大いに買われるうなぎ毎年土用の丑の日が近づくに連れ、巷ではうなぎ商品が満ちあふれ、同時にうなぎの絶滅危惧種問題と乱獲への懸念が叫ばれる。今回は総務省統計局の定点調査である「家計調査」の公開値をもとに、どのような層がうなぎをしているのか、つまり需要層となっているのかを確認する。 夏の土用の丑の日(毎年1回、あるいは2回)には、うなぎをべて精をつけよう、夏の体力不足に備えようとの習慣がある。これは通説では江戸時代の平賀源内が(夏には味が落ちているので売り上げも減退することから)困っていたうなぎ屋にセールスコピーとして、「日丑の日(なのでうなぎをべましょう)」的な提案をしたところ、大いに売り上げがあがったのがきっかけだとされている。また丑の日に「う」がつくべ物をべて夏バテを防ごうとの風習もあり、うなぎ以外でも「う」がつけば何でもよかった(うどんや瓜、うさぎ、馬肉、牛肉な

    うなぎは誰が買っているのか…うなぎの購入性向をさぐる(不破雷蔵) - エキスパート - Yahoo!ニュース
    nekonyantaro
    nekonyantaro 2017/07/24
    年収300、400万円台が凹んでる理由は何だろう?
  • 一人暮らしの平均貯蓄額は822万円だが、中央値はなんと20万円のみ!実に48.1%の単身世帯が貯金ゼロという状況のようです。 - クレジットカードの読みもの

    先日、ライブドアニュースを見たら単身世帯(一人暮らし世帯)の平均貯蓄額が出ていました(こちらの記事)。 金融広報中央委員会「家計の金融行動に関する世論調査【単身世帯調査】」(2016年)によると、単身者(一人暮らし)の人の平均貯蓄額は822万円、中央値は20万円という結果が出ていました。 さすがに平均822万で中央値が20万円ってことはないんじゃないかな…と思い、実際に金融広報中央委員会の統計をチェックしてみると、この金額はまったく間違いではなく事実であることが判明。 どうやら「貯金ゼロ世帯」が非常に多いために、中央値が限りなくゼロに引きずられてしまっているようなのです。 単身世帯の実に48.1%が貯金ゼロ: いくつか参考までに統計結果を紹介させていただきます。 まずは20代~70代の単身世帯のうち、金融資産ゼロ(要するに貯金ゼロのこと)の世帯がどのくらいいるのかの比率からです。 ご覧いた

    一人暮らしの平均貯蓄額は822万円だが、中央値はなんと20万円のみ!実に48.1%の単身世帯が貯金ゼロという状況のようです。 - クレジットカードの読みもの
    nekonyantaro
    nekonyantaro 2017/04/18
    貯金できない、日本死ね。
  • けものフレンズがキャズムを超えて流行したのは2月6日 - 未分類なブログ

    2017/02/13 タイトルおよび記事の内容を変更して再公開いたしました。 以前の内容に、引用および言及をするべきではない箇所があったことをお詫び申し上げます。 ----------------------------------------------------- こんにちは。はち (@rollhachi)です。 けものフレンズが流行っているらしいです。 昨日投稿したグーグルトレンドを用いたランキング記事に入っていた「幼女戦記」と「クズの懐」の2作品と2月6日から30日の期間で改めて比較してみると・・・ あれ!?流行っているとは言いにくい!! ところが直近7日間のデータを見てみると・・・ すっごーい伸びてきてる!!!! 昨日の48作品での比較では35位前後に位置していた作品が3位の「幼女戦記」をうような勢いで伸びていますね。 なぜこんなに広まったのか気になりませんか? 僕は気にな

    けものフレンズがキャズムを超えて流行したのは2月6日 - 未分類なブログ
    nekonyantaro
    nekonyantaro 2017/02/10
    魚拓見たけど、なんでこれが削除しなければいけない物なのか全く判らなかった。非公開情報は何も含まれていない様だし、ネタバレも無い。
  • 日本の深刻な殺人離れ

    須藤玲司 @LazyWorkz うちの親がニュース見ながら「最近は殺人が増えとるなあ…昔よりもずっと。こわいわあ」とか寝言ぬかすんで、ちょっと待てババアあんたらの時代よりおれらの時代のほうがずーっと日は良くなっとるんや、殺人なんか8割減やでと数字を見せつける朝。 pic.twitter.com/KqCTGeyLr1 2016-09-14 08:08:43

    日本の深刻な殺人離れ
    nekonyantaro
    nekonyantaro 2016/09/16
    タイトルは煽りだが、内容的には色々考える必要がある問題が含まれている。
  • おっぱい年収対比表を作ってみた。Cカップの女性は年収400〜500万円の男性が妥当 - PJ表参道

    今日はおっぱいと年収について語りたい。突然だが、以下のようなやりとりをしたことはないだろうか? 女「ねー。いい人がいたら紹介してくれない?」 男「どんな人がいいの?」 女「優しい人なら誰でもいいよー」 男「うんうん。で、音は?」 女「音は、年収1000万円以上、身長175cm以上のイケメン。あと誠実な人だと嬉しい」 ここまでストレートに言ってくる女性は稀だろうが、安定した生活を送りたいという思いから、特に年収が気になるという女性は多いだろう。それでは、男性は何を女性に求めればいいのだろうか。 結論としては、おっぱいの大きさだ。 かわいさを求めたい男性もいるだろうが、かわいさと言うのはとても主観的であいまいな指標だ。その点、おっぱいならカップサイズという客観的な指標(もちろん虚偽申告の可能性は否めないが)で語ることができる。 というわけで、おっぱい年収対比表を作成した。この対比表は、おっ

    おっぱい年収対比表を作ってみた。Cカップの女性は年収400〜500万円の男性が妥当 - PJ表参道
    nekonyantaro
    nekonyantaro 2016/06/22
    コーヒー吹きそうになった。