タグ

統計に関するsalon_hiyakeのブックマーク (12)

  • 【都道府県別】人口あたりの新型コロナウイルス死者数の推移

    全国の都道府県別,人口あたりの新型コロナウイルス死者数の推移です.下部の地域ボタンまたは凡例(スマホは「凡例」ボタンで表示)をクリックすると都道府県の表示,非表示の切り替えができます(地図のクリックで表示,折れ線グラフのラベルをクリックで非表示も可能).グラフのポイント上にカーソルで情報がポップアップ,クリックで強調,ドラッグで移動,マウスホイールでズーム.縦軸の初期表示は対数です.「縦軸」ボタンで通常スケールに切り替え可能です.「表示都道府県をURLに保存」ボタンを押すと,現在表示中の都道府県をブックマークで保存できます.「NHK」にチェックを入れて左のボタンでデータを選択すると,NHK集計のデータも見ることができます.(NHKの集計は2022/9/27,厚労省の集計は2023/5/8で終了しました) 【おことわり】御利用は各自の責任で行っていただくとともに,正確を期す場合には元デー

  • 人口、労働、賃金、社会保障などについての統計データをどう調べればよいか?|野口悠紀雄

    ◆人口 ・人口の長期時系列データ 人口というのは最も基的な統計データだが、検索エンジンで「人口」と検索しても、どこを見たらよいか分からないだろう。 e-Statには人口の統計があるらしいと分かるが、長期の人口統計がどこにあるか、分からない。探し出しても、いくつかの期間に分かれていて、使いにくい。 私が探した限りでは、『日統計年鑑』にあるこのデータ集が最も使いやすい。ただし、昔は長期に連続した表だったが、いまでは1920年で2つの表に分かれてしまっていて、やや使いにくくなった。 ・人口統計資料集 国立社会保障・人口問題研究所による統計資料集。 江戸時代の人口や世界の人口についての資料も、「Ⅰ.人口および人口増加」率の中にある。 ・将来人口推計 https://www.ipss.go.jp/pp-zenkoku/j/zenkoku2023/db_zenkoku2023/db_r5_suik

    人口、労働、賃金、社会保障などについての統計データをどう調べればよいか?|野口悠紀雄
  • 統計モデリングで癌の5年生存率データから良い病院を探す - StatModeling Memorandum

    概要 2017年8月9日に国立がん研究センターは、がん治療拠点の約半数にあたる全国188の病院について、癌患者の5年後の生存率データを初めて公表しました(毎日新聞の記事)。報告書は国立がん研究センターが運営するウェブサイトからダウンロードできます(ここ)。報告書をダウンロードしようとすると注意点を記したポップアップが表示されます。大切な部分を抜粋すると以下です。 報告書には、施設別の生存率を表示していますが、進行がんの多い少ない、高齢者の多い少ないなど、施設毎に治療している患者さんの構成が異なります。そのため、単純に生存率を比較して、その施設の治療成績の良し悪しを論ずることはできません。 一般に高齢者が多い病院ほど、進行癌(ステージが進んだ癌)が多い病院ほど、その病院の生存率は下がるわけです。それならば、統計モデリングで年齢と進行度(ステージ)の影響を取り除いて(専門的な言葉で言えば「調

    統計モデリングで癌の5年生存率データから良い病院を探す - StatModeling Memorandum
  • 出版崩壊

    この落ち込みはどこまで続くのか 何も言わずグラフを見ていただくだけで、日の出版の世界がどのような状態に置かれているか、お分かりいただけると思う。 書籍、雑誌合計の出版販売金額は、高度成長期以降、一貫して高い伸びを続け、オイルショック下でも成長を続け、バブル経済崩壊でも膨らみ続けて、1996年、2兆6563億円に達した。高度成長期初期の1960年に比較すると実に28倍。その間、対前年比で落ち込むことは一回もなかったのである。 しかし、この時をピークに転落が始まる。以来、17年間で36%落ちて2013年には1兆6823億円。2014年も月ベースでは前年同月比でマイナスが続いており、通年でも前年割れは確実である。その結果、バブル前の80年代前半の水準にまで戻ってしまったのであるが、まだ落ち足は止まっていない。 ピークからの下落率をみると、書籍の28%減に対し、雑誌は42%減。雑誌の場合、98年

    出版崩壊
  • 総務省|報道資料|統計データにおけるAPI機能の試行運用開始

    総務省は、統計データの高度利用環境の構築のため、平成25年6月10日(月)午前10時から、統計データにおけるAPI機能の導入による試行運用を開始します。これは、オープンデータ推進のトップランナーとして政府の取組を先導するものです。 総務省統計局は、平成25年5月28日付け報道資料(参考1)のとおり、統計におけるオープンデータの高度化を進めることとしており、今般、このうちAPI機能の導入について、独立行政法人統計センターが運用する「次世代統計利用システム」上で、6月10日午前10時から試行運用を開始することになりました。 API機能の導入により、例えば、(1)利用者の情報システムに政府統計のポータルサイト(e-Stat)のデータを自動的に反映、(2)ユーザー保有やインターネット上のデータ等と連動させた高度な統計データ分析などが可能となります。これにより、ビジネス活性化や新規事業の開発促進、行

    総務省|報道資料|統計データにおけるAPI機能の試行運用開始
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • 分析方法は「特性」と「変数」で変わる 精度が高いデータ解析を行うために重要な4つのS

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    分析方法は「特性」と「変数」で変わる 精度が高いデータ解析を行うために重要な4つのS
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~
  • 言語研究者のための統計の学び方―基礎を身につける|Colorless Green Ideas

    総和 総和と言っても、ピンと来ない人もいる。要するに与えられた規則に基づいて、数を足していくだけの話なのだけれども、慣れないとどういったものだか分かりづらいところがある。 総和記号の使用例 \[ \sum_{n=3}^{7} 2i = 2 \cdot 3 + 2 \cdot 4 + 2 \cdot 5 + 2 \cdot 6 + 2 \cdot 7 \] いずれにせよ、統計の教科書では、総和の記号がよく出てくるので、総和記号の取り扱いに把握しておくと統計が理解しやすくなる。高校の教科書だと、普通、数列について扱っている章に載っている。 組み合わせ論と確率 組み合わせ論と確率については、統計の入門書にもしっかり載っているので、特に力を入れる必要はないと思う。「そう言えばこんな感じなのだな」と、軽く確認するだけで十分だ。 対数 言語現象は対数の形で表されることが多いので、しっかり把握しておくこ

  • 統計的テキスト解析(1)~統計的データ解析とは?~

  • くろしお出版WEB - 言語研究のための統計入門

  • 1