タグ

統計に関するgoseiのブックマーク (6)

  • 「NHK全国ハザードマップ」を公開した理由 34テラバイトのデータと格闘 - NHK

    34テラバイトのデータと格闘して「全国ハザードマップ」を公開した理由 5月下旬に公開を開始したNHKの「全国ハザードマップ」。川の氾濫による洪水リスクを中心に掲載し、多くの方に活用頂いています。 ⇒「NHK全国ハザードマップ」の紹介記事はこちら 一方で、「市町村が出しているハザードマップがあれば十分だ」「リスクを網羅していない不完全なマップの公開は良くない」「NHKではなく国が取り組むべき仕事ではないか」といった意見も頂きました。 今回なぜ、このような取り組みを行ったのか。どうやってデータを収集して地図を作ったのか。詳しく説明します。 なぜ「デジタルデータ」を集めたのか? 私たちはこれまで「ハザードマップを見て下さい」という呼びかけを、テレビやラジオのニュースや番組、ネット記事、SNSなどで繰り返してきました。 なぜなら、自分の暮らす場所のリスクを知ることが、災害から命を守るスタートだから

    「NHK全国ハザードマップ」を公開した理由 34テラバイトのデータと格闘 - NHK
  • 高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱

    (語り手)JILIS副理事長 高木 浩光 (聞き手)JILIS出版部 編集長 小泉 真由子 (撮影)宇壽山 貴久子 この1年、過去の海外文献を調査していたという高木浩光さん。これまでの研究の一部は情報法制レポート創刊号の特集として掲載されましたが、高木さんに言わせると「あれはまだ序の口」とのこと。日お伺いする内容は近々高木さん自身が論文にされる予定とのことですが、まだ時間がかかりそうということで、急ぎ、インタビューとしてお話しいただくことになりました。なお、このインタビューは大変長くなっております。ぜひ、最後までお付き合いいただければと思いますが、時間のない方は、目次を参照していただき、気になるトピックからお読みください。 —— 今日は、高木さんがどうしても今すぐみなさんに伝えたいことがあるとのことで、インタビューでお話を聞くことになりました。 高木: はい、よろしくお願いします。話はと

    高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱
  • 文系社会人が統計のために1から高校数学をやりなおしました|hanaori

    こういう人間です ・ 文系(英文学科) ・ Webエンジニア ・ 統計を勉強中モチベーションここ2年ほど統計を勉強しているのですが、そこで毎回立ちふさがるのが数学の壁でした。わたしは文系ということもあって数ⅡB(しかも途中まで)しか履修していなかったため、微分積分や線形代数などが出てくると理解することが難しく時間がかかってしまいます。 でももっと統計を知りたいし理解したい 😭 という気持ちをずっと感じていて今回数学をやり直すことにしました。 高校3年分と考えるとなかなか決心するのに時間がかかりましたが、やってよかったと思います。スケジュール感や実際使ったなどを共有することで同じような方の参考になればよいなあ、と思います。 実際使用した ・ 講座■ よくわかる数学シリーズ 主にMY BESTシリーズを使用しました。カラーで説明もわかりやすく、目にも心にもやさしい仕上がりになっております

    文系社会人が統計のために1から高校数学をやりなおしました|hanaori
  • 高校レベルの数学から大学の教養数学くらいまでを独学/学び直した - razokulover publog

    去年の12月頃から数学の学び直しを始めた。 職業柄少し専門的な、特に機械学習の方面の書籍などに手を出し始めると数式からは逃れられなかったりする。とはいえ元々自分は高校時代は文系で数学1A2Bまでしか履修していない。そのせいか少し数学へ苦手意識があり「図でわかるOO」とか「数学無しでもわかるOO」のような直感的に理解出来る解説に逃げることが多かった。実務上はそれで問題ないにしてもこのまま厳密な理解から逃げているのも良くないなと感じたのでもう少し先の数学に取り掛かることにした。 巷には数学の学び直しについての記事が既にたくさんある。それに自分の場合は何かの受験に成功した!とか難関の資格を取得した!というような華々しい結末を迎えている状態ではない。そんな中で自分が何か書いて誰の役にたつかもわからないが、少なくとも自分と似たようなバックグランドを持つ人には意味のある内容になるかもしれないので、どの

    高校レベルの数学から大学の教養数学くらいまでを独学/学び直した - razokulover publog
  • 40代前半男性の所得中央値

    2017年の『就業構造基調査』の結果が公表されました。昨日の14:30でしたが,私は10分ほど前からパソコンの前にへばりついて,今か今かと待っていました。 http://www.stat.go.jp/data/shugyou/2017/index.html このブログでは幾多の官庁統計を分析していますが,『就業構造基調査』は最も活用しているものの一つです。この調査の目玉は有業者の所得を調査していることで,所得をキーにしたクロス集計表も多数アップされています。性別・年齢層別の所得分布,所得階層別の未婚率など,いろいろなことを明らかにできます。 調査でいう所得とは,「賃金,給料,手間賃,諸手当,ボーナスなど過去1年間に得た税込みの給与総額」をいいます(用語解説)。税引き後の年収とは区別される概念です。 私は,2017年のデータが公表されたら,今の自分の世代の所得がどうなっているかをまず明

    40代前半男性の所得中央値
    gosei
    gosei 2018/07/15
    すごく実感に近いデータだ。これまでの平均所得とか何だったのか。
  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
    gosei
    gosei 2017/01/22
  • 1