タグ

統計に関するtestedqualityのブックマーク (30)

  • 紅白歌合戦を「視聴率以外」のデータから可視化してみる|こちら徒然研究室(仮称)|note

    2022年の紅白歌合戦については既に視聴率を元にした論評がたくさん出ていると思いますが、当研究室ではデジタル空間上でアクセス可能な様々なオープンデータとプログラミング言語Pythonを使って、その影響を分析してみたいと思います。その結果、世帯視聴率のみから論ずるのとはまた異なった紅白像がみえてきました。 実は過去最高のツイート数今回の紅白のテーマは「LOVE & PEACE -みんなでシェア!-」でした。この時点で紅白が、主にSNSを通じて番組が多数シェアされることを目指し、そのための企画を準備してることが推察できますね。ロゴもTwitterやInstagramでの「いいね」ボタンのアイコンを想起させるものでした。 「第73回NHK紅白歌合戦」 出場歌手発表は 今日・11月16日(水)17:00頃を予定 今年の紅白のテーマは 「LOVE & PEACE -みんなでシェア!-」 そこで今年は

    紅白歌合戦を「視聴率以外」のデータから可視化してみる|こちら徒然研究室(仮称)|note
    testedquality
    testedquality 2023/01/14
    本当に良い分析。NHKはSNS利用を丁寧に積み上げた結果ですね。あとオープンデータである意義は新しい視点をもって利用方法を提示してくれるので民間であっても宣伝してもらう利益があるとおもうんすよ。
  • 「データ分析の民主化」の在り方を、「社員全員Excel経営」が「社員全員データサイエンス経営」へと進化していった事例に見る - 渋谷駅前で働くデータサイエンティストのブログ

    以前こんな記事を書いたことがあります。 「社員全員Excel経営」で名高い、ワークマン社のサクセスストーリーを論評したものです。2012年にCIOに就任した土屋哲雄常務のリーダーシップのもと、取引データの完全電子化を皮切りに「全社員がExcelを使いこなして数字とデータで経営する」戦略へと移行し、社内のExcelデータ分析資格を一定以上取得しないと管理職に昇進できないとか、はたまた幹部クラスの企画・経営会議ではデータに基づかない議論や提案は相手にすらされないとか、「Excelを社員全員が使えるようになるだけでもここまで企業カルチャーは変わり得るのか」という事例のオンパレードで、関連記事や書籍を読んでいて舌を巻いたのを覚えています。まさしく「ワークマンのすごいデータ活用」だったのです。 一方、個人的に強く印象を受けたのが土屋常務が様々なところでコメントしていた「我が社には突出したデータサイエ

    「データ分析の民主化」の在り方を、「社員全員Excel経営」が「社員全員データサイエンス経営」へと進化していった事例に見る - 渋谷駅前で働くデータサイエンティストのブログ
  • 「NHK全国ハザードマップ」を公開した理由 34テラバイトのデータと格闘 - NHK

    34テラバイトのデータと格闘して「全国ハザードマップ」を公開した理由 5月下旬に公開を開始したNHKの「全国ハザードマップ」。川の氾濫による洪水リスクを中心に掲載し、多くの方に活用頂いています。 ⇒「NHK全国ハザードマップ」の紹介記事はこちら 一方で、「市町村が出しているハザードマップがあれば十分だ」「リスクを網羅していない不完全なマップの公開は良くない」「NHKではなく国が取り組むべき仕事ではないか」といった意見も頂きました。 今回なぜ、このような取り組みを行ったのか。どうやってデータを収集して地図を作ったのか。詳しく説明します。 なぜ「デジタルデータ」を集めたのか? 私たちはこれまで「ハザードマップを見て下さい」という呼びかけを、テレビやラジオのニュースや番組、ネット記事、SNSなどで繰り返してきました。 なぜなら、自分の暮らす場所のリスクを知ることが、災害から命を守るスタートだから

    「NHK全国ハザードマップ」を公開した理由 34テラバイトのデータと格闘 - NHK
    testedquality
    testedquality 2022/06/22
    データ収集フローと運用の標準化がデータ活用に一番重要だということがよくわかる。
  • 今度の「統計不正」は空前絶後の大問題だぜ - モノシリンの3分でまとめるモノシリ話

    国土交通省の建設工事受注動態統計調査に不正があったと報道されているが、正確に把握している人はほとんどいないと思う。そこで、まとめる。 問題点は、「合算処理」と「二重計上」の2点。 このうち、重要なのが「二重計上」なのだが、先に「合算処理」から説明しよう。 ◆合算処理とは 合算処理とは、提出の遅れた月の調査票の数値を、後の月に合算して計上する処理のことである。 建設工事受注動態統計調査は、対象企業から毎月調査票を提出してもらう。この提出期限が対象月の翌月10日であり、非常に締め切りがタイトである。 だから、締め切りを過ぎて出されることが多々あった。 そうやって遅れて出された月の数値について、遡って修正するのも手間がかかる。 そこで、後の月に合算して計上していたのだ。 これは具体例で考えると分かりやすいので、下記のような例を想定してみよう。 ・ある企業は、1月分の調査票について、締め切り日(2

    今度の「統計不正」は空前絶後の大問題だぜ - モノシリンの3分でまとめるモノシリ話
    testedquality
    testedquality 2022/02/03
    再計算をできる方が国土交通省にいればできる。データが多分紙しかないしシステムもないはず。
  • 貯蓄ゼロ世帯の正体と単身世帯の貯蓄額 - ゆとりずむ

    こんにちは、らくからちゃです。 先日、こんな記事を書きました。 www.yutorism.jp 『標準的な家庭の貯蓄高ってどんな塩梅なんやろなー』と、調べてみた結果を割りとそのままベタッと貼り付けただけの内容でしたが、色んな人に読んで頂き、多くのコメントも頂けました。中でも、複数の方から『2人以上世帯のデータしか入っていない。独身者に人権は無いのか。』といった旨のご指摘いただきました。 独身者の貯蓄の実態・・・、なるほど・・・、 わたし、気になります!( ・`ω・´) というわけで、また統計データをゴソゴソ漁ってみました。 平均的な貯蓄高について まずは前回同様、ざっくり貯蓄高についてみておきましょう。 (出典:単身世帯の家計収支及び貯蓄・負債に関する結果(H26)) 平成26年(2014年)の単身世帯を対象とした調査結果となります。個人を対象とした調査ですので、男女別に結果が見れますね。

    貯蓄ゼロ世帯の正体と単身世帯の貯蓄額 - ゆとりずむ
  • 30代東京の子育て世帯は年収650万円必要という労働組合調査が妙に納得感高い - 銀行員のための教科書

    東京都内で夫婦2人、子供2人で暮らすのに必要な生活費について、労働組合が2019年の都内子育て世帯の最低生活費試算を公表しました。 「東京で普通に子育てをするためにはいくら必要になるのか」をテーマとしており、かなり詳細な調査となっています。労働組合が発表したものではありますが、非常に興味深いものになっています。 今回は、東京都内で夫婦2人、子供2人で暮らすということ、そして年収ということについて簡単に確認していきたいと思います。 労働組合の調査結果概要 費 住居費 家具・家事用品費 被服・履物費 交通・通信費 教育教養娯楽費 交際費その他 その他費用 まとめ 労働組合の調査結果概要 東京地方労働組合評議会(東京地評)が、「人間らしく暮らせる社会」をめざして、2019年より、最低生計費の試算調査と分析を継続して行っています。 この調査の概要は以下となります。 調査回答者約3200ケース

    30代東京の子育て世帯は年収650万円必要という労働組合調査が妙に納得感高い - 銀行員のための教科書
  • 医療事故調査制度についてチーム医療:ダブルチェックの有効性を再考する(pdf)

    ダブルチェックの有効性を再考する 京都大学医学部附属病院 医療安全管理部部長 松村由美 平成30年度医療安全セミナー 主催:厚生労働省四国厚生支局 サンポートホール高松 平成30年12月7日(金)13時00分 ダブルチェックとは? 説明してみよう! 2 誤薬の防止 各業務プロセスの中でのダブル チェックなど,・・・が重要である 日看護協会 医療安全推進のための標準テキスト 論理・文脈チェック 表層チェック 3 各業務プロセス:薬剤の場合 処方 調剤 与薬 時間差 ダブルチェック 同時 ダブルチェック ダブルチェックなし または 研修医,指導医など または カンファレンス(論理・文脈チェックに向く) 業務として定めていない 処方鑑査業務 4 看護師は,同時ダブルチェックが多い ~注射薬のダブルチェックを例に~ • 方法は様々・・・ 指示簿とラベルと薬剤を二 人で一緒に同じものをみて います

    testedquality
    testedquality 2020/09/09
    すべての仕事に有用な資料。公開してくれてありがとう!早速社内で回覧する。
  • ドコモが日本全国の人口分布をリアルタイムで確認できるWebサイトを公開、モバイル空間統計を活用

    ドコモが日本全国の人口分布をリアルタイムで確認できるWebサイトを公開、モバイル空間統計を活用
    testedquality
    testedquality 2020/06/01
    有償利用が促進できるなら公開続くと思うんですよ。
  • 機械学習モデルを作成する - Training

    Microsoft Learn では、対話的な方法で、従来の機械学習の概要を理解することができます。 これらのラーニング パスは、ディープ ラーニングのトピックに移行するための優れた基盤にもなり、各自の生産性を向上させます。 最も基的な従来の機械学習モデルから、探索的データ分析やカスタマイジングのアーキテクチャまで、ブラウザーを離れることなく、概念的内容や対話型の Jupyter Notebook を簡単に把握することができます。 知識と興味に応じて自分のパスを選択してください。 オプション 1: 完全なコース: 機械学習のためのデータ サイエンスの基礎 ほとんどのユーザーには、このパスがお勧めです。 これには、概念の理解を最大限に高めるカスタム フローを備えた、他の 2 つのラーニング パスと同じモジュールがすべて含まれています。 基になる概念と、最も一般的な機械学習ツールでモデルを構

    機械学習モデルを作成する - Training
    testedquality
    testedquality 2020/01/16
    本当におわるかやってみよう。
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
  • ア㊙️イさんのお尻と学ぶ統計学(仮置場)

    目次からリンクで飛べる各トピックはツリー形式になっているのだ。 あまりにツイート量が膨大になってしまったので、123回目以後は各ツリーの最初のツイートへリンクだけまとめておくのだ。 お尻さんは各国の歴史や制度に詳しいわけではないし統計手法も誤って理解していることがあるから(それなら黙っておけという話だけど)、間違いがあったらどんどん指摘して欲しいのだ!

    ア㊙️イさんのお尻と学ぶ統計学(仮置場)
    testedquality
    testedquality 2019/10/03
    まとめありがとうございます。ここから読ませていただきます。
  • LINE Transparency Report - LINE Corporation

    [2021年10月18日] この度、レポートの数値の集計に一部誤りがあったことを確認し、内容を訂正いたしました。訂正箇所について、赤字で表記しております(括弧内は過去の公開情報です)。 訂正に関するプレスリリース:https://linecorp.com/ja/pr/news/ja/2021/3933 捜査機関からのユーザー情報開示・削除要請 情報開示-対応件数 捜査機関 受領した要請のうち85%(86%)が日の捜査機関からのものでした。 当社では2018年1-6月の間にLINEメッセンジャーアプリに対し、前期間比13%(177件(186件))増となる1,561件(1,576件)の要請を世界各国の捜査機関から受領し、うち76%の1,193件(1,190件)の要請に対し何らかの情報開示を行いました。情報開示件数(要請数)の増加の大部分は日(人身被害関連/31%増)と台湾(金銭被害関連

    LINE Transparency Report - LINE Corporation
    testedquality
    testedquality 2019/01/23
    LINE以外にこの情報公開しているところがないのですね。LINEすごいな。
  • 不適切統計、厚労省職員の発言で発覚 「東京以外でも」:朝日新聞デジタル

    毎月勤労統計の問題が発覚するきっかけは、厚生労働省の担当職員が総務省の統計委員会の打ち合わせで「東京以外の地域でも従業員500人以上の事業所について抽出調査を実施したい」と発言したことだった。複数の関係者が明かした。 厚労省と総務省の担当職員、統計委員会の西村清彦委員長らが昨年12月13日、次回の統計委員会開催について協議した。西村氏が毎月勤労統計の調査結果について、かねて正確性を疑問視する声が出ていることを踏まえ、詳細に分析する必要があるとし、次回委員会のテーマにする考えを示したという。 その時に厚労省職員から、従業員500人以上の事業所について東京都では抽出調査をしており、東京以外への拡大を計画しているとの発言があった。西村委員長は「抽出調査は重大なルール違反」と指摘し、統計の信頼性確保の観点からも危機的状況だとの認識を示した。厚労、総務両省に早急に事実関係を確認するよう求めた。 今回

    不適切統計、厚労省職員の発言で発覚 「東京以外でも」:朝日新聞デジタル
    testedquality
    testedquality 2019/01/11
    統計局から即座に指摘が入ったいきさつから見て統計局ご立腹だろう。設計蔑ろだもん。さらに抽出に恣意がはいってたわけで・・・
  • 「毎月勤労統計」 都内事業所全数調査怠る 実施は3分の1程度 | 毎日新聞

    厚生労働省が公表している「毎月勤労統計」で、来は従業員500人以上の事業所は全て調査しなければいけないのに、東京都内分は3分の1程度しか調査していなかった。厚労省への取材で判明した。毎月勤労統計は統計法に基づいて実施されている政府の基幹統計の一つで、結果は国内総生産(GDP)などの算出にも用いられている。同省はずさんな調査の経緯や影響を調べている。 この統計は、雇用動向を把握するため、全国3万超の事業所(従業員5人以上)を対象に実施している。基給や残業代などを合計した1人当たりの現金給与総額や前年同月と比べた変動率などを毎月公表している。従業員499人以下の事業所は無作為抽出するが、500人以上は全事業所が対象になる。調査は都道府県を通じて実施している。

    「毎月勤労統計」 都内事業所全数調査怠る 実施は3分の1程度 | 毎日新聞
    testedquality
    testedquality 2018/12/29
    業務委託入札で抽出方法がhttps://www.mhlw.go.jp/toukei/list/30-1d.html#link05 と定まってるのに?すごくデータ精度や恣意が入ることを統計局は本当に嫌がるから厚生省独断なきがするなあ。
  • ナメクジの出現を予測する!- 市民科学と最新統計の融合

    外来種問題は突然に 2014年7月某日、札幌市の円山原始林で私が出会ったのは、体長15cmもの巨大な豹柄のナメクジ、マダラコウラナメクジでした。私はそれを知っていました。過去に一度だけ、ドイツ・ドレスデンの森の中で見たことがあったからです。北欧原産のナメクジがどうしてここに? 慣れ親しんだ円山の森に現れた、不似合いな新参者との突然の出会いに、目眩がしました。私の知る北海道の生態系は、これからいったいどうなってしまうのか? 我々ヒトの生活への影響は? 体長15 cmほどのマダラコウラナメクジ 市民のブログが教えてくれた 予期せぬ出会いに衝撃を受けた私は、研究室に戻るや否や、飛びつくように現状を調べ始めました。わかったことは、マダラコウラナメクジが2006年に茨城県で最初に侵入・定着が確認されたということ、さらに2010年には福島県、2012年には長野県にも侵入し勢力を拡大しているということで

    ナメクジの出現を予測する!- 市民科学と最新統計の融合
    testedquality
    testedquality 2018/08/12
    文章が面白い。そして内容がすばらしい。市民科学という言葉初めて知りましたが、人間の英知を感じます。あと試される大地の人々の洞察力。
  • ビデオリサーチのAbemaTVリリース取り下げを題材に、「視聴率」と「視聴数」の違いをはっきりさせよう。 | AdverTimes.(アドタイ) by 宣伝会議

    先月末はびっくりして、がっかりな件がありました。経緯は他のメディアの記事に書いてあるので、ざっと読んでみてください。 参考:ビデオリサーチ、「『ホンネテレビ』視聴者207万人」リリース取り下げ トップページで謝罪(ITmedia 17/12/04) かいつまんで書くと、11月28日にビデオリサーチ社が「うちの調査パネルVR CUBICで調査したらAbemaTVを見た人は2.4%で、これを人口(15〜69才)に当てはめて、AbemaTVを視聴した人数は207万人と推計しました」というようなリリースを出したんですね。 ところが翌々日の11月30日にリリースを取り下げ「ご迷惑をおかけ」したと謝罪文を掲示した。それはどうやらサイバーエージェント藤田社長が取り下げるようクレームをつけたかららしい。ざっくりそんな内容です。 「ビデオリサーチが取り下げた」ことが話題になり、ヤフトピにもそのニュースが出て

    ビデオリサーチのAbemaTVリリース取り下げを題材に、「視聴率」と「視聴数」の違いをはっきりさせよう。 | AdverTimes.(アドタイ) by 宣伝会議
    testedquality
    testedquality 2018/01/05
    きちんと取り下げについて調べていた記事をみつけた。
  • 機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界

    さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを

    機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界
  • 住宅・土地統計調査の妥当性検証と検証後の空き家率・問題化の時期

    testedquality
    testedquality 2016/07/20
    空き家問題で出てくる数値についての妥当性検証。「実感にあってない」ことが調査結果をみてお客様から出てくることがあります。その対応方法。すんげー納得した。実感とあう。
  • 気象庁 | 検証方法の説明

    予報区についてはこちらを参考にしてください。 予報区の細分図 天気予報検証結果や週間天気予報検証結果では、以下の地方予 報区名称を簡略して表記しています。 九州北部地方(山口県を含む) → 九州北部地方 九州南部・奄美地方 → 九州南部地方 個々の予報について予報と実況の降水の有無を比較し、予報区毎に1か月分を集計して検証しています。 地方予報区および全国の値は、発表官署の所在している発表区域に対して発表された予報の検証結果を集計して掲載しています。 実況の降水の有無は、観測された降水量により、以下の様にして判定しています。 降水量の観測値降水あり

    testedquality
    testedquality 2016/07/19
    「雨が降る確率」に代表される気象庁における天気予報精度の検証方法。なんだけど機械学習初心者の私には2乗平均平方根誤差の説明が一番わかりやすかったのです。ありがとう気象庁。
  • 世界で9番目に平和な国、日本 - A Successful Failure

    2016年06月16日 世界で9番目に平和な国、日 Tweet 米フロリダ州オーランドで起きた米国史上最悪の銃撃事件は世界がテロとの戦いの渦中にあることをまざまざと見せつける結果となった。また銃規制に関する議論が米国で盛んになると見られるが、あの国が市民から銃を取り上げることは無いだろう(銃乱射事件が2日に1回発生している銃社会アメリカ)。 銃撃事件など滅多に起きることのない日は平和な国だ。実際どの程度平和なのかといえば、世界163の国と地域の中で、上位9位にランクされる程である。日より平和な国はこの世界に8カ国しか存在しない。アイスランド、デンマーク、オーストリア、ニュージーランド、ポルトガル、チェコ、スイス、カナダの8カ国である。一方で米国は103位であり、カンボジアやウガンダと同レベルだ。 イギリスの経済平和研究所(IEP)は、6月10日に2016年の世界平和指数(2016 G

    世界で9番目に平和な国、日本 - A Successful Failure
    testedquality
    testedquality 2016/06/20
    9番目に平和の説得力。Tableauでのグラフの美しさと文章がどっちも好き。どうでもいいけど、タブローってカタカナで書くとサボロー君を一緒に思い出すため英語表記をするようにしてます。