タグ

統計とあとでよむに関するardarimのブックマーク (31)

  • 風俗客とキャスト「性接触の全国ネットワーク」を可視化 口コミ9万件分析で見えた「世界の狭さ」 - 弁護士ドットコムニュース

    誰と誰が性的な関係を持ったかという性接触のネットワークはHIVなどの感染症予防のために古くから研究されてきた。一方で、もっとも他人には知られたくないプライバシーに関わる内容ゆえに大々的な調査は不可能とされ、その実態は謎につつまれていた。 しかし2022年11月、静岡大学の守田智教授と長崎大学の伊東啓助教らのグループは、性風俗の口コミサイトに寄せられたレビューをもとに全国規模の「性接触ネットワーク」の構築に成功したと発表した。 その内容はどんなものなのか。守田教授と伊東助教が解説する。 「ネット上で公開されている風俗店のレビューはある人とある人が性的接触をした証拠なわけです。これを使ってネットワークを作れないかと考えました。レビューの中から女性キャストの名前と客のハンドルネームだけを抜き出して、誰と誰がつながっているのかというのを収集しました。 例えばAさんが静岡のお店で働くaさんに対して口

    風俗客とキャスト「性接触の全国ネットワーク」を可視化 口コミ9万件分析で見えた「世界の狭さ」 - 弁護士ドットコムニュース
  • サッカー本田圭佑「日本の治安、どんどん悪くなってる気がする」 → データが集まる → 「メディアに踊らされてた」

    Keisuke Honda @kskgroup2017 日の治安がどんどん悪くなってる気がする。子供だけで外で遊ばせられへん。習い事も送り迎えが必要。何かあってからでは遅いと思わせる国になってきてる。幸いなことに多くの外人はその事実にまだ気付いていない。 2023-03-03 10:30:39

    サッカー本田圭佑「日本の治安、どんどん悪くなってる気がする」 → データが集まる → 「メディアに踊らされてた」
  • 基幹統計「農業集落調査」廃止方針に研究者たちが猛反発する理由 「ミクロデータの扇の要」:東京新聞 TOKYO Web

    5年に1度、農林水産省が実施する国の基幹統計「農林業センサス」の一部で、60年以上の歴史がある「農業集落調査」の存廃がいま、議論になっている。次回2025年について、農水省が「実施が困難」だとして廃止の方針を示したところ、研究者らが猛反発。継続を求める署名は1000人を超えた。一方で、基幹統計は、相次ぐ不正で信頼性が低下。統計にかかわる職員の減少も進む。国の政策立案を支える重要統計は、大きな変革を迫られている。(特別報道部・山田祐一郎)

    基幹統計「農業集落調査」廃止方針に研究者たちが猛反発する理由 「ミクロデータの扇の要」:東京新聞 TOKYO Web
  • 「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め

    ビジネスでデータサイエンスを活用するシーンとして、過去データを使って将来を予測するタイプの問題がある。商品販売数や店舗売上高など、折れ線グラフを使って表現するようなデータ(時系列データ)に基づいた時系列分析だ。過去の販売データに基づいて翌月の発注量を決めたり、3年後など中長期の計画を策定したりするのに使う。今回は、この時系列分析に活用しやすい3つのアルゴリズムを見ていこう。 Prophet

    「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め
  • 因果推論とグラフ理論 - エクサウィザーズ Engineer Blog

    こんにちは。数理最適化ギルドでエンジニアをしている加藤です。 ある自社プロダクトの開発を通じて因果推論について勉強する機会がありました。因果推論は統計の分野ですが、その中で数理最適化技術が使えることを知り、とても面白かったのでその内容をシェアしようと思います。具体的には組合せ最適化問題のひとつである最小カット問題が、因果推論のタスクの一部である識別可能性に利用できるという話をします。 前半は因果推論についての概説で特に予備知識は仮定していないです。後半は計算時間やネットワークフローなどのアルゴリズムを知っていると読みやすいと思います。 因果推論とは 因果推論の目的 統計的因果推論とは事象の間の因果効果を実験データや観測データから推定することを目的とした統計学の一分野です。単に因果推論といった場合は統計的因果推論を含むより広い概念を指すことがありますが、簡単のため以下では因果推論といえば統

    因果推論とグラフ理論 - エクサウィザーズ Engineer Blog
  • 総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai
  • 「毎勤統計より悪質だ」 20年以上続いた国交省不正 統計不正、再びの衝撃(1) - 日本経済新聞

    「人手が足りず目の前の仕事で手いっぱい。作業を検証する余裕なんてまったくなかった」。国土交通省が「建設工事受注動態統計」を書き換えていた問題が発覚した2021年12月中旬。省内外からの批判や問い合わせに実務担当者は、思わず音を漏らした。集計はほぼ1人の職員が担っていた。対象月の実績を翌月20日までに回収する。調査票に誤りがないか目視で確認し、公表資料にまとめる作業の繰り返しだ。「一人親方で全

    「毎勤統計より悪質だ」 20年以上続いた国交省不正 統計不正、再びの衝撃(1) - 日本経済新聞
  • 家に本が多いほうがテストの正答率高い? 文科省調査

    文部科学省が全国の小中学生を対象に「家庭の蔵書数」を初めて調査したところ、25冊以下が3割を占めた一方、蔵書数が多いほうがテストの正答率が高くなる傾向が明らかになりました。 文部科学省はことし5月、全国の小学6年生と中学3年生の200万人以上を対象に「全国学力テスト」を実施し、家庭の経済的、文化的な資をはかる指標の1つとして、国際的な調査でも用いられる「家庭の蔵書数」を初めて調べました。 その結果、家にあるの数が、 ▽0~10冊と答えたのは小学生で11%、中学生で14% ▽11~25冊が小学生で19%、中学生で20%で 25冊以下と答えた子どもが3割を占めました。 ▽26~100冊が小学生で34%、中学生で32% ▽101~500冊が小学生で32%、中学生で30% ▽501冊以上が小中学生とも5%でした。 学力テストの正答率をみると、小学校の算数では、蔵書数が最も多い子と最も少ない子で

    家に本が多いほうがテストの正答率高い? 文科省調査
    ardarim
    ardarim 2021/09/05
    単なる疑似相関の域を出ないと思うけど。それに最近では電子書籍派も増えてるだろうから、本当に?と疑いたくなってくるのだけど。
  • 全国民に配るべき!総務省が示した「データ入力の統一ルール」|Excel医ブログ

    2020年12月、総務省より 【機械判読可能なデータの表記方法の統一ルール】が策定されました。 統計表における機械判読可能なデータの表記方法の統一ルールの策定 https://www.soumu.go.jp/menu_news/s-news/01toukatsu01_02000186.html 2020年11月に河野太郎 行政改革担当大臣のツイートが話題となりました。 その後正式に統一ルールが公開された形です。 各省庁がネット上で公開する統計を機械判読可能にするために、データの表記方法を統一させます。「政府統計の総合窓口(e-Stat)」で日から12月1日までの間、表記方法案に関する意見照会を行います。研究者をはじめ、皆様のご意見をお待ちしています。https://t.co/h07tCTDazc — 河野太郎 (@konotarogomame) November 25, 2020

    全国民に配るべき!総務省が示した「データ入力の統一ルール」|Excel医ブログ
  • コロナ感染させた人 マスクなし96.4% 金沢市調査(北國新聞社) - Yahoo!ニュース

    新型コロナウイルス陽性者を対象にした金沢市の調査で、濃厚接触者に感染させたとみられるケースでは、96・4%がマスクをせずに会話していたことが11日、分かった。対象の感染者84人のうち、81人がマスクを着けていなかった。市はマスクの感染予防効果は大きいとみて、まん延防止等重点措置が解除される14日以降もマスク着用の徹底を呼び掛ける。 金沢市は、福井県がコロナ対策として打ち出した「福井モデル」を参考に調べた。4月1日~5月19日の陽性者664人から無作為抽出した200人のうち、濃厚接触者に感染させたのは84人。その中でマスクをしないで会話していた81人が計148人に感染させたとみられる。 一方、マスクを付けて会話して感染させたのは3人。市によると、この3人についても意識せずに外した瞬間があったり、マスクの着け方に不備があったりした可能性があるという。 福井モデルは徹底した積極的疫学調査とPCR

    コロナ感染させた人 マスクなし96.4% 金沢市調査(北國新聞社) - Yahoo!ニュース
    ardarim
    ardarim 2021/06/12
    もうマスク無しで感染させたやつは過料課すくらいしてもいいんじゃないかな。
  • 海外「日本よ、何故なんだw」 日本が世界的に特殊である事を示すNetflixのデータが話題に

    19世紀初頭のロンドンの社交界を舞台に、 名門貴族ブリジャートン家の8人の兄弟が、 それぞれの愛と幸せを追い求める姿を描いた、 Netflixのオリジナルドラマ「ブリジャートン家」。 昨年12月25日に配信がスタートするやいなや、世界中で大ヒット。 わずか4週間で8200万世帯が視聴しており、 この数字はオリジナルドラマの中で史上最多となります。 また、イギリス、フランス、アメリカなど世界83カ国で、 Netflixのドラマ部門の視聴者数ランキング1位を記録。 さらに、Netflixが視聴可能な日以外の全ての国で、 トップ10入りを果たす快挙を達成しています。 逆に言えば、日でのみトップ10入りしていないわけですが、 その点にBBC北米特派員のジャーナリストも注目。 日の特殊性を指摘する投稿に、多くの意見が寄せられています。 その一部をご紹介しますので、ごらんください。 翻訳元■■■

    海外「日本よ、何故なんだw」 日本が世界的に特殊である事を示すNetflixのデータが話題に
  • 可視化や統計でデータに『恣意的なストーリーを語らせる』16の闇の魔術【bad charts】 - Qiita

    闇の魔術に対する防衛術 Advent Calendar 2020の三日目 はじめに データの可視化は非常に難しい。 まずデータの抽出が難しい ・データソースごとの整合性が取れているか ・取得したデータとソースデータに欠損が生じていないか ・SQL文を実行したサマリの結果が部分的に抜け落ちていないか。 その確認は時間的にも精神的にも苦痛。 しかし、苦労して抽出したデータも使い方で全くの無駄になる その例として「可視化や統計」部分に着目してお話をしようと考えた。 データの背景を知らない人には、データ可視化が歩み寄る手段になるし、伝えたい事をインパクトを伴って伝えられるなど非常にメリットである。 ※ただし 「可視化」の使い方によっては誤った理解をさせることも可能。 伝えたい事だけを正しいように見せる方法もあり、 可視化に詳しくない人に誤解を与えて自分の主張を通すこともできるかもしれない。 これは

    可視化や統計でデータに『恣意的なストーリーを語らせる』16の闇の魔術【bad charts】 - Qiita
  • 若年層、死因1位が「自殺」 先進国で日本のみ…深刻な事態

    27日に政府が閣議決定した令和2年版自殺対策白書では、昨年の自殺者数は前年より671人少ない2万169人で、全世代的に減少する中、10代が唯一、前年より増加した。15~39歳の各年代の死因は自殺が最も多く、先進国では日だけにみられる事態として、厚生労働省は「国際的にも深刻な状況」と危機感を抱く。コロナ禍の今夏には中高生の自殺が増えており、心理的な孤立化を防ぐ取り組みが求められる。 「悩み解消の知識が足りない」「さらに分析しないといけない課題。はっきりしたことは言えない」。若年層の自殺者数が減らない要因を問われ、厚労省の担当者はこう言葉を濁した。 昨年の10~19歳の自殺者は659人で、前年より60人増加。人口10万人当たりの自殺者数を示す自殺率も前年比0・3ポイント増の3・1で過去最悪を更新した。 15~39歳の各年代の死因は自殺が最多で、がんなどの病気や不慮の事故を上回る。15~34歳

    若年層、死因1位が「自殺」 先進国で日本のみ…深刻な事態
  • 「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary

    この文章は pandoc-hateblo で tex ファイルから変換しています. PDF 版はこちら 2021/10/15 追記: 後半のベイジアンブートストラップに関する解説はこちらのほうがおそらく正確です ill-identified.hatenablog.com 概要挑発的なタイトルに見えるかも知れないが, 私はしらふだしこれから始めるのは真面目な話だ — 正直に言えばSEOとか気にしてもっと挑発的なタイトルにしようかなどと迷ったりはしたが. 「全数調査できれば標抽出の誤差はなくなるのだから, 仮説検定は不要だ」という主張を見かけた. いろいろと調べた結果, この問題を厳密に説明しようとすると最近の教科書には載ってない話題や視点が必要なことが分かった. ネット上でも勘違いしている or よく分かってなさそうな人をこれまで何度か見かけたので, これを機に当初の質問の回答のみならず関

    「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary
  • 国勢調査、同性カップルをカウントせず「親族」扱い 識者「実態把握できぬ」 | 毎日新聞

    前回(2015年実施)の国勢調査で使われた調査票のサンプル。世帯員それぞれについて、「世帯主との続き柄」を回答することになっている=総務省のホームページより 今秋、5年に1度の国勢調査が実施される。国内の全世帯に関する情報を収集し、今後の政策立案につなげることが主な目的だが、事実上「除外」扱いとなりカウントされないケースがある。同性同士のカップルだ。国勢調査の記入用紙で「世帯主との続き柄」を選択する際、異性同士のカップルならば「配偶者」と記入すればそのまま集計されるが、同性同士のカップルではそれが認められず、総務省の見解では「他の親族」に分類されてしまう。当事者や識者からは「実態が正確に把握されず、国勢調査の意味をなさない」と批判の声が上がっている。なぜ同性カップルは「他の親族」扱いにされているのか。【藤沢美由紀/統合デジタル取材センター】 「おじ」「おば」と同じ? 国勢調査は外国人も含め

    国勢調査、同性カップルをカウントせず「親族」扱い 識者「実態把握できぬ」 | 毎日新聞
  • コロナ急増の先進国は米国と日本くらい? グラフが拡散→「ミスリード」と指摘相次ぐ、専門家の見解は

    新型コロナウイルスの感染者が急増している先進国は「トランプを支持する米国の一部と日くらい」としてシェアされたグラフがTwitterで拡散している。 このグラフは一見すると、各国に比べて日の感染者数が突出しているように見えるが、「ミスリード」であるとの指摘が相次いでいる。グラフの縦軸の値が、日とそのほかの国で10倍以上も異なるからだ。 シェアした医師は「実数ではなく推移を比較したもの」としているが、別の医師や専門家からは「科学者として絶対にやってはいけないこと」との批判もあがっている。 グラフをシェアしたのは、内科医でNPO法人「医療ガバナンス研究所」理事長の上昌広医師。野党の推薦で、新型コロナウイルスに関する参議院の公聴会に出席した経験もある。グラフは8月3日、以下のような文言とともにツイートされた。 「真夏の北半球でコロナが急増している先進国は、トランプを支持する米国の一部と日

    コロナ急増の先進国は米国と日本くらい? グラフが拡散→「ミスリード」と指摘相次ぐ、専門家の見解は
    ardarim
    ardarim 2020/08/06
    嘘、大げさ、紛らわしい。
  • Togetter - 国内最大級のTwitterまとめメディア

    いま話題のツイートまとめが読めるTwitterまとめに特化したまとめサイト。人気のツイートやTwitterトレンド、写真やマンガといった話題の画像から、さまざまなニュースの反応まで、みんなであつめる国内最大級のメディアプラットフォームです。

    Togetter - 国内最大級のTwitterまとめメディア
  • 安倍首相が統計不正の証拠メールを突きつけられ大慌て! 答弁中の根本厚労相に「いったん戻れ」と前代未聞の指示 - 本と雑誌のニュースサイト/リテラ

    安倍首相が統計不正の証拠メールを突きつけられ大慌て! 答弁中の根厚労相に「いったん戻れ」と前代未聞の指示 統計不正調査問題で、安倍官邸、そして安倍首相の関与を示すさらなる証拠が出てきた。それは、厚労省が同年6月に調査方法を見直すため発足させた「毎月勤労統計の改善に関する検討会」(以下、検討会)で座長を務める中央大学・阿部正浩教授に対し、厚労省側が2015年9月14日に送ったメールだ。 そのメールで厚労省側は、阿部座長に対して「委員以外の関係者から『部分入れ替え方式を検討すべきではないか』との意見があった」と伝えていた。 この2015年9月14日というのは、結果的に最後の検討会となった第6回会合が開かれる2日前のこと。同年8月7日におこなわれた第5回会合では、阿部座長は「検討会の方向性としては、総入れ替え方式で行うことが適当であるということにさせていただければと思います」と従来通りでいくこ

    安倍首相が統計不正の証拠メールを突きつけられ大慌て! 答弁中の根本厚労相に「いったん戻れ」と前代未聞の指示 - 本と雑誌のニュースサイト/リテラ
  • 統計不正追及を批判=「資源の無駄遣い」-浜田内閣参与:時事ドットコム

    統計不正追及を批判=「資源の無駄遣い」-浜田内閣参与 2019年02月16日17時35分 講演する浜田宏一内閣官房参与=16日午後、福島県郡山市 安倍晋三首相の経済政策ブレーンとして知られる浜田宏一内閣官房参与は16日、立憲民主党など主要野党が毎月勤労統計の不正調査問題を国会で追及していることについて「選挙で勝てないから、非常に能率の悪い審議で政権の人をとっちめる。資源の無駄遣いのように思う」と批判した。

    統計不正追及を批判=「資源の無駄遣い」-浜田内閣参与:時事ドットコム
  • 不適切調査 統計委員長「あぜんとした 明らかな法令違反」 | NHKニュース

    賃金や労働時間に関する厚生労働省の調査が不適切に行われていた問題で、国の統計委員会の委員長がNHKの取材に応じ、「明らかな法令違反だ」と厚生労働省の対応を厳しく批判しました。 この問題について、国が行う統計について審議する総務省の統計委員会の西村清彦委員長が、NHKの取材に応じました。 今回の問題は、西村委員長の指摘がきっかけで、先月、発覚していて、当時のやり取りについて、「すべてを調査しているか厚生労働省の担当者に尋ねたところ、違うと言われ、あぜんとした。法令違反だと申し上げたが担当者の反応は鈍かった」と話しました。 平成16年から一部を抽出する不適切な手法が取られるようになったことについては、「極めて重大な計画変更で、明らかな法令違反だ。15年にもわたって修正されなかったのは驚きだ」と述べました。 さらに、「政府の統計調査全体に対する信頼が落ちることを最も心配している。統計調査は政策の

    不適切調査 統計委員長「あぜんとした 明らかな法令違反」 | NHKニュース
    ardarim
    ardarim 2019/01/17
    統計委員長(つよそう)