タグ

統計に関するvespidのブックマーク (42)

  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
    vespid
    vespid 2019/10/08
    食べログからの説明がほしいですね
  • 所得や学歴より「自己決定」が幸福度を上げる 2万人を調査

    2018/08/31 社会システムイノベーションセンター 研究ニュース 神戸大学社会システムイノベーションセンターの西村和雄特命教授と同志社大学経済学研究科の八木匡教授は、国内2万人に対するアンケート調査の結果、所得、学歴よりも「自己決定」が幸福感に強い影響を与えていることを明らかにしました。 この研究成果は、9月12日に行われる神戸大学経済経営研究所創立100周年記念連続シンポジウム「幸せの計り方」で西村特命教授により講演され、また、独立行政法人経済産業研究所のディスカッション・ペーパーとして公開されます。 研究の背景 国連の2018年世界幸福度報告書では、日の主観的幸福度は54位と低位にありました。幸福度に影響を与えている要因は、所得、学歴、健康、人間関係など様々考えられます。1970年前後から所得水準と幸福度が必ずしも相関しないことが指摘され、幸福度研究が注目されていますが、何がど

    所得や学歴より「自己決定」が幸福度を上げる 2万人を調査
    vespid
    vespid 2018/11/04
    変なバイアスかかってないかな。現在、幸福な人ほど過去の進路の選択を「自分で決定した」と考える傾向が強いと思う
  • NHK「AIに聞いてみた」の違和感 これって本当にAI? データ分析の専門家が解説

    タイトルは「AIに聞いてみた どうすんのよ!? ニッポン」で、2017年7月22日に第1回を放送。第2回となる今回は「働き方」がテーマです。 第1回は放送前から多くのデータサイエンティストたちが「AIの分析とはどのようなものか」と正座待機していましたが、ネットでは「当にAIなのか」「統計的に正しい操作がされているのか」など批判の声も目立ちました。一方、今回はやや盛り上がりに欠けた印象です。

    NHK「AIに聞いてみた」の違和感 これって本当にAI? データ分析の専門家が解説
  • 2万件も入浴中の事故死は起こっているのか、情報の見せかた大喜利 - ネットロアをめぐる冒険

    冬も深まると恋しくなるのが温泉ですが、入浴の事故が多いんですよと言うお話。 温泉評論家の方と話していたら、毎年風呂で亡くなる人が約2万人いて、5千人は自宅で、後の1万5千名は温泉などで亡くなっているらしい。交通事故の約3倍。それを防ぐには、「旅館に着いたら必ず用意してあるお茶を飲みお菓子をべる」「朝風呂の前には水分補給する」だそうです。 — いんてきふこ (@INTEKI) 2017年12月21日 「風呂で亡くなる人が約2万人」ということで、交通事故よりもはるかに多い数です*1。うち自宅が「5千人」で、温泉などで「1万5千」人が亡くなっているとのこと。予防にはお茶とお菓子、水分補給をあげられていました。 こういう伝聞の数字が出てくるとどうしても正しいのかどうか疑ってしまう私の悪い癖があるので、毎度のように小姑めいた検証をしていきたいと思います。今日は大きなデマとかそういう感じじゃなくて、

    2万件も入浴中の事故死は起こっているのか、情報の見せかた大喜利 - ネットロアをめぐる冒険
  • 機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界

    さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを

    機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
  • 年収を偏差値化した世界

    年収を偏差値で表すと、どんなことが起きるのでしょうか。 「偏差値」という統計量は、受験戦争を通じて日社会に定着しています。 私も受験期にはこの言葉が大嫌いでした。 受験業界ではもはやなくてはならない統計量になっている偏差値ですが、その数値の高低のみで進学先を決定する風習から偏差値至上主義を生み出し、”悪の元凶”のように目の敵にされてしまっている一面があります。 実際、偏差値に振り回されて嫌な思いをされた方も多いのではないでしょうか。 しかし、これだけ長きに渡り、日の受験業界に君臨している指標ですから、使い方次第で大きな恩恵を手にできる優れた面も持ち合わせているはずです。 一方で、この偏差値という数値指標は、受験生時ほぼ毎日のように耳にし、その数値を意識して過ごしていきますが、一旦入試を終え、社会に出ると耳にする機会はほとんど無くなります。 社会人になると自分自身の客観的な立ち居地を把握

    年収を偏差値化した世界
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
  • 日本の産業分類別年収/労働時間ヒートマップ - A Successful Failure

    2016年06月07日 日の産業分類別年収/労働時間ヒートマップ Tweet 厚生労働省は毎年産業分類別に賃金や労働時間の調査を行っている。10名以上の従業員を抱える5万余の民間事業所に対する調査をまとめたものであり、最新の調査結果は今年2月に公表された平成27年賃金構造基統計調査だ。 そこで同調査にもとづき、産業分類別の年収、月間労働時間をヒートマップにしてみた。男性・女性の降順にソートしたバージョンも用意しているのでそちらも見て欲しい。サムネイルをみるだけで、男女に厳然とした差があることが一目瞭然だ。 産業分類別年収テーブル(男性ソート版・女性ソート版) 産業分類別月間労働時間テーブル(男性ソート版・女性ソート版) 産業別明細票 さらに産業分類ごとに調査結果を確認できる検索フォームも用意した。上部のプルダウンメニューを選択することで、所望の産業の給与/労働時間テーブルを参照すること

    日本の産業分類別年収/労働時間ヒートマップ - A Successful Failure
  • グラフによれば、たばこは無害?:朝日新聞デジタル

    2020年のオリンピック・パラリンピックの東京開催に向けて、競技場の建設や交通網の整備など、いろいろな分野で準備が進んでいます。世界各国から人々が集まり、夢と希望と感動を届けてくれるイベントが開かれるのは今から楽しみです。 開催に向けては、健康面でも取り組みがなされています。ただ、2015年5月15日の朝日新聞によりますと、「2020年東京五輪に向けて、東京都の検討会は禁煙・分煙の条例化を進めてきたが、条例化を先送りする最終提言をまとめた」そうです。 http://www.asahi.com/articles/ASH5X6GZ6H5XUTIL048.html  この記事によりますと「2004年以降、定着していた『禁煙五輪』の流れを断ち切りかねない動き」だそうです。 すでに欧米をはじめとする先進国では、たばこの健康に及ぼす悪影響は広く国民に周知されています。そして喫煙対策として、公共施設・レ

    グラフによれば、たばこは無害?:朝日新聞デジタル
  • ネット調査、「手抜き」回答横行か 質問文読まずに…:朝日新聞デジタル

    インターネットを使った意識調査で、回答者は質問文をきちんと読まずに「手抜き回答」している可能性がある――。そんな研究結果を、関西学院大の三浦麻子教授と国立情報学研究所の小林哲郎准教授がまとめた。ネット調査は学術研究やマーケティングで利用が広がっているが、ネットならではの課題もありそうだ。 三浦教授らは昨年8月、民間調査会社2社に登録するモニター計1800人を対象に、「あなたの生活に関するお伺い」と題し、2回の調査を実施。質問文をきちんと読まないと正しく答えられない「引っかけ質問」を潜り込ませ、不注意や手抜きによる回答がどの程度あるかを調べた。 1回目の調査では、長い質問文の末尾で「以下の質問には回答せずに次のページに進んで下さい」と指示したが、一社は51・2%、もう一社は83・8%のモニターがこの指示を守らずに答えていたという。 2回目の調査では、五つの選択肢から選ぶ形式の質問を10~50

    ネット調査、「手抜き」回答横行か 質問文読まずに…:朝日新聞デジタル
  • なぜこんな暑い夏になったのか…究極の原因が判明

    まだまだ暑くなるの? とうとう日国内でも、40度近い気温を記録する日も珍しくなくなった今日この頃。夏番の8月を迎える前に、すでにこんな調子で、いったいどこまで今年は猛暑が続くのでしょうか? このままだと当に観測史上最高に暑い夏の記録を更新してしまうのではと恐ろしくなりますね。 ちなみに上の折れ線グラフは、ニューヨークのマンハッタンにある、NASAのGoddard Institute for Space Studie(GISS)研究所が集計した観測データをもとに、1880年から現在までの地球の年間平均気温の推移を表示したものです。中央の基準となる横線は、1880年から1910年までの30年間の平均気温を0としたもので、その基準値に対するプラス/マイナスが一目でわかるようになっています。年ごとに上がり下がりこそあるものの、過去数十年間で確実に地球の気温は上昇傾向にあることが如実に示されて

    なぜこんな暑い夏になったのか…究極の原因が判明
    vespid
    vespid 2015/07/27
    相関関係を示しただけでドヤ顔で「はい、犯人はこれです」って言われても納得できるわけがない。因果関係を証明するのが非常に難しい事案なのに。
  • 名古屋がみそ消費金額「全国39位」というナゾ

    コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕

    名古屋がみそ消費金額「全国39位」というナゾ
  • カップルが一緒にお風呂に入る割合をベイズ推定してみた

    [DL輪読会]Scalable Training of Inference Networks for Gaussian-Process ModelsDeep Learning JP

    カップルが一緒にお風呂に入る割合をベイズ推定してみた
  • サッカーにおける各国の1試合あたりの平均得点のお話 - pal-9999のサッカーレポート

    さて皆さん、こんにちは。Jリーグ開幕もいよいよ間近ですが、日は、ちょっとした数字遊びネタでお送りします。内容的には、タイトルの通り、「サッカーにおける各国の1試合あたりの平均得点のお話」でありんす。 実は、ここ数日ほど、主要国の一試合あたりの平均得点を調べており、実際に調べてみたら、面白い事がわかったので、日はそれをネタにしてエントリ立てた次第です。興味のある方はおつきあいください。当は、ゼロックスカップのレビューでもしようかと思ってたんですけどね、ゼロックスの試合内容がなんとも書きにくい内容だったので、こっちに変えました。ルールダービーもレビュー対象としては、なかなか興味深い試合でしたが、ドルのレビューはこないだやったばっかですし。 もともとは「セリエAは当にゴールが少ないリーグなのか?」ってのを調べていたんですが、それで主要リーグの数字を調べて散布図作ったので、その紹介になりま

    サッカーにおける各国の1試合あたりの平均得点のお話 - pal-9999のサッカーレポート
  • 都道府県別の大学進学率

    現在では同世代の2人に1人が大学に進学しますが,大学進学率は,この2年間続けて下がっている模様です。2011年春が51.0%,2012年が50.8%,そして2013年が49.9%なり。 これは浪人込みの進学率ですが,浪人込みの率なんて出せるのか,という疑問もあるかと思いますので,当局の計算方法を説明いたしましょう。 大学進学率とは,同世代のうちどれほどが大学に進学したかという指標です。ベースは高卒者ではありません。文科省の『学校基調査』からこの値を計算する場合,当該年に大学に入った者の数を,推定18歳人口(3年前の中学校・中等教育学校前期課程卒業者)で除すことになります。 http://www.mext.go.jp/b_menu/toukei/chousa01/kihon/1267995.htm 分子の大学入学者数には,より上の世代(いわゆる浪人生)も含まれますが,当該年の18歳人口から

    都道府県別の大学進学率
  • 今回は因果関係があるのに相関関係が見られない4つのケースをまとめてみた(前編:検定力が低い) - Take a Risk:林岳彦の研究メモ

    どもお久しぶりです。林岳彦です。ローソンなどで売ってるいなばのタイカレーはそうめんのつけ汁として使ってもマジうまいのでオススメです。 さて。 今回は前々回の記事: 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ の続編として、逆のケースとなる「因果関係があるのに相関関係が見られない」ケースについて見ていきたいと思います。あんまり長いと読むのも書くのも大変なので、今回はまずは前編として「検定力の問題」に絞って書いていきます。 (*今回は上記の前々回の記事での記述を下敷きに書いていきますので、分からないところがあったら適宜前々回の記事をご参照ください) まずは(今回の記事における)用語の定義:「相関」と「因果」 今回も少しややこしい話になると思うので、まずは用語の定義をしておきたいと思います。(*細かいと

    今回は因果関係があるのに相関関係が見られない4つのケースをまとめてみた(前編:検定力が低い) - Take a Risk:林岳彦の研究メモ
  • 単純な集計とデータサイエンスによる分析とで結果が食い違うかもしれない3ケース - 渋谷駅前で働くデータサイエンティストのブログ

    一般に、データ分析の大半はそれほど高度なテクニックの類を必要としないものです。僕も常日頃から口に出して言うことが多いんですが、「統計学だの機械学習だのの出番なんてそもそも少なくて当たり前」。工数もかかるし、できればやらない方が良いです。ぶっちゃけ単純な四則演算で十分なケースの方が多数派でしょう。 なので、普段はDB上でSQL(というかHiveなど)でサクッと四則演算だけで集計処理を済ませてしまって、その結果だけを表示するようにしておいた方が圧倒的に楽で手っ取り早いはず。多くのBIツールもそういう考えのもとで作られていると思います。 ところがどっこい。世の中には、単純な四則演算での集計結果と、データサイエンスを駆使した分析結果とで、い違ってしまうケースが何故かあることが知られています。どちらかと言うとレアケースだとは思いますが、その矛盾をおざなりにするととんでもないことになることも多々あり

    単純な集計とデータサイエンスによる分析とで結果が食い違うかもしれない3ケース - 渋谷駅前で働くデータサイエンティストのブログ
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • かわいい制服天国 | かわいい制服天国は、全国の学校の可愛い制服をあつめたサイトです。

    低身長に巨乳! 稀に見る素晴らしいキャラ!!『ヘスティア』 黒髪のツインテールがポイント!露出が高いコスチュームも可愛い!! ~Anime Account~さん(@val.agueria)が投稿した写 …

    かわいい制服天国 | かわいい制服天国は、全国の学校の可愛い制服をあつめたサイトです。