タグ

statisticsに関するmoccos_infoのブックマーク (42)

  • 日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)

    2008年に日統計学会75周年記念出版として刊行されました国友直人・山拓監修『21世紀の統計科学』(全3巻)の増補版を, 日統計学会のホームページを通じて提供することとなりました.書の増補版の オンライン公開が統計科学の今後の発展に資することを期待しております. 第I巻 社会・経済の統計科学 (国友直人・山拓編) 第II巻 自然・生物・健康の統計科学 (小西貞則・国友直人編) 第III巻 数理・計算の統計科学 (北川源四郎・竹村彰通編)

  • 都道府県別統計とランキングで見る県民性 - とどラン

    様々な都道府県別統計を比較したランキング。県民性をデータと都道府県ランキングで表します。

  • 平均年収186万円…日本に現れた新たな「下層階級」の実情(橋本 健二) | 現代新書 | 講談社(1/2)

    平均年収186万円の人々 いま日の社会は、大きな転換点を迎えている。格差拡大が進むとともに、巨大な下層階級が姿を現わしたからである。その数はおよそ930万人で、就業人口の約15%を占め、急速に拡大しつつある。それは、次のような人々である。 平均年収はわずか186万円で、貧困率は38・7%と高く、とくに女性では、貧困率がほぼ5割に達している。 貧困と隣り合わせだけに、結婚して家族を形成することが難しい。男性では実に66・4%までが未婚で、配偶者がいるのはわずか25・7%である。女性では43・9%までが離死別を経験していて、このことが貧困の原因になっている。生活に満足している人の比率も、また自分を幸せだと考える人の比率も、きわだって低い。 健康状態にも問題がある。4人に1人は健康状態がよくないと自覚している。心の病気を経験した人の比率は、他の人々の3倍近い2割に上っている。そして多くが、「絶

    平均年収186万円…日本に現れた新たな「下層階級」の実情(橋本 健二) | 現代新書 | 講談社(1/2)
    moccos_info
    moccos_info 2018/01/14
    どういう基準でこの集団を切り出したのかどうか不明瞭で、そこが自在なのであればどんな集団でも作れそうな気がする
  • 日本とイタリア計100通りのプロのカルボナーラレシピを集めて解析した。全ての論争に決着を - Lifecooking

    こんにちは現代の百蘭王を目指すニャック。漆原ニャックです。 みなさんカルボナーラ好きですよね?嫌いかならそっ閉じしてください。 カルボナーラの魅力ってなんでしょうかね。 パスタ・卵・チーズ・豚肉±生クリームという少ない材料、簡単な手順にもかかわらず濃厚な味で簡単にレストランの味を楽しめるところだと思います。 ただ同時に心を痛めているのがカルボナーラの話題になると必ず登場するカルボナーラマスターたちによる「生クリーム入れる・入れない」という論争。あと「場では~」みたいな論争ね。 そこで今回は日とイタリアでのカルボナーラの作り方を集めれるだけ集めてみて、解析してみることにしました。 基的事項 日のプロのレシピ 集め方 パスタの重量を100gにそろえる 肉の種類と重量 ソースの構成成分 日人プロの一般的なカルボナーラ レシピ1(日のプロ) 生クリーム使う?使わない? 生クリームを使う

    日本とイタリア計100通りのプロのカルボナーラレシピを集めて解析した。全ての論争に決着を - Lifecooking
    moccos_info
    moccos_info 2018/01/12
    解析部分は色々ありそうだが面白い集計として
  • 宝くじ当選者の約4割はA型 当選者に共通すること | 暮らし | ファイナンシャルフィールド

    2017.12.16暮らし 宝くじ当選者の約4割はA型 当選者に共通することText : 宮﨑 真紀子 キーワード : 借金 / 使い道 / 宝くじ / ローン / イベント / 年末 / 当選 / 秘訣 / 血液型 / 当選金 毎年恒例の年末ジャンボ宝くじ。発売初日には長蛇の列がニュースになります。ですが、身近で当選した話は聞きません。当選したら何に使う?という夢物語は皆が語りますが、実際当選した人はどうなのかも気になるところです。 当選の秘訣は継続にあり今年の年末ジャンボ宝くじの概要は、1等7億円、前後賞を合わせると10億円です。1枚300円で、販売期間は11月27日から12月22日までで12月31日に抽選が行われます。10万円以上の当選数が昨年の4倍(45,550)に増えています。 「宝くじ公式サイトhttp://www.takarakuji-official.jp/  によると

    宝くじ当選者の約4割はA型 当選者に共通すること | 暮らし | ファイナンシャルフィールド
  • ホーソン効果 - Wikipedia

    ホーソン効果(ホーソンこうか、英: Hawthorne effect)とは、治療を受ける者が信頼する治療者(医師など)に期待されていると感じることで、行動の変化を起すなどして、結果的に病気が良くなる(良くなったように感じる、良くなったと治療者に告げる)現象をいう[1]。ホーソン効果は、プラセボ効果の一部として統計上扱われる場合がある。ホーソン工場で実施された、労働者の作業効率を向上させるための調査から発見された現象であるためこの名がある。 解説[編集] ホーソン効果は、米国のホーソン工場で、労働者の作業効率の向上を目指すための調査から発見された現象であるため、この名がある(ホーソン実験)。調査は工場の何を改善すれば一番効果的かを調査の目的とした。その結果、労働者の周囲や上司が関心を高めることが、物理的要因以上に効果のあることが判明した。このように、人は一般的に関心を持つ人や期待する人の心に

  • アパホテルが満足度ランキングで1位と最下位、評価真っ二つの怪 日経デジタルマーケティング

    ビジネスホテルチェーン国内最大手のアパホテルの宿泊満足度をめぐって、ビジネス誌2誌のアンケート調査結果が真っ二つに割れる珍現象が起きた。「週刊ダイヤモンド」11月4日号の特集「1万人が選んだ ベストホテル&エアライン」では、同ホテルの満足度は20ホテル中トップ。その1週間前に発行された「日経ビジネス」10月23日号特集「ビジネスパーソンに聞く 後悔しない航空&ホテル 5000人満足度ランキング」では、同ホテルの満足度は35ホテル中最下位だった。 なぜ正反対の結果が出たのか。その原因を探るには、ホテルの評価方法に目を向ける必要がある。 まず評価方法について。ダイヤモンドでは、直近2年間に宿泊したビジネスホテルについて、満足したホテルを上位3つ、不満だったホテルを1つ挙げる形だった。そして満足したホテルには1位5点、2位3点、3位1点を付与し、その総計でランキングしている。 一方、日経ビジネス

    アパホテルが満足度ランキングで1位と最下位、評価真っ二つの怪 日経デジタルマーケティング
    moccos_info
    moccos_info 2017/12/08
    おもしろい
  • The Myth of Moderate Drinking

    I love wine. It’s a great leftover from my early 20's, when all my friends were drinking ‘punch’ made up of soft drinks and the harshest alcohol that they could find. I thought buying a bottle and drinking from a glass made me look like the fanciest person at the party, and being able to pronounce “merlot” was just the icing on the cake (thanks, high-school French!). Recipe for insane student punc

    The Myth of Moderate Drinking
  • 統計学テキスト

  • 「統計学と機械学習の違い」はどう論じたら良いのか - 渋谷駅前で働くデータサイエンティストのブログ

    何かこんなメディア記事が出ていたようです。 これを読んで色々な人がツッコミを入れまくっている模様ですが、この記事の不思議なところは「完全に間違った説明というわけでもないのに何故か(両分野に詳しい)誰が読んでも猛烈な違和感を覚える」ところなんじゃないかなぁと。 正直、これはライター・インタビュアー・コメンテーター・編集者の誰のせいなのかは全く分からないんですが、ツッコミ入れられまくっている内容について色々あげつらってもあまり建設的でないので、ここでは記事中で題として取り上げられている「統計学と機械学習の違い」についてちょっとコメントしてみようと思います。 あ、もちろん僕がこれから書くコメントも別に正しいとは全く限らないので、おかしいところや間違ってるところがあったらバンバン突っ込んでいただければ幸いです*1。そしてガチ勢向けのコメントでもないので何卒悪しからず。 統計学はデータを「説明」す

    「統計学と機械学習の違い」はどう論じたら良いのか - 渋谷駅前で働くデータサイエンティストのブログ
    moccos_info
    moccos_info 2017/07/23
    そうそうこんな感じで
  • シンプソンのパラドックス - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "シンプソンのパラドックス" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2012年10月) 母集団全体では負の相関があるにもかかわらず、各層では正の相関があるといった逆転現象が起こり得る。 シンプソンのパラドックス(英: Simpson's paradox)もしくはユール=シンプソン効果(英: Yule–Simpson effect)は1951年にイギリスの統計学者エドワード・H・シンプソン(英語版)によって記述された統計学的なパラドックスである[1]。母集団での相関と、母集団を分割した集団での相関は、異なっている場合があるという逆説。

    シンプソンのパラドックス - Wikipedia
  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
    moccos_info
    moccos_info 2017/05/25
    ファーストを除く著者が以前にも問題のあるサンプリングをしているとのこと
  • Help Me Decide

    Statistics Textbook Options Each textbook offers its own flavor. All can be used as part of an intro-level statistics course. For further considerations or to ask questions, see this Forums post.

  • ロバスト統計:外れ値を含むデータの扱い方

    以下のような10個の観測値を得たとする。 2.773, 3.183, 2.969, 2.883, 3.229, 3.080, 3.204, 3.171, 2.798, 2.900 これらは標平均 = 3.019、標標準偏差 = 0.175であり、正規分布を仮定すれば95%信頼区間は [3.019 - 1.96 × 0.175, 3.019 + 1.96 × 0.175] = [2.676, 3.362] となる。実際このデータは平均 = 3、標準偏差 = 0.2 の正規乱数であるが、各統計量は良好な値を示している。しかしデータ収集時の記載ミスなどにより最後の値だけ小数点の位置がずれてしまったとすると、 2.773, 3.183, 2.969, 2.883, 3.229, 3.080, 3.204, 3.171, 2.798, 29.00 標平均 = 5.629、標標準偏差 = 8.

  • 『年収を偏差値化した世界 - RepoLog│レポログ 統計データを使って様々な暮らしをレポートするブログ』へのコメント

    ブックマークしました ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください Twitterで共有

    『年収を偏差値化した世界 - RepoLog│レポログ 統計データを使って様々な暮らしをレポートするブログ』へのコメント
    moccos_info
    moccos_info 2017/01/30
    エセ統計、たくさん釣れるからやめられない点で、ヘイトデマと同類か。そして、面白いから良いという意見の多いはてなの知識あるいはリテラシー…
  • 2015年の麻雀人口は600万人 前年より270万人減 ~レジャー白書2016

    公益財団法人日生産性部余暇創研による『レジャー白書2016~少子化時代のキッズレジャー~』が8月10日に発売された。同白書は、余暇活動調査等をもとに、わが国における余暇の実態を 需給双方の視点から総合的・時系列的にとりまとめている唯一のもので、1977 年の創刊以来通算40号目になる。 同白書には、麻雀の参加人口や市場規模が記載されているが、2015年の参加人口は600万人となり、2014年の870万人から270万人減少した。市場規模(麻雀ゲーム料)は520億円(前年比2.0%増)となった。 2016年に入って24時間麻雀番組を放送する『AbemaTV』が開局し、一般に麻雀が目に触れる機会が増えた。麻雀番組を視聴することからはじまり、麻雀ゲームをプレイ、そして雀荘でのリアル対局に繋がることができるか、2016年の参加人口に注目が集まる。 雀荘にとっては引き続き厳しい時代が続いている。オ

    2015年の麻雀人口は600万人 前年より270万人減 ~レジャー白書2016
    moccos_info
    moccos_info 2017/01/11
    どれも2009年から半減~4割減とは思えんし、年ごとに全体の傾向が大きくぶれるし、人口のほうは集計の信憑性に疑問が。
  • カテゴリデータの検定

    χ2 (カイ二乗) 検定 適合度検定や独立性の検定は全て同じ関数 chisq.test() で行うことが出来る.この場合,引数のデータの形式と引数に確率を入れるかで検定内容が異なる. 検定したいデータの形式 以下の 1.2 が適合度検定,3 ~ 5 が独立性の検定である.いずれの場合も引数に correct=F を入れることで連続性の補正を抑制することが出来る. 1 つのベクトルを引数にする場合 → c(8, 12, 10, 9, 5, 6) : 例えばサイコロを振った結果を入れて,このサイコロが正しいサイコロであるかどうか ( 1 ~ 6 の生起確率が全て等しいのか) を検定する場合は 1 つのベクトルを引数にすればよい. 1 つのベクトルと生起確率を引数にする場合 → c(20,8,5,2), p=c(4, 3, 2, 1)/10 : 35 人の血液型を調べ,これより日人の血液型は

    moccos_info
    moccos_info 2016/12/05
    “適合度検定や独立性の検定”
  • Practical advice for analysis of large, complex data sets

    By PATRICK RILEY For a number of years, I led the data science team for Google Search logs. We were often asked to make sense of confusing results, measure new phenomena from logged behavior, validate analyses done by others, and interpret metrics of user behavior. Some people seemed to be naturally good at doing this kind of high quality data analysis. These engineers and analysts were often desc

    Practical advice for analysis of large, complex data sets
    moccos_info
    moccos_info 2016/11/22
    よさげ
  • 痛みと鎮痛の基礎知識 - Pain Relief

     Pain Reliefー私のための統計処理 →→→→→→ UMINサイトに 移動しました!

  • 私のための統計処理ー基本解説

    実験はギャンブルのようなもので、 どんな結果が出るかはわからないが、 実験計画を立てる。 「2群に差がない!」という帰無仮説を立てる。 群間のサンプルの選択は公平にしなければならないが、 勝率が高くなるような実験計画をデザインも必要である。 生物実験では、物理科学実験とは異なり、 得られるデータは必然的にばらつきを伴う。 測定者による誤差 ---実験技術の向上に伴い、 データの信頼度は上がる! 測定装置、あるいは測定方法による誤差 測定されるものの性質による個体差