タグ

統計に関するtohokuaikiのブックマーク (18)

  • 「北欧は幸福度が高い」と思う人に教えたい真実

    コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕

    「北欧は幸福度が高い」と思う人に教えたい真実
    tohokuaiki
    tohokuaiki 2021/03/31
    なんとなく胡散臭い指標だとは思ってたけど、ちゃんと説明しているのはありがたい。
  • 若き統計学者の英国: いかにしてマクロ経済学はオワコンになったか

    マクロ経済学という分野は、残念ながらもう所謂オワコンになってしまった。正しく言うと、実を言うとDSGEはもうだめです。突然こんなこと言ってごめんね。でも当です。こんな感じだろう。 結論から言うと、データを見るふりをして実は全くデータを見ておらず、はっきりいってモデル化に失敗したからだ。とくに予測能力が兎角ないのが致命的だったと思う。予測能力がない結果、モデル・理論を通して将来の政策談義を結局は出来ないので、政策提言すらまともにできず、役立たずの烙印を押された。政策評価・提案等の役目は統計的手法を上手く用いている、応用ミクロの研究者が主に担うことになった。 そもそもの始まりは、合理的期待形成仮説というバカげた仮定に基づいて、数学音痴がmathinessにまみれたリアルビジネスサイクル(RBC)理論などという、さらにバカげた理論を推し進めた点であろう。それに呼応してニューケインジアンモデルが

    tohokuaiki
    tohokuaiki 2020/06/15
    社会科学ってそんなもんだよなって気がしなくも無い。実証できてるようで何もしてない的な。
  • WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times

    主な確率分布の関連図 こんにちは、吉岡(@yoshiokatsuneo)です。 Webサービスを運営していると、利用状況を分析・予測したり、A/Bテストなどで検証したりすることがよくあります。 データを一個一個見ていてもよくわからないので、データ全体や、その背景の傾向などがまとめて見られると便利ですよね。そんなとき、データの様子を表現するためによく使われているのが「確率分布」です。 学校の試験などで使われる偏差値も、得点を正規分布でモデル化して、点数を変換したものです。 今回は、Webサービスなどでよく使われる確率分布18種類を紹介します。 それぞれ、Webサービスでの利用例やPythonでグラフを書く方法も含めて説明していきます。コードは実際にオンライン実行環境paiza.IOで実行してみることができますので、ぜひ試してみてください。 【目次】 正規分布 対数正規分布 離散一様分布 連続

    WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times
  • 秘書問題 - Wikipedia

    最善を選択する確率は に収束する。 別の解法[編集] 秘書問題や類似する問題の直接的解法として Odds algorithm がある。 ヒューリスティックの性能[編集] Stein, Seale, and Rapoport (2003)[1]では、秘書問題を解く際に使われる心理学的にもっともらしいヒューリスティクスの成功確率を検討している。彼らが検討したヒューリスティクスは以下のようなものである。 カットオフ規則(CR) 最初の人の応募者を採用しない。その後、最初の候補者(そこまでで1位の応募者)を採用する。これは、 の CSP の最適ポリシーの特殊ケースである。 候補者カウント規則(CCR) 番目の候補者を選択する。最初の応募者をスキップするわけではない。単に候補者(それまでの1位)を数えるだけで、応募者の順序を深く考慮しているわけではない。 非候補者の次規則(SNCR) 非候補者(そこ

    tohokuaiki
    tohokuaiki 2018/11/11
    まーた、eが出てきてしまうのか。
  • 統計学の基礎(9.26)

    2011.9.26 東京国際大学 統計学の基礎(後期) 東京大学大学院農学生命科学研究科 大森宏 講義プリントサイト:http://lbm.ab.a.u-tokyo.ac.jp/~omori/kokusai11/koki.html 夏休みの宿題 集合知による景観解析 9月22日時点で,119名の提出がありました.ご協力ありがとうございました. 現在、整理中です. 7.比率に関する統計的推論 製品の不良率,政権への支持率,テレビ視聴率などの比率に関する統計的推論を取り扱う. 比率に関して基礎となる二項分布を学び,それを正規分布に近似して統計的推論を行うことを学ぶ. たとえば,今年の大河ドラマ江は初回視聴率23.2%だったが,視聴率は標調査なので誤差がつきまとう. この標誤差の取り扱い方を学び,真の視聴率の 95%信頼区間を求める手法を学ぶ. 7-1.二項分布 成功確率 p の事象を n

    tohokuaiki
    tohokuaiki 2018/10/30
    確率の分散と、各データの分散は違うので注意。3割打者は1.5本(平均値)±1(標準偏差)に収まる確率が68%である。といえる。実際、1~3本の和は80.1%である。打率は正規分布が前提。長嶋茂雄とかダメそう。
  • ナメクジの出現を予測する!- 市民科学と最新統計の融合

    外来種問題は突然に 2014年7月某日、札幌市の円山原始林で私が出会ったのは、体長15cmもの巨大な豹柄のナメクジ、マダラコウラナメクジでした。私はそれを知っていました。過去に一度だけ、ドイツ・ドレスデンの森の中で見たことがあったからです。北欧原産のナメクジがどうしてここに? 慣れ親しんだ円山の森に現れた、不似合いな新参者との突然の出会いに、目眩がしました。私の知る北海道の生態系は、これからいったいどうなってしまうのか? 我々ヒトの生活への影響は? 体長15 cmほどのマダラコウラナメクジ 市民のブログが教えてくれた 予期せぬ出会いに衝撃を受けた私は、研究室に戻るや否や、飛びつくように現状を調べ始めました。わかったことは、マダラコウラナメクジが2006年に茨城県で最初に侵入・定着が確認されたということ、さらに2010年には福島県、2012年には長野県にも侵入し勢力を拡大しているということで

    ナメクジの出現を予測する!- 市民科学と最新統計の融合
  • 食品総合研究所 :食品のサンプリングに関するガイダンス~品質情報解析ユニット

    抜き取り検査を行うということは検査対象の全てを検査するわけではないので検査で除外したい対象を見逃す可能性があります。検査対象の危険性が高い場合や見逃すことによる信用不安などの可能性がある場合には抜き取り検査ではなく全数検査又は全量検査を行う必要があります。 ここでは抜き取り検査の発見率と見逃し率について説明します。 ロットから抜き取るサンプル数をn個、ロットの不良品率をx%、見逃し率をp%とします。 見逃し率がp%ということは、発見率は(100-p)%であり (100-p)/100の確率で不良品を発見できることを意味します。 次にロットの不良品率がx%ということはロットからランダムに抜き取った1個のサンプルが不良品である確率は、合格品である確率は(100-x)/100になります。1個のサンプルだけを抜き取って不良品を発見できる確率はになります。 n個のサンプルが全て合格品である確率は、1個

    tohokuaiki
    tohokuaiki 2018/06/18
    エラーを見つけるための統計学。これ、わかりやすい。
  • 世帯の年間収入マップ

    tohokuaiki
    tohokuaiki 2015/12/03
    岐阜県大野町がいきなり芦屋や港区と同じリッチで焦る。
  • Optimizelyを使ってクビになりかけたワケ ~統計学が苦手なマーケターへの薦め~ | POSTD

    (訳者注: 検定手法について、この記事には一部内容が古い部分があります。Optimizelyは現在、両側検定を採用し、独自開発したより精度の高い統計手法(Stats Engine)でテスト結果を表示しています。Stats Engineに関する記事: 日語 ・ 英語 ) 私たちがSumAllでA/Bテストを一斉にスタートさせて6ヶ月が経ち、あまりよくない結末を迎えました。それは勝算があるとした結果のほとんどが新規ユーザーの獲得改善にはつながらなかったことです。それどころか、私たちは失敗したのです。そして私の一番の責任はユーザー獲得の増加であるということを考えると、当に最悪の状況でした。私にとっても、私のキャリアにとっても、そしてSumAllにとっても。 過去に A/BテストとWebサイト・パーソナライゼーションの会社 に勤めていた経験から(はっきり言うとMonetateはOptimize

    Optimizelyを使ってクビになりかけたワケ ~統計学が苦手なマーケターへの薦め~ | POSTD
  • 三重県のランキング - とどラン

    ランキングを元に計算した、三重県と似ている都道府県です。 赤が濃いところは似ている都道府県、青が濃いところは正反対の都道府県で、黄色はほとんど相関関係がない都道府県です。 地図上に青や赤の濃いところが多い都道府県は、似たものや正反対が多い都道府県。逆に黄色が多い都道府県は似たものがない都道府県ということになります。 三重県の類似都道府県一覧

  • 三重県情報: 教えて!全国ランキング 2022  ~都道府県ランキング 日本の統計~

    県庁所在地:津市 三重県は、日列島のほぼ中央で、太平洋側に位置し、東西約80km、南北約170kmの南北に細長い県土を持っています。そのため、各地域によって気候がさまざまで、東紀州(南部)は、潮岬からの台風の直撃を受ける事が多く、「台風銀座」と呼ばれています。 県土は、中央を流れる櫛田川に沿った中央構造線によって、大きく北側の内帯地域と南側の外帯地域に分けられ、海、山の豊富な自然にも恵まれ、農業・漁業も盛んです。 農業の種別割合をみると、耕種68.4%、畜産29.6%、加工農産物2.0%となっています。 また、品目別では米が最も多く(構成比29.8%)で、以下、野菜(同15.5%)、鶏(同13.6%)、果実(同6.7%)などとなっています。 産業は北中部が中京工業地帯であることから、主要企業が多く、四日市市では、自動販売機が自動販売機の生産量が全国第1位です。また全国的に有名な石油化学コ

  • jp01 - 結婚に対する離婚率マップ

    都道府県別離婚率表示 都道府県のSVGデータを使ってデータを可視化。 票の項目をクリックすると並び替えできます。

    jp01 - 結婚に対する離婚率マップ
  • 図録▽生まれ変わるとしたら男がいいか女がいいか

    統計数理研究所によって「日人の国民性調査」が1953年以来、5年ごとに戦後継続的に行われている(同じ問を継続しているが問によっては必ずしも毎回聞いている訳ではない)。長期的な日人の意識変化を見るためには貴重な調査である。この調査はすべて、全国の20歳以上(ただし2003年~08年は80歳未満、2013年は85歳未満)の男女個人を調査対象とした標調査である。各回とも層化多段無作為抽出法で標を抽出し、個別面接聴取法で実施されている。2013年調査は10~12月に行われ、回答者は3,170人だった(回収率50%)。 ここでは、「生まれ変わるとしたら男がいいか女がいいか」という問への回答結果の長期推移を追った。 結果は男性の回答と女性の回答で著しく異なっている。すなわち男性は無変化、女性は大変化である。男性は一貫して同じ男に生まれてきたいとする者が9割程度を占めているのに対して、女性は、か

    tohokuaiki
    tohokuaiki 2010/04/05
    こりゃ面白いな。最後の「楽しみが多い」というのが女性自身女性だっていうのが急造ってところ。
  • Welcome michaelvandaniker.com - Hostmonster.com

    Web Hosting - courtesy of www.hostmonster.com Home Hosting Features Help Center Contact Us About Us Domain Check Affiliates Terms © 2005-2012 Hostmonster.com. All rights reserved.

    tohokuaiki
    tohokuaiki 2010/01/27
    全体的にFirefoxのアイコンに見えてくるのは、わざとそうしたんだろうな。
  • おカネあるのに使わない高齢者 それが若者の低賃金を生む

    車や旅行が売れないのは、若者がお金を使わないからだ。一面、これは正しい。ところが、個人金融資産の内訳を見ると、8割が50歳代以上なのだ。むしろ、お金のある高齢者が消費しないため、若者にお金が環流しないという構図が見えてくる。 個人金融資産のうち8割を50歳以上が持つ 今どきの若者は、車も買わないし、旅行にも行かない。金を溜め込んで、家でケイタイやネットばかりしている。 そんな議論に対し、ネット上では、「お金がないから仕方がないだろ」といった反論がよく見られる。主に若い世代かもしれない。 もちろん、お金があっても車や旅行を購入しない可能性はある。しかし、若者にお金がない、というのを裏付けるかのような個人金融資産のデータがあるのだ。それが、情報サイト「Garbagenews.com」で2009年1月31日紹介され、タイムリーな話題としてネット上で脚光を浴びている。 第一生命経済研究所が、200

    おカネあるのに使わない高齢者 それが若者の低賃金を生む
  • 「平均のひとつ覚え」から卒業 〜社会人なら知らなきゃ恥ずかしい統計の基礎知識 | Web担当者Forum

    1日あたりの訪問者数を単純に平均すると次のようになる。 単純な平均訪問者数:4699人 しかし、このサイトは週末のアクセス数は平日の数分の1しかないため、平日と週末を分けて考えてみるのもいいだろう。そこで、平日と週末でそれぞれ平均を出すと、次のようになる。 平日の平均訪問者数:6223人 週末の平均訪問者数:888人 これで、平日は6223人より少なければ「アクセスが少なかった」、週末は888人より多ければ「アクセスが多かった」と判断していいのだろうか。 週末の平均はたしかに代表的な数値となっているが、どうも平日の平均がおかしい。グラフを見ても、ほとんどの平日は5000人以下と、平均よりも1000人以上少ないアクセス数になっている。 よく見ると9月14日のアクセス数が非常に多い。この日は、あるページがヤフーニュースで紹介されたために、非常に多くの人がサイトを訪れていたのだ。ヤフー以外にも人

    「平均のひとつ覚え」から卒業 〜社会人なら知らなきゃ恥ずかしい統計の基礎知識 | Web担当者Forum
  • ★【ブログ 比較分析】 ブログサービス比較(アクティブユーザー数集計) - ブログファン ブログ総合情報

  • 社会実情データ図録 Honkawa Data Tribune

    最も高く、7割近くが病院で亡くなる日韓国。一方、オランダやノルウェーでは病院死は3割以下。新型コロナの影響だけでなく、日を含む多くの国で病院死は低下傾向。

  • 1