タグ

統計に関するrin51のブックマーク (22)

  • 心理学・行動経済学等の著名な研究論文が次々に追試失敗【心理学】|手記千号

    心理学の研究論文は再現性が低いことが指摘されていました。再現性が低くなる原因は、学界全体に「疑わしい研究手法 (QRPs)」が蔓延していたことにあるとみられます。 現在は学界全体をあげての対策が行われているようです。研究の事前登録、データの公開、追試などが重視されるようになっています。 学界は正しい方向に進んでいるようですが、だからこそ、重要な発見だとみなされてきた過去の研究成果が次々に覆されているようです。 少々調べましたが……、いやはやこれは……脱力しました。心理学以外の分野でも援用されている有名な研究たちが、あれもこれも。興味を引かれたものに重点をおきつつ、ざっくりとメモ的にまとめておくことにします。 2021年9月12日追記 追試というのは、1年半以上かかるものも珍しくないようです。かなりの時間・精神力・体力を要するのに対して、見返りが少ないものといいます。この記事では多くの研究の

    心理学・行動経済学等の著名な研究論文が次々に追試失敗【心理学】|手記千号
  • 「配信者は人気ゲームに乗り換えた方が視聴者数は増えるのか?」統計から分析する論文が公開。ゲーム論文大賞2022、優秀賞に選ばれる  - AUTOMATON

    ホーム ニュース 「配信者は人気ゲームに乗り換えた方が視聴者数は増えるのか?」統計から分析する論文が公開。ゲーム論文大賞2022、優秀賞に選ばれる 株式会社メディアクリエイトは4月18日、「ゲーム論文大賞 2022」の受賞者を発表した。優秀賞として、配信技術研究所株式会社(以下、配信技研)および中村鮎葉氏の共著「国内ゲーム実況ライブ配信におけるチャンネルのコミュニティ的性質の統計分析」が選ばれた。 ゲーム論文大賞 2022は、2021年8月から今年1月にかけて募集された懸賞論文募集。ゲーム産業に携わる個人・グループを対象に、コンシューマー、PC、モバイル、経営論、e スポーツ、ゲーム実況、社会経済への影響などを広くテーマとして募集した。結果として、今回の募集で大賞は該当作なし。優秀賞として、配信技研および中村鮎葉氏の論文が選ばれた。 配信技研は、インターネットライブ配信技術を開発する国内企

    「配信者は人気ゲームに乗り換えた方が視聴者数は増えるのか?」統計から分析する論文が公開。ゲーム論文大賞2022、優秀賞に選ばれる  - AUTOMATON
  • ラノベ作家の統計

    最近のラノベ作家人口は約600名で、その内約400名が次の年も継続して活動します。 180名程度がいなくなり(流出)、200名程度が加わります(流入)。 ただし、「流入」は新人とは限りません。流入・流出を繰り返す人もいます。 ラノベ作家の生存率 2005年にデビューしたラノベ作家を対象として、生存率を求めました。 2000~2004年までに1冊もを出版せず、2005年に1冊以上出版した作家を 「2005年にデビューしたラノベ作家」 とします。 2005年にデビューしたラノベ作家は96名です。彼らが一番最近に出版した年を集計すると次のようになります 一番最近に出版した年 人数 割合

  • 可視化や統計でデータに『恣意的なストーリーを語らせる』16の闇の魔術【bad charts】 - Qiita

    闇の魔術に対する防衛術 Advent Calendar 2020の三日目 はじめに データの可視化は非常に難しい。 まずデータの抽出が難しい ・データソースごとの整合性が取れているか ・取得したデータとソースデータに欠損が生じていないか ・SQL文を実行したサマリの結果が部分的に抜け落ちていないか。 その確認は時間的にも精神的にも苦痛。 しかし、苦労して抽出したデータも使い方で全くの無駄になる その例として「可視化や統計」部分に着目してお話をしようと考えた。 データの背景を知らない人には、データ可視化が歩み寄る手段になるし、伝えたい事をインパクトを伴って伝えられるなど非常にメリットである。 ※ただし 「可視化」の使い方によっては誤った理解をさせることも可能。 伝えたい事だけを正しいように見せる方法もあり、 可視化に詳しくない人に誤解を与えて自分の主張を通すこともできるかもしれない。 これは

    可視化や統計でデータに『恣意的なストーリーを語らせる』16の闇の魔術【bad charts】 - Qiita
  • にじさんじの配信者の類似性をチャットデータからネットワークグラフにして分析する - Qiita

    にじさんじの配信者間で"似ている"配信者はどういう人たちか 唐突ですが、一週間前は文化の日でしたね。せっかくだったので、文化らしいことをしたいなと思い、youtube data apiを使って遊んでみることにしました。 youtube のデータを使ってなにかしよう、となったとき、他の人はどういう分析をするんでしょうか。最近よくみるデータとしてはスパチャランキング・登録者数推移の予測などが思い当たります。 そしてまた唐突に語り始めるのですが、僕はvtuberの配信をラジオ代わりに流していることが多く、いわゆるvtuberオタクです。オタクのあり方には諸説ありますが、僕はラジオ代わりということもあり雑談配信やマイクラ配信を流していることが多いです。「にじさんじ」の配信を見ることが多い気がします。 さて、「にじさんじ」は言わずとしれた大所帯グループです。約100人の配信者が一つの箱に所属してい

    にじさんじの配信者の類似性をチャットデータからネットワークグラフにして分析する - Qiita
  • 品質管理における機械学習の有用性<br>~事例に学ぶ、製造業での機械学習の活用方法~

    はじめに はじめまして、Martingale(Twitterアカウント)と申します。 10年間、半導体分野の生産技術者をしたのち、データアナリストに転職し、今はデータ分析を使って化学プラントの故障原因の解明や予知保全をやっています。 近年、注目されているディープラーニングをはじめとする機械学習ですが、私の感覚では、製造現場への導入があまり進んでいないように思います。 その背景には従来から品質管理に活用されている統計的品質管理の影響があるのではと感じています。 統計的品質管理が上手く機能しているが故に、製造現場で機械学習の必要性があまり感じられていないのではないか?ということです。 つまり、以下のような会話が繰り広げられているのではないかと。。 製造現場でのやり取り (注)絵の中で、若手エンジニアとベテランエンジニアと書いたのは、あくまでイメージです。若手の方が、学生時代にPythonを触っ

  • オンラインゲームの「ガチャ」で欲しいレアアイテムが出ない(消費者トラブル解説集)_国民生活センター

    質問 オンラインゲームのガチャを100回引きましたが、1%の確率で出るレアアイテムが、1回も出ませんでした。確率表記が間違っているのではないでしょうか。 回答 オンラインゲームの電子くじ(一般に「ガチャ」と呼ばれるもの)は、店舗等のカプセルトイ(一般に「ガチャガチャ」と呼ばれるもの。1回引くごとに確率は上がっていく)と仕組みが異なり、確率の計算方法が異なる場合があります。 オンラインゲームに関する相談がトラブルメール箱に多く寄せられており、その中でも「ガチャ」を引いたのに希望のアイテムが出ないという事例が多く見られます。 確率の表記について オンラインゲームの「ガチャ」の確率表記については、業界団体である一般社団法人コンピュータエンターテインメント協会(CESA)と一般社団法人日オンラインゲーム協会(JOGA)がガイドラインを定めています。例えばCESAのガイドラインでは、原則として「提

  • 事故多発交差点マップ (2019年版)|日本損害保険協会

    〒101-8335 東京都千代田区神田淡路町2-9 一般社団法人 日損害保険協会 業務企画部 啓発・教育・防災グループ TEL:03-3255-1294 FAX:03-3255-1236 E-mail:ansui@sonpo.or.jp

  • 【FANZA REPORT 2018 同人編】 コミケ直前 「同人に関する統計調査」 緊急結果発表! - FANZA Magazine

    「FANZA REPORT 2018 同人編」とは、2017年10月1日から2018年9月30日までの直近1年間を対象に、今年10月に配信した“FANZA動画”に関する調査に続き、 “FANZA同人”に関しても同様に実施した統計調査になります。 調査は、対象期間中に「FANZA」を訪問した約3億3千万人の利用情報からGoogle Analyticsを活用して抽出したデータに基づいたものであり、同人においてこれほど膨大な数を対象にした統計調査は、国内でも初めての試みと言えるのではないでしょうか。 なお、調査と合わせて「FANZA REPORT 2018」も比較してご覧頂くとより一層お楽しみ頂けますので、是非両レポートを照らし合わせながらご覧ください! 【FANZA REPORT 2018】 また、末尾にFANZA同人でも活躍中のサークル「チンジャオ娘。」さんによる特設コラムも掲載していま

    【FANZA REPORT 2018 同人編】 コミケ直前 「同人に関する統計調査」 緊急結果発表! - FANZA Magazine
  • マンガで超読みやすい確率統計のオススメ参考書たち|迫佑樹オフィシャルブログ

    この,最初は良かったんですが途中から「カイ二乗検定」やら「t検定」やら「重回帰分析」やらよく分からん単語がいっぱい出てきて途中で挫折,もっと初心者向けのを探すことに 調べてみると,『今はマンガで統計学を学べるようなが結構出ている』ということでした 『マンガなら僕でも簡単に読めるはず』という楽観的な考えが頭を支配し,すぐに6冊の統計学に関するマンガを購入. 『マンガだけで統計学の基礎をマスターすることはできるのか』についての検証してみました. マンガでわかる統計学入門 マンガでやさしくわかる統計学 オーム社のマンガでわかるシリーズ マンガ統計手法入門 まとめ マンガでわかる統計学入門 実は以前,このブログ内で理系大学生へのオススメ参考書を紹介しました. その記事内で私が激推ししていた,オーム社のマンガでわかるシリーズがあるのですが,統計学に関しては悲しいことにKindle版が出ておらず

    マンガで超読みやすい確率統計のオススメ参考書たち|迫佑樹オフィシャルブログ
  • 68–95–99.7 rule - Wikipedia

    This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed. Find sources: "68–95–99.7 rule" – news · newspapers · books · scholar · JSTOR (September 2023) (Learn how and when to remove this template message) For an approximately normal data set, the values within one standard d

    68–95–99.7 rule - Wikipedia
  • API機能 | 本システムについて | 次世代統計利用システム

    政府統計の総合窓口(e-Stat)で提供している統計データを機械判読可能な形式(XML等)で取得できるAPI(Application Programming Interface)を提供します。 APIを利用したアプリケーションを開発することにより、統計データを利用した高度な利用環境を構築することができます。 システムは試行運用による提供です。このため、予告なく、システムの停止、性能の劣化などが発生することがありますのでご了承ください。また、提供するデータの内容についても保証いたしません。 ご利用にあたっての条件については、利用規約をご覧ください。

  • 統計情報 - 国土交通省

    PDF形式のファイルをご覧いただくためには、Adobe Acrobat Readerが必要です。 左のアイコンをクリックしてAdobe Acrobat Readerをダウンロードしてください(無償)。 Acrobat Readerをダウンロードしても、PDFファイルが正常に表示されない場合はこちらをご覧ください。

  • (1)現行計画の概要①

    rin51
    rin51 2014/07/01
    圏央道の計画。物流を変えるよ
  • ニッポンのセックス

    昨今、様々なメディアで「草系男子」や「肉系女子」といったニュースを見かけるようになりました。週刊誌などでは「セックスレス」を特集した記事もずいぶん目にします。 私たち相模ゴム工業は「避妊」と「性感染症予防」に効果のあるコンドームを製造販売するメーカーとして、今のニッポンのセックスは、ホントはどうなっているのかを徹底的に調査しました。 日で行われたセックスに関する調査では、恐らく最大級のものであると思います。 セックスの平均回数や経験人数などの一般的なものから、セックスに対する意欲やセックスをしたくない理由など、相当踏み込んだ内容まで調査しておりますので、今のニッポンのセックスが浮き彫りになっています。 調査結果は項目ごとに区分されていますので、是非ご興味のあるものからご覧ください。 調査日:2013年1月 調査対象:47都道府県  20~60代男女 調査人数:14,100名(1都道府

  • ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm

    研究用にニコニコ動画のコメント約300GBを公開‐ニコニコインフォ 情報学研究データリポジトリ ニコニコ動画コメント等データ 国立情報学研究所のダウンロードサービスでニコ動のデータセットが公開されていたので、とりあえずダウンロードしてみました ダウンロードの手順 以下のページで、名前、メールアドレス、所属を入力すればよいみたいです。 情報学研究データリポジトリ ニコニコ動画コメント等データ 申請 データの形式 行ごとにそれぞれの動画のjsonが書かれたファイルがたくさんあります。 コメントのデータもありますが、ユーザーに関する情報はないみたいです 動画の説明などには<b></b>や<font></font>、<br />などのHTMLタグが含まれていましたので、それらの除去が必要になりそうです タグの頻度 なんか面白いことできないかなーと考えたんですが、何も思い浮かばなかったので、とりあえ

    ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm
  • 総務省|報道資料|統計データにおけるAPI機能の試行運用開始

    総務省は、統計データの高度利用環境の構築のため、平成25年6月10日(月)午前10時から、統計データにおけるAPI機能の導入による試行運用を開始します。これは、オープンデータ推進のトップランナーとして政府の取組を先導するものです。 総務省統計局は、平成25年5月28日付け報道資料(参考1)のとおり、統計におけるオープンデータの高度化を進めることとしており、今般、このうちAPI機能の導入について、独立行政法人統計センターが運用する「次世代統計利用システム」上で、6月10日午前10時から試行運用を開始することになりました。 API機能の導入により、例えば、(1)利用者の情報システムに政府統計のポータルサイト(e-Stat)のデータを自動的に反映、(2)ユーザー保有やインターネット上のデータ等と連動させた高度な統計データ分析などが可能となります。これにより、ビジネス活性化や新規事業の開発促進、行

    総務省|報道資料|統計データにおけるAPI機能の試行運用開始
  • k‐Nearest Neighbor 法 (PDF)

  • KNN法(K最近傍法)でクラス分類 - チョッキーの黒歴史

    超お手軽分類手法!!KNN法をRで実装してみた KNN法はデータ数が多量であれば、それなりの性能があるとされています。 実装方法は超簡単 入力データと全学習データとのユークリッド距離を計算。 距離が短いものから順にk個だけ学習データから取り出す。 取り出した集合で入力データのクラスを多数決で決める。 つーことでRでの実装 # KNN法 # x:入力データ, data:学習データ # t:学習データのクラスラベルのベクトル(1以上の正の整数) myKNN <- function(x,data,t,k){ classNum <- max(t) #クラス数 dataN <- length(t) #学習データ数 calcDistance <- function(d){ #ベクトル間のユークリッド距離計算 return ( sum( (d-x)^2 ) ) # sqrtなし } distances

    KNN法(K最近傍法)でクラス分類 - チョッキーの黒歴史
  • k近傍法 - Wikipedia

    k近傍法(ケイきんぼうほう、英: k-nearest neighbor algorithm, k-NN)は、入力との類似度が高い上位 k 個の学習データで多数決/平均するアルゴリズムである[1]。 パターン認識(分類・回帰)でよく使われる。最近傍探索問題の一つ。k近傍法は、インスタンスに基づく学習の一種であり、怠惰学習 の一種である。その関数は局所的な近似に過ぎず、全ての計算は分類時まで後回しにされる。また、回帰分析にも使われる。 概要[編集] k近傍法は以下の手順からなる: 入力と全学習データとの類似度(距離)測定 類似度上位 k 個の選出 選出されたデータの多数決あるいは平均 すなわち「入力とよく似た k 個のデータで多数決/平均する」単純なアルゴリズムである[1]。 例えば環境(気温/湿度/風速)から天気(雨/曇り/晴れ)を予測する分類問題を考える。k=5 のk近傍分類では、過去10

    k近傍法 - Wikipedia