並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 483件

新着順 人気順

統計学の検索結果121 - 160 件 / 483件

  • 統計学とはそもそも「無作為抽出された少量のデータ」を分析するためのものであった - 渋谷駅前で働くデータサイエンティストのブログ

    しばらく前にQuoraにこんなアンサーを書いたことを思い出したので、ついでにリブログ記事として転載の上加筆修正したものを用意してみました。僕にしては珍しくコッテコテの頻度主義的な話題である上に、「p値なんか使うのはやめてしまえ」という記事を以前に書いておきながらこんな議論をするのは自己矛盾かもしれませんが(笑)、これまでの統計学の歴史を紐解くことで、温故知新ということで新たに理解されることもあるのかなと思っています。 小標本のための統計学と、「スチューデント」ことゴセットの話 補足 小標本のための統計学と、「スチューデント」ことゴセットの話 近代統計学とは、「無作為抽出によって得られた小標本を分析することで、その背後にある母集団の性質を推定する」ために改良が積み重ねられてきた営みです。すなわち、統計学は「少量のデータを扱う学問」そのものだとも言えます。 (Skbkekas - 投稿者自身に

      統計学とはそもそも「無作為抽出された少量のデータ」を分析するためのものであった - 渋谷駅前で働くデータサイエンティストのブログ
    • データサイエンスはつまらない(パート1)【前編】 | AI専門ニュースメディア AINOW

      著者のIan Xiao氏は、顧客企業に機械学習ソリューションを提供するカナダの企業DESSAにおいて「契約リード(Engagement Lead)」という肩書で機械学習プロジェクトを指揮管理しています。同氏がMediumに投稿した記事「データサイエンスはつまらない(パート1)」では、データサイエンス職におけるつまらない側面が解説されています。 同氏の甥はコンピュータサイエンスの修士課程で勉強しており、卒業後はデータサイエンス職に就きたいと考えていると聞いて、同氏は甥が正しい判断を下せるようにデータサイエンス職における「つまらない」側面をあえて伝えようと決意しました。 データサイエンス職を志望する若者は、仕事に就けば機械学習モデルの構築のような知的にエキサイティングな業務に携われると思い込んでいます。しかし、現実には業務時間のほとんどを退屈でつまらない仕事に関わることになる、と同氏は指摘しま

        データサイエンスはつまらない(パート1)【前編】 | AI専門ニュースメディア AINOW
      • はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために

        人文系大学生〜学部卒の方々を念頭に置いた講演でのスライドです。Enjoy! *書籍:林岳彦著『はじめての統計的因果推論』(岩波書店)の情報はこちら→ https://www.iwanami.co.jp/book/b639904.html

          はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために
        • 統計学テキスト

          統計学テキスト 公開ページ このテキストは,京都女子大学現代社会学部の講義「統計学」,および佛教大学通信教育部の数学教員養成課程「確率論」の教科書として使っていたものです。出版するには受講者数が少なすぎるをよいことに,細かい改訂を繰り返して現在の形になっています。 「数式がちゃんと書いてある文系向けの統計のテキスト」がほしかったということで,講義のテキストに使ってくださっている ところもあり,とても喜んでいます(理系や技術系でもこのテキストは使えるらしく,ありがたいコメントをいただいています)。 利用の条件等は本文の「まえがき」をごらんください。(小波秀雄) 「統計学入門」 関連URL 公開時の日記 「統計学入門」ダウンロード 2020年末時点の版もダウンロードできます 新しい版をダウンロードするときには,その前にブラウザで「再読み込み」をしてください. 更新履歴 2013/03/11:公

          • ヤバいデータ分析(書籍・記事であまり扱われてないが重要なこと) - Qiita

            まえがき データ分析はなんて広いんだろう。影響力の強まりに応じ、自然・社会・人間ほぼすべてが対象となりどんどん拡大していく。対象に応じ手法も広がり複雑化し、学ぶべきことが多すぎる。データサイエンティスト協会のスキルチェックリストVer.3.001(ごめんもう4.00が出てるね)も500超の項目があります。読むべき図書も良書と思われるものだけでも増え続けており、もう手に負えない状況です。 ただ、これはやってはだめだ、ここを知らないと道に迷う、という絶対に知っておくべき点は学べる範囲だと思います。本書では、データ分析において間違えやすい、誤解しやすい点を共有し、データ分析全体をよくする目的で、かつ データ分析の入門書・専門書に分野ごとには書かれてはいますが1つにまとまっておらず目に触れにくいもの データ分析の入門書・専門書でもスルーされていたり場合によっては誤っていると思われるもの で自分なり

              ヤバいデータ分析(書籍・記事であまり扱われてないが重要なこと) - Qiita
            • 国友直人のホームページ

              私のホーム・ページにようこそ 制作協力:福井崇人・一場知之/最後の訂正:2023年1月15日 [ 英語 | 日本語 ] 研究・教育活動の主な分野 統計学、計量経済学、数理・計量ファイナンス、経済統計学、データサイエンス(統計科学) 最近の活動 社会協力活動 国土交通省第三者委員会委員(建設工事受注動態統計調査の不適切処理問題, 2021.12.23-2022.1.14) 報告書, 国土交通省 研究協力 経済時系列解析プログラム・季節調整法X12SIML(佐藤整尚先生, 2023.2.1) 日本語解説, 英語解説 新刊 「データ分析のための統計学入門」("OpenIntro Statistics, 4th Edition" by D.Diez, M.Cetinkaya-Rundel and C.Barr, 日本語印刷版(誤植訂正版), 日本統計協会, 小暮厚之氏・吉田靖氏と共訳,2021年3

              • 機械学習エンジニアは10年後には存在しないだろう。 | AI専門ニュースメディア AINOW

                著者のLuke Posey氏は、機械学習エンジニアのキャリアを積んだ後にAIスタートアップSpawner.aiを創業するかたわらMediumに記事を投稿しており、AINOW翻訳記事『無闇にデータサイエンティストを雇うのをやめよう。』の著者でもあります。同氏が最近Mediumに投稿した記事『機械学習エンジニアは10年後には存在しないだろう。』では、近い将来、「機械学習エンジニア」という職種が実効的な意味を持たなくなる、と予想が論じられています。 第三次AIブーム黎明期の頃、機械学習エンジニアは数学と統計学に関する専門知識を習得しているという希少さゆえに、高く評価され高額報酬を手にしていました。この職種には、最先端の技法を製品やサービスに落とし込む「研究者兼技術者」という立ち位置が依然として求められています。 しかし、近い将来、機械学習エンジニアには研究者としての側面が求められるなくなるだろう

                  機械学習エンジニアは10年後には存在しないだろう。 | AI専門ニュースメディア AINOW
                • 統計的因果推論とデータ解析 / causal-inference-and-data-analysis

                  統計的因果推論の解釈と、実際の運用における注意点をまとめた資料です。 先日、closedな勉強会で発表したものを一部改変したものです。 twitter : @tomoshige_n mail : tomoshige.nakamura@gmail.com �注)一部、わかりやすさを厳密性よりも優先した部分があります。厳密性などを求める方は、文献等をあたってください。

                    統計的因果推論とデータ解析 / causal-inference-and-data-analysis
                  • 統計学習の指導のために(先生向け)

                    PDF形式のファイルをご覧いただく場合には、Adobe Readerが必要です。 Adobe Readerをお持ちでない方は、バナーのリンク先から無料ダウンロードしてください。

                    • Prediction One | ソニーネットワークコミュニケーションズ

                      専門家いらずの ソニーのAI予測ツール! 専門家でなくても簡単に操作でき、 データから予測を算出するソフトウエアです。 Prediction Oneとは 「Prediction One」は、ソニー社内のAI教育にも用いられるAI予測分析ツールです。 機械学習やプログラミングなどの専門知識がなくても数クリックの簡単な操作で予測分析が実現できます。 勘や経験に頼りがちだった業務をAIで行い、業務効率化や属人化解消のサポートをします。 シンプルで簡単 自動モデリングで 高精度な予測 予測の理由が わかる デスクトップ版・ クラウド版の環境で 利用可能 複数メンバーでの 共同作業が可能

                        Prediction One | ソニーネットワークコミュニケーションズ
                      • 再現性問題のはなし - 渋谷駅前で働くデータサイエンティストのブログ

                        経済セミナー2022年6・7月号 通巻726号【特集】経済学と再現性問題 日本評論社Amazon 最近は計量経済学・統計学方面の方々との交流が多いんですが、そのご縁で『経済セミナー』の2022年6・7月号が再現性問題を取り上げていたと知り、入手して読んでみました。特集部分の目次を以下に引用すると、 特集= 経済学と再現性問題 【鼎談】再現性の問題にどう向き合うか?……川越敏司×會田剛史×新井康平 心理学における再現性の危機――課題と対応……大坪庸介 経済学における再現性の危機――経済実験での評価と対応……竹内幹 フィールド実験・実証研究における再現性……高野久紀 健全な研究慣習を身に付けるための実験・行動経済学101……山田克宣 再現性問題における統計学の役割と責任……マクリン謙一郎 という内容で、幾つかの分野にまたがって論じられています。特に、このブログ含めて個人的に度々お世話になってい

                          再現性問題のはなし - 渋谷駅前で働くデータサイエンティストのブログ
                        • 『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング+ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ

                          ここ2ヶ月ぐらいに渡って多くの方々からご著書をご恵贈たまわっているのですが、そのうちの一冊がこちら。かつて計量時系列分析を学んでいた頃に僕も大変お世話になった、Logics of Blueブログの馬場さんの手による『RとStanではじめるベイズ統計モデリングによるデータ分析入門』です。 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 作者:馬場 真哉出版社/メーカー: 講談社発売日: 2019/07/10メディア: 単行本 以前はベイズ統計モデリングの入門書というと「みどりぼん」こと『データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)』一択でしたが、皆さんもご存知のように既にメンテされていないWinBUGSを使っているなどout-of-dateな要素が多く、近年はこれに替わる良書

                            『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング+ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ
                          • 改めて、汎化性能と交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ

                            追記 再現性をチェックする実験を後日実施しています。併せてお読みください。 以前こんな記事を書きました。 この辺の話はとっくの昔に常識になっていると思っていたのですが、昨今様々な「モデル」が提唱されて公の場で喧伝されることが増えてきており、その中には明らかにこれらの記事で指摘されている問題に引っかかっているものがあるようなので、注意喚起も兼ねて改めてブログ記事として書いてみようと思います。 追記 (May 08, 2020) 本文中にも記事公開当初の初稿の時点でいくつか但し書きを入れてありますが、この記事で最も強調したかったことは「時系列データに対して多項式フィッティングを行うという本来あり得ないモデリングのやり方であっても、交差検証を行えば短期的な予測性能(汎化性能)を改善することができる」ということです。データセットにランダムウォークを選択したのは、単に極値が2つ以上ある時系列を生成し

                              改めて、汎化性能と交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ
                            • データ分析をする前に、まず生データを見てみよう - 渋谷駅前で働くデータサイエンティストのブログ

                              先日ですが、旧知の*1Grahamianさんのこんなツイートが話題になっていました。 データ分析をするときシンプルに重要なことは「生のデータを眺める」と「データの分布をグラフにする」ことなんじゃないかと思うんですよね。すぐにクロスとかファネルとかコホートとかやりたくなるんですけど、まずは目の前のデータがどんなものか頭にマッピングさせることが長期的に効いてくる感じ。— Grahamian📊データ分析と機械学習 (@grahamian2317) 2021年1月12日 何を当たり前のことを言っているんだと眉を顰める向きもあるかもしれませんが、これだけデータサイエンスやら機械学習(人工知能)やらが喧伝されている昨今においては、少なからぬ現場で「データはどこかのAPIからバルクでダウンロードしてくるor本番DBから転送してくるだけ」「やってきたデータは中身を見もせずにそのまま統計分析や機械学習など

                                データ分析をする前に、まず生データを見てみよう - 渋谷駅前で働くデータサイエンティストのブログ
                              • 疑似相関 - 井出草平の研究ノート

                                全く関連が見いだせないが、データ上は相関関係のみられる変数について。 本も出版されているようだ。 Spurious Correlations 作者:Vigen, Tyler発売日: 2015/05/12メディア: ハードカバー このエントリの元ネタはこちら。 www.tylervigen.com Gigazineでもこれらの疑似相関が取り上げられている。 gigazine.net 「米国の科学・宇宙・技術への支出」と「首吊り、絞め殺し、窒息死による自殺」 「プールに落ちて溺死した人の数」と「ニコラス・ケイジの出演作品」 「一人当たりのチーズ消費量」と「ベッドシーツに絡まって死亡した人の数」 「メイン州の離婚率」と「マーガリンの一人当たり消費量」 「ミス・アメリカの年齢」と「蒸気、高温の蒸気、高温の物体による殺人」 「アミューズメント施設事業の売上高」と「米国で授与されたコンピュータサイエン

                                  疑似相関 - 井出草平の研究ノート
                                • 計算機統計学・ベイズ統計学周辺でのお勧めの教科書10冊 - Qiita

                                  はじめに 千葉大学/Nospareの米倉です.今回は僕が専門にしている計算機統計学・ベイズ統計学周辺で僕が勝手にお勧めだと思う教科書を10冊簡単なコメント付きで紹介したいと思います.初学者向けといより,修士・博士課程位のレベルのが多いので,ややプロ向けです. お勧めのプログラミング言語 僕は普段Julia言語を用いています.特徴は非常に高速なのと,可読性の高さでしょうか.個人的にはPythonやRより優れていると感じていて,僕の周りの専門家でも使っている人が多いです. Robert and Casella "Monte Carlo Statistical Methods" この分野のバイブルと言えばバイブルみたいな感じですが,そう呼ぶにはちょっと頼りない感じもします.けどモンテカルロ法に興味がある人はマストバイです.色々な種類のモンテカルロ法が網羅的に紹介されています. Efron and

                                    計算機統計学・ベイズ統計学周辺でのお勧めの教科書10冊 - Qiita
                                  • 書評 「統計学を哲学する」 - shorebird 進化心理学中心の書評など

                                    統計学を哲学する 作者:大塚 淳発売日: 2020/10/26メディア: 単行本(ソフトカバー) 本書は応用統計学にも造詣の深い科学哲学者大塚淳による統計学の哲学の入門書になる.序章では本書について「データサイエンティストのための哲学入門,かつ哲学者のためのデータサイエンス入門」だとある. これまで読んだ統計学の哲学についてはソーバーの「科学と哲学」がなかなか面白かった.本書ではソーバー本では扱っていなかった因果推論や深層学習についても論じられていて,そのあたりも勉強したいと思って手に取った一冊になる. 序章 統計学を哲学する? 序章では本書のねらいと構成が書かれている.ねらいとしては,上記の入門書というだけでなく,「統計は確固とした数理理論であり,そこに哲学的思弁が入り込む余地はない」とか「統計は単なるツールであり,深遠な哲学とは無縁だ」とかいう誤解を解きたいということが挙げられている.

                                      書評 「統計学を哲学する」 - shorebird 進化心理学中心の書評など
                                    • cakes(ケイクス)

                                      cakesは2022年8月31日に終了いたしました。 10年間の長きにわたり、ご愛読ありがとうございました。 2022年9月1日

                                        cakes(ケイクス)
                                      • 【厳選】無料の疫学・統計学オンライン講座11選!

                                        Dr. すきとほる, MPH, PhD | 疫学専門家このブログのモットーは『研究ライフをほんのり豊かに』。研究者のための副業や転職、便利ツール、SNS運用などお役立ち情報をお届けします |【所属】大手外資製薬のGlobalチーム管理職&国立大学研究職 |【経歴】貧乏学生 ▶︎ 社畜 ▶︎ 研究職へキャリアチェンジ ▶︎ 3年で年収10倍に |【専門】薬剤疫学と医療大規模データベース研究 | ※発言は個人の見解で組織を代表しません こんにちは、すきとほる疫学徒です。 本日は、無料で学ぶことのできる疫学・統計学のオンラインコースを紹介していきたいと思います。 素晴らしい時代になったものですね。。。 ちょっと前の時代には、疫学・統計学などのPublic Healthの専門知を学びたければ、公衆衛生大学院に進学するか、自力で書籍を読むかという手段しかなかったはずです。 それが、こうしてオンライン

                                        • ポケモンデータ解析.py - Qiita

                                          # https://www.kaggle.com/abcsds/pokemon から取得した Pokemon.csv を読み込む。 df = pd.read_csv("Pokemon.csv") # df とは、 pandas の DataFrame 形式のデータを入れる変数として命名 https://www.kaggle.com/abcsds/pokemon によると、各カラム(列)は次のような意味らしいです。 #: PokeDex index number Name: Name of the Pokemon Type 1: Type of pokemon Type 2: Other Type of Pokemon Total: Sum of Attack, Sp. Atk, Defense, Sp. Def, Speed and HP HP: Hit Points Attack: At

                                            ポケモンデータ解析.py - Qiita
                                          • 8行のデータで理解する階層ベイズ - Qiita

                                            学習効果を統計的に評価したい! こんにちは グロービスではさまざまな教育事業を展開していますが、多くの人に学習を継続してもらうためには、研修をしたりコンテンツを視聴してもらったりするだけでなく、その学習効果を測定してユーザーにフィードバックすることが重要です。このとき、だれが見ても明らかな効果が出れば良いのですが、受講前後の成績変化のばらつきが大きかったりデータが少なかったりして、必ずしも分かりやすい結果が得られるとは限りません。そういった場合にデータを丁寧に紐解いて、どの程度効果があったのかを明らかにするのも分析の仕事のひとつです。 今回は階層ベイズモデルという統計モデルを使って、高校における学力コーチングの成果についてのデータを分析します。階層ベイズはやや高度な統計モデルというイメージがありますが、この記事ではたった8行のデータを例にしてその概要を説明してみたいと思います。 想定読者

                                              8行のデータで理解する階層ベイズ - Qiita
                                            • ページが見つかりませんでした – COVID-19情報共有 — COVID19-Information sharing

                                              お探しのコンテンツを見つけられませんでした。検索をお試しください。 検索:

                                              • 統計的因果推論入門の講義資料を公開しました - Unboundedly

                                                去年末に日本に帰国した際、ありがたいことに多くの方から因果推論に関するレクチャーの依頼をいただきました。 本当はこの春にも帰国してトーク予定だったのですが、コロナ渦でタイミングを逸したので思い切って講義資料を公開することにしました。 ツイッター上でのこんな話題もきっかけで・・・ これを意識するだけで(少なくとも医学・公衆衛生領域における)回帰分析ユーザーの大部分の結果の解釈やモデルに対する向き合い方が変わると思っています。日本で修士までとったけど、自分は留学するまで知らんかった。 去年末、一時帰国中にやった因果推論ワークショップ中でも触れました。 https://t.co/jEsu5WDPLx pic.twitter.com/LmidBTMQlw — KRSK (@koro485) May 27, 2020 内容はこんな感じです なんとなく回帰分析を使って「調整」をしてました、くらいの統計

                                                  統計的因果推論入門の講義資料を公開しました - Unboundedly
                                                • 【ネタバレ考察】映画『ナイチンゲール』あらすじ・感想。#MeToo映画最高作。女性への暴力根絶&アボリジニへの人権も訴求!

                                                  映画『ナイチンゲール』のあらすじ・ネタバレ・解説・感想・評価から作品情報・概要・キャスト、予告編動画も紹介し、物語のラストまで簡単に解説しています。 映画『ナイチンゲール』公式サイトにて作品情報・キャスト・上映館・お時間もご確認ください。 YouTubeで予告映像もご覧ください。

                                                    【ネタバレ考察】映画『ナイチンゲール』あらすじ・感想。#MeToo映画最高作。女性への暴力根絶&アボリジニへの人権も訴求!
                                                  • 2023年度 早稲田大学「計量分析(政治)」補助教材

                                                    最終更新日 RStudio と R Markdown R Markdown の使い方と文法 Sep. 21, 2022 R の「あるある」エラー Sep. 13, 2022 Rを使ったデータ操作 1.   データ・ハンドリング(基礎) Sep. 13, 2022 2.   データ・ハンドリング(応用) Nov. 17, 2023 3.   データ・クリーニング Sep. 13, 2022 データの可視化 4.   ggplot2(基礎) Sep. 26, 2022 5.   ggplot2(棒グラフ) Oct. 20, 2022 ggplot2(ヒストグラム) Sep. 10, 2022 ggplot2(箱ひげ図) Oct. 20, 2022 ggplot2(散布図) Sep. 20, 2022 ggplot2(折れ線グラフ) Sep. 20, 2022 ggplot2(ロリポップ・チャー

                                                    • 使える統計モデル10選(後編) | AIdrops

                                                      使える統計モデル10選(後編) 前回の記事では、使える統計モデル10選の前編として、主に回帰モデルに焦点を絞って紹介しました。 今回はその後編に当たる生成モデル編です。生成モデル(generative model)は、端的に言うと、コンピュータシミュレーションによりデータを人工的に作ることができるモデルです。データが作られる過程をうまく表現したモデルを構築することができれば、予測だけではなく異常検知やデータ圧縮など幅広いタスクに応用することができます。 生成系(教師なし系) 回帰モデルと同様、生成モデルも数個のパラメータから構成される簡単なものから、複数のモデルを巧みに組み合わせた複雑なものまで無限に存在します。ここでは、データ圧縮から自然言語処理、ソーシャルネット解析までさまざまなデータ解析のタスクで利用されている代表的な生成モデルを5つ選んで紹介します。また、生成モデルのすべては潜在変

                                                        使える統計モデル10選(後編) | AIdrops
                                                      • 【保存版】統計学のおすすめ書籍8選 | 文系からでも基礎を理解するのに役立つ書籍をピックアップ! - DAINOTE

                                                        こんにちは、DAIです。 大学時代は文系でした。 大学で初めて統計学の講義に出たときに、思いました。 「ちょ、大学の統計学の授業って、どんだけわかりにくいんだ!www」 「大学の統計学の授業ってどんだけつまらないんだwwwww」と。 大学の統計学の授業は、「高校レベルの数学ちゃんとマスターしてますぞい!」って人を対象にしているので、ど文系でいきなり「おい!なんとかついて来いよ!お前らわかってる体でやるからなwwwがはは!じゃあこのシグマは・・・・」みたいな教授に教えられても、「先生、そのたらこ唇みたいな記号なんですか?」みたいな話になるわけで、そりゃわかるはずないんですよw 難しすぎますから。 数学の基礎的なことわかってないと先に進めないので、完全に統計学が難しいと思い込んでしまい、統計アレルギーの大学生が続出してしまうんだと思います。 それと、大学の統計学って、理論を学ぶものばっかで、デ

                                                        • ベイズ深層学習(3.3~3.4)

                                                          筑波大HCOMP研究室の勉強会資料です. 内容はベイズ深層学習(著 須山敦志)の3.3から3.4節です. 日本一(誇張)ベイズ線形回帰の計算を丁寧に書いたつもりです. 本に誤記の"可能性"があります.(自分の計算が間違っている可能性もある.) 違うとかあれば連絡ください.

                                                            ベイズ深層学習(3.3~3.4)
                                                          • 【統計学「p<0.05」に下げる方法】統計好きでも意外と知らない「p値ハッキング」の中身

                                                            心理学者。キングス・カレッジ・ロンドンの精神医学・心理学・神経科学研究所の講師。2015年に科学的心理学会(アメリカ)の「期待の星(ライジンング・スター)」賞を受賞。『タイムズ』『ワシントン・ポスト』『ワイアード』などに数多く寄稿し、BBCラジオなどの出演もある。 Science Fictions あなたが知らない科学の真実 スタンフォード監獄実験はイカサマだった! 権威ある心理学研究の100件のうち、再現に成功したのはたったの39%!? 科学の信頼性を根底から揺るがす「再現性の危機」に迫る真実の書、日本上陸! 科学における不正・怠慢・バイアス・誇張が起きる仕組みを多数の実例とともに解説。既存の本で知ったウンチクを得意げに語る人に読ませたい、真実の書。 バックナンバー一覧 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。 科学の「再現性の危機」をご存じだろうか。心理学、

                                                              【統計学「p<0.05」に下げる方法】統計好きでも意外と知らない「p値ハッキング」の中身
                                                            • 9 Distance Measures in Data Science

                                                              Distance Measures. Image by the author.Many algorithms, whether supervised or unsupervised, make use of distance measures. These measures, such as euclidean distance or cosine similarity, can often be found in algorithms such as k-NN, UMAP, HDBSCAN, etc.

                                                                9 Distance Measures in Data Science
                                                              • [数理統計学]統計的検定のまとめ – かものはしの分析ブログ

                                                                都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト 通勤電車のなかで私が勉強する用のシリーズ第5弾です。今回は統計的検定についてまとめておこうと思います。 【これまでのシリーズへのリンク】 ・[数理統計学]統計的推定のまとめ ・[数理統計学]正規分布から導かれる分布(カイ二乗分布/t分布/F分布)の期待値と分散の導出まとめ ・[数理統計学]連続型確率分布の期待値と分散の導出まとめ ・ [数理統計学]離散型確率分布の期待値と分散の導出まとめ 目次 統計的仮説検定 検出力 一様最強力検定 ネイマン-ピアソンの基本定理 不偏

                                                                  [数理統計学]統計的検定のまとめ – かものはしの分析ブログ
                                                                • BASIC STUDY | AVILEN AI Trend

                                                                  全人類がわかるデータサイエンス 基礎

                                                                  • 心理学は信頼できるのか? 再現性の問題【心理学】|手記千号

                                                                    心理学は重要な学問だと思っている。 心理学上の研究成果は、法学、経済学、社会学、教育学、哲学、文学に至るまでさまざまな学問で援用されている。 重要かつ影響力のある学問だと思っているからこそ、最近は集中的に色々と読んでいるわけだが、同時に警戒感もあった。 先日、心理学の入門書の目次を眺めたところ、心理学研究手続上の諸問題について書かれた項目をみつけた。読んでみると、10年ほど前にショッキングな事実が続けざまに発覚し、心理学は危機を迎えたという。 内容が衝撃的であったので、素人ながら調べて考えてみた。そうとうな長文になってしまったが、それは驚きの反動である。 1 心理学における再現性の危機 2010年代、心理学研究の信頼性を揺るがせる大事件が立て続けに発生した。 2011年には、ダリル・ベムという社会心理学・パーソナリティ心理学分野における重鎮が、人間の予知能力を確認したとする研究論文を、世界

                                                                      心理学は信頼できるのか? 再現性の問題【心理学】|手記千号
                                                                    • なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録

                                                                      前回「ベイズ統計学に関する議論を整理する」では、できるだけ中立的な視点で書くことに注力し、伊津野なりの結論については特に書かなかった。今回のエントリでは、様々な見解や調べた結果を元に私見を書く。 もちろん、伊津野は専門家ではなく、情報や理解が不足する部分については想像で補ったため「それはおかしい」と感じられる点もあるだろう。そのような記述を見つけたら、単に批判を書くのではなく、なぜ問題だと思うのか、自身のブログやTwitterなどで他の人間にも理解できるように論点を明確に書くようにしてほしい。うんこの投げ合いはうんざりだ。それに、コメント欄に批判や反論を書かれても、伊津野の理解力では適切な回答ができるとは思えない。広い範囲に意見を投げかけた方がより専門的な回答が得られ生産的だろう。*1 前置きが長くなったので本論に移ろう。 まず先に結論を述べる。現在、ベイズ統計学は「(頻度主義とは異なる)

                                                                        なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録
                                                                      • 政府調達の布マスク 自治体などから配布希望 約2億8000万枚超 | NHKニュース

                                                                        新型コロナ対策として政府が調達した布マスクをめぐり松野官房長官は、8000万枚余りの在庫に対し個人や自治体などからの配布希望の申請が、推計でおよそ2億8000万枚以上となったことを明らかにしました。 新型コロナウイルス対策として政府はおととし、およそ2億8700万枚の布マスクを調達しましたが、去年11月末時点で8000万枚余りが在庫として残り保管費用がかさんでいることから、先に岸田総理大臣が希望者に配布し、有効活用を図ったうえで年度内をめどに廃棄する方針を示しました。 これについて松野官房長官は午前の記者会見で「個人 団体や自治体などからの配布希望の申し出を先月24日から先週28日まで受け付けた。現時点でサンプル調査に基づいて推計すると、およそ2億8000万枚以上となる見込みだ」と述べました。 そのうえで「今後1か月ほどかけて、配布枚数などを精査していくこととしており、現時点で、配布のしか

                                                                          政府調達の布マスク 自治体などから配布希望 約2億8000万枚超 | NHKニュース
                                                                        • 『「数理科学を使えば統計の”主義”を争う必要ない」という主張について検討する』

                                                                          ・はじめに 統計学の歴史では、頻度主義とベイズ主義という異なる立場の方法が存在し、違いに論争を繰り広げてきました。しかし、近年の統計学者の中には「現代の統計学は数理的な方法に基づいているから、主義の争いは解決した」と考える人もいるようです(この立場のことを、この記事では便宜的に「統計数理による主義不要論」と呼ぶことにします)。この記事では、「統計数理による主義不要論」に対して私なりの反論を考えてみることにします。論点は、以下の3つです。 1.     「“数理的な方法”を使っても、主義の争いが解決しない」ということを示唆する事実が存在する 2.     頻度主義とベイズ主義の論争を「どちらの方法が正しいか」という争いとして捉えると論争の全体像を見誤る 3.     WAICに代表される現代ベイズ法の意義は、「数理によって主義の争いを解決した」のではなく「仮にあなたが頻度主義的な価値観を重視

                                                                            『「数理科学を使えば統計の”主義”を争う必要ない」という主張について検討する』
                                                                          • 尤度とはなんだったのか

                                                                            TL;DR Ubie という会社で働いていて尤度とかを改めて見直す機会があったのでブログにまとめておく 尤度主義のような、自然と使っていたが明示的には知覚できてなかったものの存在を知った 主義や哲学に関しても言及するが、それらの良し悪しについて述べるものではない 4/1 から Ubie という会社に入社して、データ分析的な仕事やコードを書いたり楽しく働いている。 保有するデータのそのものが面白くて、今のところ主にこれを改善していくところに関わっていて、機械学習的な内容はあまりやっていない。 仕事をしていると尤度とかよく使うが、使っているうちにこれまで雑に理解してた部分が散見されたので、そもそも尤度とはなんだったのかをちょっと復習している。 色々調べていくとだいぶ広くて深いところに入り込んでしまいそうになるので、現在の理解を一部ブログにて整理しておこうというのがこのエントリである。 技術的に

                                                                              尤度とはなんだったのか
                                                                            • 『大塚(2020)「統計学を哲学する」を読む』

                                                                              光栄にも大塚淳先生より新著「統計学を哲学する」(名古屋大出版会: 以下「本書」)を御恵投いただきました。御礼に替えて、簡単に内容を紹介し議論をしていこうかと思います。特に本書が導入した「存在論」「意味論」「認識論」という三つの区別の意義を大久保の視点から論じます。最後に、私が関心を持った今後の展開について言及します。 ・はじめに 科学哲学とは、どのような分野なのだろうか。もちろん私が考えるにはあまりにも大きすぎる問だが、他の人に紹介するなら「科学における概念や論争を分析すること」あるいは「ある学術的主張の背後で暗黙的に措定されている前提を分析すること」と答えるかもしれない。本書の著者がTwitter述べた通り、 Jun Otsuka@junotk_jp あと哲学っていうと論理が及ばないところを棍棒で殴り合う、っていうイメージがあるみたいだけど、それは全くの誤解ですね。むしろ私のイメージする

                                                                                『大塚(2020)「統計学を哲学する」を読む』
                                                                              • ロジスティック回帰とElo Ratingの関係 - ブログのとさか

                                                                                はじめに 対戦ゲームのレーティングシステムとして多く採用されているElo Ratingですが, その計算式を見ると内部で行っていることはロジスティック回帰とほとんど一致することがわかります. この記事ではロジスティック回帰とElo Ratingについて簡単に説明し,それらの関係について見ていきます. また,ついでにこの事実を応用した格闘ゲームのキャラ相性解析のアイデアについて紹介したいと思います. ロジスティック回帰 ロジスティック回帰は2値分類問題の推論や分析に利用される一般化線形モデルの一つです. ロジスティック回帰ではロジット(対数オッズ)を線形モデルで予測します.*1 このことは予測確率を,線形モデルの出力を,ロジスティック回帰の重みベクトルを,バイアスを,入力ベクトルをとした時以下の式で表されます. 予測確率の計算 予測確率は以下の式で求まります.*2 更新式 ロジスティック回帰

                                                                                  ロジスティック回帰とElo Ratingの関係 - ブログのとさか
                                                                                • リキッドバイオプシーの商業化の問題点 - NATROMのブログ

                                                                                  『「血液一滴」あるいは「尿一滴」で、がんを早期発見!』という話は以前からたくさんあるが、なかなか実用化されない。こうした、少量の体液からがんを診断する技術を「リキッドバイオプシー」と呼ぶ。現時点では、一定の精度でがんを診断できるリキッドバイオプシーは複数あるが、がん検診に有効であると証明されたものは一つも存在しない。がん検診に応用するには、がん死亡率を低下させることが示されなければならず、これがハードルが高いからだ。 ある検査ががんを診断する能力を検証するのはどうすればいいだろうか。よくあるのが、すでにがんと診断された人にその検査をして、どれぐらいの割合で陽性になるのかを調べることだ。また、がんではない人を正しくがんではないと診断する能力も必要なので、健康な人にもその検査を行って正しく陰性になる割合を調べる。それぞれ数十人ずつ調べればだいたいのところはわかる。研究に参加した時点で診断はつい

                                                                                    リキッドバイオプシーの商業化の問題点 - NATROMのブログ