並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 800件

新着順 人気順

標準偏差の検索結果241 - 280 件 / 800件

  • 【書評】「統計学入門」を読んでみた感想と内容紹介 - GMO RESEARCH Tech Blog

    システム部の福原です。 最近はデータ分析事業に従事しています。 社でも新しい取り組みで、試行錯誤の毎日です。 また、個人としてもデータ分析の基礎を学びたいと思ったので、統計学の勉強をしています。 そこで、いろいろなところで紹介されている統計学入門を読んでみました。 https://www.amazon.co.jp/dp/4130420658 この書評を書いてみたいと思います。 はじめに、至極簡単に読んだ感想をお伝えしておくと、統計の基礎を一通り学びたい人におすすめできると思いました。 詳しい感想・読んだ印象は一番最後にまとめてあります(目次からも飛べます)。 それでは、内容紹介に入っていきますので、この本の内容が気になる方は読んでみて下さい。 大まかな内容紹介 多数の数字データの特徴や傾向を知りたい。 特にそれぞれのデータではなく、全体的な傾向が知りたいと考えたとします。 そのための数字デ

      【書評】「統計学入門」を読んでみた感想と内容紹介 - GMO RESEARCH Tech Blog
    • 「Ct値」「解離曲線」って何? リアルタイムPCR解析で用いられる用語まとめ

      リアルタイムPCRには特有の用語が頻出しますが、果たしてその内容を正しく理解できているでしょうか?今回は、難解でわかりにくいリアルタイムPCR解析に関する主な用語の定義をご紹介します。 ベースライン リアルタイムPCRにおけるベースラインとは、蛍光シグナルにほとんど変動がない、PCRの初期サイクル(通常3~15 サイクル)におけるシグナルレベルのことを指します。このベースラインの低シグナルは、反応のバックグラウンドあるいは「ノイズ」と同一であるとみなすことができます(図1)。リアルタイムPCRにおけるベースラインは、増幅曲線の手動解析または自動解析により、各反応毎に実験データを基に設定されます。下記に示すサイクル値(Ct)を正確に決定するためには、ベースラインを注意深く設定することが必要です。ベースラインの決定には、初期サイクルに観察されるバックグラウンドを排除するために十分なサイクル数を

        「Ct値」「解離曲線」って何? リアルタイムPCR解析で用いられる用語まとめ
      • Pandas を基礎から学ぶために「Kaggle Courses」の学習コンテンツを受講した - kakakakakku blog

        機械学習コンペティションを開催する Kaggle のサイトを見ていたら「Kaggle Courses」という「学習コンテンツ」が公開されていて,Python や SQL や 機械学習など様々なトピックを学べるようになっていた.なんと無料💰現時点でコースは「計17種類」もある.今回は今まで何となく使っていた「Pandas」を学ぶコースを受講してみた.Pandas 未経験者や Pandas の基本的な機能を一通り学びたい人におすすめ👌 www.kaggle.com アジェンダ 📊 Pandas コースは「計6個」のレッスンから構成されていて,Pandas の基礎(DataFrame と Series)から,Pandas でのデータ取得や欠損値の取り扱いまで幅広く学べる.そして,一歩一歩「歩幅を小さく」学べるため,理解できずに挫折することなく進められる点も素晴らしい! Creating,

          Pandas を基礎から学ぶために「Kaggle Courses」の学習コンテンツを受講した - kakakakakku blog
        • 回帰と相関,知っているようで知らない,その本質:Excel の回帰分析を例として

          回帰と相関,知っているようで知らない,その本質:Excel の回帰分析を例として 井口豊(生物科学研究所,長野県岡谷市) 最終更新:2024 年 1 月 19 日 1. はじめに このページでは,回帰直線とはどのようなものなのか理論的に考え,最小二乗法による直線回帰の「誤解」について取り上げたい。特に, Microsoft の Excel (エクセル)を用いて回帰分析の具体例を示し,その理論的背景を考えてみたい。 これは,読んで字のごとく,データ点からの二乗和が最小になる近似式(適合式),を求めるものである。ところが,この「データ点からの距離」の取り方が,「くせもの」なのである。 最小二乗法は頻繁に行われる直線近似法である。 Excel などの表計算ソフトでも容易に出来る。しかし,それがゆえに,どんな計算法か知らずに適用されてきているのも事実である。 ここでは,最も単純な2変数x, yのデ

          • キャスリン・ペイジ・ハーデン 著『遺伝くじ なぜDNAが社会的平等にとって問題になるのか』(2021年) - リベラルアーツの扉【別館】

            原題 著者について 速評(評者・田楽心) 原題 The Genetic Lottery Why DNA Matters for Social Equality /出版社:Princeton Univ Pr 刊行年:2021年9月 https://www.amazon.co.jp/dp/0691190801 著者について キャスリン・ペイジ・ハーデン(Kathryn Paige Harden):テキサス大学の心理学教授で、心理学及び行動遺伝学を専門とする。本書が初の著作となる*1。 Twitter:@kph3k 速評(評者・田楽心) 現代のレイシスト(人種差別主義者)は、遺伝子に大きな関心を抱いている。例えば本書の著者ハーデンの「非認知スキル(自制心や協調性など)と遺伝との関係」に関する論文への、Twitterからのアクセスを分析した結果がある。これによると、アクセス上位6クラスタのうち5ク

              キャスリン・ペイジ・ハーデン 著『遺伝くじ なぜDNAが社会的平等にとって問題になるのか』(2021年) - リベラルアーツの扉【別館】
            • 投資信託のリスクをプロが徹底解説。主なリスクや商品別リスク、対策や計算方法も | 投資信託コラム | 未来がもっと楽しみになる金融・投資メディア「HEDGE GUIDE」

              初心者にも投資しやすい投資信託ですが、投資する際にはリスクの種類や性質を理解しておくことが大切です。なお投資においてのリスクとは、不確実性の振れ幅(度合い)のことです。 今回は、リスクの種類や特徴について解説したうえで、投資信託の主要商品にどのようなリスクがあるかを説明します。また、収益の不確実性の振れ幅である「価格変動リスク(標準偏差)」の計算方法や使い方のほか、運用効率を示す「シャープレシオ」についても解説します。 目次 投資信託における主なリスク 1-1.価格変動リスク(債券は金利変動リスク) 1-2.為替リスク 1-3.クレジットリスク(デフォルトリスク) 1-4.カントリーリスク 投資信託の主な商品別リスク(リスクの低い順) 2-1.国内債券型 2-2.外国債券型 2-3.国内株式型 2-4.外国株式型 リスクの対策方法 3-1.分散投資 3-2.長期保有 価格変動リスクの調べ方

                投資信託のリスクをプロが徹底解説。主なリスクや商品別リスク、対策や計算方法も | 投資信託コラム | 未来がもっと楽しみになる金融・投資メディア「HEDGE GUIDE」
              • 『現代数理統計学の基礎』章末演習問題解答 (答案) - Qiita

                0.はじめに 『現代数理統計学の基礎』(久保川達也 著)の章末問題の答案を作成する.略解は久保川先生がこちらのサイトに掲載して下さっているが,「略解」なだけあって途中式がかなり端折られていたり,エレガントすぎて凡人では思いつきようのない解答だったりするので,多少計算がゴツくなったとしても庶民的な答案を心がける.また必要に応じて答案とは別に必要な知識の確認を行う. 各リンクから問題の方針と答案に飛べる. 1.確率 (易) ベン図書く (易) 和事象,積事象の性質 (易) 条件付き確率と同時確率 (易) 部分集合についての確率 (易) 条件付き確率の典型問題 (易) 条件付き確率の典型問題2 (易) 因果関係と相関関係,独立性 (易) 和事象と確率の和 2.確率分布と期待値 (標準) 分布関数,密度関数の定義 (標準) 分布関数,密度関数の定義2 (標準) 分布関数,密度関数の定義3 (標準)

                  『現代数理統計学の基礎』章末演習問題解答 (答案) - Qiita
                • 【2019 MLEインターンシップ】機械学習で旅行をプランニングする - Platinum Data Blog by BrainPad

                  ブレインパッドでは毎年学生向けのインターンシップを開催しています。今年も、昨年に続いて「機械学習エンジニア(Machine Learning Engineer, MLE)コース」を実施し、今回は3名がインターンシップに参加しました。その取り組みと成果をご紹介します! こんにちは、アナリティクスサービス本部AIプラクティス部の伊藤です。 今回は、今年の8月末から9月にかけて実施した機械学習エンジニアコースのインターンシップの内容についてお伝えします。 はじめに インターンの紹介と取り組みテーマ インターンシップの進め方 最終報告会 宿泊先のレコメンド(恒川さん) 周遊プランニング(藤原さん) 寄り道先のランキング(佐藤さん) 懇親会 まとめ はじめに 今年は「機械学習による旅行プランニング」というテーマで1か月間のインターンシップを実施しました。京都と名古屋から、3名の方がインターンシップに

                    【2019 MLEインターンシップ】機械学習で旅行をプランニングする - Platinum Data Blog by BrainPad
                  • 外見が良いと成績も上がる - himaginary’s diary

                    外見の経済的リターンについて研究しているハマーメッシュ*1が、「O Youth and Beauty: Children's Looks and Children's Cognitive Development」というNBER論文を上げている*2(本文も読める。著者はDaniel S. Hamermesh[バーナード大]、Rachel A. Gordon[イリノイ大]、Robert Crosnoe[テキサス大オースティン校])。以下はその要旨。 We use data from the 11 waves of the U.S. Study of Early Child Care and Youth Development 1991-2005, following children from ages 6 months through 15 years. Observers rated vi

                      外見が良いと成績も上がる - himaginary’s diary
                    • TrueSkill「まだ Elo レーティングで消耗してるの?」 - Qiita

                      徒競走のタイムと違って、対戦型ゲームの巧さというのは簡単には数値化できません。 しかし、なんとかしてそれを実現させようとして生まれたのがレーティングです。 古典的にはチェスのために生み出された Elo レーティングが存在し、様々な改良アルゴリズムが生み出されてきました。 TrueSkill は Microsoft が開発したレーティングアルゴリズムです。 Microsoft が開発したとあって Xbox Live のゲームで使用されているようです。 このアルゴリズムには既存のレーティングアルゴリズムと比較して以下のような特徴があるそうです。 収束が早い。 レーティングに初めて参加するプレイヤーの実力を推定するのに何度も何度も不適当なマッチングで対戦する必要がない。 複数人による対戦に対応している。 勝ちか負けかのみならず順位を定めるようなゲームやチーム戦1のゲームにも使用できる。 ゲームへ

                        TrueSkill「まだ Elo レーティングで消耗してるの?」 - Qiita
                      • AWS 認定 機械学習 – 専門知識(AWS Certified Machine Learning – Specialty)の学習方法とマシンラーニング・ディープラーニングの基礎知識が学べる学習リソースの紹介 - NRIネットコムBlog

                        小西秀和です。 この記事は「AWS認定全冠を維持し続ける理由と全取得までの学習方法・資格の難易度まとめ」で説明した学習方法を「AWS 認定 機械学習 – 専門知識(AWS Certified Machine Learning – Specialty)」に特化した形で紹介するものです。 重複する内容については省略していますので、併せて元記事も御覧ください。 また、現在投稿済の各AWS認定に特化した記事へのリンクを以下に掲載しましたので興味のあるAWS認定があれば読んでみてください。 ALL Networking Security Database Analytics ML SAP on AWS Alexa DevOps Developer SysOps SA Pro SA Associate Cloud Practitioner 「AWS 認定 機械学習 – 専門知識」とは 「AWS 認定

                          AWS 認定 機械学習 – 専門知識(AWS Certified Machine Learning – Specialty)の学習方法とマシンラーニング・ディープラーニングの基礎知識が学べる学習リソースの紹介 - NRIネットコムBlog
                        • ダストマン&メルツ&オカテンコ「不良が多い地域では、若年層の犯罪や10代の出産が増えるのだろうか?」(2023年3月31日)

                          子供は、生育地域によって将来の収入や学歴に影響を受けるかもしれない。この論文では、デンマークでの難民家族の準ランダムな地域分布的自然実験を元に、該当地域での不良犯罪の水準が、子供の犯罪派生率にどのように影響を与えるかを調査した。子供は、不良が多い地域で育つと、男子は19歳までに犯罪を犯す可能性が、女子は10代で母親になる可能性が高まり、男女ともに経済的成果に長期的なマイナスの影響を与えることが判明した。 子供は、育つ地域の特徴によって、将来の所得や学歴に影響を受けるのだろうか? これまでの研究では、地域環境が、子供の将来所得や学歴に影響を与えることが示されている(Chetty et al.2016、Chetty and Hendren 2018、Fatemeh et al.2019)。 地域環境での犯罪が、10代の発達に与える影響は特に懸念されている(Deming et al. 2016,

                            ダストマン&メルツ&オカテンコ「不良が多い地域では、若年層の犯罪や10代の出産が増えるのだろうか?」(2023年3月31日)
                          • どういう人々が新型コロナウイルスのワクチンを接種したがらないか:インターネット調査における検証

                            RIETI Discussion Paper Series 21-J-026 1 RIETI Discussion Paper Series 21-J-026 初版:2021 年 5 月 18 日 改訂版:2021 年 6 月 4 日 2021 年 6 月 16 日 どういう人々が新型コロナウイルスのワクチンを接種したがらないか:インターネッ ト調査における検証 関沢洋一(経済産業研究所) 橋本空(ユナイテッド・ヘルスコミュニケーション株式会社) 越智小枝(東京慈恵医科大学) 宗未来(東京歯科大学) 傳田健三(平松記念病院) 要 旨 背景:新型コロナウイルスの蔓延を終息させるためには多数の人々がワクチンの接種を済 ませることが重要であるが、ワクチン接種に対して抵抗感を持つ人々が多いことも知られ ている。どのような人々が新型コロナウイルスのワクチン接種に対する抵抗感を持ってい るかについての

                            • グローバル・サプライ・チェーンと戦争 (2022年6月9日)

                              原文 Maria Grazia Attinasl: 欧州中央銀行 External developments 部門経済学者 Rinalds Gerinvics: 欧州中央銀行アナリスト Vanessa Gunnella: 欧州中央銀行シニア経済学者 Michele Mancini: イタリア銀行・欧州中央銀行経済学者 Luca Metelli: イタリア銀行経済学者(欧州中央銀行での休暇中) 概要:ロシアのウクライナ侵略とそれに続くロシアへ課せられた制裁は、すでに混乱している世界のサプライチェーンに更なるひずみを与えている。本コラムは、この戦争が世界のサプライチェーンをすでに揺るがしていることを示す新しい指標を紹介する。そしてまた、ロシアとウクライナが世界貿易に占める割合は大きくはないものの、両国はいくつかの工業製品の生産工程の上流で使われる、短期的には代替が困難であるだろうエネルギー製品

                                グローバル・サプライ・チェーンと戦争 (2022年6月9日)
                              • Exploratoryとは?|データ活用にレバレッジをかける革新的なツール

                                Exploratoryとはまさにデータを”Explore”(探索)する分析ツールです。Exploratoryはいわゆる「BIツール」には属さないものの、その直感的でストレートなインターフェース(画面)が組織でのデータ活用にインパクトを与えてくれるため、当社でもExploratoryを使用してコンサルティング/支援をしています。Exploratoryは明朗なクレジットカード払いで、その点で主要なBIツールよりも導入しやすく、R言語(統計解析向けのプログラミング言語)を基盤としていることから統計領域・アナリティクス分野に力点を置いたコンサルティング業務の生産性を上げられています。 そこでこの記事では、Exploratoryとは何なのか、Excelでは実現出来ないのか、Tableauとはどういった点で違うのかなど網羅的にExploratoryを解説します。 1.Exploratoryとは?Exp

                                  Exploratoryとは?|データ活用にレバレッジをかける革新的なツール
                                • 前処理の改良でここまで伸びる! 実世界での画像劣化とのギャップに注目した超解像モデル「Real-ESRGAN」紹介 - Qiita

                                  前処理の改良でここまで伸びる! 実世界での画像劣化とのギャップに注目した超解像モデル「Real-ESRGAN」紹介機械学習DeepLearning論文読み超解像ICCV2021 2021年のディープラーニング論文を1人で読むAdvent Calendar24日目の記事です。今日読むのは「超解像技術」の論文です。 この論文はESRGANという、2018年の論文のリファインなのですが、訓練時の低解像度データの作成方法(訓練時の前処理)を大きく変えて、モデルはそれほど変わっていないという面白い改善です。通常この手のリファインはモデル構造側を工夫することが多いのですが、「前処理を実際の画像劣化に合わせることで、現場で通用するような超解像モデルを作りましょうね」というのがコンセプトです。前処理を変えるとこんなに変わるというのをぜひ体感してほしいです。 ICCV2021のWorkshopに採択されてい

                                    前処理の改良でここまで伸びる! 実世界での画像劣化とのギャップに注目した超解像モデル「Real-ESRGAN」紹介 - Qiita
                                  • AutoMLでおせちの価格予測&GANで非実在おせちを作る - Qiita

                                    はじめに この記事は次のAdvent Calendarの12月12日分です 機械学習の自動化プラットフォームDataRobotを使って楽しむ冬のイベント予測チャレンジ DataRobotはマネージドな機械学習(ML)プラットフォームです。データセットの用意からモデルの訓練・デプロイまでを、ブラウザを通じて進めていけるそうです。特徴量設計やモデルの選択もカバーしており、AutoMLサービスの一つということにもなります。ちょうどマネージドなAutoMLサービスに興味があったことから、この機会に試してみることにしました。 この記事がいいねと思ったらLGTMお願いします!(例のあれ) やりたいこと さて、このAdvent Calendarのお題は『冬ならではのテーマで機械学習モデルを試そう』だそうです。 私はちょうど百貨店のおせちを探していたため、おせち料理の画像からの価格予測(回帰)を扱うことに

                                      AutoMLでおせちの価格予測&GANで非実在おせちを作る - Qiita
                                    • 会誌「デジタルプラクティスコーナー」

                                      RubyはWebシステムの記述言語として高い生産性を発揮し,Web業界では広く浸透している.一方,分析的データ処理への対応が弱いため,データ処理分野ではほとんど利用されていない.昨今のDX推進などの流れから,Rubyで書かれた既存システムのデータ処理への対応が近い将来必要となるだろう.そのような要求に対応するためには,前もってRubyを分析的データ処理に対応させる必要がある.本稿では,Rubyを分析的データ処理に対応させる手段としてApache Arrowが有効であることを示す.Apache Arrowは,既存のデータ処理コンポーネント間のデータ連携の非効率性を解消するために提案された,データフォーマットとAPIである.RubyをApache Arrowに対応させることで,分析的データ処理に対応できるだけでなく,データ処理分野における先進的な取り組みにRubyからアクセスできるようになる.

                                        会誌「デジタルプラクティスコーナー」
                                      • COVID-19感染報告者数に基づく簡易実効再生産数推定方法

                                        はじめに 実効再生産数(effective reproduction number: Rt)は「(ある時刻tにおける, 一定の対策下での)1人の感染者による二次感染者数」と定義され1), 現在流行が拡大期にあるのか収束に向かっているのかを評価する疫学指標の1つとして重要である。2019年末からの新型コロナウイルス感染症(COVID-19)の流行に際しては, 世界各国・地域で流行状況を評価する指標として活用されている。しかし厳密なRtの計算には数学に関する知識やプログラミングの技術を必要とすることから, 必ずしもそうした技能を有する人材がいるとは限らない現場での活用は進んでいない。本稿では, 高度な専門知識を要さずに日ごとのCOVID-19陽性者数を使って簡便にRtの近似値を算出する方法を紹介し, その精度を検討した。 方 法 Rtを推定する時の最も簡潔な考え方は, ある時刻における感染者数

                                        • Starfish: Japanese

                                          スターフィッシュ 著:ピーター・ワッツ 訳:三音高澄 Peter Watts の長編小説 Starfish (1999) の日本語全訳。 原文は CC BY-NC-SA 2.5 の下に提供されており、翻訳はライセンスを継承している。 目次 序章:〈ケラティアス〉 ベントス デュエット 圧迫 ニッチ 大掃除 ローマ 幼形成熟 エレベーターボーイ 恋 オートクレーヴ ウォーターベッド ドッペルゲンガー 天使 野生 シャドウ バレエ ダンサー 短絡 臨界質量 ネクトン ドライバック ジャンプスタート マックレイカー 悲鳴 パピルス 亡霊 引き網 エントロピー 回転木馬 脱皮 アリバイ 隔離 泡 浣腸 変節 ヘッドチーズ 主題と変奏 グラウンド・ゼロ ソフトウェア RACTER エンドゲーム 夜勤 散開 爬虫類 スカイホップ 光の洪水 日の出 エリコ デトリタス 参考文献 謝辞 スターフィッシュ

                                          • どのような場面で多重比較補正が必要なのか - 渋谷駅前で働くデータサイエンティストのブログ

                                            先日のことですが、Querie*1で以下のような質疑がありました。 恐らくですが、これは僕が懇意にさせていただいているマクリン謙一郎さんがコメントしていた件に関連する話題だと思われます。 たしかにこれではないからHARKingとはちょっと違うと思うんだけど、実際は「同じストーリーを別のデータで何度も解析」してるわけだから多重検定になる。被説明変数は一緒だから複数の説明変数を試して有意になったやつを報告するのと構造は一緒。 https://t.co/WjnK5MnKcJ— Ken McAlinn (@kenmcalinn) 2024年3月11日 分かる人が見れば「典型的な多重比較補正問題だ」と分かる話なんですが、普段から意識していないと意外と見落とされがちなポイントだと思うんですよね。ということで、最近ネタ切れなのを糊塗する目的も兼ねて今回の記事では簡単にこの話題を改めてサクッと深掘ってみよ

                                              どのような場面で多重比較補正が必要なのか - 渋谷駅前で働くデータサイエンティストのブログ
                                            • 1ビットサンプリングでも高精度の計測ができる理由 - Kameno external storage

                                              もうすぐ衆議院議員選挙の投票日ですね。有権者が投じる1票には1名の候補者(小選挙区)と1つの政党または候補者(比例代表)しか書けません。情報量としては小さいですが、多数の有効票の統計をとることで、得票率という有効桁数が数桁もある高精度な情報が得られます。小選挙区で当選するのは1名だけですが、得票率という統計量は有権者の意志を示す数値ですので、たとえ落選候補者に投じた一票であっても無意味ではありません。総選挙の票は世論調査とは比較にならないほどたくさんのサンプル数があるので、例えば原発にYes/Noという切り口, 増税or財政再建という切り口, TPP参加の是非など、争点になっている問題について因子分析することで、民意を具体的かつ説得力をもって示すことができます。 なお、せっかくの1票を棄権したり白票を投じたのでは、得票率に影響を与えません。仮にA, B, Cの3名の候補者がいてそれぞれ得票

                                                1ビットサンプリングでも高精度の計測ができる理由 - Kameno external storage
                                              • ネット上で信憑性がありそうなIQテスト、5種類まとめて受けた結果… | Let's Hack Tech

                                                ちょっと自分のIQに興味があって、一々仰々しいペーパーテスト受けるのもアレだったので、ネットで「ちょっと真面目に」IQ測れそうなテストをいくつか探して、挑戦してみました。 ネット上で、特によくFacebookなんかで見かける、簡易なアプリで「これが解けたらIQ150!」みたいなヤツは眉唾で、ほとんど信用できません。 というより、ああいうのはほぼ遊びですね。 何故ネット上の簡易なIQ測定が信用できないのかは、IQという数字の性質を知る事で理解できるようになります。 当記事前半でIQという数字の性質を少し詳しく解説しています。 後半では今回受けたIQテストと結果を合わせて紹介しています。 「別にテスト以外興味ないよ」って方は目次をクリックするとジャンプできます。 IQとは? 知能指数(ちのうしすう、独: Intelligenzquotient, 英: Intelligence Quotient

                                                  ネット上で信憑性がありそうなIQテスト、5種類まとめて受けた結果… | Let's Hack Tech
                                                • Jリーグの観客動員数をあえて平均を使わず考察する【コラムその126】 - スタ辞苑〜全国スタジアム観戦記〜

                                                  プロスポーツの大きな指標の一つ、それが観客動員数です。 プロたるもの、お客を呼んでナンボというのは避けて通れない宿命です。 一方、観客動員数の評価の時によく使われるのが「平均値」です。 その算出方法はあえてここで説明はしませんが、この平均値には実は大きな落とし穴があるのです。 その例えとして、「全国中学校校長の平均売春人数」というのがあります。 イメージで言えばもちろん0人のはず…ですが、実はこれは1.2人なのです。 え、中学校の校長ってみんな売春してるの…? …というわけではなく、これは一人のレジェンド校長が平均値を押し上げまくっているにすぎないのです。 www.youtube.com このように平均値は数値のある一面を表現しているにすぎず、平均だけを見ていると必ず見落とす部分があるのです。 今回は平均値で語られがちなJリーグの観客動員数を、あえて平均値を使わずに考えてみたいと思います。

                                                    Jリーグの観客動員数をあえて平均を使わず考察する【コラムその126】 - スタ辞苑〜全国スタジアム観戦記〜
                                                  • 推測統計フローチャート(推定、検定を考えるにあたっての解法の整理) - あつまれ統計の森

                                                    中心極限定理などに基づいて母集団の確率分布のパラメータの点推定・区間推定や、パラメータに関する仮説の検定を行う推測統計は、基本的な考え方は一貫している一方で推定の対象や分散の既知・未知などに置ける場合分けなど、関連する概念が多くわかりにくい。 そのため当稿では解法の整理の補助となるように、推測統計に関連するトピックをフローチャートの形式にまとめる。作成にあたっては、「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の$9$章〜$12$章を主に参考にした。 大枠の整理 推測統計を考える際の前提 推測統計を考える際に前提となるのが母集団(population)と標本(sample)である。記述統計学(descriptive statistics)では得られた標本についてのみ考えるが、得られた標本の裏側の母集団についても考察を行うのが推測統計である。 推測統計では母集団の持つ分布である、母集団分布(

                                                      推測統計フローチャート(推定、検定を考えるにあたっての解法の整理) - あつまれ統計の森
                                                    • A/Bテストが出来ない場面での因果推論による効果検証 - Gunosyデータ分析ブログ

                                                      本記事は、Gunosy Advent Calendar 2020 19日目の記事です。 昨日はサンドバーグさんの Amazon AthenaのPartition Projectionを使ったALB Access Logの実例 (w/ terraform & glue catalog) - Gunosy Tech Blog でした。 こんにちは、GTL(Gunosy Tech Lab) 所属のクボタです。 社内では主にニュースパスというアプリの分析などを行なっています。 本記事ではA/Bテストの実施が難しい場面でチームでも利用している因果推論による効果検証について簡単に紹介させていただきます。 はじめに Gunosyではアプリ内でのロジックやUIの変更、キャンペーンなどの施策においてデータに基づく効果検証をしています。 効果検証では分析対象の施策起因による変化である因果効果のみを求めたいです

                                                        A/Bテストが出来ない場面での因果推論による効果検証 - Gunosyデータ分析ブログ
                                                      • 【FX】トラリピ AUD/NZD(豪ドル/NZドル)設定 - ココブロ

                                                        AUD/NZDの3種類の設定を公開! 本記事では、ココの考える3つのAUD/NZDの設定を紹介します。各自の許容リスクに応じて参考にして頂ければ幸いです。 またココが実際に稼働させている設定も開示します。 ココのトラリピ運用実績 AUD/NZDがトラリピ向けだと思う理由 AUD/NZDの特徴 高い連動性 先進国同士の通貨ペア レンジが狭い ショック相場に比較的強い AUD/NZDのトラリピ設定紹介(3種類) AUD/NZDのトラリピ設定(いのちをだいじに) AUD/NZDのトラリピ設定(ガンガンいこうぜ) AUD/NZDのトラリピ設定(いろいろやろうぜ) バリトラ(バリアブルトラリピ)の考え方 ココのトラリピAUD/NZDの設定 ココの「いろいろやろうぜ」設定 ココの「いのちをだいじにVer.2」設定 ココの「いろいろやろうぜ」の注文方法 2020/9/26から、ついに、トラリピ に、AU

                                                          【FX】トラリピ AUD/NZD(豪ドル/NZドル)設定 - ココブロ
                                                        • スペイン風邪による死がナチ党の得票を引き上げた - himaginary’s diary

                                                          という実証結果を示した論文をMostly Economicsが紹介している。論文は「Pandemics Change Cities: Municipal Spending and Voter Extremism in Germany, 1918-1933 」と題されたNY連銀のスタッフレポートで、著者はKristian S. Blickle。 以下は本文の一節のMostly Economicsからの孫引き。 ...influenza deaths of 1918 are correlated with an increase in the share of votes won by right-wing extremists, such as the National Socialist Workers Party (aka. the Nazi Party), in the crucial

                                                            スペイン風邪による死がナチ党の得票を引き上げた - himaginary’s diary
                                                          • 画像処理で自炊書籍画像を読みやすく加工する 初級編

                                                            この記事は KLab Engineer Advent Calendar 2019 24日目の記事です。 AdventCalendarどころか、Qiitaへの、もっと言えばネットに向けた技術エントリの投稿自体が初めてになります suzuna-honda といいます。よろしくお願いします。 はじめに 私は書籍をスキャンして電子書籍として読む、いわゆる「本の自炊」を趣味としています。 不眠症のケがあり、眠くなるまでの暇潰しとして、自炊した本を読書するのが日課になっています。枕の横にはiPadが欠かせません。 どの程度、深く、この「本の自炊」と向き合っているかといいますと、 書籍のスキャン 1冊ごとにパッケージング、管理の為のタグ付け スキャンした画像の画質調整、端末(iPad/iPhone)への最適化 端末(iPad/iPhone)へのデータ転送、閲覧 までの一連のワークフロー、ほぼ全てのツール

                                                              画像処理で自炊書籍画像を読みやすく加工する 初級編
                                                            • 基本再生産数の分散にも気をつけよ - himaginary’s diary

                                                              前回エントリで紹介したKronradのコメントを受けてコーエンは、 ロビン・ハンソン(Robin Hanson)ジョージメイソン大学経済学准教授が今月初に自ブログに上げたシミュレーションにリンクしている。ハンソンもKronradと同様にR0(基本再生産数)の不均一性に着目しているが、Kronradがそのばらつきがむしろ福音となる可能性を指摘したのに対し、ハンソンはそのばらつきを抑えることの重要性と難しさを説いている。 ハンソンのシミュレーションでは、R0が対数正規分布に従うことを仮定し、以下のパラメータを当てはめた場合を考察している。 対数平均=-2、標準偏差=1 R0の最頻値は0.05、中央値は0.14となり、R0>0.70となるのは人口の5%、R0>1となるのは人口の2%に過ぎない。しかしその少数の人間が高いR0を維持すると、感染の10循環の間の全人口のR0平均は20という極めて高い値

                                                                基本再生産数の分散にも気をつけよ - himaginary’s diary
                                                              • 【異常検知】食品画像を攻略してみる - Qiita

                                                                今回は、実例があまり出てこない食品画像を攻略してみたいと思います。(といっても、精度100%は出ていません(^^;) (右端「Padim + YOLOv5」が提案手法) 食品画像の難しさ 食品画像の検査は、工業製品と違って難しいと言われています。個人的には 見た目に多様性がある 位置が決まっていない が理由だと思っております。 見た目の多様性は、例えばミカンでいうと、色やサイズ、形が様々で、一つとして同じものはありません。つまり、正常品の範囲が広く、正常/異常の境界線があいまいになりがちです。一方、工業製品は多様性が少なく、正常品の範囲が狭いです。このため、正常/異常の境界線がはっきりしています。 二点目、「位置が決まっていない」は、食品という特性上、位置が多少ズレることがあります。さらに、2つの食品があったとして、2つの位置が入れ替わったとしても正常となることがあります。つまり、位置ベー

                                                                  【異常検知】食品画像を攻略してみる - Qiita
                                                                • ②2:6:2(おみこし)の法則-数字にまつわるビジネスの法則 - まねき猫の部屋

                                                                  数あるブログから、よくお越し下りました。 数字にまつわるビジネスの法則を語る第2回目「2:6:2の法則」のお話です。 別名、「おみこしの法則」とか「働きありの法則」などとも呼ばれています。 働き方や人間関係などに悩んだら、ぜひ思い出していただきたい法則です。 まねき猫流の解釈や事例もご紹介します。 良かったら最後までお付き合いください。 数字をクリックするとジャンプします。 お忙しい方は一部だけでもご覧ください。 目次 1.「2:6:2の法則」とは? 2.実際の例 3.262から学ぶこと 4.まとめ お忙しい方は、「終わりへ」を「プチ」とすると文末に飛びます。 終わりへ このシリーズの1回目の記事はこちらです。 www.my-manekineko.net 1.「2:6:2の法則」とは? 会社や学校などの集団において、その構成するメンバーの力量ややる気のある人の割合が、一定の比に落ち着くとい

                                                                    ②2:6:2(おみこし)の法則-数字にまつわるビジネスの法則 - まねき猫の部屋
                                                                  • 文系マーケターの思考停止 足りないのは「データ分析のイメージ」

                                                                    近年、マーケティングでは経験や直感に頼るのではなく、データを基にした「統計」による分析の重要性が高まっている。そこで日経クロストレンドでは2022年夏、法政大学経営学部の西川英彦教授による特別講義として、特集「文系マーケターのための統計入門」を掲載した。その講義では「平均と標準偏差」「仮説検定」「相関分析と無相関検定」「カイ二乗検定」「t検定」について学んだ。本特集では続編として、発展的な分野に取り組む。扱うテーマは「回帰分析」「分散分析」「因子分析」「コンジョイント分析」の4つ。どれもマーケターなら基本的な知識は身に付けておきたい手法だ。講義を始めるにあたり、夏のおさらいを含め、マーケティングの実務における統計知識の必要性について西川先生に解説してもらう。 知れば知るほど面白い統計の世界。マーケティング施策の精度を高めるためにも、基本的知識は身に付けておきたい。最初は難しく感じるかもしれ

                                                                      文系マーケターの思考停止 足りないのは「データ分析のイメージ」
                                                                    • Wasmer 1.0がリリースされたので、ベンチマークを取ってみた

                                                                      先日、WebAssemblyランタイム Wasmer (https://wasmer.io/) のバージョン1.0がリリースされました。 WebAssemblyは元々はウェブブラウザで実行するための低水準のバイナリコードフォーマットとして導入されましたが、単にポータブルな仮想マシンと見ることもできるので、これを用いてアプリケーション実行環境を作ろうというのも、ごく自然な流れだと言えるでしょう。 WebAssembly公式によって WASI (https://wasi.dev/) というシステムインターフェースが定義されています。まだネットワークAPIが無かったりして、多くのアプリケーションが動かせるという状況ではなさそうですが、将来的にポータブルなアプリケーション実行環境として使えるようになるかもしれません。こう聞くと、誰もがJavaを想起すると思いますが、特定の会社の意向に左右されないオ

                                                                        Wasmer 1.0がリリースされたので、ベンチマークを取ってみた
                                                                      • 遺伝率が8割ということは両親の身長で子どもの身長は決まるのですか|Atsushi Oshio

                                                                        「身長の遺伝率は8割くらいらしいですね」 「そうだね。だいたい70から80パーセントくらいが身長の遺伝率だとされるね」 「知能指数も同じくらいですよね」 「うん。知能指数も同じくらいだと言われるよ」 「じゃあ,やっぱり両親の背の高さで子どもの身長の8割は決まってしまうのですね」 「え?そんなことはないよ」 「そうなのですか?だって,遺伝率8割なのですから,親から子に8割伝わるのではないのですか?」 問題の混同この会話では「遺伝率が8割」という問題と,「親と子の身長が8割同一」という話が混同しています。後者は言い換えれば,「両親の身長がわかると子どもの身長を80%予測することができる」です。 「身長の遺伝率が8割」とは,身長が個々でばらついているときに,そのばらつきの80%は遺伝で決定されるという話です。その「遺伝」については,どこにも「親から子に遺伝的に伝わる身長」とは書かれていません。

                                                                          遺伝率が8割ということは両親の身長で子どもの身長は決まるのですか|Atsushi Oshio
                                                                        • 【水曜日はSTUDY DAY!📃】赤マル💮勉強!29ー3 - 社会福祉士&医療事務(診療報酬実務能力試験)の資格の合格を目指そう!

                                                                          どうも~。当ブログをご覧いただいてる、そこのあなた!毎度ご覧いただき、ありがとうございます。担当のSW-challengeで~す。 今回もさっきの続きの私の赤マル勉強方法をご紹介します。👏 それでは、いってみましょう。(^-^)/ 目次 1、第8問:2019年度💮社会調査問89📖 (1)問題について📕 (2)結果💯 (3)前回との比較!📃 (4)感想📱 2、第9問:社会調査問90📖 (1)問題について📕 (2)結果💯 (3)前回との比較!📃 (4)感想📱 3、まとめ✏️ 番外編🌹 注意事項⚠️ 赤マルのサイトから問題文と選択肢を引用しています。(赤マルから許可をえています。✏️) 実際の試験の選択肢の番号とは異なります。 1、第8問:2019年度💮社会調査問89📖 (1)問題について📕 社会調査の基礎の問89 実施年度:2019年 問題文 量的調査の集計と分

                                                                            【水曜日はSTUDY DAY!📃】赤マル💮勉強!29ー3 - 社会福祉士&医療事務(診療報酬実務能力試験)の資格の合格を目指そう!
                                                                          • 標準偏差の公式と計算例をわかりやすく解説 |AVILEN

                                                                            標準偏差は分散の平方根であることを念頭において、以下のように計算を進めましょう。 ①平均を算出 90+80+40+60+905=72\frac{90+80+40+60+90}{5} = 72590+80+40+60+90​=72 ②分散を算出 s2=(90−72)2+(80−72)2+(40−72)2+(60−72)2+(90−72)25=376s^2 = \frac{(90-72)^2+(80-72)^2+(40-72)^2+(60-72)^2+(90-72)^2}{5} = 376s2=5(90−72)2+(80−72)2+(40−72)2+(60−72)2+(90−72)2​=376 ③標準偏差を算出 s=376≒19.39071s = \sqrt{376} ≒ 19.39071s=376​≒19.39071 標準偏差を求める意義分散も標準偏差も、観測したデータのばらつきを表現すると

                                                                            • 投資を始める前に知っておきたい投資先の種類別のリスクとリターンの関係。

                                                                              投資を始める前に知っておきたい投資先の種類別のリスクとリターンの関係。 2021年5月17日 2021年6月9日 投資 はじめての投資, 初心者 最近、株高の影響もあるのか投資に興味を持つ方が増えています。 私のもとにもはじめて投資をする人からいろいろな質問が・・・ その中で特に多いのがどの投資商品から始めたらいいんだろ?ってことです。 投資とひとくくりに言っても株式投資、投資信託、債券、REITなどいろいろな種類があります。 さらにそれぞれ国内、海外の投資先もあります。 各資産クラスの中でもいろいろな投資先がありますよね。 さらに暗号資産など投機的なものも人気があります。 こんなにも選択肢があると迷ってしまいますよね。 そこで今回は投資を始める前に知っておきたい投資先の種類別のリスクとリターンを解説していきます。 まず知っておきたいリスクとリターンの関係投資をはじめる前提として知っておき

                                                                                投資を始める前に知っておきたい投資先の種類別のリスクとリターンの関係。
                                                                              • SQLではじめるデータ分析

                                                                                クラウドの普及とともに、SQLの利用範囲は拡大し、データサイエンティストもデータベースを直接扱う機会が増えています。本書は、データ分析に関わるSQLのテクニックを学び、分析プロセスにおいてSQLを最大限に活用するためのものです。時系列解析などでは、SQLが日付・時刻の比較や処理に長けており、威力を発揮できる最たるものです。本書ではデータの前処理から始め、時系列解析、コホート分析、テキスト分析、異常検知など、SQLの操作を通じて高度なテクニックまで学ぶことができる構成になっています。サンプルコードはGitHubからダウンロード可能で、実際に手を動かしながら学ぶことができます。 はじめに 1章 SQLによる分析 1.1 データ分析とは 1.2 なぜSQLなのか 1.2.1 SQLとは 1.2.2 SQLの利点 1.2.3 SQL vs. R/Python 1.2.4 データ分析ワークフローの一

                                                                                  SQLではじめるデータ分析
                                                                                • 山岡重行の統計的仮説検定の説明に対する北田暁大の批判について

                                                                                  社会心理学者の山岡重行氏の『腐女子の心理学2』の巻末の統計学用語の説明に関して、社会学者の北田暁大氏が色々と批判している*1。しかし、あれこれ経緯がある*2からだと思うが、全般的に勇み足になっているので指摘しておきたい。山岡氏の記述にも問題が無いとは言い切れないのだが、統計学を学んでいない人向けの説明であろうことを念頭に置くと、山岡氏が統計学に無理解であるかのような批判は適切ではないと思われる。 1. P値の解釈について 北田氏は、山岡氏のように統計的仮説検定で「事実認定」をすることは、アメリカ統計学会(ASA)の声明*3に合致しないと主張しているのだが、何を「事実認定」するのかについて注意が払われていない不適切な批判になっている。 山岡氏の説明では、分類したグループ間の平均値に差があるのか「事実認定」するために、統計的仮説検定を用いることになっている(pp.72–73)。つまり、データと

                                                                                    山岡重行の統計的仮説検定の説明に対する北田暁大の批判について