サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
掃除・片付け
note.com/hanaori
今年になって『データ解析のための統計モデリング入門(通称 緑本)』を読みました。 とても読者にやさしく書かれているなと感じる一方、どうしても特に後半が個人的に難しく「もっと理解したいな」と思ったため David Robinson さんが書かれた記事なども参考にしつつ、もう少し自分なりに噛み砕いて考えてみようと思います。 ベイズ推定がよくわかってないことが理解が難しかった大きな原因のひとつだと感じたので、こちらの記事ではベイズ推定の基本的な考え方からまとめて共有できればと思います。 ・ ベイズ推定に入門したい方 ・ rstan に少し触れてみたい方 ・ 緑本を読書中の方 などなど そんな方々に一緒に楽しんでいただける記事になっているとうれしいです。 ベイズ推定とはまずはベイズ推定の全体の流れを確認したいと思います。ベイズ推定は大きく以下の流れで作業を進めていきます。むずかしい言葉がたくさん出
検出力の手計算がいつもぱっとできないので、これを機に検出力についてまとめてみようと思います。同時にこれから勉強したい、今そこ勉強中だよという方の参考になるとうれしいです 🌱 統計的仮説検定の基本的な流れ最初に基本的な統計的仮説検定の流れを確認します。 1. 帰無仮説(H0)を設定する(例: μ = 0) 2. 対立仮説(H1)を設定する (例: μ = 1, μ > 0) 3. 有意水準(α)を決定する(例: α = 0.05) 4. サンプルから検定統計量を計算する 5. 4で計算した検定統計量が、3で決めた有意水準から求められる棄却域内に収まれば、H0 を棄却する 第1種の誤りと第2種の誤り 検定を行うときは有意水準・棄却域を定め、求めた検定統計量がその中に入ると自動的に H0 が棄却されます。しかし棄却域に入っているものの本当は H0 が正しい場合もあります。反対に本当は H1 が
少し前に高校数学をやり直したのですが、徐々に勉強スタイルが整ってきたので使って便利だったツールをまとめておこうと思います。 今から勉強はじめようと思ってる方や、もうすでにはじめられてる方の参考になればうれしいです。 GeoGebra Graphing Calculator 数式を入力するとグラフを描いてくれます。 Webブラウザやスマホ・iPadのアプリでも使用でき、ぱっとグラフの形を確認したいときにとっても便利です。 Webブラウザや iPad などでも使用できます。 Wolfram Alpha図を描いてくれるところは GeoGebra に似ていますが、こちらは入力された数式などに対して構造化されたデータを用いて適切な結果を返してくれる検索エンジンのようです。 いろんなWebページをインデックスして検索結果を返す Google などとはまた違っておもしろいですね。 GeoGebra は非
noteでエンジニアをしています。 統計学がおもしろくて勉強中です。今統計学を勉強中の方やそんなに詳しくないよ、という方でも楽しんでもらえるような記事を書いていきたいなと思っています。 その他ときどき山や日常の出来ごとも書きます。
こういう人間です ・ 文系(英文学科) ・ Webエンジニア ・ 統計を勉強中モチベーションここ2年ほど統計を勉強しているのですが、そこで毎回立ちふさがるのが数学の壁でした。わたしは文系ということもあって数ⅡB(しかも途中まで)しか履修していなかったため、微分積分や線形代数などが出てくると理解することが難しく時間がかかってしまいます。 でももっと統計を知りたいし理解したい 😭 という気持ちをずっと感じていて今回数学をやり直すことにしました。 高校3年分と考えるとなかなか決心するのに時間がかかりましたが、やってよかったと思います。スケジュール感や実際使った本などを共有することで同じような方の参考になればよいなあ、と思います。 実際使用した本 ・ 講座■ よくわかる数学シリーズ 主にMY BESTシリーズを使用しました。カラーで説明もわかりやすく、目にも心にもやさしい仕上がりになっております
今年早々、note の月間アクティブユーザー数が1,000万人を突破したという記事が出たと思います。 実際 note はかなりの勢いで成長していますが、はたして過去のデータを用いて今後の成長の予測ができるのかどうか気になりました。 今回はGAの週間アクティブユーザー数データを用いて、どのようにnote が成長しているのか、次週のアクティブユーザー数が予測できるのかを見ていきたいと思います 😊 ■ 原系列・差分系列・対数差分系列の確認 ① 原系列 ・ 各時点で期待値・ばらつきが異なる非定常なデータ → 差分を取ってプロットしてみる ※ 定常なデータ(ここでは弱定常のこと): 1) 期待値が各時点で一定、2) 分散・共分散が各時点で一定 ② 差分系列 ・ 期待値が一定になっている ・ 後半、ばらつきが徐々に大きくなることから、週間アクティブユーザー数は指数的に増加していると考えられる → 対
以前の重回帰による賃貸価格の予測では、『最寄り駅ごとに賃貸価格の母集団分布(例えば各説明変数の母回帰係数)が異なりそう』という仮説を立て、1駅ずつ重回帰モデルを推定していきました。 ただ、駅が変わるとモデルの作り直しをしたりですんごいめんどくさい。 今回はそうした「最寄り駅」ごとに階層構造になっているデータに対する分析手法として知られている「階層線形モデル」を試してそうしたお悩みの解消を試みたいと思います( ˆoˆ ) ■ 今回やりたいこと・ 階層線形モデルを用いて賃料の予測をする(回帰問題に取り組む) ・ 予測の評価指数として各駅の決定係数 0.8 以上を目指す ■ 階層線形モデルとは切片や傾きが各グループ(今回であれば各駅)ごとに正規分布に従って得られると仮定してモデルを推定します。 ランダム切片モデル ・ 各グループごとに切片が異なる(正規分布に従って得られるとする。) ・ 傾きは同
はじまりこの note を運営しているピースオブケイク社でエンジニアをしている hanaori です。少し前から統計学を勉強中でして、現実世界に当てはめて試せそうな題材を探している毎日を過ごしています。 そんな折、「弊社CTOが引っ越しを検討している」という話を聞き、 CTOの引越し先としてコスパの良い物件を、統計を使って探し出しだす のはどうかとひらめいてしまいました 😆 そこで、重回帰分析を用いてコスパに優れる物件を洗い出していきたいと思います。 今回探す物件の条件ここで今回対象とする物件の条件を確認しておきます。 ・ ジムが近い(→ 狙いは東京体育館) ・ 最寄り駅は千駄ヶ谷 ・ 高すぎる物件はちょっと・・・(一旦20万より下で設定) 物件データを可視化する今回は千駄ヶ谷駅周辺の物件データを用意しました。 最寄り駅ごとに箱ひげ図を描いてみると駅ごとに賃料の分布が異なりそうなことが分
統計検定を受けようと思った背景昨年Courseraという教育系サービスでMachine Learningを学んだところ統計の知識が前提になっている部分が垣間見え、もっと根本から理解したいと思い勉強をスタートしました。 ちなみに今回合格したのはCBTでの受験です。 同じような方の参考になるかなと思い、今回は勉強に使った本をご紹介します。 こんな人間です- 文系(英文科) - Web系エンジニア - 統計の知識はゼロ 参考書① よくわかる数学2・B
このページを最初にブックマークしてみませんか?
『hanaori|note』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く