アメリカへの交換留学とノルウェーへの大学院留学を経た後に、データサイエンティストを目指そうとする人の戯れ言。 えー説明の正確性については勘弁して下さいw 内容もとてつもなく初歩的なものです。 マルコフ連鎖って聞いた時に「あーこんなことしてるんだな」というアイデアが解るように・・・なるといいなw 以下の地点ABCを行き来するすごろくみたいなものをしてると思いましょう。 矢印の上にはその移動が起きる確率が書いてあります。 つまり、Aなら AからB:1/3 AからC:1/3 AからA:1/3 という確率で移動します。 これを一覧表(マトリックス)にするとこんなかんじです。 で、まぁとりあえず何が知りたいの?って話になるわけです。 ここで知りたいことはx回移動させた時にコマがA,B,Cのそれぞれにいる確率です。 この確率を知るにはx回移動させる事を10万回位実験してみればいい訳ですが、 マルコフさ
WS大では4月の終わりに高校生を対象にした講演会があって、 S教授、K教授、それに私の3人が30~40分ずつ 統計のコースを履修している11年生、12年生(高校2、3年生)の前で話をした。 私は自分が高校生の頃を思い出して 「統計学に興味を持った理由」を話して学生の興味を惹きつつ、 「統計学でウソをつく法」という有名な本からタイトルをもらって 最近の雑誌記事を元に統計でどういうトリックが使われているか、 という話をした。 それに対してK教授はもう少しアカデミックに、 確率論と統計学の違いについて説明した。彼の答えは 「統計学はギャンブラーのためのもので、 確率論はカジノの設計者のためのものだ」 という簡潔なものであった。 これはなかなか上手い説明だと思う。 すなわち、統計学とは、真実が分からない中で 利用可能な情報からどうそれを解明するかを研究する学問で、 確率論とは所与の数学構造の系とし
The document describes various probability distributions that can arise from combining Bernoulli random variables. It shows how a binomial distribution emerges from summing Bernoulli random variables, and how Poisson, normal, chi-squared, exponential, gamma, and inverse gamma distributions can approximate the binomial as the number of Bernoulli trials increases. Code examples in R are provided to
こんにちは。久々の投稿です。 僕のTwitterをフォローしてくれている方はご存知かと思いますが、4月から機械学習エンジニア/データサイエンティスト(見習い)として働く事が決まりました。 今日六本木の某社から正式に内定を頂きましたが、間違いなくTwitterのおかげでありTwitterこそ就活の全てであると確信した次第でございます— マスタケ (@MATHETAKE) 2017年2月23日 良い区切りですので今回はタイトルの通り、ただの純粋数学の学生だった僕がデータサイエンスの勉強を何故/どのようにしてきたのか、についての思い出せる範囲で書こうと思います。 Disclaimer: この記事は基本的に、"What I did" に関する記事であって決して "What you should do" についての記事ではありません。そんな勉強方法おかしいとか、こうすべきだ、みたいなマサカリは一切受
「一様乱数を足し合わせて平均値をとった値は正規分布っぽくなるよ」というツイートを見かけて、「それって統計的にどうなんだろう?」という疑問が湧いたので検証してみました。 はじめに 昨日・一昨日ぐらいに Twitter 上でちょっとした話題になっていた アニメーションの監修で、「 Random();の代わりに、(Random()+Random()+Rrandom()+Random()+Random())/5.0f; を使うと、動きにコクが出る」と言ったら、ピュアオーディオ扱いされるのですが・・・これは根拠のあるアルゴです。 — 深津 貴之 (@fladdict) 2016年11月3日 というツイートに関連して、「一様乱数の平均値を正規乱数として代用する」的なツイートをちらほら見かけて気になっていたので、統計的に検証してみましたよ、というブログエントリです (このツイート自体に対して揶揄するつも
武田邦彦氏が、「どうも何かを間違っているような気がします」という保留付きながら、「タバコを吸わない人に対して、タバコを吸うと肺がんの死亡率は10倍以上減る」という推論をしていました。 ■武田邦彦 (中部大学): 奇っ怪な結果?? タバコを吸うと肺がんが減る?! でも、なにか釈然としなかったので、1955年頃から1985年頃までの統計的データから、「タバコを吸うと何倍ぐらい肺がん(気管、気管支を含む)になりやすいのか?」という計算をしてみました。基礎となるデータは厚労省やがんセンターなどから出ている男性のものを使い(下の図。データ自体は誰も異議がないと思います)、次の前提を起きました。 1) タバコの害は継続的に20年ぐらい吸った人が、さらに20年ぐらい後に肺がんになる(そのために1985年以後の喫煙率のデータは使えません。1985年の20年後は2005年になり、それ以後はデータがまだ無いか
もう武田邦彦はお腹いっぱいだよと思っている人も多かろうとは思うけど、もうちょっとだけ。ナマモノだから早目に調理しないといけないネタ。武田邦彦先生は、喫煙が肺癌の原因であると主張する人たちの資料は曖昧で、事実をそのまま示しておらず、自分の都合のよいデータだけを選んで出していることがわかっちゃったんだそうだ。さすが武田先生!以下が、武田先生の「そのまま示された事実」です。■人の健康をダシに??政策に絡む研究のいかがわしさ(武田邦彦) - BLOGOS(ブロゴス)より引用した。 実は「タバコを吸っても吸わなくても肺がんは同じ」ということなのです。 意味わかんないでしょ?私も最初、意味がわからなかった。しかし、ちゃんと読んだら一応は「タバコを吸っても吸わなくても肺がんは同じ」と判断した理由が書いてあるのです。武田先生は円グラフの数字を「各疾患での死亡者中の喫煙者の割合」と考えたのです。武田先生の思
竹中平蔵さんのtweetが大分叩かれているようです。 http://togetter.com/li/133823 この87%という確率はBPT分布に従って算出されています。*1 http://www.asahi.com/national/update/0507/TKY201105060460.html によると、直近の東海地震は1854年の安政東海地震で、さらに周期は100-150年と考えられているとのことです。 つまり、下記の図(正確ではありません。ラフなものです)の、 (青色部分の面積)÷((青色部分の面積)+(黄色部分の面積))が 0.87 であるということです。 このように、一様な分布ではないため、たとえば直近の1年間に東海地震が起きる確率は、(87% ÷ 30) よりも大きいものになります。 逆に、今から29年後から30年後までの1年間に東海地震が起きる確率は、(87% ÷ 30
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く