Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!
Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!
アカデミアでもビジネスでも統計解析のニーズは高くて、 データを分析して欲しいというような依頼は結構くる。 しかし、分析の対価としてどこまで給料をもらうべきなのか、 というのはなかなか難しい問題だ。 完全にビジネスとして外注して、博士レベルの統計屋に 分析をさせると、単価は1時間で100ドル前後のようだ。 以前に、コンサルティング会社が時給75ドルでそういった求人を 出していたから、マージンなどを考えれば大体そんなものなのだろう。 継続的に分析案件が発生するのであれば、 常勤で統計屋を雇えばもっと安く済む。 私も、大学院生の時は、医学部でデータの分析をして、 生活費や給料、健康保険料を払ってもらっていた。 一番厄介なのは、依頼者が案件をあくまで「共同研究」だと考えている場合である。 もちろん雑誌や学会等に投稿することになれば、 分析者として共著者に名前を入れてもらうことになるが、 それが統計
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 前回の寄稿では、リクルートにおけるビッグデータ活用の概要を紹介しました。 今回は、具体的な事例をお話しする前に、一度、視点をビッグデータそのものに戻して、“ビッグ”であることの意義や価値をビジネス的な視点や統計的な視点からレビューし直してみたいと思います。 ビッグデータの“ビッグ”とは、そのものずばり「データ量の膨大さ」を意味しますが、ここで一つ考えていただきたいことがあります。それは、何らかビジネスに役立つ知見を得るために、本当に膨大なデータの分析が必要なのか、ということです。 インターネットが消費者のライフスタイルへ浸透している昨今、企業側に日々ストックされるウェブアクセスログのような消費者の行動データを、ビジネスに生かせないかと思
皆さん,ご存じの指数型分布族(exponential family)について私の拙い理解をまとめておきたいと思います.指数型分布族といえば,難しめの統計学や機械学習の本を読んだときに突如出てきて,「え,何それ,指数分布じゃないの?僕,指数分布しか知らないよ−」と思っている読者を撲殺し,しかし,殺されている本人は「まぁ,たぶん指数分布みたいなものだろう,とりあえず読み進めよう」と見ない振りをしているアレです.えぇ.私もそういう理解です.しかし,このままではいかんので,そこらへんにあった文献を元に簡単な理解をまとめておきたいと思います.ちなみに私の初エンカウンターはPRMLでした.てか,(私が学んだゆるい)大学時代の講義ではこんなもの習わなかったのですが,この指数型分布族とはどういう統計の授業では学ぶモノなのでしょう….単なる勉強不足かもしれませんが…. あいつもこいつも指数型分布族 まず,P
飯田 西内さんは医学部のご出身ですが、統計学はどこで学ばれたのですか。 西内 医学部の中でも、公衆衛生学が専門でしたので、統計学は最初に学んだんです。公衆衛生学は原因を突き詰めた後、人々がどのように行動するのか、また、社会構造を変えられるのかといった、ありとあらゆるものが対象になります。経済学を含めた、社会科学全般について、博士課程で学びました。 飯田 なるほど。特に公衆衛生学とか疫学はまさに、統計学の生みの親みたいなものですからね。 西内 疫学とは原因不明の疫病を防止するための学問ですが、その最初の研究が19世紀のロンドンではやったコレラです。当時のロンドン中の医師や科学者、役人が対策を繰り出すのですが、どれも効果がない。そんな中でジョン・スノウという外科医はコレラで亡くなった人の生活状況について調べまくって、同じような状況下でコレラにかかった人とかかっていない人の違いを比べました。 飯
Yoshihiro Sato @yoshisatose 最近、TLで偽陽性の話題を目にするので、一つ練習問題を紹介します。これは昨秋、私が担当している統計学(1年生向け)の試験で出題した問題で、あとで複数の学生から「とても面白い問題だった」という反応がありました。「ベイズの定理」の問題なので、分かる人には簡単です。四則演算で解けます。 2013-03-18 21:31:42 Yoshihiro Sato @yoshisatose 【問題】 人口の5%がある病気に罹っているとします。この病気に罹っているかどうかを確かめる検査があるのですが完全なものではなく、病気に実際に罹っている人が受けると90%の確率で陽性となり、病気に罹っていない人が受けると90%の確率で陰性と出ます。(続く…) 2013-03-18 21:32:29
「統計学が最強の学問である」は、タイトル通り統計学の価値について紹介されている書籍です。 Cakesの加藤さんに教えてもらったので買ってみたのですが、遅ればせながら書評抜き読書メモを公開させて頂きます。 正直、統計とか分析とかっていう単語を聞くと、一瞬で耳をふさぎたくなる理数科出身なのに文系受験して法学部に逃げた自分がここにいるわけですが。 実はネットの進化やスマホの普及により、いわゆるビッグデータと言われる、利用者の動向が何でも分析できる時代がすぐそこに見えていることが明らかになっており、統計学の重要性は明らかに増していると感じます。 実はビジネスにおいて、統計学のような数値を元に適切な判断を行うことは、インターネット以前から重要だったわけですが、最大の問題はデータが取れない、もしくは取るのに膨大なコストがかかること、でした。 それが最近はデータ取得コストがあきらかに低下し、逆にデータが
はじめに 今回紹介する本は玄人向けではなく「データ分析が重要そうだけど、なんだかよくわかんないと思っている人」向けです。 昨今ではデータマイニングという単語がエンジニアやマーケティング担当者のものだけでなく、経営レイヤーでも重要視されてきています。 ビッグデータというバズワード的なものも頻繁に言われ始めて、めんどくさい上司とかはとにかく口にし出すような状況ではないでしょうか?(想像です) 勉強しないと!と思いはするものの、統計やらHadoopやらRやら、それにまつわるものが多すぎて何から手をつけていいのかわからないもの。 というわけで、私が最近読んだ中でも「何ができるものなのか」という浅く広いテーマについて触れている本をいくつか紹介します。 統計学 統計学が最強の学問である 作者:西内 啓ダイヤモンド社Amazon cakesの連載をまとめた本ですが、統計学がどういった分野に使われているの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く