タグ

統計学に関するNSTanechanのブックマーク (9)

  • 実践! Rで学ぶ統計解析の基礎 - @IT

    Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!

  • 統計屋はどこまで給料をもらうべきか - Willyの脳内日記

    アカデミアでもビジネスでも統計解析のニーズは高くて、 データを分析して欲しいというような依頼は結構くる。 しかし、分析の対価としてどこまで給料をもらうべきなのか、 というのはなかなか難しい問題だ。 完全にビジネスとして外注して、博士レベルの統計屋に 分析をさせると、単価は1時間で100ドル前後のようだ。 以前に、コンサルティング会社が時給75ドルでそういった求人を 出していたから、マージンなどを考えれば大体そんなものなのだろう。 継続的に分析案件が発生するのであれば、 常勤で統計屋を雇えばもっと安く済む。 私も、大学院生の時は、医学部でデータの分析をして、 生活費や給料、健康保険料を払ってもらっていた。 一番厄介なのは、依頼者が案件をあくまで「共同研究」だと考えている場合である。 もちろん雑誌や学会等に投稿することになれば、 分析者として共著者に名前を入れてもらうことになるが、 それが統計

  • “ビッグデータ分析”は本当に必要か?

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 前回の寄稿では、リクルートにおけるビッグデータ活用の概要を紹介しました。 今回は、具体的な事例をお話しする前に、一度、視点をビッグデータそのものに戻して、“ビッグ”であることの意義や価値をビジネス的な視点や統計的な視点からレビューし直してみたいと思います。 ビッグデータの“ビッグ”とは、そのものずばり「データ量の膨大さ」を意味しますが、ここで一つ考えていただきたいことがあります。それは、何らかビジネスに役立つ知見を得るために、当に膨大なデータの分析が必要なのか、ということです。 インターネットが消費者のライフスタイルへ浸透している昨今、企業側に日々ストックされるウェブアクセスログのような消費者の行動データを、ビジネスに生かせないかと思

    “ビッグデータ分析”は本当に必要か?
  • 指数型分布族とはなんぞ - Fire and Motion

    皆さん,ご存じの指数型分布族(exponential family)について私の拙い理解をまとめておきたいと思います.指数型分布族といえば,難しめの統計学や機械学習を読んだときに突如出てきて,「え,何それ,指数分布じゃないの?僕,指数分布しか知らないよ−」と思っている読者を撲殺し,しかし,殺されている人は「まぁ,たぶん指数分布みたいなものだろう,とりあえず読み進めよう」と見ない振りをしているアレです.えぇ.私もそういう理解です.しかし,このままではいかんので,そこらへんにあった文献を元に簡単な理解をまとめておきたいと思います.ちなみに私の初エンカウンターはPRMLでした.てか,(私が学んだゆるい)大学時代の講義ではこんなもの習わなかったのですが,この指数型分布族とはどういう統計の授業では学ぶモノなのでしょう….単なる勉強不足かもしれませんが…. あいつもこいつも指数型分布族 まず,P

    指数型分布族とはなんぞ - Fire and Motion
  • 対談「なぜ統計学が最強なのか」――西内 啓・統計家×飯田泰之・駒澤大学経済学部准教授

    飯田 西内さんは医学部のご出身ですが、統計学はどこで学ばれたのですか。 西内 医学部の中でも、公衆衛生学が専門でしたので、統計学は最初に学んだんです。公衆衛生学は原因を突き詰めた後、人々がどのように行動するのか、また、社会構造を変えられるのかといった、ありとあらゆるものが対象になります。経済学を含めた、社会科学全般について、博士課程で学びました。 飯田 なるほど。特に公衆衛生学とか疫学はまさに、統計学の生みの親みたいなものですからね。 西内 疫学とは原因不明の疫病を防止するための学問ですが、その最初の研究が19世紀のロンドンではやったコレラです。当時のロンドン中の医師や科学者、役人が対策を繰り出すのですが、どれも効果がない。そんな中でジョン・スノウという外科医はコレラで亡くなった人の生活状況について調べまくって、同じような状況下でコレラにかかった人とかかっていない人の違いを比べました。 飯

  • 佐藤吉宗先生の統計学入門(1)-偽陽性問題-

    Yoshihiro Sato @yoshisatose 最近、TLで偽陽性の話題を目にするので、一つ練習問題を紹介します。これは昨秋、私が担当している統計学(1年生向け)の試験で出題した問題で、あとで複数の学生から「とても面白い問題だった」という反応がありました。「ベイズの定理」の問題なので、分かる人には簡単です。四則演算で解けます。 2013-03-18 21:31:42 Yoshihiro Sato @yoshisatose 【問題】 人口の5%がある病気に罹っているとします。この病気に罹っているかどうかを確かめる検査があるのですが完全なものではなく、病気に実際に罹っている人が受けると90%の確率で陽性となり、病気に罹っていない人が受けると90%の確率で陰性と出ます。(続く…) 2013-03-18 21:32:29

    佐藤吉宗先生の統計学入門(1)-偽陽性問題-
  • [徳力] 統計学が最強の学問である (西内啓)を読んで、あらためて統計や分析を学ぶことの重要性を再認識中です。

    「統計学が最強の学問である」は、タイトル通り統計学の価値について紹介されている書籍です。 Cakesの加藤さんに教えてもらったので買ってみたのですが、遅ればせながら書評抜き読書メモを公開させて頂きます。 正直、統計とか分析とかっていう単語を聞くと、一瞬で耳をふさぎたくなる理数科出身なのに文系受験して法学部に逃げた自分がここにいるわけですが。 実はネットの進化やスマホの普及により、いわゆるビッグデータと言われる、利用者の動向が何でも分析できる時代がすぐそこに見えていることが明らかになっており、統計学の重要性は明らかに増していると感じます。 実はビジネスにおいて、統計学のような数値を元に適切な判断を行うことは、インターネット以前から重要だったわけですが、最大の問題はデータが取れない、もしくは取るのに膨大なコストがかかること、でした。 それが最近はデータ取得コストがあきらかに低下し、逆にデータが

    [徳力] 統計学が最強の学問である (西内啓)を読んで、あらためて統計や分析を学ぶことの重要性を再認識中です。
  • データ分析の重要性を理解するための入門書5冊 - UNIX的なアレ

    はじめに 今回紹介するは玄人向けではなく「データ分析が重要そうだけど、なんだかよくわかんないと思っている人」向けです。 昨今ではデータマイニングという単語がエンジニアやマーケティング担当者のものだけでなく、経営レイヤーでも重要視されてきています。 ビッグデータというバズワード的なものも頻繁に言われ始めて、めんどくさい上司とかはとにかく口にし出すような状況ではないでしょうか?(想像です) 勉強しないと!と思いはするものの、統計やらHadoopやらRやら、それにまつわるものが多すぎて何から手をつけていいのかわからないもの。 というわけで、私が最近読んだ中でも「何ができるものなのか」という浅く広いテーマについて触れているをいくつか紹介します。 統計学 統計学が最強の学問である 作者:西内 啓ダイヤモンド社Amazon cakesの連載をまとめたですが、統計学がどういった分野に使われているの

    データ分析の重要性を理解するための入門書5冊 - UNIX的なアレ
  • はてなブログ | 無料ブログを作成しよう

    我が家のダグウッド ダグウッドとはハナミズキのことである。昔、日からポトマックリバーの桜の苗木を送った返礼として、アメリカから送られて来たのが日での始まりで、アメリカ原産でアメリカヤマボウシともいうらしい。 最近では日でも、あちこちで、街路樹であったり、庭木であっ…

    はてなブログ | 無料ブログを作成しよう
  • 1