タグ

統計に関するsobataroのブックマーク (21)

  • 決定版:サービスの盛り上がり具合をユーザの数(DAU)から読み解く方法

    CEDEC2013にて発表させていただいた内容の一般公開用スライドです。 ネットサービスの基中の基とされるKPI 「DAU(Daily Active Users)」。売上の分解にも使いやすく、複数のサービスを比較するときには必須の指標です。しかし、運営の現場では「ノイズが多くて使いにくい」「経営者(えらい人)にサービスの状況の誤解を与える」という扱いを受けがちな指標でもあります。 セッションの内容 : セッションでは、ソーシャルゲームのDAUを題材に、測り方にほんの少し工夫(工夫の方法は汎用的なものです)を加えることで、DAUを現場の肌感覚にもあう指標に変身させる方法、特に、運営期間が長くなったサービスにおける課題抽出に活用する方法をご紹介します。 発表日時 : 2013年8月23日(金) 16:30~17:30 詳細URL : http://cedec.cesa.or.jp/201

    決定版:サービスの盛り上がり具合をユーザの数(DAU)から読み解く方法
    sobataro
    sobataro 2014/10/28
    “DAUを売上増減の原因分析につかうことはいったん忘れ、DAUの変化からユーザーの気持ちを受け取ろう” 良い
  • 読売新聞「大学の実力2013」を活用した偏差値・退学率・就職率を分析した論文が興味深い - Clear Consideration(大学職員の教育分析)

    high190です。 今年も読売新聞が実施する「大学の実力」調査の結果が7月9日、10日の2日間に渡って紙面に掲載されました。大学関係者のみならず、社会的にも大きな注目を集めている調査ですが、公表された調査結果を具体的に大学改革へと活かしている大学も多くあるのではないかと思います。 また、この調査によって大きな注目を集めたのが大学の退学率と就職率です。大学からすると退学率は公表したくない指標のひとつではありましたが、この調査を通じて現在では多くの大学が退学率を公表するようになっています。今年の10月から稼働予定の大学ポートレート*1においては中途退学者数、留年者数等は公表項目から除外*2されていますが、いずれ公表が必須となるのではないか?と予想しているところです。そういった意味でも大学・受験生にとっても重要な指標である退学率ですが、読売新聞の調査データを基に社会科学系の学部*3で偏差値と退

    読売新聞「大学の実力2013」を活用した偏差値・退学率・就職率を分析した論文が興味深い - Clear Consideration(大学職員の教育分析)
  • スマホマーケットの概要と、�マーケティングの失敗例と改善 (アナリティクス アソシエーション 特別セミナー)

    アナリティクス アソシエーション 特別セミナー 改善活動を継続する鍵は何だろう?�~グロースハックに学ぶビジネス改善~ http://a2i.jp/activity/seminar-activity-2/18670/Read less

    スマホマーケットの概要と、�マーケティングの失敗例と改善 (アナリティクス アソシエーション 特別セミナー)
  • Tyler Vigen's personal website

    Tyler Vigen's project list Spurious Scholar Published: January 27, 2024 What it is: Thousands of AI-generated academic research articles based on the correlations from the spurious correlations project Spurious Correlations Originally published: May 2014 Update launched: January 27, 2024 What it is: Random correlations dredged up from silly data, turned into linear line charts. Now with AI-generat

    Tyler Vigen's personal website
  • DATA GO JP/open data

    データセット データセットとは、ファイルやURLなどの「オープンデータ」が登録された入れ物を指します。 データポータルでは、複数の切り口からデータセットを探すことができます。

    sobataro
    sobataro 2013/12/20
    ゴミの山…
  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
    sobataro
    sobataro 2013/06/13
    さらっと俯瞰してある
  • 統計学入門−目次

    最終更新日:2022年08月24日 前口上へ 第1章へ webmaster@snap-tck.com Copyleft (C) 2000 SNAP(Sugimoto Norio Art Production)

  • リサーチ・ナビ | 国立国会図書館

    リサーチ・ナビは、調べものに役立つ情報を紹介する国立国会図書館の調べ方案内です。 テーマや各種資料ごとに、調査のポイントや参考になる資料、便利なデータベース、使えるWebサイト、関係する機関などを紹介しています。

    リサーチ・ナビ | 国立国会図書館
  • 日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)

    2008年に日統計学会75周年記念出版として刊行されました国友直人・山拓監修『21世紀の統計科学』(全3巻)の増補版を, 日統計学会のホームページを通じて提供することとなりました.書の増補版の オンライン公開が統計科学の今後の発展に資することを期待しております. 第I巻 社会・経済の統計科学 (国友直人・山拓編) 第II巻 自然・生物・健康の統計科学 (小西貞則・国友直人編) 第III巻 数理・計算の統計科学 (北川源四郎・竹村彰通編)

  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家

    久しぶりの投稿です。この一年間、Rの勉強会などに参加したり主催したりしてきて、後輩や勉強会の方々の話をいろいろ聞くとこができました。そんな中、一年間でRと統計学・機械学習を身に付けれるようなフローを作れるかも?と思ったので、ここで記録しておきます。統計学や機械学習は理論を勉強するだけでなく、Rで実際に解析してみることで、より理解が深まります。 ステップ1. 分布・検定 理論 統計学入門 (基礎統計学?) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (79件) を見る R Rによるやさしい統計学 作者: 山田剛史,杉澤武俊,村井潤一郎出版社/メーカー: オーム社発売日: 2008/01/25メディア: 単行購入: 64人 クリック: 782回この商品を含

    一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • クラスター分析

    クラスター分析     Last modified: Aug 28, 2015 似通った個体あるいは変数のグループ化を行うための分析手法である。 クラスター分析の結果は,図 1 のようなデンドログラム(樹状図)として表現される。 個体が似通っているかどうかの判定基準としてはいくつかあるが,取り扱いが容易なユークリッド距離を用いる。 個体のクラスター分析を行う場合には,解析に用いるデータを正規化する場合としない場合では結果がかなり異なることがある。 解析に使用する変数が異なった単位で表されているときには,正規化した方がよいかもしれない。しかし,ある変数が決定的な性質を持つ場合には,正規化することは他の変数と同格に取り扱ってしまうことになるので正規化しない方がよいかもしれない。 $n$ 個の個体について,$p$ 個の変数 $X_{i1}, X_{i2}, \dots X_{ip}\ (i =

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • Google先生が教えてくれた日本におけるFacebookの利用の実態 - もとまか日記

    憶測で物を語るのが3度の飯より好きな、ネットの実名「もとまか」です。でも辛子明太子の方が好きです。 さて、先日Facebookについて以下の記事を書きました。 Facebookが楽々と世界で普及していった当の理由 この記事にはたくさんの方からTwitterで反応を頂きました。ありがとうございますm(_ _)mFacebookのこと書いてるのにTwitterからってのがインターネットは相変わらず面白いなぁと思いました。 でも、実は私にはまだモヤモヤした感が残ってたんです。それが、以下のこと。 そうです、あのFacebookに関するGoogleトレンドの結果。この記事のGoogleトレンドへの言及部分は、来筋から言えば外しても構わなかったんですが、この図に気がついてしまって、その意味するところが理解出来ず、どうしても気になったので入れてみたわけでした。 決して別記事にするのが面倒くさかった

  • 「YouTubeやニコ動が音楽購入の阻害要因にも」日本レコード協会が分析 

  • 「こんにゃくゼリーの窒息、重症率85%」は本当か、適切な表現なのか

    消費者庁は2010年6月30日、「品SOS対応プロジェクト会合」配布資料を公表した(【発表ページ】)。その資料で語られている論説、及びそれを元にした一部報道(例えば[こんにゃくゼリーの窒息、重症率85% 消費者庁分析])では、いかにもこんにゃくゼリー”のみ”がリスキーな品であり、過去に品安全委員会が下した「アメ程度の事故頻度」という品リスク評価は問題があるとの見解を示している。特に「こんにゃくゼリーの窒息、重症率85%」という見出しは非常に印象を与えるが、当にそれは検証されたデータを「適切に」表現しているのだろうか。今回は発表資料をグラフ化し、再検証することにした。 まずは開示されている【窒息事故の詳細分析について(品)(PDF)】をチェックする。ここには全4137件の品・製品などの窒息事故のうち、原因物質が不明なものをのぞき、具体的な原因品が明らかになっているもの2414

    「こんにゃくゼリーの窒息、重症率85%」は本当か、適切な表現なのか
  • 百万分の一は小さな値ではない

    2005/02/15 2006/01/02 原子力発電所は安全である。という宣伝がされています。例えば、「原発が事故を起こす確率は隕石が当たって死ぬ確率よりも小さい」などと言う人までいます。 当でしょうか 工場などの故障を研究している人がいます。故障が起きると生産が止まり損害となるので、部品を定期的に交換する事になります。では部品交換はどの程度の頻度で行なえば良いのでしょうか。新品には初期不良が付き纏います。古い部品は消耗しています。この問題を解決するために、部品の個々の故障頻度の統計と確率論で工場全体が最も収益を上げる交換頻度をはじきだします。 同様のことを原子力発電所でも行なっています。PSA(確率論的安全評価)と言います。電力会社やその他の宣伝を見ると典型的な大事故である「炉心損傷」の頻度は炉・年当り10-6程度の様です。で、この10-6という数字を「小さい」と宣伝しています。

  • フラクタルビスケット、ポアソンスパゲッティ - 小人さんの妄想

    フラクタルの語源は 「ラテン語の動詞frangereは『壊れる』、すなわち不規則な断片ができるという意味」 なのだそうです。 >> http://www.biwa.ne.jp/~k-tochi/siryou/siryofra.html それでは、実際にものを壊したときの破片は、どのような大きさに散らばるのでしょうか。 岩石に衝撃を与えて破壊するとその破片の大きさの分布はベキ分布になることが知られています。 ガラスのコップを硬い床に落として割った時にできる破片も同じです。 大きな破片はほんの数個で、中くらいの破片はかなりの数になり、小さな破片は無数にあります。 -- 経済物理学の発見(光文社新書)より. 試しにやってみようと思ったのですが、岩石を割るのはたいへんだし、ガラスのコップを割るのはもったいない。 簡単に割れるものを探してみたところ、戸棚の中にビスケットがありました。 小袋の中に入っ

    フラクタルビスケット、ポアソンスパゲッティ - 小人さんの妄想
    sobataro
    sobataro 2009/12/16
    "岩石に衝撃を与えて破壊するとその破片の大きさの分布はベキ分布になる"/"スパゲッティを適当に折れば、冪乗法則ではなくて、ポアッソン分布というものになるらしい。"