タグ

統計に関するniseissaのブックマーク (11)

  • ダメな統計学:目次|Colorless Green Ideas

    2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』に大幅に加筆したものだ。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 ここに公開する『ダメな統計学』は、アレックス・ラインハート (Alex Reinhart) 氏が書いたStatistics Done Wrongの全訳である。この文章は全部で13章から構成されている。詳しくは以下の目次を参照されたい。 はじめに データ分析入門 検定力と検定力の足りない統計 擬似反復:データを賢く選べ p値と基準率の誤り 有意であるかないかの違いが有意差でない場合 停止規則と

    ダメな統計学:目次|Colorless Green Ideas
  • データ & アナリティクス | アクセンチュア

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    データ & アナリティクス | アクセンチュア
  • データ匿名化手法

    データがビジネスを駆動する現在、さらなるサービスの進化と利便性を推進するために、個人に関する情報は不可欠です。書は、機微な個人情報を多く含むヘルスデータを題材に、プライバシー保護とデータ有用性という相反する命題をいかに満たすかについて、豊富な実例とともに解説する書籍です。リスクベースの非特定化方法論、横断的データ、縦断的イベントデータ、データリダクション、地理空間の集約、マスキングなどデータの匿名化に必要な事柄を網羅的に解説します。医療者はもちろん、個人のプライバシーを守りつつ、より洗練されたサービスを提供したいエンジニア、データ技術者必携の一冊です。 監訳者まえがき まえがき 1章 イントロダクション 1.1 匿名化すべきか、せざるべきか 1.1.1 同意を得るか、匿名化するか 1.1.2 お金節約する 1.1.3 人目に触れたくない 1.2 匿名化における2の柱 1.2.1 マス

    データ匿名化手法
  • ホーム | 統計数理研究所

    2024/05/23 「統計数理を活用して未踏物質空間を切り拓く」産学連携シンポジウム (ハイブリッド開催) 2024/05/24 統計数理研究所オープンハウス「人と社会に寄り添うデータサイエンス」 2024/05/24 大学院説明会(2024年度第1回) 2024/06/07 第59回統計的機械学習セミナー 2024/06/25 「線形モデルにおける同時許容限界区間と医療・製薬における最適化の応答局面法」(オンサイト開催) 2024/06/27 第32回品質工学研究発表大会(RQES2024S) 2024/09/23 German-Japanese Fall School "Time Series, Random Fields and beyond"

  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas
  • データサイエンティストではない人に知っておいて欲しい事 - hotokuとは

    統計を専門にしている訳ではない人と話していて感じた違和感があったので、書き留めておきたい。 疑うべき順番は モデル → 推定法 データ分析をしていれば、当然、期待を掛けたモデルのデータへの当てはまりそうが悪いという事が度々ある。こういう時、統計屋さんとして自然に浮かぶのは「モデルが間違っている」という発想である。と思うのだが、非統計屋さんと話していると、このような時に「別の推定法を試してみたらどうだろう」と言われる事がある。多分、目の前のモデルに対する過度の期待から来るのだろうと思うが、このような態度では統計的に見ると妥当性を欠いた分析をしてしまう危険を孕んでいる。 ひとつの事例 とある線型状態空間モデルのパラメータを推定した所、どうしてもデータに合わない部分があった。実は、それが合わない理由は簡単で、ある潜在変数は常に正であるはずなのだ。線型状態空間モデルでは、潜在変数の分布は正規分布で

    データサイエンティストではない人に知っておいて欲しい事 - hotokuとは
  • バラク・オバマ版『マネーボール』 大統領選勝利の鍵はビッグデータの徹底活用

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 選挙でソーシャルメディアを活用するのは当たり前、情報は分析してこそ価値が生まれる。写真はオバマ大統領とFacebookのマーク・ザッカーバーグCEO(出典:Christopher Dilts/Obama for America) 米国の大統領選挙でオバマ大統領が再選を果たした。 この勝利をもたらした重要な要因がオバマ陣営の「情報戦」に求められるようだ。 オバマ陣営は徹底してビッグデータを活用したという話が、開票日翌日のTIMEの記事に載っていた。 アップルやマイクロソフト(とくにXbox)など、すぐにでも採り上げておかないといけない話題が山積みだが、今回はこの米大統領選挙に関する「旬のネタ」を紹介したい。 選挙対策のプロが頼ろうとする「

    バラク・オバマ版『マネーボール』 大統領選勝利の鍵はビッグデータの徹底活用
  • 世界の都市圏人口の順位 - Wikipedia

    ^ Demographia:東京、神奈川、千葉、埼玉、群馬、栃木、茨城の各県に広がる都市的地域を含む。Géopolis:東京。UN WUP:東京:2005年の国勢調査時の行政区分において茨城県の土浦市、古河市、龍ケ崎市、水海道市(現常総市)、取手市、牛久市、つくば市、守谷市、稲敷市、かすみがうら市、美浦村、阿見町、河内町、伊奈町(現つくばみらい市)、谷和原村(現つくばみらい市)、五霞町、境町、利根町、栃木県の小山市、南河内町(現下野市)、国分寺町(現下野市)、野木町、大平町(現栃木市)、藤岡町(現栃木市)、群馬県の館林市、新町(現高崎市)、板倉町、明和町、埼玉県のさいたま市、川越市、熊谷市、川口市、行田市、所沢市、飯能市、加須市、庄市、東松山市、春日部市、狭山市、羽生市、鴻巣市、深谷市、上尾市、草加市、越谷市、蕨市、戸田市、入間市、鳩ヶ谷市、朝霞市、志木市、和光市、新座市、桶川市、久喜市

  • 統計的に正しいランキングを行う方法 - Hello, world! - s21g

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 ポジティブ/ネガティブ投票による正しいランキング方法が以下の記事で紹介されています。 How Not To Sort By Average Rating この計算方法では、投票数が少ない場合には分散が大きく不正確な評価で、 投票数が多くなるにつれて分散が小さく正確な評価が得られているという事を考慮しています。以下数式 これはScoreの信頼区間を表しています。 この信頼区間の下界をランキングのスコアにすれば良い事になります。 ここで、は、 です。全体に占めるポジティブ投票数の割合ですね。 は標準正規分布上の 信頼区間の有意確率です。 さて、五段階評価によるRatingに同様のテクニックを適用する場合はどうしたらいいでしょうか

    niseissa
    niseissa 2009/05/11
    数式でも、コードでみると理解できる。 完全なプログラマ脳なりw
  • アルファブックマーカーは誰だ - Life like a clown

    タイトルは釣り. こういう言い方があるのかどうかわからないけれど、アルファブロガーとかいう称号同様、アルファブックマーカーみたいな人がいらしゃって、その人がブックマーク付けると多くの人が見に行って、その人たちは自分たちもブックマークを付ける傾向があるんじゃないかなぁと想像しています。 そういう力を持っている人が何人くらいいるかはわからないですが、そんなに多くはないんじゃなかろうか?100人には満たないのでは無かろうか?そんな想像もしているんですよ。はてなブックマークのホッテントリは有象無象の集団が創り上げるのではなくその力を持った人たちによるニュースサイトになっているのではなかろうかと思います。 http://d.hatena.ne.jp/tanabeebanat/20080901#1220275251 一度データを取って結果を見てみたかったので,上記を検証してみました.下記の Ruby

    アルファブックマーカーは誰だ - Life like a clown
  • 1