タグ

統計学に関するchess-newsのブックマーク (55)

  • 統計検定 1 級に合格する方法 - Qiita

    はじめに: 統計学の重要性 NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。 今回は統計検定 1 級について記します。 統計検定とは日統計学会による公認の資格であり、統計に関する知識や活用力を評価するものです。 日常的に大量のデータが溢れている昨今、データ分析機械学習に対するニーズは最高の高まりを見せています。最近では何も考えずともただデータを入力するだけでデータ分析機械学習手法を実行してくれるツールも多数出回るようになりました。 データ分析機械学習を実際に遂行するにあたって、統計学は強力な基礎になります。確かに最近は便利なツールの発達のおかげで、統計を学ばずともデータ分析を実行できる環境が整いつつありますが、その状態でデータ分析手法や機械学習手法を実際に適用しようとすると、しばしば誤った推論をしてしまったり、複雑な状況に対してどのようなアプロー

    統計検定 1 級に合格する方法 - Qiita
  • データ & アナリティクス | アクセンチュア

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    データ & アナリティクス | アクセンチュア
  • 統計検定:Japan Statistical Society Certificate

    統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。問い合わせ:統計検定センター

  • データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう!|ハイクラス転職・求人情報サイト AMBI(アンビ)

    データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう! ビッグデータ、データサイエンス、人工知能など、統計学を主軸においた分野が隆盛ですが、統計学には高いハードルを感じる方も少なくないでしょう。k平均法を実際に手を動かしながら理解することで、データ分析を身近に感じることができます。 はじめまして、藤井健人(@studies)と申します。イタンジ株式会社でデータ基盤周りの運用を担当しています。 「ビッグデータ」「データサイエンス」「人工知能」といったバズワードに代表されるように、統計学を主軸においた分野の隆盛が日常となって久しいです。 しかし「統計学は学問的な要素があり難しい」という印象を持たれやすく、「実務に活かすのはハードルが高い、怖い」と感じる方も少なくないのではないでしょうか。 そういった方を対象に、今回は統計学の手法の一つであるk平均法を学んでいただ

    データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう!|ハイクラス転職・求人情報サイト AMBI(アンビ)
  • 統計検定を理解せずに使っている人のために I - J-Stage

    318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.

  • 統計学入門−目次

    最終更新日:2022年08月24日 前口上へ 第1章へ webmaster@snap-tck.com Copyleft (C) 2000 SNAP(Sugimoto Norio Art Production)

  • シャピロ–ウィルク検定 - Wikipedia

    シャピロ–ウィルク検定(シャピロ–ウィルクけんてい、英語: Shapiro–Wilk test)とは、 統計学において、標 x1, ..., xn が正規分布に従う母集団からサンプリングされたものであるという帰無仮説を検定する検定である。この検定方法は、サミュエル・シャピロとマーティン・ウィルクが1965年に発表した[1]。 定義[編集] 検定統計量は、 ただし、 x(i)(括弧で囲まれた添え字「i」のついた)は、i番目の順序統計量、つまり、標の中でi番目に小さい数値である。 は、標平均である。 定数aiは、次の式によって与えられる。 ただし、 m1, ..., mnは、標準正規分布からサンプリングされた独立同分布の確率変数の順序統計量の期待値であり、V はこの順序統計量の分散共分散行列である。 帰無仮説は、Wが小さすぎる場合に棄却される。 参考文献[編集] Algorithm AS

    chess-news
    chess-news 2017/03/02
     正規性
  • Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas

    はじめに Rには、“ggplot2”というライブラリがある。このライブラリを使うと、デフォルトの作図コマンドよりも効率的に作図ができ、しかも分かりやすくて美しい図を描くことができる。美しい図といってもピンと来ないかもしれないが、百聞は一見にしかず、下の2つの図を比べてもらいたい。1つ目の白い背景の図がRのデフォルトの作図コマンドで作成された散布図である。2つ目の灰色の背景の図が“ggplot2”を使った散布図である。 Rのデフォルトの作図機能を使った場合の散布図の例 “ggplot2”を使った場合の散布図の例 以下では、“ggplot2”のコンセプトと簡単な作例を紹介したいと思う。最初は抽象的な話をする。このため、最初から読んで分かりづらかったら、後の方の作例を先に見た方が理解が早いかもしれない。 “ggplot2”のコンセプト “ggplot2”は、どのように作図を行っているのであろうか

    Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas
  • 相関係数,回帰直線

    Excel:相関係数,回帰直線 ◇このページで利用する関数等の一覧◇ グラフ--散布図 ツール--分析ツール r表 SLOPE(yの配列の範囲,xの配列の範囲):傾き INTERCEPT(yの配列の範囲,xの配列の範囲):y切片 CORREL(系列1の範囲,系列2の範囲):相関係数 PEARSON(系列1の範囲,系列2の範囲):相関係数 STEYX(系列1の範囲,系列2の範囲):推定値の標準誤差 TREND(既知のy,既知のx,新しいx,1):回帰直線上の推定値 FORECAST(新しいx,既知のy,既知のx):回帰直線上の推定値 ■操作方法の要約■ Excelを用いて,右の表1のようなデータ(2列)から図1のような散布図を作成し,相関係数,回帰直線を求めるには (1) 散布図の作成方法は[こちら] (2) 図1の(2) 回帰直線 を表示するには: 散布図のマーカー(右図では青の点)の1

  • ピアソンの相関係数、Spearman(スピアマン)の順位相関係数

    Σxi,Σyi,Σxi2,Σyi2,Σxiyiを求めたら、今度は偏差平方和(Sxx,Syy)と偏差積和(Sxy)を求める。 偏差平方和を求めたら、次は統計量rを求める。 このときのr0.05はn=14のとき相関係数検定表(r表)から、r0.05=0.532であると分かる。 |r|=0.943>0.532=r0.05より、P<0.05となるので帰無仮説を棄却できる。つまり、「年齢と酵素Xの量には関連がある」ということができる。 ……………………………………………………………………………………………………………… Spearmanの順位相関係数(ノンパラメトリック法) データが正規分布するならピアソンの相関係数rで検定すればいいが、正規分布しないならSpearmanの順位相関係数rsで検定する。 ・仮説の設定 帰無仮説(H0):「相関はない」と仮定する。 対立仮説(H1):「相関はある」と仮定

  • 即席!データサイエンス部署にいきなり配属されたどーにかしないといけない - Qiita

    わーっと書いてみた間違ってたらごめんな Ver.1.0 なにも分からないがとりあえずデータサイエンティストとしての外面だけ取り繕いたい場合 『Rによるデータサイエンス-データ解析の基礎から最新手法まで』 金 明哲著 森北出版 2007年とやや古いですが、機械学習の基的な手法が網羅されています。書のRコードをひたすら写経のように実行しましょう。書とほぼ同内容が著者の金氏のページで公開されていますのでそちらでもよいと思います。 https://www1.doshisha.ac.jp/~mjin/R/ データ分析で用いられる、多変量解析や機械学習などの代表的な手法がほぼ網羅されています。 相談できる人もいない自分が今どのレベルなのかこっそり確認したい場合 データサイエンティストのスキルチェック データサイエンティスト協会が決めたスキル表からランダムに抜き出して簡易チェックができるとのこと。

    即席!データサイエンス部署にいきなり配属されたどーにかしないといけない - Qiita
  • データサイエンティスト(本物)は決して幻の職業などではない - 渋谷駅前で働くデータサイエンティストのブログ

    かつて拙著出版の際に大変お世話になった技術評論社(技評)さんから、『データサイエンティスト養成読』改定2版のPRとして以下の記事がリリースされていました。この記事がもう何と言いますか、「読めばそのままデータサイエンティスト(物)もしくはグローバルにおけるData Scientistのスキル要件になっている」ほどの素晴らしい記事なので、ぜひ皆様にはご一読をお薦めいたします。 ちなみにここであえて「物」と銘打ったのは、少し前にもどこかで論じられていた記憶があるのですが、要は「なんちゃってデータサイエンティスト」は含まないということです。僕の知る限り、日国内でデータサイエンティストと言うと「データサイエンティスト(カナ)」と方々から侮られるのが常なのですが、それはそもそも後述するように数年前に大量に発生したデータサイエンティスト(物)でも何でもない専門的スキルに乏しい人々のことが世間で

    データサイエンティスト(本物)は決して幻の職業などではない - 渋谷駅前で働くデータサイエンティストのブログ
  • R-bloggers

    R-bloggers R news and tutorials contributed by hundreds of R bloggers In the digital age, where data proliferates like stars in the night sky, the role of an analyst transcends mere number-crunching. They are the modern-day storytellers, whose quill is the cursor, and parchment, the screen. Each report crafted is not just a document; it’s a distilled potion of wisdom ... It’s been almost a month s

    R-bloggers
  • ソフトウェアのための統計学 – 前編 | POSTD

    ソフトウェア開発の原点は可能性の追求であり、不可能を可能にすることです。ひとたび ソフトウェア が開発されると、エンジニアは次に 程度 という課題に向き合うことになります。企業向けのソフトウェアであれば、「速度はどれくらいか」と頻繁に問われ、「信頼性はどの程度か」という点が重視されます。 ソフトウェアのパフォーマンスに関する質問に答え、さらには正しい内容を語る上で欠かせないのが統計学です。 とはいえ、統計学について多くを語れる開発者はそうはいません。まさに数学と同じで、一般的なプロジェクトで統計学が話題に上ることなどないのです。では、新規にコーディングをしたり、古いコードのメンテナンスをしたりする合間に、手が空くのは誰でしょうか? エンジニアの方は、ぜひ時間を作ってください。近頃は、15分でも貴重な時間と言えるでしょうから、 こちらの記事をブックマークに追加 しておいてもいいでしょう。とに

    ソフトウェアのための統計学 – 前編 | POSTD
  • Stanによるベイズ推定の基礎 | Logics of Blue

    新規作成日:2015年12月5日 最終更新日:2016年9月22日 理論がわかっても、実践ができなければ意味がありません。 ここでは、Stanというフリーソフトを使って、ベイズ統計学をもとにしたパラメタ推定をパソコンで実行する方法を説明します。 ベイズとMCMCの組み合わせでもって統計モデルのパラメタを推定することができるのでした。この方法を、以下では「ベイズ推定」と呼ぶことにします。 ここでは、Stanを用いて統計モデルのパラメタのベイズ推定をする方法を説明します。 重要な点は、「Stanの使い方」を覚えるだけではうまくいかないということです。 Stanの内部で使われているのは乱数生成アルゴリズムです。乱数を生成してパラメタを推定するという行為は、最小二乗法なりで方程式を解き、パラメタを一発で推定するやり方とは大きく異なります。 その違いをぜひ理解なさってください。 コードをまとめたもの

  • データサイエンティストを目指すというかデータ分析を生業にするなら読んでおきたい初級者向け5冊&中級者向け12冊(2015年冬版) - 渋谷駅前で働くデータサイエンティストのブログ

    (Photo via VisualHunt) 追記 2017年3月現在の最新書籍リストはこちらです。 最近になってまた色々とデータサイエンティストを目指す人向けのお薦め書籍リストとか資料リストとかが出てきてるんですが、個人的には何かと思うところがあるので僕も適当にまとめておきます。偏りありまくり、完全に主観で決めたリストなので文句が出まくるかと思いますが、もはや毎回のことなのでご容赦を。 なおこちらのリストはあくまでもビジネスの現場でデータ分析を生業にする(しようとしている)人たち向けのものであり、研究者含めたガチ勢の方々向けのものではありませんのでどうか悪しからずご了承下さい。 ちなみに毎回言ってますが、アフィリエイトは全くやっていないのでここに貼られたリンクを踏んで皆さんが購入されても僕の懐には一銭も入りません。拙著だけはそもそも例外ですが(笑)。*1 初級者向け5冊 一応初級者向けと

    データサイエンティストを目指すというかデータ分析を生業にするなら読んでおきたい初級者向け5冊&中級者向け12冊(2015年冬版) - 渋谷駅前で働くデータサイエンティストのブログ
  • 【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita

    統計学や機械学習をを勉強していると「尤度」という概念に出会います。まず読めないというコメントをいくつかいただきましたが、「尤度(ゆうど)」です。「尤もらしい(もっともらしい)」の「尤」ですね。犬 じゃありませんw 確率関数や確率密度関数を理解していれば数式的にはこの尤度を処理できると思うのですが、少し直感的な理解のためにグラフィカルに解説を試みたいと思います。 コードの全文はGithub( https://github.com/matsuken92/Qiita_Contents/blob/master/General/Likelihood.ipynb )にも置いてあります。 正規分布を例にとって 正規分布の確率密度関数は f(x)={1 \over \sqrt{2\pi\sigma^{2}}} \exp \left(-{1 \over 2}{(x-\mu)^2 \over \sigma^2

    【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita
  • ofmind.net

    ofmind.net 2020 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • 統計科学のための電子図書システム

    2019年10⽉1⽇ 統計科学のための電子図書システムは 統計数理研究所の機関リポジトリに移行しました。 移行後のページ

  • 文系のための「数の可視化」(7)

    ヒストグラムと箱ヒゲ図は、両方とも分散あるいは標準偏差の状況を 視覚的に解りやすく表現したものである。 ヒストグラムは、全体的な分布の形を視覚化し、 データの偏り方を視覚化する。 一方、箱ヒゲ図は、全体的な分布の範囲を四分位で表し、 データの偏り方を視覚化する。 分散や標準偏差というのは、全体のバラツキの程度を指標化しているだけ。 それに対して、箱ヒゲ図やヒストグラムは、全体のデータの偏り方を観察できる。 また、標準偏差からの乖離の程度を見たり、 あるいは、対応する分布を考えるためにも用いる。 これらは、統計においては、非常に重要なことである。 さて、今回は、この辺りの話には深入りせず、 もう少し、データのバラツキの可視化方法について考えてみる。 「箱ヒゲ図」と「ヒストグラム」の両方の特性を併せ持った可視化方法がある。 ここで紹介する方法は、かなり魅力的。利用価値も高い。 それにも関わらず

    文系のための「数の可視化」(7)
    chess-news
    chess-news 2015/09/18
    ヴァイオリン・プロット(violin plot) ビーンズ・プロット(bean plot) ビースウォーム(beeswarm)