並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 35 件 / 35件

新着順 人気順

統計解析の検索結果1 - 35 件 / 35件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

統計解析に関するエントリは35件あります。 統計データ機械学習 などが関連タグです。 人気エントリには 『旧Twitter社が「バズる」ツイートの法則を徹底的に統計解析して168ページもの資料にした代物、SNSマーケティングやってるプロが全員廃業するレベルの優良資料だった』などがあります。
  • 旧Twitter社が「バズる」ツイートの法則を徹底的に統計解析して168ページもの資料にした代物、SNSマーケティングやってるプロが全員廃業するレベルの優良資料だった

    いぐぞー ✈️ 旅するプログラマー @igz0 旅とプログラミングをこよなく愛します。 アメリカ大陸🇺🇸を横断しました!!小学生からプログラミング→新卒SIer→Webに目覚め個人事業主兼会社員。テレビ出演経験あり。 Webサービスを作りました。AI・VRに没頭中。IT関連中心にツイートします!!アイコンは@ixy先生より利用許諾済み。Amazonアソシエイト。 note.com/igz0/ いぐぞー ✈️ 旅するプログラマー @igz0 Twitter公式が「バズる」ツイートの法則を徹底的に統計解析して168ページの資料にした代物、SNSマーケティングやっているプロが全員廃業するレベルの化け物級の優良資料だった。 ちなみに無料。 SNSで「バズりたい」と思う人は全員これ読めばいいんじゃないかってレベル。 marketing.twitter.com/content/dam/ma… pi

      旧Twitter社が「バズる」ツイートの法則を徹底的に統計解析して168ページもの資料にした代物、SNSマーケティングやってるプロが全員廃業するレベルの優良資料だった
    • Python統計テクニック集 ~Pythonで抗う統計解析~ - Qiita

      これは、Open and Reproducible Science Advent Calendar 2019:13日目の記事です。 記事の目的 統計解析といえばRです。 しかし私のようにPythonだけでなんでもやりたい人もいます。 そんな人に向けて、Pythonで統計解析を行う上で便利なライブラリやテクニックをご紹介します。 同じテーマの記事や書籍も多々ありますが、他ではあまり紹介されていないものを中心にまとめるつもりです。 各ライブラリ・テクニックの詳細についてはなるべく別記事を紹介する方針です。 対象:Pythonを使ったことはあるけれどガチではない人 Jupyter Notebook / Lab 様々な記事で紹介されているド定番ですが、一応ご紹介します。 なぜ私たちはSPSSのようなGUIベースでなく、PythonやRのようなプログラムベースの統計ソフトを使うのか。 それは高価だか

        Python統計テクニック集 ~Pythonで抗う統計解析~ - Qiita
      • 【気象データ】「〇〇年に一度の大雨」の算出 (確率降水量の算出)【統計解析】 - LabCode

        気象庁は観測結果をもとに、各地点について「〇〇年に一度の降水量」を算出し、発表しています。 ある期間内に1回起こると考えられる降水量のことを確率降水量といいます。気象庁の解説ページでは、確率降水量の推定方法が解説されていますので、これに基づいて「〇〇年に一度の大雨」の値を計算してみたいと思います。 大まかには次のような流れになっています。 年最大日降水量のヒストグラムを作成する 分布関数を当てはめる 分布関数の当てはまり具合を確認する 当てはめた分布関数から確率降水量を算出する 今回は、上記3. をとばして、4.の「当てはめた分布関数から確率降水量を算出する」を実際にやってみましょう! 再現年と確率降水量 気象庁の解説ページにもあるように、再現年 $T$ は $$ T = \frac{1}{1 – F(x; \theta)} $$ で与えられます。ここで、$F(x; \theta)$ は確

          【気象データ】「〇〇年に一度の大雨」の算出 (確率降水量の算出)【統計解析】 - LabCode
        • 【ネットワークの統計解析】第8回 事例紹介「Uber における GNN の活用」 - Sansan Tech Blog

          こんにちは. DSOC 研究開発部の黒木裕鷹です. 夏の訪れを感じつつある最近ですが,ランニングをはじめました. 形から入ろうと思い,かっちょいいシューズとウェアを揃えたのですが,なんとか1週間は続いており気分が良いです. まだまだ2, 30分走るだけでバテバテになってしまいますが,いずれは健康大魔神になろうと思っています. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる(統計)解析を気の向くままに紹介しています. 前回の記事では,グラフラプラシアン・グラフフーリエ変換について簡単におさらいしました. あまり理論やモデルの紹介ばかりが続いても面白くないので,今回の記事ではビジネス応用の事例紹介をしたいと思います. 具体的には,Uber における GNN の適用事例を2つほど取り上げることにしました. 私たちの生活にもすっかり浸透した Uber や UberEat

            【ネットワークの統計解析】第8回 事例紹介「Uber における GNN の活用」 - Sansan Tech Blog
          • 【ネットワークの統計解析】第5回 代表的なネットワークのモデルを俯瞰する (3) - Sansan Tech Blog

            こんにちは. Sansan DSOC 研究開発部の黒木裕鷹です. 2回目の緊急事態が宣言され,昇降デスクを買ったりモニターや服を買い足したりしていました. お財布は寂しいですが,在宅戦闘力が高まりなんだか良い気分です. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 前回の記事では,DeepWalkやnode2vecをはじめとするnode embeddingの手法を浅く広く紹介しました. 今回は,ネットワークデータに対する深層学習 (Graph Neural Network; GNN) を俯瞰していきます. 数式は可能な限り使わず,直感的に全体像を把握する助けとなれば良いなと思っています. それではやっていきます. はじめに ノード単位のタスクとグラフ単位のタスク グラフフィルタ spectral-based グラフフィル

              【ネットワークの統計解析】第5回 代表的なネットワークのモデルを俯瞰する (3) - Sansan Tech Blog
            • 【気象データ】「〇〇年に一度の大雨」の算出 (分布関数の当てはめ編)【統計解析】 - LabCode

              はじめに ここ最近、大雨のニュースを見るたびに「〇〇年に一度の大雨」という表現を目にします。これは「千年に一人の美少女」や「百年に一度の逸材」といったレトリックではなく、データに基づいて統計的に算出された根拠のある数字です。 気象庁や自治体では観測結果をもとにこのような量を算出し、発表することで防災に役立てています。このシリーズでは、算出方法を確認し、Pythonを使って、実装・計算してみたいと思います。 なお、ここで紹介する手法は、実際に公的機関が発表しているものとは異なる場合が多分にありますので、十分にご注意ください。 今回は、前回に引き続き、分布関数をヒストグラムに当てはめる方法について紹介したいと思います。 「○○年に一度の大雨」の計算方法とは? 気象庁は観測結果をもとに、各地点について「〇〇年に一度の降水量」を算出し、発表しています。 ある期間内に1回起こると考えられる降水量のこ

                【気象データ】「〇〇年に一度の大雨」の算出 (分布関数の当てはめ編)【統計解析】 - LabCode
              • 【ネットワークの統計解析】第4回 代表的なネットワークのモデルを俯瞰する (2) - Sansan Tech Blog

                こんにちは.そして,あけましておめでとうございます. Sansan DSOC 研究開発部の黒木裕鷹です. 8月下旬からはじめたこの連載も,はやいもので第4回となりました. 結構な文量をそこそこのペースで書いているような気もしますが,仕事もちゃんとしているつもりです(笑) さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 前回の記事では,特に複雑ネットワークを中心として,1980から2000年代に盛んに開発されてきた手法を紹介しました. 今回からはいよいよ,ネットワークデータに対する深層学習 (Graph Neural Network; GNN) やノードの表現学習 (node embedding) を俯瞰していきたいと思います. ただし,少しボリュームが出てしまうのでさらに2回に分け,GNNの大部分は次回記事に回します. そ

                  【ネットワークの統計解析】第4回 代表的なネットワークのモデルを俯瞰する (2) - Sansan Tech Blog
                • Rubyで理解する統計解析の基礎: 1章〜2章 - Journal InTime(2022-10-28)

                  _ Rubyで理解する統計解析の基礎: 1章〜2章 サンプルコードをRubyで書き直しつつPythonで理解する統計解析の基礎を読んでいる。 Python版のサンプルのforkにRuby版のnotebookを追加していく予定だけど、途中でRubyで書き直すのは挫折しそうな気が……。 環境 ruby 3.2.0dev (2022-09-26T05:44:54Z master a8ad22d926) [x86_64-darwin21] iruby-0.7.4 numo-narray-0.9.2.1 numo-gsl-0.1.2 daru-0.3 charty-0.2.12 1章(notebook) numpyの代りにnumo、pandasの代りにdaruを使用してだいたい問題なかった。 ただ、index_col相当の機能がDaru::DataFrame.from_csvにない(多分)せいで、

                  • 統計ソフト JMP で音楽業界の動向を分析してみた。 #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ

                    経験ゼロから統計の世界へ JMP この度、ご縁があって統計ソフト「JMP」(ジャンプ)のマーケティング部門で働くことになりました。どの会社でも、社員が自社の製品や業界を学ぶのは大切なこと。そこで勉強がてら統計初心者の私が、JMPを使って身近なテーマを調べていくことにしました。 迷った末に決めた、今回のテーマは「音楽業界の動向」。音楽CDやストリーミングサービスなど音楽の聴き方はどんどん変わっていますが、売上で見たとき現在の主流と言えるものは何でしょうか。そこを調べてみました。 音楽ストリーミングは多くの人々が利用するサービスへ まずはSpotifyやApple Musicなどの音楽ストリーミングサービスに注目してみます。日本国内では既に10社以上がサービスを提供しており、利用者は近年増加傾向にあります。 しかし、音楽ストリーミングサービスの会員には、お試し期間の「無料会員」と「有料会員」の

                      統計ソフト JMP で音楽業界の動向を分析してみた。 #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ
                    • JMPで作る「モザイク図と分割表」 - 統計解析ソフト JMP ブログ

                      直感的に操作できる統計解析ソフトは、ただ使い勝手が良いだけではありません。ソフト操作のストレスから解放されることで、より深いデータの考察を可能にしてくれます。 「パレート図と円グラフ」の作り方を1ステップずつ確認したのが前回(未見の方はこちら)でしたが、今回は統計解析ソフト「JMP(ジャンプ)」を使って「モザイク図と分割表」にチャレンジしてみましょう。 「JMP(ジャンプ)」なら今回も数ステップで簡単にグラフが作れます。[※分割表は二次元の度数表で、モザイク図はそれをグラフで表したものです。これらは、2つのカテゴリカル変数の関係を調べるときに役立ちます。] JMPを持っていなくても大丈夫です。初めての方も30日間無料のトライアル版で一緒に操作してみましょう。統計解析ソフトは操作が難しいと思っている方はぜひJMPを使ってみてください。 ■ セットアップ JMPを起動します(インストールがまだ

                        JMPで作る「モザイク図と分割表」 - 統計解析ソフト JMP ブログ
                      • 「沖縄県疫学統計・解析委員会資料」を専門家が検証 |

                        「沖縄県疫学統計・解析委員会資料:解説および資料」(令和3年7月12~25日)を、徳田安春( 群星沖縄臨床研修センター)、渋谷健司(相馬市新型コロナウイルスワクチン接種メディカルセンター)、河村雅美(The Informed-Public Project)で検証し、意見書として発表しました。 疫学・統計学的分析は、新型コロナウイルス感染の動向を把握し適切な対応を取るためにも、また、その効果のモニタリングと評価を行うためにも、最も重要な基本的情報です。ゆえに、使用データや分析においては、科学的検証に耐えるだけの妥当性や透明性が担保されることも重要です。 しかし、沖縄県疫学統計・解析委員会の資料は、疫学・統計学的推論が不適切な解釈をしている例がみられたため、専門家が問題を具体的に検証しました。 検証の結果として以下のことがわかりました。 1)県の疫学・統計学的分析は、疫学・統計学的推論が全くな

                          「沖縄県疫学統計・解析委員会資料」を専門家が検証 |
                        • 【ネットワークの統計解析】第1回 ネットワークデータと標本調査(1) - Sansan Tech Blog

                          こんにちは. Sansan DSOC 研究開発部の黒木です.今年の春に新卒社員として入社しました. 専門は統計解析で,特に時系列データやネットワークデータの分析を行ってきました.最近では,タイピングゲーム「寿司打」のやりすぎで左手中指の第2関節が少し痛みます. こちらの連載では,自分の勉強・復習も兼ねて,古典的な手法からより発展的な話題まで,ネットワークデータにまつわる統計解析を紹介していこうと思います. ネットワークとは,主体となるノード,それらのつながりであるエッジから構成される対象で,webページの巨大な集合であるWWW (World Wide Web) やSNSにおける人のつながり,交通網,食物連鎖のネットワークなど,その例は多岐に渡ります. 近年の機械学習やデータサイエンスの盛り上がりとともに,このようなネットワークデータからも有益な知見を得たいという欲求が高まっています.そんな

                            【ネットワークの統計解析】第1回 ネットワークデータと標本調査(1) - Sansan Tech Blog
                          • JMPで描く「ランチャート(折れ線グラフ)」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ

                            統計解析ソフト「JMP(ジャンプ)」は、簡単な操作で、分かりやすいグラフを素早く作成することができます。その結果、多くの時間をデータのより深い考察に充てることができます。 前回は「散布図」の作り方を確認しましたが、今回はJMPで「ランチャート(折れ線グラフ)」を作ってみましょう。 [※ランチャートとは、時系列に沿って、データの変化を分析する折れ線グラフです。] 今回も数ステップで簡単にグラフが作れます。さっそく試してみましょう! ■セットアップ JMPを起動します(まだインストールしていない方は下からダウンロードしてください)。 www.jmp.com ■ランチャート 1.対象データを開きます(今回はサンプルデータを使用します) 「ヘルプ」>「サンプルデータライブラリ」と進み、「Time Series」>「GNP.jmp」を選択します。 2.メニューから「グラフ」>「グラフビルダー」を選択

                              JMPで描く「ランチャート(折れ線グラフ)」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ
                            • ラグビーワールドカップ2019:選手の体格は、ゲームのパフォーマンスと関連したのか?【後編】 - 統計解析ソフト JMP ブログ

                              Photo by Edgar Pimenta on Unsplash その2:身長、体重とセットプレイ(スクラム、ラインアウト)成功率の関係 ポイント:この記事では、ある対象に絞ってデータ分析することで、興味深い結果が得られた例を示します。 前回の記事では、今回日本で開催されたラグビーワールドカップでトップ8に残った国(チーム)の選手に対し、身長と体重の関係をフォワード(FW)、バックス(BK)別に比較してみました。 今回の記事では、選手の身長や体重と、ゲームでのスクラムやラインアウトといったセットプレイとの間に関連があったかどうかを考察してみます。 日本が南アフリカに敗れた一因に、日本ボールのラインアウトで、南アフリカに多くのインターセプト(奪取)を与えてしまったことが挙げられると思います。この試合の南アメリカのラインアウト成功率は100%に対し、日本のラインアウト成功率は61.5%であ

                                ラグビーワールドカップ2019:選手の体格は、ゲームのパフォーマンスと関連したのか?【後編】 - 統計解析ソフト JMP ブログ
                              • 無料で学ぶRと統計解析:おすすめのウェブサイト - Qiita

                                Rに出会って、早5年(2023年現在)。これまでに出会った、無料で、RやRを使った統計解析を学ぶことができるウェブサイトのメモです。ブックマークしているもの、Xでツイート、リツイートしてきたものを公開します。 随時更新して追加していきます。他にもあればコメント欄にお願いします。 (英語の記事多い!) Rで統計解析 UCLA Statistical Methods and Data Analytics 【英語】コーディング方法など細かい事例が豊富です。 An Introduction to Bayesian Data Analysis for Cognitive Science 【英語】ベイズに特化しています。 New statistics for design researchers A Bayesian workflow in tidy R 【英語】ベイズに関する分析法がまとめてあります

                                  無料で学ぶRと統計解析:おすすめのウェブサイト - Qiita
                                • ラグビーワールドカップ 2019:選手の体格はパフォーマンスに影響を与えたのか? - 統計解析ソフト JMP ブログ

                                  増川 直裕 Photo by Edgar Pimenta on Unsplash その1: 選手の身長と体重の関連性を考察してみる 「ラグビーワールドカップ2019」は、南アメリカの優勝で幕を閉じました。ご存知の通り、日本は南アフリカに敗れはしましたがトップ8進出を果たし、日本で開催したこともあり、にわかファンも巻き込んで日本中が大熱狂しました。私自身も、今回のワールドカップ以前は、たまにテレビをつけてラグビー中継をやっていれば何となく見る程度でしたが、今回のワールドカップでラグビーの面白さを再認識し、日本戦のすべての試合、他の国々のいくつかの試合をテレビで観戦しました。 いろいろな試合を見ていると、小柄な選手、大柄な選手、非常に背が高い選手とさまざまな体格の選手がいるなあと感じました。ラグビーには様々なポジションがあり、ポジションごとに主な役割が異なってきますので、当たり前かもしれません

                                    ラグビーワールドカップ 2019:選手の体格はパフォーマンスに影響を与えたのか? - 統計解析ソフト JMP ブログ
                                  • 【気象データ】「〇〇年に一度の大雨」の算出 (当てはめる分布関数の解説編)【統計解析】 - LabCode

                                    「○○年に一度の大雨」の計算方法とは 気象庁は観測結果をもとに、各地点について「〇〇年に一度の降水量」を算出し、発表しています。 ある期間内に1回起こると考えられる降水量のことを確率降水量といいます。気象庁の解説ページでは、確率降水量の推定方法が解説されていますので、これに基づいて「〇〇年に一度の大雨」の値を計算してみたいと思います。 大まかには次のような流れになっています。 年最大日降水量のヒストグラムを作成する 分布関数を当てはめる 分布関数の当てはまり具合を確認する 当てはめた分布関数から確率降水量を算出する 今回は、上記2. の「分布関数を当てはめる」の準備として、当てはめに用いられる分布関数を確認しておきましょう。 当てはめる分布関数の種類 気象庁の解説ページにあるように、当てはめに用いられる分布関数は次の5種類です。 グンベル分布 一般化極値 (GEV) 分布 平方根指数型最大

                                      【気象データ】「〇〇年に一度の大雨」の算出 (当てはめる分布関数の解説編)【統計解析】 - LabCode
                                    • JMPで作る「箱ひげ図」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ

                                      JMPは一般的な表計算ソフトウェアなどと比べて、操作が簡単で素早く、分かりやすいグラフを作成することができます。その結果、多くの時間をより深いデータの考察に充てることができます。 さて、グラフ作成の前回は「ヒストグラム」の作り方を確認しました。 jmp-japan.hatenablog.com 今回は統計解析ソフト「JMP(ジャンプ)」で「箱ひげ図」にチャレンジします。 [※箱ひげ図は、データの分布を「箱」と「ひげ」で表したグラフで、データがどのあたりの値に集中しているかをひと目で捉えることができます。] 今回もわずか数ステップで簡単にグラフが作れます。まずは試してみましょう! ■セットアップ JMPを起動します(インストールがまだの方はトライアル版をダウンロードしてください)。 www.jmp.com ■箱ひげ図 ‒ 一変量 1.対象データを開きます(今回はサンプルデータを使用します)

                                        JMPで作る「箱ひげ図」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ
                                      • 統計解析向けのプログラミング言語「R」の実装に欠陥、任意コード実行のおそれ/JVNが注意喚起

                                          統計解析向けのプログラミング言語「R」の実装に欠陥、任意コード実行のおそれ/JVNが注意喚起
                                        • 【気象データ】「〇〇年に一度の大雨」の算出 (データ取得・ヒストグラム作成編)【統計解析】 - LabCode

                                          「○○年に一度の大雨」の計算方法とは? 気象庁は観測結果をもとに、各地点について「〇〇年に一度の降水量」を算出し、発表しています。 ある期間内に1回起こると考えられる降水量のことを確率降水量といいます。気象庁の解説ページでは、確率降水量の推定方法が解説されていますので、これに基づいて「〇〇年に一度の大雨」の値を計算してみたいと思います。 大まかには次のような流れになっています。 年最大日降水量のヒストグラムを作成する 分布関数を当てはめる 分布関数の当てはまり具合を確認する 当てはめた分布関数から確率降水量を算出する 今回は、年日最大降水量 (各年について、24時間に降った雨の最大値のデータ) を取得し、様々なプロットを通してデータを把握したいと思います (「1. 年最大日降水量のヒストグラムを作成する」まで)。 0. データを取得する 今回使用する年最大日降水量は、気象庁の過去の気象デー

                                            【気象データ】「〇〇年に一度の大雨」の算出 (データ取得・ヒストグラム作成編)【統計解析】 - LabCode
                                          • 統計解析向けプログラミング言語Rの新たなメジャーバージョン「R 4.0」リリース | OSDN Magazine

                                            Revoluton Analytics(米Microsoft傘下)のR言語開発チームは4月24日、統計解析向けプログラミング言語「R 4.0.0」(開発コード「Arbor Day」)を公開した。 Rは統計解析向けプログラミング言語。Revoluton Analyticsがオープンソースで開発を行っており、2015年に米Microsoftが同社を買収したことによりMicrosoft傘下のプロジェクトとなった。R 1.0.0が公開されたのは2000年2月、プロジェクトは今年20周年を迎えた。 R 4.0は、2013年4月のバージョン3.0に続くメジャーリリースとなる。新機能として、文字列を定義するための新たな文法が新たに加わった。C++で使われているものに似た文法で、バックスラッシュやクォート、ダブルクォートなどを含む文字列を表現する際に便利だという。 また、文字列をfactor型に自動変換す

                                              統計解析向けプログラミング言語Rの新たなメジャーバージョン「R 4.0」リリース | OSDN Magazine
                                            • StataとRの比較ツイートから見える社会科学研究者の統計解析ソフトウェア選択事情

                                              StataとRは、医療統計や社会科学でよく使われている統計解析ソフトウェアだ。ユーザー層が被った代替的な選択肢である。Rの方が歴史は数年古いが、Stataの方が研究や教育での普及が早かった。これらの分野のユーザー数は、今でもStataの方が多いであろう。しかし、近年、ライセンス料の問題なのかStataをRで代替するようになってきており、両者を比較した言及を時折見かける。 1. プログラマ視点から見るとRの圧勝 プログラミング言語としてのStataは柔軟性の低い旧世代のマクロ言語といった趣で、オブジェクト指向関数型言語にシンタックスシュガーを被せたSのクローンであるRの方が洗練されている。Stataは最近のバージョンまで同時に複数データファイルをメモリに保持できなかったなど「無いわ~」と言いたくなることが*1。データ操作やグラフィックスもRの人気パッケージ*2を使うと、かなりRに分がある。し

                                                StataとRの比較ツイートから見える社会科学研究者の統計解析ソフトウェア選択事情
                                              • プログラミング素人が R で統計解析できるようになるまでの全行程 - Xtra etc

                                                プログラミングについてはまだまだ全くの素人ですので, 偉そうなことは言えませんが, プログラミング素人 = つまり私が, R で統計解析できるようになるまでの行程を, 順番に書いて・記録してみたいと思います. 【目次】 統計学をどこで学んだか R をどこで知ったか・使い始めたか 卒論で R でのデータ解析のために参考にした本 まず, R で統計解析, て, どの程度のことをしているのかと言うと, 現在 (2019年 1 月), 農学部 (分野は園芸学です) の 4 年生で, 卒論の統計解析を R でしてみようと思い立ち, 結果, すべて R で行いました. ちなみに R 以外のプログラミング言語を, ちゃんと何かの役に立つレベルで使ったことはありません. つまり, プログラミングについては全くの素人です. 本記事では, プログラミング素人のわたしが, どのようにして卒論の統計解析を R で

                                                  プログラミング素人が R で統計解析できるようになるまでの全行程 - Xtra etc
                                                • JMPで作る「散布図」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ

                                                  「データ分析の必要性を感じていても、どこから始めれば良いのか分からない」という方を対象に、さまざまなグラフの作成法をご紹介しているこのシリーズ。 今回は「散布図」の描き方です。 [※散布図(分布図)は、縦軸と横軸にそれぞれ別の量や大きさ等をとり、データが当てはまるところを点でプロットしたもので、2つの量の関係性を見るのに優れたグラフです。] 利用可能なデータが社内に存在するのに、それを十分に活用できていないのはもったいないですよね。いくつかのグラフの作成法を知っていれば、状況に応じた適切なデータ分析が可能になります。今回も一緒に頑張りましょう! ■ セットアップ JMPを起動します(インストールがまだの方は下からダウンロードしてください)。 ■散布図(2つの変数) 1、対象データを開きます(今回はサンプルデータを使用します) 「ヘルプ」>「サンプルデータライブラリ」と進み、「Car Phy

                                                    JMPで作る「散布図」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ
                                                  • JMPで作る「ヒストグラム、記述統計量、幹葉図」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ

                                                    データ分析や統計解析をビジネスに活用し、データからより深い洞察を得ようとする方がここ数年増えてきている印象です。しかし、実際には分析に際してプログラミングが必要なソフトもあり、実務で気軽にデータ分析を行うのはハードルが高いと思っている方も多いでしょう。直感的に操作できて、もっと多くの時間をより深い理解と洞察のために割けるソフトがあれば、使ってみたくないですか? 「モザイク図と分割表」の作り方を確認したのが前回でしたが、今回は統計解析ソフト「JMP(ジャンプ)」で「ヒストグラム、記述統計量、幹葉図」にチャレンジしてみましょう ※ヒストグラムは、縦軸に度数、横軸に階級をとった統計グラフの一種で、データの分布状況を視覚的に認識するために主に統計学や数学、画像処理等で用いられています。幹葉図(みきはず)は、「幹」とよばれる左側のけた(今回はテストの点数の十の位)と、「葉」とよばれる右側のけた(今回

                                                      JMPで作る「ヒストグラム、記述統計量、幹葉図」#統計ソフト #データ分析 #データサイエンス - 統計解析ソフト JMP ブログ
                                                    • 令和婚を可視化、予測してみる - 統計解析ソフト JMP ブログ

                                                      今年話題になった「令和婚」。今回は統計解析ソフト「JMP」で、近年の婚姻件数を可視化し、年や月ごとの傾向を見ていきます。 皆さん、令和婚は婚姻件数にどれくらいのインパクトを与えたと思いますか? さらに「時系列分析」で、将来の婚姻件数まで予測してみましょう。 婚姻件数は減少傾向 婚姻件数が多い月は? 時系列分析による2019年の異常傾向を確認してみる 2020年の婚姻件数の予測 今年も終わりに近づいて来ました。5月に元号が平成から令和になり、その時は「新たな時代の幕開けだな」と感じましたが、正直なところ今はその実感が薄れ、個人的には10月に実施された消費税増税のインパクトの方が強かった印象です。 令和に関連する事項として、元号が令和に変わるタイミングで結婚をする「令和婚」が話題になりました。ワイドショーやメディアで取り上げられた「令和婚」、しかし、「令和婚」によって今年結婚した人は本当に増え

                                                        令和婚を可視化、予測してみる - 統計解析ソフト JMP ブログ
                                                      • 旧Twitter社が「バズる」ツイートの法則を徹底的に統計解析して168ページもの資料にした代物、SNSマーケティングやってるプロが全員廃業するレベルの優良資料だった (2ページ目)

                                                        いぐぞー ✈️ 旅するプログラマー @igz0 Twitter公式が「バズる」ツイートの法則を徹底的に統計解析して168ページの資料にした代物、SNSマーケティングやっているプロが全員廃業するレベルの化け物級の優良資料だった。 ちなみに無料。 SNSで「バズりたい」と思う人は全員これ読めばいいんじゃないかってレベル。 marketing.twitter.com/content/dam/ma… pic.twitter.com/8DHDzY6UEr 2024-02-12 16:15:18

                                                          旧Twitter社が「バズる」ツイートの法則を徹底的に統計解析して168ページもの資料にした代物、SNSマーケティングやってるプロが全員廃業するレベルの優良資料だった (2ページ目)
                                                        • 統計解析ソフト JMPで作る「パレート図&円グラフ」データ分析の初心者向けです! - 統計解析ソフト JMP ブログ

                                                          前回は「度数の棒グラフ」の作り方を見ました(未見の方はこちら)。 今回は「パレート図と円グラフ」にチャレンジしてみましょう。統計解析ソフト「JMP(ジャンプ)」なら数ステップで簡単に作れます。 [※パレート図は値が降順にプロットされた棒グラフと、その累積構成比を表す折れ線グラフを組み合わせた複合グラフです。品質管理などで重要な項目が何かを調べる時などによく使われています。] JMPを持っていなくても大丈夫です。初めての方も30日間無料のトライアル版で一緒に操作してみましょう。統計解析ソフトは操作が難しいと思っている方、ぜひJMPを使ってみてください。 www.jmp.com ■ セットアップ JMPを起動します(インストールがまだの方は上のリンクからダウンロードしてください)。 ■ パレート図の作り方 対象データを開く(今回はサンプルデータを使います。) 「ヘルプ」>「サンプルデータライブ

                                                          • 決定係数 R2の違い: Excel, OpenOffice, LibreOffice および統計解析ソフト R を用いて

                                                            この表から,以下のことが容易に分かる。 Excel の決定係数はマイナス Excel の Linest 関数と統計ソフト R では,同じ決定係数 Calc の決定係数は,相関係数の 2 乗 それでは, Excel のグラフと Linest 関数,および統計ソフト R の決定係数は,どのように算出されるのだろうか? それを明らかにするためには,まず回帰分散分析として,y 観測値を,以下のような3種類の変動として捉えてみることが必要になる。 回帰変動(回帰平方和, RSS, Regression Sum of Squares) 残差変動(残差平方和, SSR,Sum of Squared Residuals) 全変動(全平方和, TSS,Total Sum of Squares) 全変動は回帰変動と残差変動の和になる。 TSS = RSS + SSR この中で,特に SSR と TSS に焦点

                                                            • 「沖縄県疫学統計・解析委員会資料:解説および資料」 (令和3年7⽉ 12〜25 ⽇)の検証

                                                              • 機械学習のためのカーネルの数理: 2020年度「統計解析」(学部)「統計解析II」(大学院) – Joe Suzuki (鈴木譲) 公式ブログ

                                                                2020年度春夏学期月曜3限「統計解析」(学部)「統計解析II」(大学院)@基礎工B104 は、機械学習のためのカーネルに関しての講義を行います。今回も単元ごとの復習ビデオを提供する他、書籍出版(機械学習の数理100問シリーズ)の準備として、ビデオ、問題、解説を逐次公開していきます。フィードバック情報をいただき、書籍に反映していければと考えています。 正定値カーネルの理論多変量解析への応用サポートベクトルマシンへの応用ヒルベルト空間再生核ヒルベルト空間リッジ回帰、平滑化スプライン、加法モデルへの応用関数の複雑さと汎化の理論、ラデマッハ複雑度HSIC(1) 平均の概念の導入HSIC(2) 独立性検定グラフィカルモデルの学習への応用ガウス過程(1) 定義と性質ガウス過程(2) ガウス過程の計算とスパース近似ガウス過程の応用ベイズ深層学習 参考図書 赤穂昭太郎: カーネル多変量解析 (2008)

                                                                • 祝!藤井聡太新棋聖 持ち時間が長い方が強いってホント? - 統計解析ソフト JMP ブログ

                                                                  藤井棋聖は、将棋では不利とされる後手番が非常に多いにも関わらず、高い勝率を残していることを前回の記事で書きました。 jmp-japan.hatenablog.com 今回の記事では、持ち時間と勝率の関係を調べてみます。 持ち時間と勝率の関係 将棋では、棋戦ごとに持ち時間が決められています。例えば棋聖獲得後に菅井八段に勝利した将棋日本シリーズ(予選)は持ち時間10分の早指し戦ですし、棋聖戦(本戦以降)は4時間、現在タイトル挑戦中である王位戦(タイトル戦)は2日制の合計8時間です。棋戦ごとに持ち時間が異なるので棋士は柔軟な対応を求められます。 最近の藤井棋聖の将棋は、中盤長考するケースが良く見られ、持ち時間をフルに使う将棋を指されています。一方、非公式の早指し戦で2回連続して優勝するといった早指しの能力にも定評があります。 以下は、藤井棋聖が2020年7月18日までに対戦した公式戦(218試合

                                                                    祝!藤井聡太新棋聖 持ち時間が長い方が強いってホント? - 統計解析ソフト JMP ブログ
                                                                  • 統計解析ソフト JMP によって、プロ野球のホームゲームにおける応援の効果を検証。 - 統計解析ソフト JMP ブログ

                                                                    今年(2020年)はコロナウィルスの影響で、軒並みスポーツの試合が中止、または延期されましたが、その中で、5月に一足早く開幕したドイツのサッカーリーグでは、ホームチームの勝率が異常に低くなっていることがニュース等で話題になりました。 本来、サッカーであれば熱狂的なホームチームのサポーターが勝利を後押しするという構図が思い浮かびますが、この時は無観客試合になっているためホームチームの勝率が低くなっているのではないかと言われていました。 多くのチームスポーツで、ホームチームにアドバンテージがあることが言われていますが、単にサポーターの応援だけがアドバンテージの要因となっているわけではないと思います。地元で戦えるのでアウェイチームに比べて移動の負担が少ないことや、ホームチームに有利と考えられる試合のルールなど応援だけでないさまざまな要因が絡んでくるはずです。 プロ野球におけるホームチームの「勝率

                                                                      統計解析ソフト JMP によって、プロ野球のホームゲームにおける応援の効果を検証。 - 統計解析ソフト JMP ブログ
                                                                    • 祝!藤井聡太新棋聖 驚くべき勝率に隠された不利な状況をデータで読み解く - 統計解析ソフト JMP ブログ

                                                                      2020年7月16日、ついに藤井棋聖が誕生しました。私はあまり将棋が強くありませんが、明るいニュースがない昨今、棋聖戦の挑戦権獲得の前からどうなるか注目していました。 藤井棋聖になるまでの道のりで、多くの対戦がなされていますが、実は相当不利な状況で多くの勝ち星を挙げているのです。今回はそこをデータで考察してみましょう。 公式戦の勝敗 まずは、藤井棋聖の、2016年度のデビューから棋聖獲得までに戦った公式戦の勝敗をまとめてみます。 183勝34敗で、勝率84.3%と堂々たる成績です。プロ棋士では、たとえ1年間の成績でも80%以上の勝率を残すのは非常に難しいと言われています。 先手、後手の割合 今度は、公式戦の先手(番)と後手(番)の割合を同様にまとめてみます。 一般に将棋では、後手は先手に比べ若干不利だと言われています。棋士の先手後手は振り駒(歩を振り放ってランダムに決める方法)や、対局ごと

                                                                        祝!藤井聡太新棋聖 驚くべき勝率に隠された不利な状況をデータで読み解く - 統計解析ソフト JMP ブログ
                                                                      • 【ネットワークの統計解析】第6回 論文紹介1「GCNを用いたフェイクニュースの検知」 - Sansan Tech Blog

                                                                        こんにちは. Sansan DSOC 研究開発部の黒木裕鷹です.先月も,今月も,また服を買ってしまいました. 出かける先はコンビニぐらいしかないのですが,おしゃれをすると心が躍り,陳列商品も不思議とキラキラして見えますね. さて,この連載では,自分の勉強・復習も兼ねて,ネットワークデータにまつわる統計解析を気の向くままに紹介しています. 前回の記事では,ネットワークデータに対する深層学習 (Graph Neural Network; GNN) を俯瞰し,直感的に全体像を把握するような導入をしました. 今回の記事では,番外編的に分析手法の紹介を少し離れ,グラフデータの分析を実際に応用する論文を1つ紹介したい思います. buildersbox.corp-sansan.com はじめに 論文のポイント 対象データ 作成したいネットワーク データ収集 ネットワークの作成 ノードに付随する特徴量 モ

                                                                          【ネットワークの統計解析】第6回 論文紹介1「GCNを用いたフェイクニュースの検知」 - Sansan Tech Blog
                                                                        1

                                                                        新着記事