[B! stats] teddy-gのブックマーク

teddy-g id:teddy-g

statsに関するteddy-gのブックマーク (22)

Cybersecurity Supply And Demand Heat Map
teddy-g 2024/06/01
セキュリティ関連職のオープンポジションとかの統計をインタラクティブなヒートマップで調べることができる。便利。

cybersecurity

statistics

stats

biz
リンク
因子分析をExcelで理解する - Qiita
主成分分析とは似て非なる手法として「因子分析」(Factor Analysis) があります。主成分分析(PCA)では、説明変数に対して重み行列（固有ベクトル）a を線形結合した「主成分」 yPC1を合成しました。ここで、主成分は、説明変数と同じ数だけ定義します。 yPC1 = a1,1 x1 + a1,2 x2 + a1,3 x3 + a1,4 x4 + a1,5 + ... 因子分析では、説明変数（観測変数）x が「因子」(factor) という潜在変数から合成されるという考え方に基づき、その因子得点 f と重み行列（因子負荷） w 、そして独自因子 e を特定します（主成分分析に独自因子という考え方はありません）。 x1 = w1,1 f1 + w1,2 f2 + e1 x2 = w2,1 f1 + w2,2 f2 + e2 x3 = w3,1 f1 + w3,2 f2 + e3
teddy-g 2023/10/14
因子分析をEXCELでやる方法…なんだけど、この通り進めていくと途中で手詰まりになる。おとなしくRかPython使った方が早い。

datascience

analysis

data

excel

math

statistics

stats
リンク
Ransomware Posts
teddy-g 2023/08/24
RansomWatchのデータを2020年から収集している。

cybersecurity

cyberattacks

ransomware

malware

threatactors

threats

statistics

stats

biz
リンク
(Python編) 時系列データをサクッとSTLでトレンド・季節性に分解
幸か不幸か、ビジネス系のデータの多くは時系列データです。売上データもホームーページのアクセスログもセンサーデータも時系列データです。時系列データを手にしたとき、どのようなデータなのか見てみたい、ということは多々あります。多くの場合、折れ線グラフを描き傾向を掴む、ということをやります。折れ線グラフを眺めると、トレンド（上昇傾向や下降傾向）や季節性などが見て取れるケースがあります。そこで、サクッとトレンドや季節性などを掴む手法がSTL分解（Seasonal Decomposition Of Time Series By Loess）です。 STL分解（Seasonal Decomposition Of Time Series By Loess）を実施することで、元データをトレンド、季節性、残差に分解することができます。元データ　＝　トレンド　＋　季節性　＋　残差 STL分解（Seas
teddy-g 2023/06/20
STL分解すれば時系列のトレンドをざっくり捉えることができる。ビジネスデータの場合、Seasonal Factorは12ヶ月と思っておけば大体OK。

python

data

analysis

bigdata

statistics

stats

timeseries

pandas

matplotlib
リンク
25+ Crucial Average Cost Per Hire Facts [2023]: All Cost Of Hiring Statistics - Zippia
teddy-g 2022/09/13
米国の採用コストは通常の従業員で$5,000、エグゼクティブだと$15,000。そして小規模企業の方が教育コストがかかる。

US

biz

statistics

stats
リンク
Cyber Security Market Size, Share & Growth | Forecast, [2030]
teddy-g 2022/02/28
セキュリティの世界市場統計。MSSPだけではなくすべてが対象。備忘。

marketing

market

statistics

stats

cybsersecurity

MSSP
リンク
Managed Security Services Market Size - Growth & Trends
teddy-g 2022/02/28
Managed Security Servicesの市場統計。備忘。

marketing

market

statistics

stats

cybersecurity

MSSP
リンク
Managed Security Services (MSS) Market : US, Canada, China, Germany, UK - Size and Forecast 2023-2027
teddy-g 2022/02/28
Managed Security Servicesの市場統計。備忘。

marketing

market

statistics

stats

cybersecurity

MSSP
リンク
COVID-19 Impact & Recovery Analysis - Managed Security Services Market 2020-2024 | Increase in Adoption of Cloud-based Services to Boost Growth | Technavio
teddy-g 2022/02/28
Managed Security Servicesの市場統計。備忘。

market

stats

statistics

marketing

cybersecurity

MSSP
リンク
大企業･中小企業の定義と企業数、従業者数 | 転職グッド｜転職前に必ず見ておきたい情報サイト
転職にあたって、「大企業以外考えていない」「中小企業に入って一緒に成長したい」などのように、企業の規模を表すものとしてよく用いられます。実は日本国内の就業者数の約3分の2は中小企業が雇用しており、国には「中小企業庁」という中小企業の育成、発展に関する事務などを所掌する専門の省庁を設置しているくらい、その動向はとても重要なものなのです。今回は大企業と中小企業の違い、その定義と企業数、従業者数についてわかりやすく解説いたします。まず最初にどういう場合に大企業と呼び、どういう場合に中小企業と呼ぶのか、その定義についてご説明いたします。中小企業の定義は、中小企業基本法において定められており製造業の場合、資本金3億円以下または従業者数300人以下卸売業の場合、資本金1億円以下または従業者数100人以下小売業の場合、資本金5千万円以下または従業者数50人以下サービス業の場合、資
teddy-g 2021/08/19
日本の大企業・中堅企業・中小企業の数と従業員数が説明されてるページ。元ネタの経済センサス調べる手間が省ける。ざっくり言うと平均従業員数は大企業1,300人、中堅企業40人、小企業3人。

biz

statistics

stats
リンク
Cyberpunk Style with Matplotlib
teddy-g 2020/10/21
Matplotlibを使って黒背景・ネオン効果ありのクールなグラフを作る方法。小ネタ。

python

matplotlib

statistics

stats

graph

data

datascience
リンク
Pandasでピボットテーブルを手軽に作成するpivot_table関数の使い方
pivot_table関数 APIドキュメント params: returns: ピボットテーブルを作成する複数要素を元に多層化させるデータの個数をカウントする列ごとと行ごとの合計を表示複数の統計量を表示させる関数を使って統計処理を指定する欠損値を補完欠損値があるデータも表示させるまとめ参考ピボットテーブルとはエクセルで有名な機能の1つで馴染みの方も多いかもしれません。複雑なデータ構造を一目で分かりやすくする目的でよく使われるもので、クロス集計したものをまとめたものとなります。 2つの要素間の相関が分かりやすく現れるので使いこなせると重宝するでしょう。例えば男女間での科目ごとの平均点といったものをひと目で把握することができます。 Pandasでも手軽にピボットテーブルを作成できるpivot_table関数が実装されています。そこで本記事ではpivot_table関数
teddy-g 2020/08/17
PandasでEXCELのピボットと同じことができる。インデックスがmulti-indexになるのでその辺の値の操作は注意する必要がある。関数を柔軟に適用できるのでEXCELより凝った集計・統計を作りたいときは便利。

python

data

datascience

statistics

stats

tips

pandas
リンク
図録▽新聞・雑誌に対する国民の信頼度（国際比較）
日本では、新聞・雑誌に対する国民の信頼度が高く、その分、新聞・雑誌などマスコミの影響力は大きい。この点を、すでに、図録5215で見ているが、ここでは、対象国を増やし、また政府に対する信頼度との相対関係についても分析した。 2017～20年に実施された2017年期の世界価値観調査によると、新聞・雑誌（英語ではThe Press、プレス）を「非常に信頼」、及び「やや信頼」している国民は、日本の場合、69.3％にのぼっており、図に掲げた78か国中、ベトナム（79.3％）、フィリピン（71.2％）、バングラデシュ（71.1％）に次ぐ世界第4位の高さとなっており、第5位の中国（68.2％）を上回っている。日本の信頼度は、先進国の中では断然1位であり、2位のポルトガル（50.4％）、3位の韓国（49.6％）を大きく凌駕している。世界全体を見渡すと、途上国と儒教圏で新聞・雑誌に対する信頼度は高く、欧
teddy-g 2019/09/07
2005年のデータなので古いけど、日本の新聞・雑誌に対する国民の信頼度が高いという話。

global

statistics

stats
リンク
PCA prcomp: how to get PC1 to PC3 graph
teddy-g 2017/03/17
こうするとPC3以降も軸にできるっていうんだけどggbiplotがうまく動かない。

R

statistics

stats

machine learning

machinelearning

pca
リンク
Plotting PCA (Principal Component Analysis)
This document explains PCA, clustering, LFDA and MDS related plotting using {ggplot2} and {ggfortify}. {ggfortify} let {ggplot2} know how to interpret PCA objects. After loading {ggfortify}, you can use ggplot2::autoplot function for stats::prcomp and stats::princomp objects. library(ggfortify) df <- iris[1:4] pca_res <- prcomp(df, scale. = TRUE) autoplot(pca_res) PCA result should only contains n
teddy-g 2017/03/17
ggplot2とggfortifyでPCAとかグラフ。

R

statistics

stats

machine learning

machinelearning

pca
リンク
RPubs - Plotting PCA/clustering results using ggplot2 and ggfortify
Hide Comments (–) Share Hide Toolbars
teddy-g 2017/03/17
Rのggplot2を用いてPCA書いたりクラスタリングしたり。PC3以降を軸にしたいんだが。

R

statistics

stats

machinelearning

machine learning

pca
リンク
判別分析（マハラノビス）
トップページ→研究分野と周辺→システムの評価→ 例えば二次元で考えると、x軸y軸平面に多数の点が散らばり、これが幾つかのグループに分かれているとする。判別分析では、新たな点が与えられたとき、どのグループに属するかを判別する。判別分析には、幾つかの方法があり、「サポートベクターマシン（SVM）」のように区分する線を引く方法もある。ここでは、マハラノビス距離を用いた判別分析について述べる。マハラノビス距離最も一般的に使われる距離はユークリッド距離である。一次元（例えばx軸上）では、x座標の差がそのまま距離となる。例えば二つのグループがあるとき、新たな点が与えられてどちらのグループに属するかを判別する際、新たな点のx座標と双方のグループの中心とのユークリッド距離を測り、短い方に属すると考える事も出来る。しかし、この方法では、以下のような場合に問題となる。青い点と赤い点の二つのグルー
teddy-g 2017/01/11
[unsupervisedlearning]マハラノビス距離に関し、２変数の場合が丁寧に説明してある。

bigdata

data

analysis

analytics

statistics

stats

math

anomalydetection
リンク
エクセルにてmmultとtranspose関数を併用したいです。 - =MMULT(MMULT(I12:M12,I14:M... - Yahoo!知恵袋
エクセルにてmmultとtranspose関数を併用したいです。 =MMULT(MMULT(I12:M12,I14:M18),TRANSPOSE(I12:M12))^0.5 という式を入力すると＃VALUE!とエラーが表示されます。 Transposeの部分をG14:G18のように縦で指定すれば動くのですが、ソルバーとの関係でTransposeで指定したいです。なぜエラーになるのでしょうか？どう変更すればよいでしょうか？
teddy-g 2017/01/04
1MMULTとTRANSPOSEじゃなくてSUMPRODUCT使えというBA以外の回答見ておお！そんな関数あったわ！となった。2変数でマハラノビス距離試しに計算しようとしてはまってたところなので、備忘まで。

excel

statistics

stats
リンク
尤度の解説
このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。
teddy-g 2017/01/03
ある観測データの下での仮説の確からしさが尤度。H0とH1の尤度の比がロッド値で、どっちが確からしいかを見るのに使う。

statistics

stats

math

bayes

bayesiannetwork

data

analysis

analytics

bigdata
リンク
【統計学】正規分布とカイ二乗分布の関係を可視化してみる。 - Qiita
統計学、可視化してみるシリーズの続編です。カイ二乗分布は、ABテストのカイ二乗検定等でよく使う分布です。$\chi^2$と書いてカイ二乗です。グラフにすると下記のような形で、自由度と呼ばれるkの値に応じて形が変化します。 (グラフ描画のコードはこちら) 今回もWikipedia先生にカイ二乗分布の定義を聞いてみると、独立に標準正規分布に従う $k$ 個の確率変数 $X_1, ..., X_k$ をとる。このとき、統計量$$Z = \sum_{i = 1}^k X_i^2$$の従う分布のことを自由度 $k$ のカイ二乗分布と呼ぶ。という返事が返ってきました。うーん、どういうこと？正規分布の密度関数を２乗するの？どうやら違うようです。まず、「独立に標準正規分布に従う $k$ 個の確率変数」ということなのでまずは標準正規分布に従う乱数のヒストグラムを書いてみようとおもいます。30,0
teddy-g 2017/01/03
カイ二乗分布と正規分布の関係がビジュアルに理解できる。正規分布の対数から計算されるマハラノビス距離が自由度＝次元数のカイ二乗分布に従うのも納得。

statistics

stats

math

data

bigdata

analysis

analytics

anomalydetection
リンク
1 2 次のページ