タグ

あとで読むと統計に関するkibitakiのブックマーク (6)

  • 「よろしい。ではDBも内製だ」 IIJのインシデント調査システムが内製すぎる件

    IIJ Technical NIGHTは、2020年9月11日にオンラインで開催した技術勉強会です。ここで熊坂氏が、SOC(Security Operation Center)のアナリストを支援するインシデント調査システム「CHAGE(チャゲ)」を社内で開発した理由と、その実装について紹介しました。 IIJのインシデント調査システム 熊坂駿吾氏(以下、熊坂):IIJの熊坂から、社内で作成しているインシデント調査システムに関して紹介いたします。「インシデント調査システムが内製すぎる件」というところで、IIJの中で作成しているCHAGE(チャゲ)を紹介します。 まず私は2015年にIIJに新卒入社しまして、2018年度からSOCで業務を行っています。アナリスト的なことは詳しくやっていなくて、どちらかというとアナリストたちが業務を行うための環境の整備をしています。 具体的には、Windowsのメ

    「よろしい。ではDBも内製だ」 IIJのインシデント調査システムが内製すぎる件
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • 統計分析をフル活用し、年間数千万以上の広告宣伝費削減に成功─ リクルート式ビッグデータのビジネス活用最前線

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    統計分析をフル活用し、年間数千万以上の広告宣伝費削減に成功─ リクルート式ビッグデータのビジネス活用最前線
  • データサイエンティストではない人に知っておいて欲しい事 - hotokuとは

    統計を専門にしている訳ではない人と話していて感じた違和感があったので、書き留めておきたい。 疑うべき順番は モデル → 推定法 データ分析をしていれば、当然、期待を掛けたモデルのデータへの当てはまりそうが悪いという事が度々ある。こういう時、統計屋さんとして自然に浮かぶのは「モデルが間違っている」という発想である。と思うのだが、非統計屋さんと話していると、このような時に「別の推定法を試してみたらどうだろう」と言われる事がある。多分、目の前のモデルに対する過度の期待から来るのだろうと思うが、このような態度では統計的に見ると妥当性を欠いた分析をしてしまう危険を孕んでいる。 ひとつの事例 とある線型状態空間モデルのパラメータを推定した所、どうしてもデータに合わない部分があった。実は、それが合わない理由は簡単で、ある潜在変数は常に正であるはずなのだ。線型状態空間モデルでは、潜在変数の分布は正規分布で

    データサイエンティストではない人に知っておいて欲しい事 - hotokuとは
    kibitaki
    kibitaki 2012/12/22
    なるほどわからん
  • 市場規模一覧(多分、永遠に未完成) - Chikirinの日記

    いろんな業界の市場規模を知りたいなーと思うのだけど、バシッとした一覧表が見つからない。データはあそこにある、ここにあるという人は多いけど、じゃあ、この業界は○兆円ですよ、教えてくれる人は少ない。ので、自分で作ってみた。 とりあえずこのサイトの数字をベースに作ったんだけど、普通にググッてでてくる数字と大きくかけ離れている場合もあるんで、他の情報もいろいろ勘案してます。 自分用のメモなんで中途半端かつ超適当です。感覚的に「んっ?」な数字もあるので信じないように。適宜、直します。気長にやるつもり。10年計画くらいで。 どれかについて知ってる方、ツイッターやブックマークなどで教えて頂けると感謝です。ただし、台とかケースとかトンとか興味ないです。金額が知りたい。数千億未満の市場は割愛。「市場規模ってなにさ?」という質問はボツ。 そんじゃーねー ★★★ <乗り物関連> ・自動車 44兆円(自動車メーカ

    市場規模一覧(多分、永遠に未完成) - Chikirinの日記
  • 私はこうやってマーケティングデータを集めています。 : LINE Corporation ディレクターブログ

    今年も熱い夏がやってきました。ロックフェスと事業計画の熱い夏が! というわけでこんにちは、佐々木です。 今回は、「予算(事業計画)って、どうやって(何を根拠に)立てているんですか?」というスタッフの質問に答えるために、事業計画のために集めた資料の出典を紹介します。 なお、資料の多くは私が担当するブログ関連事業のものですので、ネットならではのマーケティングデータの集め方といった内容になります。限定的な分野ですが、なにかの参考になれば幸いです。 総務省 情報通信政策研究所(IICP) ・総務省 情報通信政策研究所 まずは総務省調べのデータ。 大規模なリサーチ結果を無料で利用できるので、とても重宝します。 例1)「ブログ・SNSの経済効果の推計」(PDF) 例2)「ブログの実態に関する調査研究」報告書文(PDF) 矢野経済研究所 ・矢野経済研究所 ブログ関連の市場調査で優れたレポートを発表して

    私はこうやってマーケティングデータを集めています。 : LINE Corporation ディレクターブログ
  • 1