タグ

統計とscikit-learnに関するmisshikiのブックマーク (3)

  • ナイーブベイズの実装確認 - Qiita

    今回調べたこと ナイーブベイズを実装しようとした際に、最終的な予測の出力で迷った部分があったので、sklearnの実装を参考。 その際に実装の中身を追ったので、内容を記録。 ソースコード 参考コード 今回はBernoulliNBの実装を参考に中身を確認。 import numpy as np from sklearn.naive_bayes import BernoulliNB rng = np.random.RandomState(1) X = rng.randint(5, size=(6, 100)) Y = np.array([1, 2, 3, 4, 4, 5]) clf = BernoulliNB(force_alpha=True) clf.fit(X, Y) print(clf.predict(X[2:3]))

    ナイーブベイズの実装確認 - Qiita
    misshiki
    misshiki 2023/07/24
    “ライブラリの中身を確認する記事”
  • Pythonで統計・データ分析!~基本統計量の活用と機械学習の基本

    Pythonで統計・データ分析!~基統計量の活用と機械学習の基数学×Pythonプログラミング入門(1/5 ページ) データ分析において最もよく使われる表形式のデータを取り扱う方法を見ていく。まず、pandasデータフレームの基的な取り扱い方法を確認し、次に、各種の基統計量を求める。また、基統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介する。

    Pythonで統計・データ分析!~基本統計量の活用と機械学習の基本
    misshiki
    misshiki 2023/01/23
    “pandasデータフレームの基本的な取り扱い方法を確認し、次に、各種の基本統計量を求める。また、基本統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介
  • 【機械学習】決定木をscikit-learnと数学の両方から理解する - Qiita

    今回はわかりやすい例を出しましたが、確かに部屋を決めるとき、私たち自身も下記の様な考え方をするのではないでしょうか。 どの条件が一番上に来るかは人それぞれですが、例えば1階は少し嫌で、2階以上かをまずは考え、2階以上であれば、さらにオートロックもあればいいね、という意味で部屋を借りる。 逆に、2階以上じゃなくても(1階の部屋)、ある程度の部屋の広さならまあ借りてもいいか、逆に1階だし狭いなら借りないな・・・・というようなフローで考えていくと思います。 まさにこれが木の構造を表していて、このように条件を分岐させて判断を決めていくのが決定木です。 では、この条件の分岐はどのように決められるのでしょうか。今出した例は直感的な説明で、根拠も何もなかったと思います。 ここで出てくるのが「不純度」です。 詳細は後半の数学の章に回しますが、この不純度を元に決定木は条件の分岐を決めています。 要は、元のデ

    【機械学習】決定木をscikit-learnと数学の両方から理解する - Qiita
  • 1