並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 73件

新着順 人気順

scikit-learnの検索結果1 - 40 件 / 73件

  • PyTorch/TensorFlow/Keras/scikit-learnライブラリ内蔵のデータセット一覧

    PyTorch/TensorFlow/Keras/scikit-learnライブラリ内蔵のデータセット一覧:AI・機械学習のデータセット辞典 機械学習やディープラーニング用の主要ライブラリが提供する「画像/音声/テキストなどのデータセット」の名前とリンクを表にまとめ、典型的な使い方を簡単に紹介する。 連載目次 本連載「AI・機械学習のデータセット辞典」では、ここまで主に、scikit-learnやKeras/TensorFlow(tf.keras)、TensorFlow Datasets、PyTorchといった主要なPythonライブラリに共通的に含まれる代表的なデータセットを紹介し、各ライブラリでの典型的な実装コード例を示してきた。しかし、これらの全ライブラリに共通的に含まれているデータセットはまれで非常に少ない。よってこれからは、個々のライブラリに1つしか含まれていないようなこまごまと

      PyTorch/TensorFlow/Keras/scikit-learnライブラリ内蔵のデータセット一覧
    • 【Gradio】爆速で機械学習アプリを作る -PyTorch・TensorFlow・scikit-learnの好きなモデルで遊ぼう-|はやぶさの技術ノート

      【Step1】Google Colaboratory のノートブックを新規作成 Google Colab を起動して、ノートブックを新規作成します。 【Step2】Gradio インストール 以下のコマンドでPythonライブラリの Gradio をインストールします。

        【Gradio】爆速で機械学習アプリを作る -PyTorch・TensorFlow・scikit-learnの好きなモデルで遊ぼう-|はやぶさの技術ノート
      • Scrapyとscikit-learn、Streamlitで作るかんたん機械学習アプリケーション / Making ML App with Scrapy, scikit-learn, and Streamlit

        DeNAのデータサイエンス輪講(DS輪講)での発表内容です。 Scrapyとscikit-learn、Streamlitを使うことで、機械学習を使ったデモアプリをクイックに作ることができます。 ソースコードはGitHubに公開しています。 https://github.com/amaotone/movie-recommendation-demo

          Scrapyとscikit-learn、Streamlitで作るかんたん機械学習アプリケーション / Making ML App with Scrapy, scikit-learn, and Streamlit
        • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF"

          鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF

            QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "鉄板のPython教材といえば東大が無料公開している「Pythonプログラミング入門」 ・Google Colabなので環境構築でハマる心配がない ・基本文法, Numpy, pandas, scikit-learnまで平易に学… https://t.co/bGyo4HKFZF"
          • scikit-learn-contrib の Metric Learning を試す - u++の備忘録

            Metric Learning について Metric Learning は、データの教師情報を基にデータ間の距離や類似度などの Metric を学習する手法です。日本語で手軽に読める記事だと、*1, *2 などが詳しいです。 このたび、phalanx さんの tweet *3で、 Metric Learning の基礎的なアルゴリズムのいくつかが scikit-learn-contrib *4に搭載されていると知りました。 本記事では、scikit-learn-contrib の metric-learn パッケージを用いて、簡単にMetric Learning を試します。 インストール README や PyPI *5 に記載のある通り、次の通りにインストールします。 pip install metric-learn 利用するデータセット 今回は、sklearn に含まれている lo

              scikit-learn-contrib の Metric Learning を試す - u++の備忘録
            • scikit-learn、Keras、TensorFlowによる実践機械学習 第2版

              本書はコードを動かしながら学び、機械学習が使えるようになることを目的とした書籍です。現実的な問題を出し、サンプルデータを示しながら、機械学習で問題を解決に導くまでの一連の手法を体系立てて解説します。 深層学習以外の機械学習にはscikit-learnを使い、機械学習プロジェクトの流れ、データからモデルを学習する方法、データの処理・クリーニングなどの基礎から、特徴量の選択や過学習、データの次元削減など応用までを学びます。深層学習にはTensorFlowとKerasを使い、ニューラルネットワークの構築と訓練、ニューラルネットワークアーキテクチャ、深層学習や強化学習、さらにTensorFlowの分散処理のメカニズムや実装までを幅広く解説します。 第2版では教師なし学習と深層ネットワーク訓練手法、コンピュータビジョンテクニック、自然言語処理、Tensor Flowの大規模な訓練や効率的なデータの取

                scikit-learn、Keras、TensorFlowによる実践機械学習 第2版
              • KNNアルゴリズム(K-近傍法)をscikit-learnを使わず5行で実装する。(Python)|es

                機械学習のライブラリは抽象化されていますが、どのように動いているいるのか、アルゴリズムは絶対理解しておいた方がいいいです。逆に機械学習を学ぶということは、アルゴリズムの理解が大部分を占めます。 k-近傍法(k-nearest neighbor algorithm)は、分類や回帰のためのシンプルな機械学習アルゴリズムです。 k-近傍法は、新しいデータが与えられたときに、そのデータが近いとされる、学習用のデータセット中の個々のサンプルとの距離を計算します。その後、これらのサンプルからk個の最も近いサンプル(k-nearest neighbors)を選択します。これらk個のサンプルから、新しいサンプルが最も多く分類されるクラスを予測します。 例えば、新しいサンプルが緑の点としてプロットされているとします。k=3の場合、この新しいサンプルに最も近い2つのサンプル(緑の点)を選択します。この3つのサ

                  KNNアルゴリズム(K-近傍法)をscikit-learnを使わず5行で実装する。(Python)|es
                • scikit-learnのモジュール全部説明する - Qiita

                  scikit-learn(機械学習のpythonライブラリ)のモジュールを全部説明しました モチベ:スクラッチで実装した後で「あ〜組み込みであったのかよ〜」となり、悲しみが発生したため 公式 API Referenceを参考に書いています 公式用語集と合わせてご覧ください 個人的によく使うものは太字にしています 記事内容にプルリクがある場合はコメントいただけると嬉しいです 名前 説明

                    scikit-learnのモジュール全部説明する - Qiita
                  • scikit-learnで機械学習パイプラインをインタラクティブに描画、HTML保存する方法 - Qiita

                    本記事では、scikit-learnのv0.23から搭載された、インタラクティブなパイプライン確認の実装、そしてそれをHTML化して保存、活用する方法を解説します。 環境 scikit-learn==0.23.2 Google Colaboratory 本記事の実装コードはこちらに置いています https://github.com/YutaroOgawa/Qiita/tree/master/sklearn 実装 [1] バージョン更新 まず、Google Colaboratoryのscikit-learnのバージョンが2020年9月ではv0.22なので、v0.23へと更新します。 !pip install scikit-learn==0.23.2 pipで更新したあとは、Google Colaboratoryの「ランタイム」→「ランタイムを再起動」を実行し、 ランタイムを再起動します。 (

                      scikit-learnで機械学習パイプラインをインタラクティブに描画、HTML保存する方法 - Qiita
                    • ロジスティック回帰をscikit-learnを使わずゼロから実装する(Python)|es

                      機械学習を理解するにはアルゴリズムをから実装するのが一番です。そして問いデータを使って遊んでみましょう。 ロジスティック回帰とは、二項分類(2値分類)を行うための方法です。二項分類とは、ある物体がAかBのどちらかに分類することを指します。例えば、試験の点数が60点以上かどうかで分類することができます。 ロジスティック回帰では、試験の点数だけでなく、その他の情報も考慮に入れることができます。例えば、試験の点数だけでなく、勉強時間や家庭環境なども考慮に入れることができます。これらの情報を使って、試験の点数が60点以上かどうかを推定することができます。 import numpy as np class LogisticRegression: def __init__(self): self.w = None self.b = None def fit(self, X, y, learning_r

                        ロジスティック回帰をscikit-learnを使わずゼロから実装する(Python)|es
                      • scikit-learn入門&使い方 ― 機械学習の流れを学ぼう

                        連載目次 前回は、機械学習の基礎と、主要なPythonライブラリの概要を説明しました。 今回は、Pythonを使った機械学習プログラミングの基本的な流れを、実際にコードを書きながら体験的に学んでいきましょう。具体的には、データの読み込みと加工から、グラフによる可視化、統計的な数値計算、そして簡単な機械学習モデルの構築まで、基本的な一連の流れを体験できます(図1)。 今回で学べること 図1の通り、機械学習プログラミングの基本的な流れに沿って進めると、第1回で紹介した主要なPythonライブラリ(pandas、NumPy、Matplotlib、seaborn、scikit-learnなど)を各場面で使い分けることになります。 各ライブラリを深く理解して使いこなすためには、個別に詳しく学ぶことが必要です。ただし本連載では、詳細には触れず、実践で役立つ基本的な使用例に絞って説明します。もっと深く掘

                          scikit-learn入門&使い方 ― 機械学習の流れを学ぼう
                        • 【機械学習】決定木をscikit-learnと数学の両方から理解する - Qiita

                          今回はわかりやすい例を出しましたが、確かに部屋を決めるとき、私たち自身も下記の様な考え方をするのではないでしょうか。 どの条件が一番上に来るかは人それぞれですが、例えば1階は少し嫌で、2階以上かをまずは考え、2階以上であれば、さらにオートロックもあればいいね、という意味で部屋を借りる。 逆に、2階以上じゃなくても(1階の部屋)、ある程度の部屋の広さならまあ借りてもいいか、逆に1階だし狭いなら借りないな・・・・というようなフローで考えていくと思います。 まさにこれが木の構造を表していて、このように条件を分岐させて判断を決めていくのが決定木です。 では、この条件の分岐はどのように決められるのでしょうか。今出した例は直感的な説明で、根拠も何もなかったと思います。 ここで出てくるのが「不純度」です。 詳細は後半の数学の章に回しますが、この不純度を元に決定木は条件の分岐を決めています。 要は、元のデ

                            【機械学習】決定木をscikit-learnと数学の両方から理解する - Qiita
                          • Shota Imai@えるエル on Twitter: "文科省が出した高校新学習指導要領の「情報II」の教員研修用教材,結構なボリュームで,データサイエンスの部分はpython実装で,scikit-learnやニューラルネットを試したりkaggleの導入に触れたり,なかなかガチな内容に… https://t.co/SGcKNDRz6L"

                            文科省が出した高校新学習指導要領の「情報II」の教員研修用教材,結構なボリュームで,データサイエンスの部分はpython実装で,scikit-learnやニューラルネットを試したりkaggleの導入に触れたり,なかなかガチな内容に… https://t.co/SGcKNDRz6L

                              Shota Imai@えるエル on Twitter: "文科省が出した高校新学習指導要領の「情報II」の教員研修用教材,結構なボリュームで,データサイエンスの部分はpython実装で,scikit-learnやニューラルネットを試したりkaggleの導入に触れたり,なかなかガチな内容に… https://t.co/SGcKNDRz6L"
                            • Scikit-Learn でモデルカードを作成してクラウドにデプロイする方法 | Google Cloud 公式ブログ

                              ※この投稿は米国時間 2020 年 10 月 17 日に、Google Cloud blog に投稿されたものの抄訳です。 機械学習モデルは、多数の難しいタスクを遂行するために使用されるようになりました。大きな可能性を秘める ML モデルですが、その使用方法、構成、制限に関して疑問も寄せられています。そうした疑問に対する回答を文書化することで状況が明確になり、共通の理解を得ることができます。これらの目標を達成するために、Google はモデルカードを導入しました。 モデルカードの目的は、機械学習モデルの全体像を簡潔に提供することです。まず、モデルカードはそのモデルの機能、意図するユーザー層、その管理者について説明します。また、アーキテクチャや使用されているトレーニング データなど、モデルの構成に関する情報も提供します。さらに、生のパフォーマンス指標だけでなく、モデルの制限とリスク緩和の機会

                                Scikit-Learn でモデルカードを作成してクラウドにデプロイする方法 | Google Cloud 公式ブログ
                              • K-Meansクラスタリング scikit-learnを使わずゼロから実装する(Python)||es

                                K-Meansは個人的にも好きなアルゴリズムで、教師あり学習を必要とせず、混沌とした中からパターンを見つけ出してくれる可能性があります。 実際、実践で使うとそのような都合の良いデータはほとんどなく、むしろ 仮説を否定する場合に使う方が現実的かもしれません。 自分の場合、顧客のセグメント分けに使うことが多いです。 ステップ 1. ランダムに k 個のデータポイントを初期のセントロイドとして選ぶ。 ステップ 2. トレーニングセット内のデータポイントと k 個のセントロイドの距離(ユークリッド距離)を求める。 ステップ 3. 求めた距離に基づいて、データポイントを一番近いセントロイドに割り当てる。 ステップ 4. 各クラスタグループ内のポイントの平均を取ることでセントロイドの位置を更新する。 ステップ 5. ステップ 2 から 4 をセントロイドが変化しなくなるまで繰り返します。 以下、シンプ

                                  K-Meansクラスタリング scikit-learnを使わずゼロから実装する(Python)||es
                                • 実際にscikit-learnで出力されるPrecisionやRecallを事例に、適合率と再現率の意味を説明しようと思う - Qiita

                                  実際にscikit-learnで出力されるPrecisionやRecallを事例に、適合率と再現率の意味を説明しようと思う 分類モデルの評価指標として、適合率や再現率などがあります。Web上で多くの解説記事がありますが、scikit-learnのclassification_reportに表示される各指標を読み解くためには、プラスアルファの理解が必要です。この記事では、実際にscikit-learnで出力される内容を例にして、適合率と再現率の意味を解説します。 Webとかでよくある説明 機械学習で分類モデルを評価するとき、正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F1-scoreなどの評価指標をよく利用します。これらの解説として、以下のような2値分類の説明が多くあります。 正解率(Accuracy) 正解率(Accuracy) は、全体の中で正解した

                                    実際にscikit-learnで出力されるPrecisionやRecallを事例に、適合率と再現率の意味を説明しようと思う - Qiita
                                  • scikit-learnとtidymodelsの比較

                                    こんにちは,shun(@datasciencemore)です!! 今回は,scikit-learnとtidymodelsの比較をしていきたいと思います. 機械学習をするための有名なパッケージとして,Pythonはscikit-learn,Rはtidymodelsが挙げられます. これらは何が違うのでしょうか? それを確認するために以下の4つの観点でscikit-learnとtidymodelsを比較してみましょう. 連携性収納性統一性一貫性 結論からいうとtidymodelsの圧勝です!! scikit-learnとtidymodelsの比較結果を表にまとめるとこのようになります. 以下,これらの4つの観点について詳細に見ていきましょう! 1.連携性 まずは1つ目,連携性についてです. データサイエンスプロジェクトは主にこんな感じの業務フローなのでした. 図を見ていただくとお分かりになると

                                    • 11月新刊情報『scikit-learn、Keras、TensorFlowによる実践機械学習 第2版』

                                      11月新刊情報『scikit-learn、Keras、TensorFlowによる実践機械学習 第2版』 Aurelien Geron 著、下田 倫大 監訳、長尾 高弘 訳 2020年11月4日発売予定 832ページ ISBN978-4-87311-928-1 定価5,280円(税込) 本書はコードを動かしながら学び、機械学習が使えるようになることを目的とした書籍です。現実的な問題を出し、サンプルデータを示しながら、機械学習で問題を解決に導くまでの一連の手法を体系立てて解説します。 深層学習以外の機械学習にはscikit-learnを使い、機械学習プロジェクトの流れ、データからモデルを学習する方法、データの処理・クリーニングなどの基礎から、特徴量の選択や過学習、データの次元削減など応用までを学びます。深層学習にはTensorFlowとKerasを使い、ニューラルネットワークの構築と訓練、ニュ

                                        11月新刊情報『scikit-learn、Keras、TensorFlowによる実践機械学習 第2版』
                                      • scikit-learn の機械学習パイプライン

                                        はじめに 機械学習で予測モデルを作るときは データの分割 データの前処理 予測モデルの学習 クロスバリデーションによるハイパーパラメータチューニング といった手順を踏む必要がある。慣れるまではこれらの手順に対応する scikit-learn のクラスをひとつひとつ呼び出して自分で一連の処理をやってみるのが勉強になるが、慣れてしまうと似たような手続きを毎回書くのは非常に面倒くさい。 scikit-learn には、この一連の処理を簡潔に記述するためのパイプラインの仕組みがあるので、その使用方法について説明する。 一連のコードは Google Colab 上にアップロードしてある。 データの分割 これは人間が管理すべき問題なので、自動化もやろうと思えばできるだろうが、人間がいちいちやったほうがよい。機械学習をやるとき、データは基本的に 訓練データ 教師データともいう。予測モデルを学習させるため

                                          scikit-learn の機械学習パイプライン
                                        • 【Python】scikit-learn Pipeline と前処理の設定ファイル化 |

                                          sklearn.pipeline.Pipeline sklearn.pipeline.Pipeline を上手く使うとfit, transform, predict を一つの Python オブジェクトにまとめられコードが簡潔になったり, 手続き型的なコードと比較してミスが減りやすくなる利点がある。 前処理に関する変換を scikit-learn ぽいクラスにして, これらを繋いだ変換パイプラインを作ってみる。パイプラインで使うには最後のステップ以外は次のステップで使う表現を生成する transform() をクラスメソッドに実装する必要がある。 また, 今回はパラメータに渡す値は設定ファイルから読み出す仕組みにする。 # -*- coding: utf-8 -*- import re import numpy as np import pandas as pd from sklearn.

                                          • 【入門者向け】特徴量選択の基本まとめ(scikit-learnときどきmlxtend) - Qiita

                                            手法 1. Filter Method Filter Methodは統計的な手法(分散やχ二乗検定など)で特徴量の評価・選択をします。他の手法に比べると計算量が少なく、最初に足切りで実施するものだと考えています(経験浅いのであまり根拠なし)。 1.1. 低分散変数の削除 分散が低ければ、説明変数としての意味ないと考え特徴から削除する方法です。VarianceThreshold関数を使います。 今回の例では分散0としており、まったく変動していない特徴を対象とします。ベルヌーイ分布の分散であるp(1 − p)を使うのもありかと思います。 分散0はPandasのget_dummies関数でオプションdummy_naを使った時に出てしまいました。欠損値がある特徴があったため、get_dummies関数を使ったのですが、欠損値がない特徴量もNaNの列ができてしまい、すべて値が0で分散が0の列ができて

                                              【入門者向け】特徴量選択の基本まとめ(scikit-learnときどきmlxtend) - Qiita
                                            • NumPy / Pandas / Matplotlib / scikit-learn などの理解度確認ができる「Python 3 エンジニア認定データ分析試験」に合格した - kakakakakku blog

                                              先週末に「Python 3 エンジニア認定データ分析試験」を受験して合格した🎉とても良い試験で,特に試験勉強をする過程で知識の幅が広がった.試験の認知度向上のためにも紹介したいと思う.当然ながら試験問題に関しては何も書かず,基本的に公開情報をベースにまとめていく! www.pythonic-exam.com 試験概要 : Python 3 エンジニア認定データ分析試験 📊 試験名にもある通り「Python 3 エンジニア認定データ分析試験」は Python を使った「データ分析」に関する理解を問う試験で「数学」や「Python ライブラリ」に関する出題が多くある.詳しくは以下に出題範囲を載せる. セクション 出題数 出題率 データエンジニアの役割 2 5.0% Python と環境 : 実行環境構築 1 2.5% Python と環境 : Python の基礎 3 7.5% Pytho

                                                NumPy / Pandas / Matplotlib / scikit-learn などの理解度確認ができる「Python 3 エンジニア認定データ分析試験」に合格した - kakakakakku blog
                                              • scikit-learnの学習結果をpickleしない - Qiita

                                                機械学習を簡単に行うための有用なライブラリの一つはscikit-learnである。 この文書では、scikit-learnの学習結果をpickleしないで済ます方法について述べる。 scikit-learnの特徴 各種識別器の学習・予測・評価方法のためのインターフェースがそろえてある設計。 各種アルゴリズムを試して、比較しやすい。 ドキュメントが充実している。 前提 python scikit-learn pickle scikit-learn に欠けているもの scikit-learnで学習した結果を保持するための枠組みが不足している。 そのため、sckit-learnで作った学習済みの識別器をpickleして、それをpickl.loads(pickle済みのファイル)して使ってしまうということをしてしまいやすい。 問題点 scikit-learn のサイトでも、pickleしたものを使

                                                  scikit-learnの学習結果をpickleしない - Qiita
                                                • 【機械学習初心者向け】scikit-learn「アルゴリズム・チートシート」の全手法を実装・解説してみた - Qiita

                                                  scikit-learnのアルゴリズム・チートシートで紹介されている手法を全て実装し、解説してみました。 注釈 本記事シリーズの内容は、さらに丁寧に記載を加え、書籍「AIエンジニアを目指す人のための機械学習入門 実装しながらアルゴリズムの流れを学ぶ」 として、出版いたしました。 概要 scikit-learn アルゴリズム・チートシート 【対象者】機械学習を使用したい方、初心者向けの機械学習本を読んで少し実装してみた方 scikit-learnの説明は英語で分かりにくいし、実装例もシンプルでなくて、よく分からんという方 【得られるもの】模擬データを用いて、各手法を使用したミニマム・シンプルなプログラムが実装できるようになります。 アルゴリズムの詳細な数式は理解できませんが、だいたい何をやりたいのか、意図と心、エッセンスが分かります。 アルゴリズムマップの手法をひとつずつ実装・解説します。

                                                    【機械学習初心者向け】scikit-learn「アルゴリズム・チートシート」の全手法を実装・解説してみた - Qiita
                                                  • scikit-learnで混同行列を生成、適合率・再現率・F1値などを算出 | note.nkmk.me

                                                    クラス分類問題の結果から混同行列(confusion matrix)を生成したり、真陽性(TP: True Positive)・真陰性(TN: True Negative)・偽陽性(FP: False Positive)・偽陰性(FN: False Negative)のカウントから適合率(precision)・再現率(recall)・F1値(F1-measure)などの評価指標を算出したりすると、そのモデルの良し悪しを判断できる。 scikit-learnのsklearn.metricsモジュールにそれらを簡単に算出するための関数が用意されている。 3.3. Model evaluation: quantifying the quality of predictions — scikit-learn 0.20.3 documentation ここではまず混同行列について説明する。 混同行列

                                                      scikit-learnで混同行列を生成、適合率・再現率・F1値などを算出 | note.nkmk.me
                                                    • conda Numpyのようにscikit-learnも高速化する方法 - Qiita

                                                      最近、condaで入れるNumpyの方が、pipで入れるNumpyより動作が早いことが少し話題になっています(元記事は最近ではないのですが)。本記事では、scikit-learnもインストールを工夫すれば、より高速に動作することを解説します。 はじめに 記事、「Anaconda の NumPy が高速みたいなので試してみた」 https://tech.morikatron.ai/entry/2020/03/27/100000 を最近Twitterのタイムラインで何度も見かけました(元記事は20年3月に記載されたものですが)。 condaでインストールするNumpyの方が、pipでインストールするNumpyより早い、というお話です。 なぜ早いの? 上記の記事では、CPUで「Intel Core i7-9750H」を使用しています。 このCPUの仕様は以下です。 https://www.int

                                                        conda Numpyのようにscikit-learnも高速化する方法 - Qiita
                                                      • scikit-learnのLatent Dirichlet Allocation (LDA) のcoherenceを求める - Qiita

                                                        scikit-learnのLatent Dirichlet Allocation (LDA) のcoherenceを求めるPython機械学習scikit-learnLDA はじめに ちゃお…† まいおり…† LDA (Latent Dirichlet Allocation)、わたしの好きなモデルです。 しかし、現時点のscikit-learn (1.2.2) にはLDAモデルのcoherence (コヒーレンス) を求める関数はありません。 そこで強引に?LDAモデルのcoherenceを求める方法を記します。 コヒーレンスとは 記述や事実の集合は、それらが互いに支持し合っている場合、首尾一貫している (coherent) と言われます。したがって、首尾一貫した事実の集合は、事実のすべてまたは大部分をカバーする文脈で解釈することができます。 トピックのコヒーレンスを測るとは、トピック内の

                                                          scikit-learnのLatent Dirichlet Allocation (LDA) のcoherenceを求める - Qiita
                                                        • AIを使った株価予想をPythonのscikit-learnライブラリRandam Forestで試してみた - Qiita

                                                          検索速度を得るために、証券コード(scode)と日付(tday)にインディクスを張る。 株価データは、例えば下記のサイトよりダウンロードする。 http://souba-data.com/ ダウンロードした株価のZIPファイルを解凍して、CSVファイルの中から証券コード、終値を読込んでSQLiteに保存するサンプルコードを記載する。 def data_dl(): conn = sqlite3.connect("chart.db"); c = conn.cursor() d = datetime.datetime.today(); for i in range(0,365): d = datetime.datetime.today() - datetime.timedelta(days=i); zip_path = "data\\T%s.zip" % (d.strftime("%y%m%d"

                                                            AIを使った株価予想をPythonのscikit-learnライブラリRandam Forestで試してみた - Qiita
                                                          • ScikitAllStars: 主要なscikit-learnの教師あり機械学習法を全部Optunaでチューニングしてスタッキングまでやっちゃうツール - Qiita

                                                            ScikitAllStars: 主要なscikit-learnの教師あり機械学習法を全部OptunaでチューニングしてスタッキングまでやっちゃうツールPython機械学習scikit-learnStackingOptuna 教師あり機械学習法はたくさんありますが、scikit-learn に入ってるもののうち主なものを全部使って、optunaでハイパーパラメーターチューニングして、できたモデルをさらにstackingしてしまうという一連の作業をまとめて行うライブラリ ScikitAllStars を作りました。 なぜこんなツールを作ったかって?めんどいからです。 また、ScikitAllStars の特徴として、教師あり機械学習が「回帰問題」なのか「分類問題」なのかという違いをほとんど意識せずに使えるというところもあります。 以下のコードは全て Google Colaboratory 上で

                                                              ScikitAllStars: 主要なscikit-learnの教師あり機械学習法を全部Optunaでチューニングしてスタッキングまでやっちゃうツール - Qiita
                                                            • scikit-learnとLightGBMの評価関数比較 - Qiita

                                                              このページについて LightGBMで学習して、そのパラメタグリッドサーチをGridSearchCV(sklearn)でという状況が多いかと思います。 どの評価関数であれば、ライブラリ標準で共通で利用できるのかをまとめてみようと思います。 下記を書いたあとに、気になって調べ始めたので内容は重複します。(スミマセン) 途中で力尽き、今回は回帰だけでまとめています。 比較一覧 評価関数 GridSearchCVでの指定方法 lightGBMでの指定方法 メモ

                                                                scikit-learnとLightGBMの評価関数比較 - Qiita
                                                              • Scikit-learn DevSprint Japan 2021 Spring : 富士通

                                                                富士通研究所は、AI分野における世界最大のOSSであるScikit-learnをサポートするため、2019年からScikit-learnコンソーシアムに加入し、OSSコミュニティの持続的発展に寄与しています。 今回、Scikit-learn のDevSprint JapanをScikit-learnコンソーシアムと共同で5月26日(水)- 5月28日(金)の日程で開催することになりましたので、参加者を募集します。 またDevSprint Japanに合わせて、Scikit-learnやトポロジカルデータ解析技術の機械学習応用(富士通研究所で開発しているTopological Data Analysis Time Series Shaper: TDA-TSS含む)に関するチュートリアルも開催します。 Scikit-learn DevSprint Japanについて・日程: 2021年5月26

                                                                  Scikit-learn DevSprint Japan 2021 Spring : 富士通
                                                                • Scikit-learn でロジスティック回帰(クラス分類編) - Qiita

                                                                  はじめに ロジスティック回帰は、説明変数の情報にもとづいて データがどのクラスに属するかを予測・分類する(例:ある顧客が商品を買うか買わないかを識別する) 注目している出来事が発生する確率を予測する(例:ある顧客が何%の確率で商品を買うか予測する) ために利用されるモデルです。 この記事では、Scikit-learnライブラリを使い、ロジスティック回帰によりクラス分類を行う方法を備忘録として書いておきます。 Scikit-learn について Scikit-learnは、Pythonの機械学習ライブラリの一つです。 公式ドキュメント:http://scikit-learn.org/stable/index.html ロジスティック回帰について ロジスティック回帰は、分類のためのアルゴリズムです(例:電子機器を故障するクラス or 故障しないクラスに分ける)。単純なアルゴリズムなので実装しや

                                                                    Scikit-learn でロジスティック回帰(クラス分類編) - Qiita
                                                                  • GitHub - iryna-kondr/scikit-llm: Seamlessly integrate LLMs into scikit-learn.

                                                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                      GitHub - iryna-kondr/scikit-llm: Seamlessly integrate LLMs into scikit-learn.
                                                                    • scikit-learn 入門 — ディープラーニング入門:Chainer チュートリアル

                                                                      scikit-learn 入門¶ scikit-learn は Python のオープンソース機械学習ライブラリです。 様々な機械学習の手法が統一的なインターフェースで利用できるようになっています。 scikit-learn では NumPy の ndarray でデータやパラメータを取り扱うため、他のライブラリとの連携もしやすくなっています。 本章では、この scikit-learn というライブラリを用いて、データを使ってモデルを訓練し、評価するという一連の流れを解説し、Chainer を使ったディープラーニングの解説に入る前に、共通する重要な項目について説明します。 機械学習の様々な手法を用いる際には、データを使ってモデルを訓練するまでに、以下の 5 つのステップがよく共通して現れます。 Step 1:データセットの準備 Step 2:モデルを決める Step 3:目的関数を決める

                                                                        scikit-learn 入門 — ディープラーニング入門:Chainer チュートリアル
                                                                      • 【機械学習】ロジスティック回帰をscikit-learnと数学の両方から理解する - Qiita

                                                                        1.目的 機械学習をやってみたいと思った場合、scikit-learn等を使えば誰でも比較的手軽に実装できるようになってきています。 但し、仕事で成果を出そうとしたり、より自分のレベルを上げていくためには 「背景はよくわからないけど何かこの結果になりました」の説明では明らかに弱いことが分かると思います。 この記事では、2~3で「理論はいいからまずはscikit-learn使ってみる」こと、4以降で「その背景を数学から理解する」2つを目的としています。 ※私は文系私立出身なので、数学に長けていません。可能な範囲で数学が苦手な方にもわかりやすいように説明するよう心がけました。 ※線形単回帰Verでも同様の記事を投稿していますので、併せてお読みいただけますと幸いです。 【機械学習】線形単回帰をscikit-learnと数学の両方から理解する ※2020.7.26 4.ロジスティック回帰を数学から

                                                                          【機械学習】ロジスティック回帰をscikit-learnと数学の両方から理解する - Qiita
                                                                        • PythonでAI開発、scikit-learnとpandasでデータを読み込んでみよう

                                                                          今回から、乳がんの判定に関するモデルの構築を題材に、PythonでのAI開発の方法を見ていきましょう。医学の場合、最終的な病気の診断は、あくまで医者が行うものですが、このようなモデルがあれば医者は自分の診断の正しさを確認できます。このように人間の判断の補助としての位置付けも機械学習モデルとしての意味のある利用形態です。 例題データの説明 今回の実習で利用するデータセットは、「Breast Cancer Wisconsin(Diagnostic)Data Set」(乳がん診断データセット)と呼ばれるものです。 乳がんの検診で腫瘍が見つかった患者に対して腫瘍細胞を採取し、顕微鏡で分析した結果を数値化した情報となっています。 W.N. Street, W.H. Wolberg and O.L. Mangasarian, “Nuclear Feature Extraction for Breast

                                                                            PythonでAI開発、scikit-learnとpandasでデータを読み込んでみよう
                                                                          • scikit-learn 入門:6つの機能と分類・回帰の実装方法を徹底解説!

                                                                            皆さんは、scikit-learn(よみ:サイキット・ラーン)をご存知でしょうか。Pythonを使っている方、機械学習を学ばれている方なら一度は耳にしたことがあることでしょう。しかし、scikit-learnを知っている方の中でも、scikit-learnでいったい何ができるのか、その全貌を知っている方はそれほど多くはないのではないでしょうか。 そこで本稿では、scikit-learnの4つの特徴と、6つの主な機能について詳しく解説した上で、実際に回帰と分類の実装を行います。機械学習をこれから学ぼうとされている方はもちろん、scikit-learnを使っている皆さんも改めて、本稿でscikit-learnの良さを学びましょう。 scikit-learnとは まずは、scikit-learnとはいったいどのようなライブラリで、どのような特徴があるのかを解説していきます。 scikit-lea

                                                                              scikit-learn 入門:6つの機能と分類・回帰の実装方法を徹底解説!
                                                                            • Visualizing Decision Trees with Python (Scikit-learn, Graphviz, Matplotlib)

                                                                              Image from my Understanding Decision Trees for Classification (Python) Tutorial (blog, video).Decision trees are a popular supervised learning method for a variety of reasons. Benefits of decision trees include that they can be used for both regression and classification, they don’t require feature scaling…

                                                                                Visualizing Decision Trees with Python (Scikit-learn, Graphviz, Matplotlib)
                                                                              • Scikit-learnが実験的にGPU対応していたので調査してみた! - Qiita

                                                                                はじめに みずほリサーチ&テクノロジーズ株式会社の@fujineです。 いきなりですがAIエンジニアの皆さん、scikit-learnが実験的にGPUに対応していたこと、ご存知でしょうか? scikit-learnは機械学習分野における古参パッケージの1つです。多様な機能を提供する一方、FAQにて「GPUに対応する予定はない(キリッ)」と公式宣言しており、scikit-learnが好きな自分としては「勿体無いなぁ」と常々感じていました。 そんな中、何気なくRelease Highlights for 1.2を読んでいたら以下文面を発見!しかも約半年前の2022年12月にリリースされてる… Experimental Array API support in LinearDiscriminantAnalysis Experimental support for the Array API sp

                                                                                  Scikit-learnが実験的にGPU対応していたので調査してみた! - Qiita
                                                                                • ところてん on X: "情報IIの教科書、普通にscikit-learnで機械学習してるし、クラスタリングしてるし、SQLite3でRDBMSしているし、やばいんですよ https://t.co/XsDutAhLC8"