[B! 機械学習][python] petite_blueのブックマーク

petite_blue id:petite_blue

機械学習とpythonに関するpetite_blueのブックマーク (23)

データマイニング入門
ビックデータ分析技術は情報処理技術を学ぶ上で重要となっている。本講義では、データ分析・データマイニングの基礎について学ぶとともに演習を通して実際にデータを分析するプロセスを学ぶ。特に、前期課程の「データマイニング入門」講義のさらに発展的な内容を学習することで、後期課程や大学院におけるデータサイエンス、人工知能、機械学習、自然言語処理などの関連講義の基礎となる知識を習得することを目標とする。
petite_blue 2022/07/03
python

機械学習

bigdata

教材
リンク
PyCaretからAutoVizを使用して探索的データ分析（EDA）を簡単に行ってみる - DATAFLUCT Tech Blog
こんにちは！nakamura（@naka957）です。本記事では、PyCaretで簡単に探索的データ分析を行う方法をご紹介します。探索的データ分析（Explanatory Data Analysis: EDA）とは、データセットを様々な視点から分析し、データを考察することを目的に行うことです。EDAで得られた知見や仮説を活用し、その後のデータ分析や機械学習モデルの構築を有効に行うことができます。データを考察するための最も有効な手法は、可視化することです。そのため、データを可視化するスキルはEDAにおいて非常に重要になります。本記事ではEDAを目的とした可視化する方法をご紹介します。では、早速始めていきます。 PyCaretとは AutoVizとはライブラリのインストール実行の前準備 EDAの実行散布図棒グラフ密度分布 Violinプロットヒートマップ（相関係数） Auto
petite_blue 2022/05/01
python

機械学習

automl
リンク
PyTorch／TensorFlow／Keras／scikit-learnライブラリ内蔵のデータセット一覧
PyTorch／TensorFlow／Keras／scikit-learnライブラリ内蔵のデータセット一覧：AI・機械学習のデータセット辞典機械学習やディープラーニング用の主要ライブラリが提供する「画像／音声／テキストなどのデータセット」の名前とリンクを表にまとめ、典型的な使い方を簡単に紹介する。連載目次本連載「AI・機械学習のデータセット辞典」では、ここまで主に、scikit-learnやKeras／TensorFlow（tf.keras）、TensorFlow Datasets、PyTorchといった主要なPythonライブラリに共通的に含まれる代表的なデータセットを紹介し、各ライブラリでの典型的な実装コード例を示してきた。しかし、これらの全ライブラリに共通的に含まれているデータセットはまれで非常に少ない。よってこれからは、個々のライブラリに1つしか含まれていないようなこまごまと
petite_blue 2020/07/22
機械学習

python
リンク
深い森(multi-Grained Cascade Forest)と浅い森(Random Forests)を動かして比較してみた - Qiita
深い森(multi-Grained Cascade Forest)と浅い森(Random Forests)を動かして比較してみたPython 機械学習 MachineLearningrandomForestgcForest はじめに gcForestを動かしてみる。背景近年、機械学習のモデルは主にニューラルネットワークを用いる深層学習に注目が集まっている。しかし、一般的に深層学習を十分に利用するには、膨大な計算資源や、ネットワークの構造とパラメーターのチューニング、学習用の大規模データが必要というネガティブなポイントがある。これらの問題点を解決するために、深層学習の代替案として決定木とアンサンブル学習を利用して深く学習するgcForest(multi-Grained Cascade Forest)が提案されている。内容本ページでは次のような決定木ベースの機械学習モデルを構築します。 R
petite_blue 2019/02/18
機械学習

python

決定木
リンク
Pythonではじめる OpenAI Gymトレーニング
ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement LearningPreferred Networks
petite_blue 2018/07/08
機械学習

強化学習

deep learning

python
リンク
Google Colaboratoryを使えば環境構築不要・無料でPythonの機械学習ができて最高 - karaage. [からあげ]
Google Colaboratoryが便利最近、Google Colaboratoryがちょっと気になっていたのですが、タダケン (id:tadaken3)さんの以下記事に分かりやすく使い方が書いてあったのをきっかけに試して見ました。結論から言うと、これ良いですね。Google Colaboratoryには以下の特徴（利点）があります。ローカルPCに必要なのはブラウザ（Google Chrome）のみクラウド上にPython環境がありPython2/3 両方使える機械学習に必要なライブラリは、ある程度プリインストールされている（numpy, matplotlib, TensorFlow等）必要なライブラリは !pip installでインストールできる日本語フォントも（ちょっと工夫すれば）使える無料で使える。なんとGPUも12時間分を無料で使える！これ死角無さすぎでは…
petite_blue 2018/03/21
python

機械学習
リンク
Pythonでベイズ最適化を使ってハイパーパラメータを探索するライブラリ実装のメモ - Qiita
はじめにベイズ最適化(参考：ベイズ最適化入門, 機械学習のためのベイズ最適化入門)を使うと、機械学習の時の各種Try&Errorで決めざるを得ないようなハイパーパラメータの探索を効率よく実施できる可能性があります。考え方などは最近色々解説記事が増えてきたおかげで理解はできるのですが、GridSearchのライブラリみたいな形ではWeb上で見つけられなかったので、今回作りました。きっと車輪の再発明なのだと思うのですが、まあ再発明は勉強にはなるので良しとします。今回使っている各種Version Python3.5 numpy==1.11.1 scikit-learn==0.17.1 コード from itertools import product from sklearn.gaussian_process import GaussianProcess # The MIT License
petite_blue 2018/02/08
機械学習

python

ベイズ最適化
リンク
How to build your own AlphaZero AI using Python and Keras
Update! (2nd December 2019)I’ve just released a series on MuZero — AlphaZero’s younger and cooler brother. Check it out 👇 How to Build Your Own MuZero Using Python (Part 1/3) How to Build Your Own MuZero Using Python (Part 2/3) How to Build Your Own MuZero Using Python (Part 3/3) In this article I’ll attempt to cover three things: Two reasons why AlphaZero is a massive step forward for Artificial
petite_blue 2018/01/27
DeepMind

python

AI

機械学習
リンク
データサイエンスプロジェクトのディレクトリ構成どうするか問題
あるいは、論文 "Best Practices for Scientific Computing" および "Good Enough Practices in Scientific Computing" について。 TL;DR 標題の件について、未だに答えは見えていないのだけど、自分の現状と他の人の例を文字で残しておく。こういう話で「あーその手があったかー！」と知ったときの興奮はすごいので、みなさんもっとオープンにいきましょう。大切なのは、ソフトウェア開発と同じ要領でデータサイエンスのプロジェクトを捉えて、分析と言う名の“開発”を行うつもりでディレクトリを掘ること。必要なものリストナウいデータサイエンス/機械学習プロジェクトの中には（経験上、ぱっと思い浮かぶだけでも）次のようなファイル群があって、僕たちはそれらを良い感じに管理したい。ソースコード役割がいろいろある：前処理（こ
petite_blue 2017/12/18
python

jupyter

機械学習
リンク
機械学習における、定型的な作業を自動化する - Qiita
機械学習を利用する際は、データの前処理から始まって適切なモデルを選んでパラメーターを最適化して・・・というように多くの作業が伴います。ただ、この作業の少なくない部分は定型的なものです。前処理でいえば、数値データに対しては正規化を行う、カテゴリー変数は0/1の特徴量へ変換する(ダミー変数化)、といった処理はどんな場合でもとりあえず実行する処理になります。もちろん高度な特徴量エンジニアリングなどは話が別ですが、データがあったときに定型的な作業をさくっと行い、とりあえず基礎的なモデルでどれぐらいの精度が出るのかを見てみたい、というシーンはよくあるものです。そこで、そんな作業を自動化するための仕組みを開発しました。名前はkaruraといいます。 chakki-works/karura コンセプトとしてはこの図のように、モデルを作るにあたっての定型的な一連の作業を自動化する、といったものです。
petite_blue 2017/10/05
karura Insight

機械学習

python
リンク
GitHub - JasperSnoek/spearmint: Spearmint is a package to perform Bayesian optimization according to the algorithms outlined in the paper: Practical Bayesian Optimization of Machine Learning Algorithms. Jasper Snoek, Hugo Larochelle and Ryan P. Adams. Adv
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
petite_blue 2017/03/31
機械学習

python
リンク
Hyperoptを使った、関数の最適化 - のんびりしているエンジニアの日記
皆さんこんにちはお元気ですか。私は元気です。本日はhyperoptと呼ばれるライブラリを紹介したいと思います。 KaggleのForamで時々あがっていたので、気になっていました。 Hyperoptについて What is Hyperopt? hyperoptはTree-structured Parzen Estimator Approach(TPE)やRandomSearchを使って、最適化を行うライブラリです。しかし、掲載論文を読む時間がないので、最適化の方法はともかく、このライブラリは最小化するパラメータの推定を行ってくれます。（他のもできるかもしれませんが、今回は調べていません。） Hyperoptについて、Scipy2013で発表をしているようです。興味が有る人は以下のビデオもどうぞ。 www.youtube.com Install sudo pip install h
petite_blue 2017/03/31
機械学習

python
リンク
PythonでXGBoostをちゃんと理解する(3) hyperoptでパラメーターチューニング - KAZ log TechMemo
xgboostのハイパーパラメーターを調整するのに、何が良さ気かって調べると、結局「hyperopt」に落ち着きそう。対抗馬はSpearmintになりそうだけど、遅いだとか、他のXGBoost以外のモデルで上手く調整できなかった例があるとかって情報もあって、時間の無い今はイマイチ踏み込む勇気はない。 Hyperparameter Optimization using Hyperopt - Otto Group Product Classification Challenge | Kaggle Optimizing hyperparams with hyperopt - FastML 前回辺りにアルゴリズム振り返って、チューニングには特別気をつけなきゃいけないことも無さそうなので、ガリガリとコード書いて動かしてみます。 hyperoptはつまるところ最適化問題のソルバーで、目的関数を一定の
petite_blue 2017/03/31
python

機械学習
リンク
Orange Data Mining
Data Mining Fruitful and FunOpen source machine learning and data visualization. Download Orange 3.36.2 Apr 15, 2024 So Sweet and So Fresh … New Text Mining Tutorial is OutA step-by-step guide on how to build a classifier to predict food types. Getting the know the widgets Test and Score, Logistic Regression, Confusion Matrix, Predictions. Jan 11, 2024 Scoring Sheets: Transf orm Data into Insightfu
petite_blue 2017/03/31
python

DataMining

機械学習
リンク
データマイニングツール”Orange” | MindTech
Orange (http://orange.biolab.si)は汎用の機械学習やデータマイニング用のツールで、スロベニアのLjubljana大学のコンピューター情報サイエンス学部の Janez DemšarさんとBlaž Zupanさんらによって開発が始まり、現在ではオープンソースとしてコミュニティベースで開発が続けられています。 Orangeはあまり経験のないデータマイニングの初心者から、スクリプトを書いてデータ処理のアルゴリズムを実装するプログラマーまで、多様なインターフェースを持つユニークなツールとなっています。また、多岐にわたるプラットフォームをサポートしており、Windows, Mac OS X, Linuxで動かすことが出来ます。
petite_blue 2017/03/31
python

機械学習

datamining
リンク
PythonによるDeep Learningの実装（Stacked Denoising Autoencoders 編） - Yusuke Sugomori's Blog
Deep Learningの実装に関する記事が連続していますが、今回はStacked Denoising Autoencoders（SdA）について紹介します。 SdAは、前回の記事で実装したDenoising Autoencoders（DA）の層を組み合わせていくことで特徴抽出を行い、最後の層でロジスティック回帰を用いて教師あり学習を行います。一応、SdAはDeep Belief Netsよりも画像認識では高い精度が得られているみたいです。ソースは以下。
petite_blue 2016/02/17
deep learning

python

機械学習
リンク
【チュートリアル】機械学習を使って30分で固有表現抽出器を作る - Qiita
はじめに固有表現抽出は、テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を抽出する技術です。固有表現抽出は、質問応答システム、対話システム、情報抽出といった自然言語処理を用いた応用アプリケーションの要素技術としても使われています。今回は機械学習技術を使って固有表現抽出器を作ってみます。 ※注意事項理論的な話は一切出てきません。理論を知りたい方は他を当たってください。対象読者固有表現抽出を少しは知っている方固有表現抽出器を作ってみたい方 Pythonコードを読める方固有表現抽出とは？ここでは、固有表現抽出の概要と方法について説明します。概要固有表現抽出は、テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を抽出する技術です。具体例を見てみましょう。以下の文から固有表現を抽出してみます。上記の文に含まれる固有表現を抽出すると人名と
petite_blue 2016/02/01
python

機械学習

nlp
リンク
TensorFlow 畳み込みニューラルネットワークで手書き認識率99.2%の分類器を構築 - Qiita
TensorFlowとは2015/11/9にオープンソース化されたGoogleの機械学習ライブラリです。この記事ではディープラーニングと言われる多層構造のニューラルネットワークをTensorFlowを利用して構築しています。 TensorFlowはPythonから操作できますがバックエンドではC++で高速に計算しています。macのPython2.7系環境でTensorFlowの上級者用チュートリアルを行い、手書き認識率99.2%の多層構造の畳み込みニューラルネットワークモデルの分類器を構築したときの作業メモです。特別な設定なしにCPU使用率270%メモリ600MByteとちゃんと並列計算してくれました。MNISTランキングを見ると認識率99.2%は上位のモデルとなるようです。 TensorFlowチュートリアル TensorFlowの初心者用と上級者用チュートリアル2つに取り組んでみました
petite_blue 2015/11/11
TensorFlow

Deep Learning

機械学習

python
リンク
Autogradで微分して、モデルを構築するとこまでの解説 - のんびりしているエンジニアの日記
皆さんこんにちはお元気ですか。 Twitter上で突然賑わった、Autogradについて書いてみることにします。 Autogradとは Autogradについての説明 github.com Autogradはnumpyらしく書くことができ、その記載した式を微分してくれるライブラリです。（in Python）現状、Pythonとtorch(lua)にて実装があるようです。 Theanoとの違いはシンボルを定義せず、数値計算した内容を直接渡すことができます。といったところでしょうか。正直自動微分は新しくないものです。（Theanoがありますので）悲しいことにPythonのAutogradは現状、GPU演算を行うことができません。 testの中にGPU関係の内容はあるようですが、一応featureにGPU operationsのサポートとして掲載されていますね。 Install sud
petite_blue 2015/11/09
機械学習

python

autograd
リンク
Autogradという野郎が乗り込んできたのでガクブルな件 - Qiita
Autogradという野郎が乗り込んできました。はい、そりゃもういきなり。複雑な確率モデルや損失関数だとしても、パラメータに関する勾配をこれでもかというぐらい簡単に計算できちゃうので、機械学習の世界に大きな影響を与えそうです。現時点では、PythonとTorchでの実装が公開されているようですが、これからJuliaなど他の言語でも実装されていきそうですね。（補足：この記事を書いたすぐ後にGoogleがTensorFlowなるものを出してきまして、そちらでも自動微分がしっかり実装されてるみたいです〜。機械学習関連のフレームワークは移り変わりが激しいですねー ^^; ）ちなみに始まりはこんな感じでした。ゆるいですね。とりあえずチュートリアルやりながら、Python版チュートリアルの前半部分にテキトーな日本語訳をつけたので、ここでシェアしておきます。英語が読める方は、僕のヘンテコな日本語
petite_blue 2015/11/08
機械学習

python
リンク
1 2 次のページ