[B! machinelearning] ko-ya-maのブックマーク

ko-ya-ma id:ko-ya-ma

machinelearningに関するko-ya-maのブックマーク (32)

ChatGPT
A conversational AI system that listens, learns, and challenges
ko-ya-ma 2022/12/02
ai

machinelearning

webservice

chat
リンク
はじめに — 機械学習帳
import torch x = torch.tensor([1., -1.]) w = torch.tensor([1.0, 0.5], requires_grad=True) loss = -torch.dot(x, w).sigmoid().log() loss.backward() print(loss.it em()) print(w.grad)
ko-ya-ma 2021/11/29
よくできている

learning

machinelearning

tutorial

basic

python
リンク
機械学習のパラメータチューニングを「これでもか！」というくらい丁寧に解説 - Qiita
はじめに私はこれまで機械学習のパラメータチューニングに関し、様々な書籍やサイトで学習を進めてきました。しかしどれもテクニックの解説が主体のものが多く、「なぜチューニングが必要なのか？」という目的に関する記載が非常に少なかったため、体系的な理解に苦労しました。この経験を後世に役立てられるよう、「初心者でも体系的に理解できる丁寧さ！」をモットーに記事にまとめたいと思います。具体的には、 1. パラメータチューニングの目的 2. チューニングの手順とアルゴリズム一覧 3. Pythonでの実装手順 (SVMでの分類を例に) の手順で解説を進めます。独自解釈も含まれるため、間違っている点等ございましたら指摘頂けると有難いです。なお、文中のコードはこちらのGitHubにもアップロードしております。 2021/9/6追記：LightGBMのチューニング実行例追加以下の記事に、Ligh
ko-ya-ma 2021/06/08
実際丁寧。そして物量！

dev

machinelearning

tips
リンク
Interpretable Machine Learning
Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。本書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo
ko-ya-ma 2021/05/14
dev

learning

study

book

machinelearning
リンク
StyleGAN2で属性を指定して顔画像を生成する - すぎゃーんメモ
memo.sugyan.com の記事の続き(？)。ある程度の学習データを収集して学習させたモデルが出来たので、それを使って実際に色々やってみる。 StyleGAN2-ADA 学習 mapping出力と生成画像生成画像の属性推定結果から潜在空間の偏りを抽出表情推定顔姿勢推定髪領域推定 (顔解析) 年齢 (上手くいかず) 複合 Repository StyleGAN2-ADA 前回の記事でも書いたけど、厳選した16,000枚の画像を使って StyleGAN2-ADA を使って生成モデルを学習させてみた。 github.com これは StyleGAN2 から進化したもので、より少ない枚数からでも安定して学習が成功するようになっていて、さらにparameter数など調整されて学習や推論もより早くなっている、とのこと。それまでのStyleGANシリーズはTensorFlowで実装され
ko-ya-ma 2021/04/02
image

machinelearning
リンク
AWS、ビジュアルなデータクレンジングツール「AWS Glue DataBrew」発表。大規模データの整理を迅速に実現
AWS、ビジュアルなデータクレンジングツール「AWS Glue DataBrew」発表。大規模データの整理を迅速に実現データを基に分析を行う場合、対象となるデータがきちんと整っている必要があります。しかし多くの場合、日付データの中に日付に変換されなかった数値データが混ざっていたり、同じ会社なのに「株式会社」と「（株）」と「(株)」の表記が揺れているせいで別の会社に分類されたり、名前や住所のどこかに余計なスペースが入っていて別のデータになったり、データをインポートしたときのミスで2つの列が連結されて1つの列に入っていたりと、整っていないデータが紛れ込んでいるものです。これらを整理しなければ、正確なデータ分析はできません。そこで、データ分析の前処理としてデータを整える、いわゆる「データクレンジング」と呼ばれる作業が行われます。データクレンジングは一般に手間と時間がかかる作業です。どんな
ko-ya-ma 2020/11/18
aws

data

dev

machinelearning
リンク
SQLたったの2行で機械学習！BigQuery MLを用いたコロナ分析 - Qiita
はじめに令和にもなるとSQLを2行書くだけで機械学習できてしまうようです。本記事では、表題の技術BigQuery MLの概要と使い方を調べ、世を騒がせているコロナの分析をしてみました。「SQLで機械学習」や「コロナ分析」に興味がある方は覗いてみてください。本記事の対象者 SQLだけで機械学習したい人コロナ分析に興味ある人機械学習を簡単に試してみたい人機械学習はよく分からんけどデータベースはよくいじるという人本記事の対象でない人データとか機械学習とか難しいから興味ない人機械学習モデルのアルゴリズムとか詳しく知りたい人機械学習つよつよだから自分で独自モデル作って幅広い分析したい人 BigQuery ML概要 BigQueryとは BigQuery MLはBigQuery上のサービスです。BigQueryを知らない方のために簡単にBigQueryについて説明します。BigQu
ko-ya-ma 2020/10/14
machinelearning

tech
リンク
Numeraiトーナメント　－伝統的クオンツと機械学習の融合－ - Qiita
はじめに本記事は、MediumのTowards Data Scienceに寄稿した「Numerai Tournament: Blending Traditional Quantitative Approach & Modern Machine Learning」を和訳したものである。 Numeraiトーナメントについて Numeraiはクラウドソーシング型ファンドと呼ばれる、不特定多数の人間による株価の予測結果をもとに運用するヘッジファンドである。Numeraiでは予測性能を競うトーナメントが開催される。トーナメント参加者はNumeraiから提供されるデータセットを元に予測モデルを構築し提出を行う。参加者はその予測性能に応じてランキングされ、報酬が支払われる（徴収されることもある）。 Numeraiへの出資者には、ルネッサンス・テクノロジーズの共同創業者であるハワード・モーガン、チューダ
ko-ya-ma 2020/07/11
dev

machinelearning

statistics

math
リンク
楽曲を最大5トラック（ヴォーカル／ドラム／ベース／ピアノ／その他）に分離できる無料のオーディオ分離ツール「Spleeter」公開 - amass
楽曲を最大5トラック（ヴォーカル／ドラム／ベース／ピアノ／その他）に分離できる、高速かつ無料のオーディオ分離ツール「Spleeter」が公開。音楽ストリーミングサービス「Deezer」のエンジニアリングチームが開発。機械学習によって楽曲を分離するツールです。「Spleeter」には、3つの事前トレーニングモデルが付属されており、以下の3タイプへの分離が可能になっています。 2つ（ヴォーカル／その他の伴奏） 4つ（ヴォーカル／ドラム／ベース／その他） 5つ（ヴォーカル／ドラム／ベース／ピアノ／その他）実行例： https://waxy.org/2019/11/fast-and-free-music-separation-with-deezers-machine-learning-library/ 「Deezer」内の紹介文 https://deezer.io/releasing-sple
ko-ya-ma 2019/11/07
dev

music

tool

machinelearning
リンク
2019年のDevOps/MLOpsエンジニアの標準的スキルセット - Qiita
ちなみに、IT業界全体のシェアとしてはMicrosoftのAzureの方がGCPを上回っていますが、Web業界においてIaaSにAzureを採用している企業さんは2019年時点ではまだまだ少ないので、現状ではとりあえずAzureへのキャッチアップは後回しにしておいて問題ないと思われます。クラウドアーキテクチャ設計前述したAWSやGCPの各種マネージドサービスを適切に組み合わせてアーキテクチャ設計を行い、それを構成図に落とし込める能力は必須となります。いわゆる「アーキテクト」という職種の担当領域でもありますが、「サービスを安定稼働させたまま、バリューをユーザに迅速に届ける」ためには、自動化のしづらい構成が採用されてしまったり、無駄な機能が開発されてしまったり、アンマネージドなツールやサービスが使用されて管理工数が肥大化したりしないように、アーキテクチャ設計の段階からDevOpsエンジニ
ko-ya-ma 2019/08/22
トレンド感が得られる記事

devops

cloud

kubernetes

aws

gcp

machinelearning

まとめ
リンク
AIが三国志を読んだら、孔明が知力100、関羽が武力99、を求められるのか？をガチで考える物語（自然言語処理編） - Qiita
吉川英治の「三国志」＠青空文庫をINPUTとして、「自然言語処理」と「機械学習」によって上記のように、武力や知力などのパラメータを推論する。三国志小説の機械学習結果として、１つの武将を５０次元ベクトルに変換し、そのベクトルを、全く同じ「式」に入れて出てきた値が、上記の表。このような方法：「小説(自然言語)」⇒「数値化」⇒「式」によって、武力/知力を求めることが出来るか？という実験＆研究が今回のテーマ。他の成果としては、以下のような武将名の「演算」が楽しめる。（これも実際の出力結果より抜粋）諸葛亮に近い人は誰？ ⇒ 姜維、司馬懿、陸遜、周瑜、魏延、馬謖劉備にとっての関羽は、曹操にとって誰？ ⇒ 袁紹、張遼 ※若いころの馴染み的な意味や対比が多いので袁紹？孫権にとっての魯粛は、劉備にとって誰？ ⇒ 司馬徽（水鏡先生）、徐庶 ※賢者を紹介するポジションなのか？精度の
ko-ya-ma 2019/07/30
machinelearning

dev

japanese

ai
リンク
Guess.js
Libraries & tools for enabling Machine Learning driven user-experiences on the web
ko-ya-ma 2019/05/08
マシンラーニングでリンク先を先読み

machinelearning

javascript

web
リンク
エムスリーの機械学習エンジニアが語る、医療用語に注目した文書の類似度計算のしくみ
エムスリーの機械学習エンジニアが語る、医療用語に注目した文書の類似度計算のしくみ医療用語に注目した文書の類似度計算 2019年1月22日、freee株式会社にて、Data Driven Developer Meetupが主催するイベント「Data Driven Developer Meetup #4」が開催されました。サービスをより良いものにするために日々データと向き合っているデータサイエンティストやエンジニアなど、様々な職種で活躍する人々が集い、知見を共有する本イベント。今回は日本経済新聞社とエムスリー株式会社の2社がメインセッションに登壇し、自社の取り組みについて語りました。プレゼンテーション「医療用語に注目した文書の類似度計算」に登場したのは、株式会社エムスリーのnishiba氏。医療用語が用いられた文書の類似度を計算するために用いた仕組みとその裏側を語ります。講演資料はこちら
ko-ya-ma 2019/04/25
dev

machinelearning

word
リンク
Google Colaboratoryでタブレット・スマホからプログラミングや機械学習ができるようになっていた話 - Qiita
Google Colab（Colaboratory）をタブレットやスマホで試したらどうなるんだろう？と思って試してみました。結果、いけました。既出気味ではあるものの、スマホやタブレットで環境構築不要でプログラミングができてしまいます。環境：iPad Air2 Colabの本来のサポート環境は、PC版のChromeとFirefoxなのでSafariだとうまく動かないこともあるかもしれませんが、ぱっとやった限りでは確認できませんでした。こんな感じ手書き数字画像（MNIST）の分類をしてみました。 iPadでディープラーニングできてるもちろんPC版同様、無料GPU使えます。 iPadで頑張って入力したコードはこちらです。 from keras.datasets import mnist from keras.layers import Dense, Input from keras.mo
ko-ya-ma 2019/01/04
dev

google

machinelearning

tablet
リンク
Googleの機械学習のレッスンが無料で受けれて資格が貰える余暇。｜ガジェット通信 GetNews
こんにちは。夏休みの最終日に宿題をやる派のひろゆきです。ネットで暇つぶしにニュースサイトを見てる人も多いと思うんですが、「新しい知識を得る」ってエンタメなんですよね。ってことで、ネットには無料でいろいろ覚えられるサイトがあったりするんですが、マサチューセッツ工科大学とか、ハーバード大学とかがやってるedXの機械学習のコースとか試してみたんですが、20分ぐらいで飽きちゃったりして、宝箱を開けたりとか別の事はじめちゃうんですよね。 Machine Learning https://www.edx.org/course/machine-learning-columbiax-csmm-102x-4 んで、スタンフォード大学やコロンビア大学が授業を公開してたりするCourseraに、Googleが提供してる機械学習のコースがあるのですね。ちなみに、二日前から東京大学もコースを提供しはじめてます
ko-ya-ma 2018/09/20
learning

dev

free

machinelearning
リンク
Big Sky :: golang で tensorflow のススメ
« Software Design 2018年7月号「Vim 絶対主義」の執筆に参加しました。 | Main | ボタンを押したら golang の if err... を自動入力 » tensorflow といえば Python と思っておられる方も多いのではないでしょうか。間違いではないのですが、これは初期に作られた Python 向けのバインディングに研究者達が多く食いついた結果に過ぎないと思っています。実際 tensorflow は現在 C言語、C++、Python、Java、Go から利用する事ができ、最近では JavaScript にも移植されています。筆者自身も Go で tensorflow を使ったシステムを構築し、運用保守しています。問題も発生せず機嫌良く動いています。学習の利用部分は GPU のパフォーマンスに依存しますが、それ以外の部分については各言語の実装に依存し
ko-ya-ma 2018/08/25
golang

image

dev

machinelearning

tutorial
リンク
人間参加型（human-in-the-loop）機械学習とは？
This domain may be for sale!
ko-ya-ma 2018/08/07
楽しげなデータセットがたくさん

machinelearning

resource

dev

data
リンク
UCI Machine Learning Repository
Welcome to the UC Irvine Machine Learning Repository! We currently maintain 22 data sets as a service to the machine learning community. You may view all data sets through our searchable interface. Our old web site is still available, for those who prefer the old format. For a general overview of the Repository, please visit our About page. For information about citing data sets in publications, p
ko-ya-ma 2018/08/07
> “We currently maintain 22 data sets as a service to the machine learning community”

data

machinelearning
リンク
Kaggle: The Home of Data Science
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
ko-ya-ma 2018/08/07
コンペとかおもしろデータセットとか > "Kaggle is the place to do data science projects"

data

machinelearning

dev
リンク
FizzBuzz Zero ―― 人類の知識なしでFizzBuzzをマスターする
for i in range(1, 101): if i % 15 == 0: print("FizzBuzz") elif i % 3 == 0: print("Fizz") elif i % 5 == 0: print("Buzz") else: print(i) プログラム問題としてあまりにも有名になってしまったので、今ではあらゆる言語のFizzBuzzがそろっています。面白いですね。深層学習で FizzBuzz この記事の読まれている大半の方は、FizzBuzzを書くのにあまり苦労しないでしょう。しかし、あなたが何かの拍子でプログラムの書き方を忘れてしまったらどうでしょう？心配する必要はありません。そういうときこそAIの出番です。最近は空前の人工知能ブームで、猫も杓子もDeep Learningです。実際、Deep LearningによるFizzBuzzは、いくつも先例
ko-ya-ma 2018/05/11
dev

machinelearning

basic

code
リンク
1 2 次のページ