並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 2564件

新着順 人気順

機械学習の検索結果281 - 320 件 / 2564件

  • 「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見

    はじめに 機械学習に関する実用的な知見を知るために、「Kaggleで勝つデータ分析の技術」を読んだので、Kaggle以外の場面でも活用できる話題をまとめてみた。本書は機械学習の基本的な内容も含んでいるが、この記事では機会学習に関する一通りの知識を持ち、実問題に利用している読者を想定してまとめた。従って、勾配ブースティング木の仕組みや、回帰タスクの評価方法等、基本的な内容については解説しない。本記事では、評価の落とし穴や、モデルを改善するための特徴量の工夫、チューニングのTipsについて紹介する。 特徴量 Tips 1: 欠損値の扱い データにはしばしば欠損値が含まれている。欠損値は、そもそも値が存在していない場合の他に、ユーザが意図して入力していない場合や、観測器のエラーによって取得できていない場合等、様々な理由によって生じる。欠損がランダムに発生していない限り、欠損しているという事実が何

      「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見
    • 「数理最適化」とは――4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方

      「数理最適化」とは――4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方:リクルート事例で分かる数理最適化入門(1) リクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるのかを紹介する連載。初回は、数理最適化の概要、リクルートにおける4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方などについて。 近年多くの企業で、ビジネスでのデータ活用が当たり前になっています。中でも機械学習を用いた成功事例については、耳にしている読者の方も多いと思います。一方で、同じくデータ活用の技術である「数理最適化」は、さまざまな領域で成果を上げているにもかかわらず、その実態について知っている人はあまり多くないようです。 本連載ではリクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるの

        「数理最適化」とは――4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方
      • 機械学習とは?定義から学習手法・5つのアルゴリズム・活用事例までわかりやすく解説 | AI専門ニュースメディア AINOW

        最終更新日: 2023年1月6日 こんにちはAINOWインターンのsatoshiです。今回の記事ではAIやディープラーニングと混同されがちな機械学習について、それらの関係性・違いを理解できるようにわかりやすく説明します。 また機械学習を知る上で必要不可欠な用語(教師あり学習や教師なし学習、各アルゴリズムなど)に関しても、この記事を通して、きちんと整理して理解できるようになっています。 機械学習とはAIの1つの要素技術です。 多くの企業で取り組むことができる技術の1つでしょう。機械学習について理解するのに必要なことは3つあり、以下のようになります。 データからルールやパターンを発見する方法である 識別と予測が主な使用目的である 分析の精度は100%ではないが、従来の手法より精度をあげられる可能性は高い 機械学習にできる4つこと 機械学習は与えられた膨大なデータを元にして、複数のルールやパター

          機械学習とは?定義から学習手法・5つのアルゴリズム・活用事例までわかりやすく解説 | AI専門ニュースメディア AINOW
        • 【書評】「仕事ではじめる機械学習」を読んで、機械学習プロジェクトの大変さを知った夏 | DevelopersIO

          どうも。DI部@大阪オフィスの玉井です。 仕事ではじめる機械学習という本を読んだので、久しぶりに書籍エントリを投下します。この本はとってもとってもとってもとってもとってもとっても大スキよ ダーリン I like you. ダーリン素晴らしいので、ぜひこの気持ちをみなさんに伝えたいと思いました。 この本を読もうと思った理由 今後、機械学習を扱う製品やサービスが増えてくるのではないか、と思ったから 現在、私は製品サポートエンジニアとして、データ分析に関係する製品やサービス(Tableauとか)のサポートや導入を行っています。機械学習は触れたことは一切ありません。また(少なくとも現時点では)機械学習エンジニアに転向する予定もありません。 ところで、データ分析関係の製品やサービスっていうのは、それはもうすごい勢いで色々なものがリリースされています。弊社ではTableauやAlteryxといった製品

            【書評】「仕事ではじめる機械学習」を読んで、機械学習プロジェクトの大変さを知った夏 | DevelopersIO
          • AzureMLは機械学習をこれから勉強する人にとって最高の環境だった - Qiita

            ブルベースの諫山です。 先日、機械学習の勉強会を職種・役職関係なく、非エンジニアも含め20名以上で開催しました。会社として今後、機械学習に力を入れていくに際し、共通言語を持つ必要性を感じたため、開催に至りました。 その研修ではAzureMLを使って簡単な回帰モデルの作成ができることをゴールとして課題設定したため、営業メンバーでも問題なく課題をこなすことができました。AzureMLでなければ、営業メンバーはきっと課題を完成させることはできなかったでしょう。今回はAzureMLが初学者の学習プラットフォームとしては最適である理由などをお伝えしたいと思います。 AzureMLを選んだ理由 エンジニアのみであれば、Pythonでコードを書くことも出来たでしょう。しかし、今回は営業メンバーも含まれているため、コードを書かせることは出来ません。一方、AzureMLはドラッグ&ドロップで機械学習のステッ

              AzureMLは機械学習をこれから勉強する人にとって最高の環境だった - Qiita
            • 「機械学習〜推薦システムを題材に〜」講義資料(生成AIの話題も含む)|masa_kazama

              2023年に東京都立大学で非常勤講師として、学部3年生向けに「機械学習〜推薦システムを題材に〜」というテーマで講義をしました。 90分×3コマ×2日間の計6コマの集中講義で、Streamlitで映画のレコメンドアプリを実際に作ってみるなどの演習も含めたものです。 昨年、大学院生向けに同様の講義を3コマ分していたので、それを拡張する形で、最近話題の生成AIの話も1コマ分用意しました。(昨年の授業資料はこちらにあります。) 推薦システムや生成AI×推薦システムについて興味ある方のご参考になりましたら。 1日目(90分×3コマ) 推薦システムの概要 推薦システム-各推薦アルゴリズム 推薦システムの周辺技術(評価指標について)

                「機械学習〜推薦システムを題材に〜」講義資料(生成AIの話題も含む)|masa_kazama
              • 検索マーケターが知っておくべき検索エンジンと機械学習の話 - ブログ - 株式会社JADE

                こんにちは、株式会社JADE創業者の長山一石です。以前は、主に Google と Twitter のスパム検出チームで働いていました。 2019 年の記事では、「レンダー バジェット」という用語を作りました。今日は、マーケティング担当者が機械学習と検索エンジン、主に Google について知っておくべきことについて少しお話ししたいと思います。 「検索における機械学習の重要性を説明してください」 私は仕事柄、よく面接をします。検索マーケティング業務経験者の方ともよくお話をします。その中でよく使う質問の 1 つに、「今日の Google 検索における機械学習の重要性について説明してください」というものがあります。しかし、応募者の方が満足のいく答えを思いつくことは非常にまれです。犯しがちなよくある間違いの 1 つは、RankBrain、BERT、MUM などの、Google 検索で使用されている

                  検索マーケターが知っておくべき検索エンジンと機械学習の話 - ブログ - 株式会社JADE
                • 「AI・機械学習の勉強を始めたい」「AIサービスを作りたい」人のための技術情報フォーラムです!

                  連載目次 本「@IT/Deep Insider」は、機械学習エンジニアを目指す人~初中級者のためのAI(人工知能)技術情報フォーラムです*1。主に「これから勉強したい人」~「AIサービスを作りたい人や実践活用したい人」に向けて、Python言語連載から、技術用語解説、技術解説記事、技術事例、ニュースやイベントレポートなど、AI・機械学習・ディープラーニングに関するさまざまな情報を幅広く発信しています。 *1 私は、本フォーラムの編集長を務めさせていただいている一色政彦です。本フォーラムは、2019年6月18日にオープンし、2020年6月25日現在で、早くも約1年が過ぎたことになります。この1年間のご愛読に感謝を申し上げます。編集スタッフともども、2年目も頑張っていきますので、相変わらぬご愛読のほどよろしくお願いいたします。会員限定コンテンツも多いですが、会員登録は無料ですので、ぜひ登録して

                    「AI・機械学習の勉強を始めたい」「AIサービスを作りたい」人のための技術情報フォーラムです!
                  • 最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」

                    最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」:AutoML OSS入門(6)(1/4 ページ) AutoML OSSを紹介する本連載第6回は、ローコード機械学習ライブラリ「PyCaret」を解説します。さまざまな機械学習ライブラリのラッパーであるPyCaretは、データ分析のあらゆる工程でコードの行数を削減します。

                      最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」
                    • 機械学習で使う英単語まとめ

                      機械学習の資料は英語が多い 機械学習を勉強していると英語で書かれた資料に目を通す機会も多い。 たとえば「derivative」という単語が出てくる。 一般的には「派生」という意味。 しかし、頻繁に「derivative」という単語が出てくる。 これは何か専門用語なんだろうなと思い、あたりをつけて調べたら「導関数」のことだった。 他にも、「differentiation」を「差」だと思って読んでたら、実は「微分」のことだったり。 こういう日常で使われる場合の英単語の意味と、専門用語での意味は微妙にイメージのずれがある。 何度も辞書を引かなくていいように、一覧表にまとめた。

                        機械学習で使う英単語まとめ
                      • 機械学習は次のステージへーーMIT研究者が発明、“No-Hardware AI”「Neural Magic」のインパクト - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                        Image Credit : Neural Magic HP ピックアップ:Neural Magic gets $15M seed to run machine learning models on commodity CPUs ニュースサマリ:“No-Hardware AI” 企業を謳う「Neural Magic」は、11月6日、シードラウンドにて1,500万ドルの資金調達を実施したと発表した。出資者にはComcast Ventures NEA、Andreessen Horowitz、Pillar VC、Amdocsが名を連ねる。 同社は、MITでマルチコア処理と機械学習を長年研究してきた2人の研究者によって2018年に設立された。ディープラーニングモデルを処理する高コストなGPUやTPUなどの専用AIハードウェアを使うことなく、汎用CPUでより大きなモデルをより速く、より高い精度で処理

                          機械学習は次のステージへーーMIT研究者が発明、“No-Hardware AI”「Neural Magic」のインパクト - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                        • 機械学習システムの信頼性を数値化する ML Test Scoreのハンズオンワークショップを開催しました | メルカリエンジニアリング

                          こんにちは、メルカリでCRE (Customer Reliability Engineering) に所属している @hurutoriya です。 今回メルカリ社内での勉強会の一環として、Google が提案した機械学習システムの信頼性を数値化する ML Test Score のハンズオンワークショップを開催しました。 本記事では、ML Test Score の説明、ワークショップの開催方法や簡単な考察などをお話します。 今回はWFHの影響も受け Google Meet を使ったフルリモートでの開催となりました。 ワークショップの内容として、メルカリ内で実際に運用されている機械学習システムを対象に、実際にそのシステムを開発する機械学習エンジニアが ML Test Score を計算しました。 ML Test Scoreの説明 ML Test Score の目的は、定量化しづらい機械学習シス

                            機械学習システムの信頼性を数値化する ML Test Scoreのハンズオンワークショップを開催しました | メルカリエンジニアリング
                          • 【ディープラーニング】機械学習初心者が競艇1位予想を作れるのか試してみた。 - Qiita

                            はじめに ディープラーニングの勉強を始めて1ヶ月。 基礎的なものは理解できた気がしてきたので、何かできないかと考えてみました。 そしてふと、この競艇の順位予想が思いつきました。 順位予想ができるという確信はありませんでしたが、ボートレースのデータのオープンソースが公開されていることがわかり、これはやってみるしかないと思いました。 参考にしたデータ元と特徴量 ↓データ元のサイトは下記リンクから飛ぶことができます。↓ BOTE RACE OFFICIAL タウンロード・他 選手のデータから勝率まで細かく載っているので学習させるにはちょうどいい情報量だと思います。 今回学習させるデータの種類は以下の通りです。 艇番 年齢 体重 級別 全国勝率 全国2率 当地勝率 当地2率 モーターナンバー モーター勝率 ボートナンバー ボート勝率 とりあえずこの情報量で学習させていきます。 選手番号を使うことも

                              【ディープラーニング】機械学習初心者が競艇1位予想を作れるのか試してみた。 - Qiita
                            • 機械学習のオススメ情報収集術|べいえりあ

                              今回は、自分が機械学習に関する最新情報を収集するにあたってどういう情報源を頼っているのかを紹介してみたいと思います。 はじめに今回の記事では、機械学習(主にNLP、あと医療を少々)の「最新情報(=最新の研究)」の収集術について書きます。個人的に思っているのは、最新の研究情報の収集というのは基礎的なことを理解して初めて意味を成すものだと思っているので、もし基本的な教科書を読んでいないのであれば、まずはMurphy本(機械学習)だったりJurafsky-Martin(NLP)を読むことをオススメします。 ブログ、特に各企業のAIブログなど最近は優秀な研究者の方々がアカデミアから企業に移っていたりするので、企業のAIブログなどをフォローしていると結構な量の情報を集められたりします。 企業のAIブログの良い点は、大抵の場合論文の著者が記事を書いているので内容がとても正確であること。デメリットは一応

                                機械学習のオススメ情報収集術|べいえりあ
                              • 【強化学習編】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita

                                はじめに 今回は強化学習編として、Transformer/BERTの発展モデルや新たな学習法・正則化方法の提案に関する内容などの最新論文を7本ご紹介します!著者実装が公開されているものは、その情報も併せてまとめました。論文は自動機械学習(AutoML)を専門としICMLなどのトップカンファレンスへの論文採択経験もある斉藤と、需要予測・異常検知など様々な分野で機械学習/ディープラーニングの産業応用に取り組んできた小縣が中心となってスキルアップAI講師陣にて厳選しました。ぜひ、今後の学びにご活用ください! CoBERL: Contrastive BERT for Reinforcement Learning 実装のURL:https://github.com/deepmind/dm_control 強化学習における新たなエージェント「Contrastive BERT for Reinforce

                                  【強化学習編】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita
                                • 機械学習の初心者がpythonで有馬記念を予想してみた - Qiita

                                  機械学習の初心者がpythonで...シリーズの第二弾です。 前回の記事『機械学習の初心者がpythonで競馬予測モデルを作ってみた』では、競馬を題材にして、簡単な学習モデルを構築する過程をまとめてみました。 今回は実践編ということで、2020年の総決算である有馬記念の予想を実際にしてみたいと思います。アドベントカレンダーの大トリを担当ということもあり、ちょうどタイミング的にもピッタリ?ですね! ※ 環境構築は前回の記事を参照してください 有馬記念とは? 中央競馬のGI競走の一つで、ファン投票によって出走馬が選出され、別名グランプリとも言われる1年を締めくくるビッグレースです。 レース概要はこちらです。 開催日:2020/12/27 (日) 競馬場:中山競馬場 コース:芝2500m 小回りの中山競馬場の長距離レースということで、個人的には紛れが起きやすいレースだと感じています。実際に、3着

                                    機械学習の初心者がpythonで有馬記念を予想してみた - Qiita
                                  • 自然言語処理におけるEmbeddingの方法一覧とサンプルコード - 機械学習 Memo φ(・ω・ )

                                    概要 自然言語処理における単語や文章のEmbeddingの方法を勉強したので概要を記載しました。 また、学習済みモデルからEmbeddingベクトルを取得するサンプルソースコードも一部記載しました。 概要 Word2vec fastText GloVe Skip-thought SCDV USE ELMo BERT おわり 宣伝 Word2vec 似た意味の単語の周りには同じような単語が出現するとして、ある単語の周辺に出現する単語を予測するNNの隠れ層の重みを、ある単語のベクトルとしたもの。Doc2vecはWord2vecを文章に拡張したもの。 NNには以下のようなSkip-Gramのモデルが使われる。 Word2vecの元論文 : [1310.4546] Distributed Representations of Words and Phrases and their Composit

                                      自然言語処理におけるEmbeddingの方法一覧とサンプルコード - 機械学習 Memo φ(・ω・ )
                                    • AI・機械学習のための数学超入門 ~中学数学からのおさらい編~

                                      AI/機械学習、ディープラーニングを学び始めると、どこかで数式を読むことになる。それも偏微分や線形代数など大学レベルの数学である。この壁にぶつかって、数式を理解できないままスルーしたり、学ぶこと自体を諦めてしまったりする人も少なくないのではないだろうか? 本書は、主にAI/機械学習の教材などに書かれている数式でつまずいたことがある初学者に向けた、「AIに最低限必要な数学を基礎の基礎からしっかりと、しかも効率的に学ぶ」ための電子書籍の第1部である。具体的には連載『AI・機械学習の数学入門 ― 中学・高校数学のキホンから学べる』を構成する、 という全4部の中の「第1部 中学数学からのおさらい編」を電子書籍(PDF)化したものである。 数学を学んでから10年以上のブランクがある場合は、本人が考えている以上に数学を忘れているものだ。偏微分や線形代数などのAI(特にディープラーニングのニューラルネッ

                                        AI・機械学習のための数学超入門 ~中学数学からのおさらい編~
                                      • 5分で分かる機械学習(ML)

                                        1分 ―― 機械学習 (ML:Machine Learning)とは 人間が経験から学ぶように、機械がデータから学習することを機械学習(ML)と呼びます。例えば犬や猫の画像データから「あれが犬」「これが猫」と判断できるように学習することなどです。これは人間の子供に犬や猫を見せて「あれが犬」「これが猫」と覚えさせるのに似ていますね。 「5分で分かる人工知能(AI)」でも説明しましたが、機械学習には例えば、回帰分析や主成分分析、決定木、サポートベクタマシン、ディープラーニング(=ニューラルネットワークという仕組みを発展させたもの)など多くの手法(後述)があります(図1)。 統計学と機械学習の違い 回帰分析や主成分分析と聞いて、統計学の多変量解析を思い浮かべたかもしれません。実際に、一部の統計学の手法は機械学習でも使用します。しかし、統計学はデータを分析してインサイト(=内在する本質)を得ること

                                          5分で分かる機械学習(ML)
                                        • 機械学習でFizzBuzzを実現する

                                          元ネタ 実行結果 GoogleColaboratoryで動かした結果は以下です 教師データの作成 学習用の教師データを生成して確認します。 本来は教師データは外部から提供されるはずだが、今回はそれがないので自分で生成する。 import numpy as np def fizzbuzz(n:int): if n % 15 == 0: return "FizzBuzz" if n % 5 == 0: return "buzz" if n % 3 == 0: return "Fizz" return n def generate_sample_data(size=1000): feature = np.random.randint(0, np.iinfo(np.int32).max, size) label = list(map(fizzbuzz, feature)) return featu

                                            機械学習でFizzBuzzを実現する
                                          • 機械学習によって「SEO」と「デジタル広告」はどう変わった? 担当者が知っておきたい現実と未来 | 【レポート】Web担当者Forumミーティング 2019 Autumn

                                              機械学習によって「SEO」と「デジタル広告」はどう変わった? 担当者が知っておきたい現実と未来 | 【レポート】Web担当者Forumミーティング 2019 Autumn
                                            • 機械学習初心者はGoogleAutoML Tablesを使ってみては?メリットや使い方、使用感を知っておこう

                                              ※「AutoML Tables┃Google Cloud」より引用 とりあえず機械学習に触れてみたいという方にとって、基本無料で利用できるというのは非常に魅力的でしょう。 GoogleAutoML Tables を実際に使ってみた 最後にGoogleAutoML Tableの体験デモを機械学習初心者の筆者が実際に行ってみた手順と感想をご紹介します。 なお、デモの内容や手順は「クイックスタート」に従っています。 手順1:GoogleAutoML Tablesを有効化する まずは、Google Cloud Platformに登録し、GoogleAutoML Tablesを有効化します。 Google Cloud Platform登録時には支払元のクレジットカードを登録する必要がありますが、料金が自動的に発生することはありません。 手順2:データをインポートする続いて機械学習の対象となるデータを

                                                機械学習初心者はGoogleAutoML Tablesを使ってみては?メリットや使い方、使用感を知っておこう
                                              • 機械学習業界で働き始めて3年目の初心者への(技術的)アドバイス | AI専門ニュースメディア AINOW

                                                著者のChris氏はデータサイエンティストで、AINOW翻訳記事『機械学習エンジニアが職を失いつつある。しかし、とにかく機械学習を学ぼう』の著者でもあります。同氏が最近Mediumに投稿した記事『機械学習業界で働き始めて3年目の初心者への(技術的)アドバイス』では、自身の実務経験にもとづいた新米機械学習エンジニアに対する技術的アドバイスが解説されています。 Chris氏の機械学習アプリ開発における数々の成功と失敗から導き出された教訓は、以下のような6項目に集約されます。 データの特徴を抽出する教師なし学習に安易に手を出さない。多くの場合、人間の直観に劣る。 ニューラルネットワークにも安易に手を出さない。初心者には難易度の高い技法である。 問題を二値分類としてとらえる。3値以上に分類するマルチクラス分類より良いパフォーマンスを発揮することが多い。 ハイパーパラメータを調整する。デフォルトのそ

                                                  機械学習業界で働き始めて3年目の初心者への(技術的)アドバイス | AI専門ニュースメディア AINOW
                                                • 誰でもノーコードで画像判別の機械学習モデルを作成できる「Lobe」【イニシャルB】

                                                    誰でもノーコードで画像判別の機械学習モデルを作成できる「Lobe」【イニシャルB】
                                                  • こんなデータじゃ機械学習できねぇよ MLにおけるデータマネジメントの重要性

                                                    Machine Learning Casual Talkは、機械学習を用いたシステムを実運用している話を中心に、実践的な機械学習に関して気軽に話せる会です。実際に運用していく上での工夫や、知見を共有します。第12回目のテーマは「機械学習プロジェクトに関する「ベストプラクティスとアンチパターン」。機械学習ではデータを扱いますが、そのデータマネジメントがしっかりしていないと破綻してしまうという点について、ゆずたそ氏がお話します。前半は使えないデータとは何かについて。 自己紹介 ゆずたそ氏(以下、ゆずたそ):では、発表を始めたいと思います。「データマネジメントなきMLは、破綻する。〜こんなデータじゃ機械学習できねぇよ問題の処方箋〜」という話をしたいと思います。 はじめに、まず自己紹介です。「yuzutas0」というアカウントをやっています。機械学習の専門家ではないのですが、機械学習を使った施策に

                                                      こんなデータじゃ機械学習できねぇよ MLにおけるデータマネジメントの重要性
                                                    • 機械学習とHuman-in-the-Loopで優勝する違反検知の話 | メルカリエンジニアリング

                                                      こんにちは。AIチーム所属ソフトウェアエンジニアの@shidoです。 機械学習は様々なサービスの中で強力な武器となりますが、データパイプラインの構築や学習のための計算リソースの確保など、リーズナブルにシステムに組み込むには機械学習特有の困難を克服しなければなりません。 またその困難は機械学習の応用先によっても様々だと思っています。今回の記事ではデータパイプラインの構築に「Human-in-the-Loop (HITL)」と呼ばれる機構を違反出品検知のための機械学習システムへ取り入れた実例と、この仕組みについての考察をお話します。 もくじ 違反出品検知システムについて メルカリの安心・安全・公正な取引環境への取り組み ポリシーの変更について 不正取引の潮流の変化について 機械学習システムによる違反出品の検知 機械学習による違反出品検知の強みと課題 継続的なモデルアップデートの重要性 Huma

                                                        機械学習とHuman-in-the-Loopで優勝する違反検知の話 | メルカリエンジニアリング
                                                      • 機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning –

                                                        機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning – 論文紹介 概要 「Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning」は、米国のNIST(National Institute of Standards and Technology)が策定を進めている機械学習セキュリティに関するベストプラクティスのドラフトであり、機械学習システムの安全確保を目的として、機械学習にまつわるセキュリティを「攻撃」「防御」「影響」の3つの視点で分類している。 NISTIR8269はブログ執筆時点(2020年7月9日)でドラフト版であるが、「NIST SP8

                                                          機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning –
                                                        • 1億7000万円ものコストダウンを機械学習で達成したDropbox、一体どんな方法を取ったのか?

                                                          Dropboxが自社サービス上の「ファイルプレビュー機能」を機械学習で効率化することで、170万ドル(約1億7000万円)の費用削減を達成しました。具体的なシステムの内容について、機械学習エンジニアのWin Suen氏が説明しています。 Cannes: How ML saves us $1.7M a year on document previews - Dropbox https://dropbox.tech/machine-learning/cannes--how-ml-saves-us--1-7m-a-year-on-document-previews Dropboxはアップロードされたファイルを素早くプレビューするため、「Riviera」という内部システムを利用して事前にファイルのプレビューデータを生成しているとSuen氏は説明。しかし、事前に生成したデータが利用されず無駄になるケ

                                                            1億7000万円ものコストダウンを機械学習で達成したDropbox、一体どんな方法を取ったのか?
                                                          • 無理をしない機械学習プロジェクト2/step_or_not2

                                                            Challenge to data-driven 信託銀行で実践するデータドリブンな組織、カルチャーへの挑戦 / Challenge to data-driven Culture - practiced at a trust bank

                                                              無理をしない機械学習プロジェクト2/step_or_not2
                                                            • 機械学習やレコメンドでよく見る「特徴量」の本質とは――「行列分解」の基本を図版とPythonコードで理解する

                                                              AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回は「行列計算」について学びました。今回のテーマは、「行列の計算分解」です。 前回、データを分析する際には、基本的に1次元のベクトルデータではなく多次元のデータを用いることが多いので、行列計算が重要になると解説しました。行列の計算は、AIが行う計算でもよく使用されており、さまざまな分析に関わる教科書などは行列表記での説明がほとんどです。今回紹介する「行列分解」は、そんな行列計算の中で重要なテクニックの一つです。 行列分解をする理由や行列分解後に得られる結果の意味などについて、数式の内容よりも意味の解釈に注力して解説するので、そこに注目して学習してください。 行列分解をする理由 初めに「行列分解とは何か」を説明します。行列分解とは、ある行列を

                                                                機械学習やレコメンドでよく見る「特徴量」の本質とは――「行列分解」の基本を図版とPythonコードで理解する
                                                              • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "筑波大が無料公開している機械学習の講義動画 https://t.co/aOlSBqYefi ・講義ノートもダウンロード可能 ・単回帰に始まりCNN, RNN, GANまでひと通り学べる https://t.co/CqpnzfBfOm"

                                                                筑波大が無料公開している機械学習の講義動画 https://t.co/aOlSBqYefi ・講義ノートもダウンロード可能 ・単回帰に始まりCNN, RNN, GANまでひと通り学べる https://t.co/CqpnzfBfOm

                                                                  QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "筑波大が無料公開している機械学習の講義動画 https://t.co/aOlSBqYefi ・講義ノートもダウンロード可能 ・単回帰に始まりCNN, RNN, GANまでひと通り学べる https://t.co/CqpnzfBfOm"
                                                                • エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita

                                                                  本内容は、技術書典7 合同本『機械学習の炊いたん2』収録の、「エッジで機械学習」記事を公開したものです。内容は2019年9月時点の調査等に基づきます。 最近Raspberry Pi 4の検証結果などをみていると、エッジ、かつCPUでもそれなりの速度で動くケースもみられます。またこの後にM5StickV(K210)などを触りましたが、専用チップも使い所があります。今後、それらの動きもできれば補足したいと思います。 9/12-22に開催された技術書典9では、新刊『機械学習の炊いたん3』を頒布しました。私は、「AIエンジニア、データサイエンティストのための経営学、ソフトウェア工学」を寄稿しています。他にも機械学習のビジネス、エンジニアリング、数理までもりだくさん。気になられたら、ぜひご覧ください! 他にも、技術書典9「機械学習、データ分析」系の新刊リスト - Qiitaの通り、たくさんの本が出品

                                                                    エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita
                                                                  • 機械学習による株価予測 さがそう 真のNumerai Signals - Qiita

                                                                    追記事項(2020/10/13) 10月13日、本日Numerai Signalsが正式にリリースされた。これに伴ってFounderのRichard Craib氏がMediumに記事を投稿している(画像はMedium記事より引用)。 本記事の初回投稿時にはSignalsのターゲットはブラックボックスと書いたが、現在ヒストリカルターゲットが提供されるようになっている。これに加えてCraib氏の記事を受けて、Signalsに参加するインセンティブについても纏め直した。また記事の随所や画像についても最新のものに更新した。 はじめに 前回記事はこちら。 これまでベータ版であったNumerai Signalsの仕様がほぼほぼ確定した。株価のリターンを予測してシャープを競うベータ版から大きく変更が入り、誰も見たことのないようなオリジナルのSignalを探索するというタフな仕様となっている。筆者はこのト

                                                                      機械学習による株価予測 さがそう 真のNumerai Signals - Qiita
                                                                    • 機械学習の歴史 - AI.doll

                                                                      WikipediaのTimeline of machine learningというページに機械学習の歴史がまとめられた表があったので、あとから見返しやすいように全て日本語にしてみた。 日本語訳はガバガバかもしれないので心配な人は元ページを見てね。 ムムッってとこがあったらコメントで教えてほしい 年表 1763 ベイズの定理のベース トマス・ベイズ(Thomas Bayes)の著書, "An Essay towards solving a Problem in Doctorine of Chances"がベイズが死んだ2年後, 彼の友人により修正・編集され出版された. 1805 最小二乗 アドリアン=マリ・ルジャンドル(Adrien-Marie Legendre)が最小二乗(méthode des moindres carrés)について記述. 1812 ベイズの定理 ピエール=シモン・ラプ

                                                                        機械学習の歴史 - AI.doll
                                                                      • 本番環境での機械学習モデルの監視について (1/3)

                                                                        このシリーズでは本番環境でのモデルの監視の必要性について考えていきます。全3回を予定しています。今回はその最初の回です。データの集計処理に不具合が発生してしまい、すべてのユーザーのログイン回数が0となってしまった場合に発生する事象について、ケーススタディとして見ていきます。 今回の要旨 機械学習を本番環境で用いる場合、モデルに投入するデータが壊れると結果が壊れる機械学習モデルの精度指標を監視するだけでは不十分なことがあるデータの型だけではなく、欠損を表す値の割合や値の分布の変化についても監視が必要TOC· はじめに · 主旨 · 前提: EC サイトのマーケティングキャンペーン · 背景 · 机上検証 · 評価結果 · ケーススタディ すべてのユーザーのログイン回数が0 · 問題発生 · 発生した事象 · 原因 ∘ 他チームの行った変更に対応できていない ∘ データの欠損について気がつけて

                                                                          本番環境での機械学習モデルの監視について (1/3)
                                                                        • AI Platform Pipelines (Kubeflow Pipelines)による機械学習パイプラインの構築と本番導入 - ZOZO TECH BLOG

                                                                          ZOZOテクノロジーズ推薦基盤チームの寺崎(@f6wbl6)です。ZOZOでは現在、米Yale大学の経営大学院マーケティング学科准教授である上武康亮氏と「顧客コミュニケーションの最適化」をテーマに共同研究を進めています。 推薦基盤チームでは上武氏のチームで構築した最適化アルゴリズムを本番環境で運用していくための機械学習基盤(以下、ML基盤)の設計と実装を行っています。本記事ではML基盤の足掛かりとして用いたAI Platform Pipelines (Kubeflow Pipelines) の概要とAI Platform Pipelinesの本番導入に際して検討したことをご紹介し、これからKubeflow Pipelinesを導入しようと考えている方のお役に立てればと思います。記事の最後には、推薦基盤チームで目指すMLプロダクト管理基盤の全体像について簡単にご紹介します。 上武氏との共同研

                                                                            AI Platform Pipelines (Kubeflow Pipelines)による機械学習パイプラインの構築と本番導入 - ZOZO TECH BLOG
                                                                          • 機械学習やPythonの基礎を学べる無料講座、早大の講師らが担当 | Ledge.ai

                                                                            画像は『スマートエスイー「機械学習」講座PV~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では5月12日の15時から、早稲田大学を中心に35以上の大学、企業、業界団体が手がける社会人教育プログラム「スマートエスイー」の一環として、オンライン講座「機械学習」が開講される。受講料は無料。 本講座では、人工知能(AI)における機械学習の理論を把握した上で、「Python言語の基礎」「教師あり学習・教師なし学習」「強化学習」「異常検知と半教師あり学習」などについて学べる。実際のデバイスやデータを用いた演習、実習、議論については、オンラインでも参加できるプログラムを用意している。 講師・スタッフは電気通信大学大学院 情報理工学研究科 准教授の清雄一氏、早稲田大学 グリーン・コンピューティング・システム研究機構 研究院客員准教授の坂本一憲氏、早稲田大学 理工学

                                                                              機械学習やPythonの基礎を学べる無料講座、早大の講師らが担当 | Ledge.ai
                                                                            • 競馬予想 機械学習(LightGBM)で回収率100%超えたと思ったら、やらかしてた話 - Qiita

                                                                              謝意 注意!!! この記事は完全にやらかしています ストックしてくれた人、申し訳ないです。 @hal27 様の指摘で気づくことができました、ありがとうございます。 ・やらかしたこと スクレイピング段階から致命的なミスを犯しました。 レース時点から前走3レース分のデータを取得していたつもりですが、実はスクレイピング実行時刻から最新の3レース分の情報を取得していました。 ただ、前走の情報を全く使わずに予測したところ、平均して90%ほどの回収率だったので、 正しいデータを使っても、100%は超えれるんじゃないかと思っています。 やり直します! この記事はやらかしちゃっててるんだなと思いながら見て下さい。(特に前走情報のスクレイピング部分に気を付けてください) はじめに 最近データ分析にはまっています。 データ分析コンペのKaggleをやっていて、私がよく思うのは「売上予測?もっと面白いテーマはな

                                                                                競馬予想 機械学習(LightGBM)で回収率100%超えたと思ったら、やらかしてた話 - Qiita
                                                                              • 【機械学習 × テニス】姿勢推定とLightGBMを用いたテニスのスイング認識【動作検出】 - はんぺんのIT日記(改)

                                                                                はじめに 手法の決定 開発環境 データ取得 動画撮影 アノテーション 関節位置のデータ モデリング 学習用データ データ加工 データ分割 学習 評価 評価用データ Feature Importance Confusion matrix 動作の誤検出 高度化検討 トラッキングの追加 姿勢の検出精度の高いモデルの使用 特徴量の再検討 予測モデルへの転換 関節位置データのAugmentation さいごに 参考 はじめに こんにちは。はんぺんです。 テニスのスイングの検出・分類モデルを作ってみました。 youtu.be モチベーションとしては、インテリジェントデバイス的な何かを作ってみたいというものです。 ちょうど魔法少女リリカルなのはのレイジングハートみたいなイメージです。 インテリジェントデバイスとは、AIを有し自ら思考するタイプのデバイスのこと。 出展:レイジングハートとは (レイジングハ

                                                                                  【機械学習 × テニス】姿勢推定とLightGBMを用いたテニスのスイング認識【動作検出】 - はんぺんのIT日記(改)
                                                                                • 実用アルゴリズムの基礎「動的計画法」と機械学習の基礎「類似度」を知る

                                                                                  実用的なソフトウエアを開発するにはアルゴリズムの知識は欠かせない。基礎から機械学習まで、厳選した10個のアルゴリズムをPythonによる実装とともに解説する。 [7 動的計画法] レーベンシュタイン距離 多くの人にとって、アルゴリズムの学習の最初の壁となるのが、「動的計画法」ではないでしょうか。動的計画法は、「問題の部分的な結果を記録・利用しながら、最終的な結果を求める」手法の総称です。クイックソートや深さ優先探索のような手法よりも、1 段か2段、抽象的な概念である点と、アルゴリズムを可視化しにくい点が、難しく感じる原因なのだと思われます。また、“動的計画法”という名称が内容に合っていないことも、動的計画法をわかりにくくしていると言えるでしょう。 しかし、多くの有用なアルゴリズムは動的計画法の手法を使っているので、避けて通ることはできません。 ここでは、動的計画法で「レーベンシュタイン距離

                                                                                    実用アルゴリズムの基礎「動的計画法」と機械学習の基礎「類似度」を知る