並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 751件

新着順 人気順

mlの検索結果241 - 280 件 / 751件

  • 〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud 公式ブログ

    〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう 前回は、AutoML Tables による EC サイトの LTV 分析事例を紹介しました。今回は、同じ AutoML Tables を、より身近な課題の解決に使う方法を紹介します。 その課題とは、筆者自身が抱えていた 2 つの悩みです。ひとつは、スキャンして PDF で保管している書籍の「積ん読」を大量に抱えていたこと。もうひとつは、自宅作業ばかりで増え続けてしまっている体重です。 この 2 つの課題を一挙に解決するソリューションとして筆者が思いついたのが、「PDF 書籍をオーディオブックに変換する」という方法です。読みたかった書籍をオーディオブック化しておけば、ランニングしながら積ん読を解消できます。 この動画のように、Cloud Sto

      〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud 公式ブログ
    • PyTorchでの学習・推論を高速化するコツ集 - Qiita

      本記事では、NVIDIAから発表されているPyTorchでのディープラーニングを高速化するコツ集を紹介します。 【※NEW】22年6月新記事:スクラム関連の研修・資格のまとめ & おすすめの研修受講方法 本記事について 本記事は、NVIDIAのArun Mallyaさんの発表、 「PyTorch Performance Tuning Guide - Szymon Migacz, NVIDIA」 に、説明やプログラムを追加して、解説します。 本記事のポイントは、Andrej KarpathyがTwitterで呟いている通りとなります。 good quick tutorial on optimizing your PyTorch code ⏲️: https://t.co/7CIDWfrI0J quick summary: pic.twitter.com/6J1SJcWJsl — Andrej

        PyTorchでの学習・推論を高速化するコツ集 - Qiita
      • データサイエンスはつまらない(パート1)【前編】 | AI専門ニュースメディア AINOW

        著者のIan Xiao氏は、顧客企業に機械学習ソリューションを提供するカナダの企業DESSAにおいて「契約リード(Engagement Lead)」という肩書で機械学習プロジェクトを指揮管理しています。同氏がMediumに投稿した記事「データサイエンスはつまらない(パート1)」では、データサイエンス職におけるつまらない側面が解説されています。 同氏の甥はコンピュータサイエンスの修士課程で勉強しており、卒業後はデータサイエンス職に就きたいと考えていると聞いて、同氏は甥が正しい判断を下せるようにデータサイエンス職における「つまらない」側面をあえて伝えようと決意しました。 データサイエンス職を志望する若者は、仕事に就けば機械学習モデルの構築のような知的にエキサイティングな業務に携われると思い込んでいます。しかし、現実には業務時間のほとんどを退屈でつまらない仕事に関わることになる、と同氏は指摘しま

          データサイエンスはつまらない(パート1)【前編】 | AI専門ニュースメディア AINOW
        • ChatGPTで自前のドキュメントを利用できるプラグイン、「ChatGPT Retrieval Plugin」の概要 | DevelopersIO

          2023年3月23日、OpenAI社はChatGPTでのプラグインの立ち上げを発表しました。 これにより、ChatGPTとさまざまな情報を組み合わせることができるようになり、ChatGPTが利用できるシーンはさらに多様になっていくと予想されます。 この発表と併せて、OpenAI社のGithubリポジトリで、「ChatGPT Retrieval Plugin」が公開されました。 このプラグインにより、ChatGPTで自前のドキュメントを利用する(つまり、自前のドキュメントの情報をもとにしたQ&Aなどができる)ようになるようです。 2023年3月24日現在、まだChatGPTのプラグイン自体は利用するにはWaitlistに登録して順番を待たなければいけない状態です。そのため、このプラグインをいまいま試すことはできないのですが、Github上のREADMEを読み解いて、どんなことができるかなどざ

            ChatGPTで自前のドキュメントを利用できるプラグイン、「ChatGPT Retrieval Plugin」の概要 | DevelopersIO
          • Stanford CS229: Machine Learning Full Course taught by Andrew Ng | Autumn 2018

            Led by Andrew Ng, this course provides a broad introduction to machine learning and statistical pattern recognition. Topics include: supervised learning (gen...

              Stanford CS229: Machine Learning Full Course taught by Andrew Ng | Autumn 2018
            • 情報数理科学VII

              機械学習手法の定式化を前半で学び、それらの基礎となるパラメータ推定理論を後半で扱う。 演習では講義で扱ったアルゴリズムの実践を行う。 Ⅰ.教師あり学習 1.最小二乗法 2.過学習と正則化 3.交差検証 4.正則化付き経験リスク最小化 5.カーネル法 Ⅱ.教師なし学習 1.ハードクラスタリング問題 2.ソフトクラスタリング問題 3.次元削減問題 Ⅲ.ベイズ推論 1.各問題の確率論的定式化 2.推定理論 Ⅳ.凸最適化 1.凸関数 2.双対問題 3.最適化法

                情報数理科学VII
              • CyberAgent AI事業本部2024年度MLOps研修基礎編 / MLOps Basic

                同年度のMLOps研修資料はこちらです。 (1/4) CyberAgent AI事業本部2024年度MLOps研修Container編: https://speakerdeck.com/szma5a/container-for-mlops (2/4) CyberAgent AI事業本部2024年度MLOps研修基礎編: https://speakerdeck.com/nsakki55/mlops-basic (3/4) CyberAgent AI事業本部2024年度MLOps研修応用編: https://speakerdeck.com/tyaba/mlops-handson (4/4) CyberAgent AI事業本部2024年度MLOps研修実践編: https://speakerdeck.com/hosimesi11/mlops-practice

                  CyberAgent AI事業本部2024年度MLOps研修基礎編 / MLOps Basic
                • 第1回 自分にしか書けないものにこだわった ―異色の機械学習書誕生の裏側 | gihyo.jp

                  2021年8月に発売される『機械学習を解釈する技術』の著者である森下光之助氏と、『施策デザインのための機械学習入門』を共著した齋藤優太氏、安井翔太氏の3人による対談を3回にわたってお届けします。第1回は、書籍執筆のモチベーションのお話から。 それは個人的な興味から始まった 安井:では僕から振ったほうがいいでしょうか。じゃあとりあえず執筆のモチベーションと裏話みたいなところから伺っていきたいのですが。 安井翔太(やすいしょうた)2013年にNorwegian School of Economicsにて経済学修士号を取得しサイバーエージェント入社。入社後は広告代理店にて広告効果検証等を行い、その後2015年にアドテクスタジオへ異動。以降はDMP・DSP・SSPと各種のアドテクプロダクトにおいて、機械学習に関する業務やデータを元にした意思決定のコンサルティングを担当。現在はAILabの経済学チー

                    第1回 自分にしか書けないものにこだわった ―異色の機械学習書誕生の裏側 | gihyo.jp
                  • Googleが自然言語処理の弱点「言い換え」を克服するデータセットを公開

                    by Nicole Honeywill 自然言語処理のアルゴリズムは言葉の順序や構造の理解を不得意としてきました。この課題を克服すべく、Googleが新たにデータセットを公開。このデータセットで訓練を行うと、機械学習モデルのテキスト分類精度が50%から80%にまで向上するとのことです。 Google AI Blog: Releasing PAWS and PAWS-X: Two New Datasets to Improve Natural Language Understanding Models https://ai.googleblog.com/2019/10/releasing-paws-and-paws-x-two-new.html Googleは機械翻訳や音声認識で自然言語処理を取り入れていますが、自然言語処理では最先端のアルゴリズムでも「ニューヨークからフロリダへのフライト」

                      Googleが自然言語処理の弱点「言い換え」を克服するデータセットを公開
                    • Whisper + GPT-3 で会議音声からの議事録書き出し&サマリ自動生成をやってみる! - Qiita

                      こんにちは!逆瀬川 (https://twitter.com/gyakuse)です! 今日は議事録の音声からの書き出しとサマリの自動生成を行います。 概要 会議音声(wavとかmp3ファイル)からWhisperを用いて書き出しを行い、GPT-3.5でサマリを自動生成します。 会議音声としていますが、べつにどんな音声でも大丈夫です。 Colab whisper.cpp版(処理に動画秒数×10倍程度の時間がかかりますがGPU不要です) whisper.fp16版(処理は動画秒数/4程度の時間で済みますがGPU必須です) 使い方 OpenAIのAPIキーを貼り付け ランタイム > すべてのセルを実行から実行し、最初の処理の下に出てくるファイル選択で録音ファイルを選択します ひたすら待ちます 実装 Whisperの軽量化 Whisperの軽量化としては、cpp実装のwhisper.cppがあります

                        Whisper + GPT-3 で会議音声からの議事録書き出し&サマリ自動生成をやってみる! - Qiita
                      • 推薦システム実践入門

                        情報化時代が到来し、日常で意思決定をする回数と選択肢の数が急増したことで、推薦システムの需要が高まっています。そのため、昨今では多くのウェブサービスへ新たに推薦システムの導入が検討されることも増えました。本書では、推薦システムの概要から、UI/UX、アルゴリズム、実システムへの組み込み、評価まで紹介し、適切な推薦システムの実装ができるようになります。「実際の仕事に活かす」ことを目的に、著者たちが実務で経験した推薦システムの成功事例や失敗事例を交えながら、実サービスに推薦システムを組み込むという観点を重視した入門的な内容です。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷版

                          推薦システム実践入門
                        • グーグルが発見した、機械学習が現実世界で使い物にならない理由

                          研究室ではうまく機能する人工知能(AI)システムが、現実世界でうまく機能しないことはしばしばある。主な原因としてこれまで、AIを訓練・テストする際に使うデータと現実のデータの不一致が指摘されていたが、グーグルの研究チームは別の原因を突き止めた。 by Will Douglas Heaven2020.11.24 391 308 72 55 研究室で完璧に近い性能を発揮できるように調整された機械学習モデルが、現実世界では良い結果を出せないことがしばしばあるというのはよく知られている。通常これは、人工知能(AI)を訓練およびテストする際のデータと、現実世界で遭遇するデータの間に不一致が起こることが要因となって起こる問題であり、「データシフト」と呼ばれている。例えば、高品質な医用画像から疾病の兆候を発見するよう訓練されたAIが、忙しい病院の安価なカメラで撮影された、ぼけや切れ目がある画像に対して能

                            グーグルが発見した、機械学習が現実世界で使い物にならない理由
                          • 時系列データを前処理する際のPython逆引きメモ - EurekaMoments

                            機械学習のための「前処理」入門 作者:足立悠リックテレコムAmazon 目的 データ分析の仕事をする中で最も扱う機会が多いのが 時系列データだと思います。その中で欠損値を扱ったり、 統計を取ったり、特徴量を作り出したりするのですが、 毎回やり方を忘れてググっているので、上記の書籍を読んで こういった前処理の方法をいつでも確認できるように メモしておこうと思います。 目次 目的 目次 日時のデータをdatetime型に変換する 最初の日時からの経過時間を計算する 各データの統計量を計算する 欠損値の確認と補完 経過時間の単位を変換する データフレーム結合する 基準日時からの経過時間を計算する 重複した行を削除する 特定のデータ列をインデックスにする 部分的時系列を抽出して統計量を計算する データフレームの各列をリストにして結合する 不均衡データから教師データを作成する データの読み込みと可視

                              時系列データを前処理する際のPython逆引きメモ - EurekaMoments
                            • 国友直人のホームページ

                              私のホーム・ページにようこそ 制作協力:福井崇人・一場知之/最後の訂正:2023年1月15日 [ 英語 | 日本語 ] 研究・教育活動の主な分野 統計学、計量経済学、数理・計量ファイナンス、経済統計学、データサイエンス(統計科学) 最近の活動 社会協力活動 国土交通省第三者委員会委員(建設工事受注動態統計調査の不適切処理問題, 2021.12.23-2022.1.14) 報告書, 国土交通省 研究協力 経済時系列解析プログラム・季節調整法X12SIML(佐藤整尚先生, 2023.2.1) 日本語解説, 英語解説 新刊 「データ分析のための統計学入門」("OpenIntro Statistics, 4th Edition" by D.Diez, M.Cetinkaya-Rundel and C.Barr, 日本語印刷版(誤植訂正版), 日本統計協会, 小暮厚之氏・吉田靖氏と共訳,2021年3

                              • 第1回 難しくない! PyTorchでニューラルネットワークの基本

                                PyTorchの習得は、シンプルなニューラルネットワーク(NN)の、まずは1つだけのニューロンを実装することから始めてみよう。ニューロンのモデル定義から始め、フォワードプロパゲーションとバックプロパゲーションといった最低限必要な「核」となる基本機能に絞って解説。自動微分についても簡単に触れる。 連載目次 人気急上昇の「PyTorch」を使いたい。そう考えて、PyTorchの公式チュートリアルを開いて学習を始めてみた、という人は少なくないだろう。しかし、挫折してしまったり、なかなか進まなかったり、という人も少なくないのではないだろうか。 というのも、その公式チュートリアルの、最初の「テンソル」解説だけは(NumPyライクな直観的なAPIなので)難しくないとしても、次が「Autograd(自動微分)」、その次が「ニューラルネットワーク」……と言いつつも、いきなり「CNN(畳み込みニューラルネッ

                                  第1回 難しくない! PyTorchでニューラルネットワークの基本
                                • データサイエンティストの終わりなき戦い - Qiita

                                  はじめに 筆者はかつてデータサイエンティストだった者です。 統計や機械学習をバリバリ使いこなしてデータを分析し、将来の売り上げ予測や要因分析、施策の効果検証などをすることに憧れてこの世界に入りましたが、そうした時間は全体の1割ほどに過ぎず、残り9割の時間の戦いに疲れて戦場を後にしました。 なぜデータサイエンティストは戦わなければならないのだろう。 おそらく一因としてあるのが、データサイエンティストという言葉がバズワード化しすぎてしまったせいで、その定義の輪郭が失われてしまったことだと思います。 整理された定義は、言わずと知れた尾崎隆さんのデータサイエンティスト・機械学習エンジニア・データアーキテクトの定義とスキル要件(2021年版)に記載されています。 しかし、専門家でも意見が別れる定義を素人がはっきりと分かるはずもなく、過度な期待が寄せられることで討死してしまうデータサイエンティストが少

                                    データサイエンティストの終わりなき戦い - Qiita
                                  • DeepLearningの歴史、学習方法について (E資格対策) - Qiita

                                    まずディープラーニングがどのように発展していったのかお話しします。 第一次ニューラルネットワークブーム ある時、脳の神経細胞を仕組みを再現した人工ニューロンを作ります。 人工ニューロンとは上図のようなものを指します。 この複数の信号から1つの信号を出力するアルゴリズムをパーセプトロンと呼びます。 この人工ニューロンを2つ重ねるとが学習できるらしくブームが起こります。下図。 ですが世の中の多くを占めている非線形の問題が解けなく、ブームが終わります。 第二次ニューラルネットワークブーム 実は3層以上重ねるとどうやら非線形問題が解けることは知られていましたが、誰も実装まで手が付けられませんでした。 ところがある時、BackPropagationという方法が発見され、3層以上を重ねられました。 何層も重ねたものをニューラルネットワークと呼びます。 (アルゴリズムを多層パーセプトロンといいます。)

                                      DeepLearningの歴史、学習方法について (E資格対策) - Qiita
                                    • Deep Tabnine - Tabnine Blog

                                      Update (August 19): We’ve released Tabnine Local, which lets you run Deep Tabnine on your own machine. TL;DR: Tabnine is an autocompleter that helps you write code faster. We’re adding a deep learning model which significantly improves suggestion quality. You can see videos below and you can sign up for it here. There has been a lot of hype about deep learning in the past few years. Neural network

                                        Deep Tabnine - Tabnine Blog
                                      • 2020年のおもしろかったDL/ML論文10選 - Qiita

                                        はじめに 2020年も,機械学習コミュニティでは多くの新しい成果が見られました.2019年に引き続き,1年を振り返ってもっとも面白かった論文を10本紹介したいと思います. * 本記事は,私のブログにて英語で書いた記事を翻訳し,適宜加筆修正したものです. ** 記事中の画像は,ことわりのない限り対象論文からの引用です. 論文10選(公開順) 普段から,読んだ論文を簡単にまとめてツイートしているので,それを使って公開日順に振り返っていきます.対象はおおまかに「2020年に公開された論文」と「2020年に学会・雑誌で発表されたもの」とします.全くの主観で選んでいるので,私の興味範囲である深層学習および応用研究に偏っている点はご容赦ください. 紹介するのはこちらの10本です! Rigging the Lottery: Making All Tickets Winners PIFuHD: Multi

                                          2020年のおもしろかったDL/ML論文10選 - Qiita
                                        • 因果推論の先へ―機械学習で因果効果を予測する『反実仮想機械学習(Counterfactual Machine Learning)』入門 | 株式会社ARISE analytics(アライズ アナリティクス)

                                          Tweet 因果推論の先へ―機械学習で因果効果を予測する『反実仮想機械学習(Counterfactual Machine Learning)』入門 はじめに ARISE analytics の近藤です。本記事では、次世代の意思決定技術として注目されている反実仮想機械学習(Counterfactual Machine Learning:CFML)を紹介します。 本記事は、CFMLを日本語で体系的に整理し、初学者の理解を手助けすることをねらいとして執筆しました。本記事の理解促進につながるように、ベースとなった勉強会資料を記載します。こちらも併せて閲覧いただくことで理解の助けになれば幸いです。 目次 ・ はじめに ・ Counterfactual Machine Learning(CFML) ・ Off-Policy Evaluation(OPE) ・ CFMLを支える技術(オープンデータとツー

                                            因果推論の先へ―機械学習で因果効果を予測する『反実仮想機械学習(Counterfactual Machine Learning)』入門 | 株式会社ARISE analytics(アライズ アナリティクス)
                                          • Google のクチコミの仕組みについて

                                            行ったことのない場所を検索するとき、地域の多くの情報が詰まった Google のクチコミを使えば、お店やレストランなど、あなたにぴったりの場所やビジネスの情報を見つけることができます。 日々、世界中のユーザーから数百万件にのぼるクチコミが投稿されており、Google は情報の有益性と正確性を保つため 24 時間体制でサポートしています。不適切なコンテンツを防ぐための作業の多くはあまり知られていませんが、今回はユーザーがクチコミを投稿した時の舞台裏を紹介します。 ポリシーの作成と実施 クチコミが実際の体験や来店に基づいていることを確認し、関係性のないコメントや不快なコメントを Google ビジネス プロフィールから除外するために、 厳格なコンテンツポリシー を作成しています。 世界が進歩するにつれて、Google のポリシーと保護も進化しています。これにより、不正行為の対象となる可能性があ

                                              Google のクチコミの仕組みについて
                                            • 画像認識と深層学習

                                              日本ロボット学会 ロボット工学セミナー 第126回 ロボットのための画像処理技術 講演資料 https://www.rsj.or.jp/event/seminar/news/2020/s126.html 2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては深層学習,その中でも特に畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなった.CNNはクラス分類をはじめとして,物体検出やセグメンテーションなど様々なタスクを解くためのベースネットワークとして広く利用されてきている.本講演では,CNNの発展を振り返るとともに,エッジデバイスで動作させる際に重要となる高速化等,関連する深層学習技術の解説を行う. 1. クラス分類向けモデルについて 1.1. ILSVRCで振り返る進化の歴史 1.2. その他重要なモデル 1

                                                画像認識と深層学習
                                              • 勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)

                                                Gradient Boostingは近年Kaggleなどのコンペティションで注目を集めている分類や回帰問題に対するアルゴリズムの一つである。XGBoost, LightGBM, CatBoostなどが有名ではあるが、それらを土台にして近年はDeepGBMやNGBoostといった新規アルゴリズムの登場、汎化理論解析の進展、モデル解釈性の付与方法の多様化など、理論から応用まで多岐にわたる研究が行われている。本チュートリアルでは、Gradient Boostingに関する近年の研究動向やテクニックを、それらの社会実装までを見据えながら紹介していく。 Read less

                                                  勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
                                                • (データを扱う)ビジネスマン全てにおすすめの本 - HELLO CYBERNETICS

                                                  はじめに データ分析:実用系 Kaggleで勝つデータ分析の技術 ウェブ最適化ではじめる機械学習 データ分析:因果推論 入門 統計的因果推論 計量経済学 大人の教養 世界標準の経営理論 科学的に正しい筋トレ 最強の教科書 落合務のパーフェクトレシピ はじめに 今回は、特にドメインを指定せず、読むと間違いなく誰にでも勉強になるであろうと感じた書籍を紹介します。 データ分析:実用系 Kaggleで勝つデータ分析の技術 Kaggleで勝つデータ分析の技術 作者:門脇 大輔,阪田 隆司,保坂 桂佑,平松 雄司発売日: 2019/10/09メディア: 単行本(ソフトカバー) "Kaggleで勝つ"と題名にはありますが、データ分析、特に予測モデルを作るようなケースで重要な基礎知識が実践的に学ぶことができる非常に良い本となっています。例えば、交差検証といえば、基本的には汎化誤差の推定量として統計学の本に

                                                    (データを扱う)ビジネスマン全てにおすすめの本 - HELLO CYBERNETICS
                                                  • Microsoft、機械学習の初学心者向けにカリキュラムを無償公開

                                                    Microsoft、機械学習の初学心者向けにカリキュラムを無償公開:AIとデータサイエンスのカリキュラムも公開予定 Microsoftは機械学習の初学者向けカリキュラム「Machine Learning for Beginners」をGitHubで無償公開した。いわゆる「古典的な機械学習」について24のレッスンを通じて学習できる。

                                                      Microsoft、機械学習の初学心者向けにカリキュラムを無償公開
                                                    • レコメンドエンジン導入までの取り組みとアーキテクチャについて - コネヒト開発者ブログ

                                                      こんにちは!MLエンジニアのたかぱい(@takapy)です。 今回は、ママリのアプリ内にレコメンドエンジンを導入したので、導入までの取り組みやアーキテクチャについてご紹介できればと思います。 目次 ママリ内での課題 アーキテクチャ概要 EDAとアルゴリズムについて オフライン検証の失敗と学び A/Bテストについて レコメンドアルゴリズムについて 強調フィルタリング(アイテムベース) Matrix Factorization 最後に ママリ内での課題 ママリはサービスとして6年目を迎え、サービスの成長とともにアプリ内の記事数も増えており、それに伴いユーザーが本来欲しい情報にたどり着くことも難しくなってきました。 加えて「子育て層のユーザー」という切り口1つとっても、0才児のママと1才児のママでは悩みや欲しい情報がまったく異なります。 このような背景から、これまで人的に行っていたルールベースで

                                                        レコメンドエンジン導入までの取り組みとアーキテクチャについて - コネヒト開発者ブログ
                                                      • DWHを活用した機械学習プロジェクト/ml-with-dwh

                                                        Data Platform Meetup 【vol.2】 https://data-platform-meetup.connpass.com/event/155073/ での発表スライドです。 クックパッドにおける,DWHと密に連携した機械学習プロジェクトの話です。

                                                          DWHを活用した機械学習プロジェクト/ml-with-dwh
                                                        • Transformer

                                                          2022年6月8日にSSII 2022のチュートリアル講演で使用 2023年2月2日に順天堂大学産学連携講座:AI技術とビジネス活用で使用 2017年に機械翻訳を対象として提案されたTransformerは、従来の畳込みや再帰を排して自己注意機構を活用したニューラルネットワークです。2019年頃からコンピュータビジョン分野でも急速に応用が進んでいて、より柔軟かつ高精度なネットワーク構造としての地位を確立しつつあります。本スライドでは、そんなTransformerの最前線を概説しています。基盤モデルやVision Transformer、MLP/CNNの逆襲についても取り扱っています。 ・そもそもTransformerって? ・Transformer旋風と基盤モデル ・Transformerのノウハウ ・Transformerはオワコン?! ・CNNはオワコン?!

                                                            Transformer
                                                          • AIトレンド(短期~長期)を追うのに参考にしている人/リンク集|bioshok

                                                            とりあえず僕(TwitterID @bioshok3)がAIトレンド(現状から長期まで)を追うのに参考にしている人やサイトを随時ここに書いていきます。 (※個人的に追っている方orリンクなので情報の正確性は保証しません。それと分類も主観的なものです。) AI論文系発信

                                                              AIトレンド(短期~長期)を追うのに参考にしている人/リンク集|bioshok
                                                            • 機械学習による競馬予想で安定して勝てるのか? (2022年に半年奮闘した上での考察)

                                                              この記事は 競馬AI / 予想Tech Advent Calendar 2022 の23日目です。 はじめに 「機械学習による競馬予想で安定して勝てるのか?」 ということで、半年ほど奮闘して実感したことや思ったことを書きます。 対象は中央競馬(JRA)の開催レースです。「馬柱」や「上がり3ハロン」のような一般的な競馬用語は知っている前提で書くので、競馬初心者の方は調べて詳しくなりながらお読みください。 また、この記事では詳細なコードの内容までは紹介しません。 自己紹介 普段はLinuxサーバ上でコマンドを叩くことで生計を立てています。開発職ではありません。得意なコマンドは uptime です。 競馬歴はダイワスカーレットが現役の頃からで、競馬ゲームのウイニングポストもよくプレイしていました。好きな馬はヒカリデユールです。 あらまし 職場の先輩が「機械学習で競馬予想AI作ろうとしてる。自分で

                                                                機械学習による競馬予想で安定して勝てるのか? (2022年に半年奮闘した上での考察)
                                                              • 機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita

                                                                scikit-learnライブラリを用いて、機械学習の実装とアルゴリズムをバランス良く学んでいただく書籍を執筆しました。 AIエンジニアを目指す人のための機械学習入門 実装しながらアルゴリズムの流れを学ぶ(電通国際情報サービス 清水琢也、小川雄太郎 、技術評論社) https://www.amazon.co.jp/dp/4297112094/ 既に発売開始しています。 機械学習の ・各種アルゴリズムの実装 ・それぞれのアルゴリズムの動作の仕組み これらを学んでみたい方に向けて執筆いたしました。 ご活用いただければ幸いです。 昨年書いた書籍 つくりながら学ぶ! PyTorchによる発展ディープラーニング(小川雄太郎、マイナビ出版) の、機械学習版のような位置付けです。 本記事では、 ・本書を書いたモチベーション ・本書の概要 ・本書の目次 を紹介いたします。 本書を書いたモチベーション 本書

                                                                  機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita
                                                                • Webエンジニアが使う身近な Kubernetes を開催しました - エムスリーテックブログ

                                                                  こんにちは。エムスリーエンジニアリングGの岩月(@kaito2)です。 9/9(月) にSpeeeさん1のオフィスをお借りして、Kubernetes勉強会 題して「Webエンジニアが使う身近な Kubernetes」を開催しました!! Webエンジニアが使う身近な Kubernetes - connpass なんと 当日の早朝には台風第15号 (ファクサイ) が直撃!! 私も午後からの出勤でした。 そんな足元の悪い中多くの方にお越しいただき、ありがとうございました。 本勉強会は、最近着々と身近になってきているコンテナオーケストレーションシステムである Kubernetes への取り組みについて発表・議論を目的としています。 今回は、エムスリーと JapanTaxi さんでの Kubernetes に関する取り組みの発表でした。 発表内容 発表順に内容および資料を紹介します。 Kuberne

                                                                    Webエンジニアが使う身近な Kubernetes を開催しました - エムスリーテックブログ
                                                                  • グーグル「Explainable AI」発表--機械学習モデルが結論を得るプロセスの透明性向上へ

                                                                    ほとんどの人が何らかのアルゴリズムに日々接している一方、人工知能(AI)がどのように機能するのか、実際に理解していると自信を持って言える人はそれほど多くない。しかし、Googleが英国で現地時間11月20日から開催している「Google Cloud Next '19 UK」で発表した新たなツールは、一般の人々が機械学習(ML)の難解さをひもとくうえで力となるはずだ。 「Explainable AI」(説明可能なAI)と呼ばれるこのツールは、MLモデルが思考を重ねる手法と、結論に至った理由をユーザーに説明するという、その名が示す通りの機能を有している。 Explainable AIは、そういった機能を実現するために、データセット内の各特徴がアルゴリズムの導き出した結果にどの程度の影響を与えたのかを定量化する。つまり、それぞれのデータ係数には、MLモデルにどの程度影響を与えたのかを示すスコアが

                                                                      グーグル「Explainable AI」発表--機械学習モデルが結論を得るプロセスの透明性向上へ
                                                                    • 「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見

                                                                      はじめに 機械学習に関する実用的な知見を知るために、「Kaggleで勝つデータ分析の技術」を読んだので、Kaggle以外の場面でも活用できる話題をまとめてみた。本書は機械学習の基本的な内容も含んでいるが、この記事では機会学習に関する一通りの知識を持ち、実問題に利用している読者を想定してまとめた。従って、勾配ブースティング木の仕組みや、回帰タスクの評価方法等、基本的な内容については解説しない。本記事では、評価の落とし穴や、モデルを改善するための特徴量の工夫、チューニングのTipsについて紹介する。 特徴量 Tips 1: 欠損値の扱い データにはしばしば欠損値が含まれている。欠損値は、そもそも値が存在していない場合の他に、ユーザが意図して入力していない場合や、観測器のエラーによって取得できていない場合等、様々な理由によって生じる。欠損がランダムに発生していない限り、欠損しているという事実が何

                                                                        「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見
                                                                      • AI For Everyone (すべての人のためのAIリテラシー講座)

                                                                        AIはエンジニアだけのものではなく、今や社会⼈の基本リテラシーと⾔えます。本 コースは、AIの基礎を学びたい⽅、今の組織をAIを使いこなせる組織へと変⾰させ たい⽅、そんなすべての⽅々に、理系⽂系問わず、肩書きや職種問わず、受講いた だけるコースです。 本コースでは、次のことを学習していただきます: - ニューラルネットワーク、機械学習、ディープラーニング、データサイエンス など、⼀般的なAIに関する専⾨⽤語とその意味 - 実際にAIができること、できないこと - 組織の課題解決のためにAIを適⽤できる可能性とその⽅法 - 機械学習およびデータサイエンスプロジェクトの進め⽅ - AIエンジニアチームと連携して社内でAI戦略を構築する⽅法 - AIを取り巻く倫理的および社会的議論の概要 本コースはDeepLearning.AIが提供している通常の「AI for Everyone」(オリジナル

                                                                          AI For Everyone (すべての人のためのAIリテラシー講座)
                                                                        • データ分析コンペで役に立つ特徴量管理方法と学習・推論パイプライン【コネヒトマルシェLT書き起こし】 - コネヒト開発者ブログ

                                                                          こんにちは!MLエンジニアの野澤(@takapy0210)です! 気づけば2019年の営業日も残り20日強ですね。年始に立てた個人的な目標が1/5しか達成できていないことに先日気付いたので、残りの期間で1つくらいは達成できると良いですね、という他人行儀な振る舞いをしたくなっている今日この頃です。 さて今回は、11月5日に開催した(コネヒトマルシェ)でLTした内容の全文書き起こしです。参考資料とあわせてご紹介できればと思います。 全文書き起こしは初の試みなので「ふ〜ん。なるほど〜」ぐらいのお気持ちで見ていただければと思います。 発表資料はこちらです。 Kaggleとは Kaggleと書いて「カグル」と読みます。日本でも最近は定着してきましたが、Kaggleに参加している方を「カグラー(Kaggler)」とも呼びます。 「The Home of Data Science & Machine L

                                                                            データ分析コンペで役に立つ特徴量管理方法と学習・推論パイプライン【コネヒトマルシェLT書き起こし】 - コネヒト開発者ブログ
                                                                          • AzureMLは機械学習をこれから勉強する人にとって最高の環境だった - Qiita

                                                                            ブルベースの諫山です。 先日、機械学習の勉強会を職種・役職関係なく、非エンジニアも含め20名以上で開催しました。会社として今後、機械学習に力を入れていくに際し、共通言語を持つ必要性を感じたため、開催に至りました。 その研修ではAzureMLを使って簡単な回帰モデルの作成ができることをゴールとして課題設定したため、営業メンバーでも問題なく課題をこなすことができました。AzureMLでなければ、営業メンバーはきっと課題を完成させることはできなかったでしょう。今回はAzureMLが初学者の学習プラットフォームとしては最適である理由などをお伝えしたいと思います。 AzureMLを選んだ理由 エンジニアのみであれば、Pythonでコードを書くことも出来たでしょう。しかし、今回は営業メンバーも含まれているため、コードを書かせることは出来ません。一方、AzureMLはドラッグ&ドロップで機械学習のステッ

                                                                              AzureMLは機械学習をこれから勉強する人にとって最高の環境だった - Qiita
                                                                            • 「機械学習〜推薦システムを題材に〜」講義資料(生成AIの話題も含む)|masa_kazama

                                                                              2023年に東京都立大学で非常勤講師として、学部3年生向けに「機械学習〜推薦システムを題材に〜」というテーマで講義をしました。 90分×3コマ×2日間の計6コマの集中講義で、Streamlitで映画のレコメンドアプリを実際に作ってみるなどの演習も含めたものです。 昨年、大学院生向けに同様の講義を3コマ分していたので、それを拡張する形で、最近話題の生成AIの話も1コマ分用意しました。(昨年の授業資料はこちらにあります。) 推薦システムや生成AI×推薦システムについて興味ある方のご参考になりましたら。 1日目(90分×3コマ) 推薦システムの概要 推薦システム-各推薦アルゴリズム 推薦システムの周辺技術(評価指標について)

                                                                                「機械学習〜推薦システムを題材に〜」講義資料(生成AIの話題も含む)|masa_kazama
                                                                              • 機械学習システムの信頼性を数値化する ML Test Scoreのハンズオンワークショップを開催しました | メルカリエンジニアリング

                                                                                こんにちは、メルカリでCRE (Customer Reliability Engineering) に所属している @hurutoriya です。 今回メルカリ社内での勉強会の一環として、Google が提案した機械学習システムの信頼性を数値化する ML Test Score のハンズオンワークショップを開催しました。 本記事では、ML Test Score の説明、ワークショップの開催方法や簡単な考察などをお話します。 今回はWFHの影響も受け Google Meet を使ったフルリモートでの開催となりました。 ワークショップの内容として、メルカリ内で実際に運用されている機械学習システムを対象に、実際にそのシステムを開発する機械学習エンジニアが ML Test Score を計算しました。 ML Test Scoreの説明 ML Test Score の目的は、定量化しづらい機械学習シス

                                                                                  機械学習システムの信頼性を数値化する ML Test Scoreのハンズオンワークショップを開催しました | メルカリエンジニアリング
                                                                                • 機械学習のオススメ情報収集術|べいえりあ

                                                                                  今回は、自分が機械学習に関する最新情報を収集するにあたってどういう情報源を頼っているのかを紹介してみたいと思います。 はじめに今回の記事では、機械学習(主にNLP、あと医療を少々)の「最新情報(=最新の研究)」の収集術について書きます。個人的に思っているのは、最新の研究情報の収集というのは基礎的なことを理解して初めて意味を成すものだと思っているので、もし基本的な教科書を読んでいないのであれば、まずはMurphy本(機械学習)だったりJurafsky-Martin(NLP)を読むことをオススメします。 ブログ、特に各企業のAIブログなど最近は優秀な研究者の方々がアカデミアから企業に移っていたりするので、企業のAIブログなどをフォローしていると結構な量の情報を集められたりします。 企業のAIブログの良い点は、大抵の場合論文の著者が記事を書いているので内容がとても正確であること。デメリットは一応

                                                                                    機械学習のオススメ情報収集術|べいえりあ