並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 47件

新着順 人気順

教師なし学習の検索結果1 - 40 件 / 47件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

教師なし学習に関するエントリは47件あります。 機械学習AI学習 などが関連タグです。 人気エントリには 『Kaggleは実務の役に立つ? データサイエンティストがKaggleから学んだ「教師あり学習」の勘どころ - エンジニアHub|Webエンジニアのキャリアを考える!』などがあります。
  • Kaggleは実務の役に立つ? データサイエンティストがKaggleから学んだ「教師あり学習」の勘どころ - エンジニアHub|Webエンジニアのキャリアを考える!

    エンジニアHub > 記事一覧 > Kaggleは実務の役に立つ? データサイエンティストがKaggleから学んだ「教師あり学習」の勘どころ Kaggleは実務の役に立つ? データサイエンティストがKaggleから学んだ「教師あり学習」の勘どころ 機械学習のトレーニングとして、Kaggleに挑む方は多いでしょう。ただ、Kaggleで鍛えて、データサイエンティストとしての実際の業務に生かせるの?こんな疑問にこたえるべく、日本経済新聞社のデータサイエンティスト、石原祥太郎さんが、「仕事とKaggle」の関係性を綴ります。 日本経済新聞社でデータサイエンティストとして働いている石原です。 本稿では、筆者が社外活動として取り組んでいる世界規模の機械学習コンペティション「Kaggle」を紹介します。特に「Kaggleがどのような観点で実務に役立っているか」という筆者の経験談を基に、Kaggleの魅力

      Kaggleは実務の役に立つ? データサイエンティストがKaggleから学んだ「教師あり学習」の勘どころ - エンジニアHub|Webエンジニアのキャリアを考える!
    • 教師あり学習の精度を超えた!?相互情報量の最大化による教師なし学習手法IICの登場!

      3つの要点 ✔️相互情報量を最大化する枠組みでニューラルネットを学習する教師なし学習手法IICの提案 ✔️予測値をそのまま出力するニューラルネットを学習可能であるため、クラスタリングが不要 ✔️従来の教師なし学習手法の「クラスタが一つにまとまってしまう問題」および「ノイズに弱いという問題」を解決 Invariant Information Clustering for Unsupervised Image Classification and Segmentation written by Xu Ji et.al (Submitted on 22 Aug 2019) subjects : Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG) はじめに 近年、様々な場面において、深層学習手法が使用さ

        教師あり学習の精度を超えた!?相互情報量の最大化による教師なし学習手法IICの登場!
      • Pythonではじめる教師なし学習

        教師なし学習はラベル付けされていないデータから学習する機械学習の一種です。現在の機械学習では大量のラベル付きのデータを用いる教師あり学習が主流ですが、ラベルを付けるには膨大なコストがかかります。現実世界に機械学習を適用していくためには、ラベル付けを必要としない教師なし学習の重要性が増してくると考えられます。本書は実践的な視点から、データにある隠れたパターンを特定し、異常検出や特徴量抽出・選択を行う方法を紹介します。ラベルなしデータを有効に利用することで、機械学習の可能性を各段に広げる教師なし学習の本質に迫ります。さらに、変分オートエンコーダ(VAE)や敵対的生成ネットワーク(GAN)、制限付きボルツマンマシン(RBM)などの生成モデルも紹介します。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書

          Pythonではじめる教師なし学習
        • 2020年超盛り上がり!自己教師あり学習の最前線まとめ! - Qiita

          オミータです。ツイッターで人工知能のことや他媒体の記事など を紹介していますので、人工知能のことをもっと知りたい方などは @omiita_atiimoをご覧ください! 他にも次のような記事を書いていますので興味があればぜひ! わずか1%のラベルでImageNet高精度「SimCLR」解説 出きたてホヤホヤ!最新オプティマイザー「AdaBelief」を解説! 画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! 新たな活性化関数「FReLU」誕生&解説! 自然言語処理の王様「BERT」の論文を徹底解説 2021/02/28 SimCLRのバッチサイズに関する記述を修正 2020年に大きく盛り上がりを見せた分野に自己教師あり学習(=Self-Supervised Learning(SSL))があります。SSLとは名前の通り自分で教師を用意するような手法で、デー

            2020年超盛り上がり!自己教師あり学習の最前線まとめ! - Qiita
          • 教師なし学習によるMackerelの異常検知機能について�〜設計/運用/評価の観点から〜

            Machine Learning Casual Talks #10での登壇資料です https://mlct.connpass.com/event/125316/

              教師なし学習によるMackerelの異常検知機能について�〜設計/運用/評価の観点から〜
            • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC"

              ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC

                QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC"
              • コンペで使える!?LightGBMで実装する3つの弱教師あり学習 - ABEJA Tech Blog

                ABEJAでデータサイエンティストをしている小林です。 今回は、もしかしたらいつか業務や機械学習コンペに役立つかもしれない情報、LightGBMで弱教師あり学習を行う方法についてお話します。 コードはこちらで公開しております。 目次 はじめに 弱教師あり学習の例(マルチインスタンス学習) LightGBMで弱教師あり学習がしたい! PU分類 問題設定 解き方 LightGBMの実装 実験 Partial Label Learning 問題設定 解き方 LightGBMの実装 実験 マルチインスタンス学習 問題設定 解き方 LightGBMの実装 実験 おわりに はじめに 機械学習を行うためには、一般的に、大量の入力データと、それら一つ一つに対応した正確なラベルが必要です。 例えば、犬と猫の画像分類を行う場合には、それぞれの画像一つ一つに犬か猫のラベルがついていてほしいですね。 一方で場合に

                  コンペで使える!?LightGBMで実装する3つの弱教師あり学習 - ABEJA Tech Blog
                • 脱・人力アノテーション!自己教師あり学習による事前学習手法と自動運転への応用

                  こんにちは、TURING株式会社(チューリング)でインターンをしている、東大大学院修士一年の舘野です。 TURINGは完全自動運転EVを開発しているベンチャー企業です。 完全自動運転を実現するには、車の周りの環境をセンシングし認識するシステムが不可欠です。センシングのためのセンサーは様々考えられますが、TURINGでは主にカメラを用いています。 自動運転AIにはカメラデータから信号機・標識・周囲の車、などの情報を読み取る必要がありますが、そのためにはそれぞれの目的に対応した学習が必要です。 一番単純な方法は、学習させる各動画フレームに対して人間が信号機・標識・周囲の車などの正解情報を付与し、AIモデルが動画を見て正解情報を予測できるようにすることです。下図は、画像から車を検出するモデルの例です。モデルの中身は画像の特徴量を抽出する部分と、分類を行う部分を分けて表現していますが、学習時は元デ

                    脱・人力アノテーション!自己教師あり学習による事前学習手法と自動運転への応用
                  • 教師なし学習でも「世界最高クラス」の精度で不良品を見分ける画像分類AI

                    東芝は2021年4月28日、教師なし学習でも高精度でグループ化できる画像分類AI(人工知能)を開発したと発表。ラベル付け作業を行っていない画像データから、高精度に不良品や製品欠陥を検出することが可能になる。 東芝は2021年4月28日、教師なし学習でも高精度でグループ化できる画像分類AI(人工知能)を開発したと発表した。ラベル付け作業を行っていない画像データから、高精度に不良品や製品欠陥を検出することが可能になる。 教師なし学習の分類精度向上に貢献 今回東芝が発表した画像分類AIは、分類基準を指定するラベル付けを行っていない画像から有効な特徴を抽出、学習して、それに基づいた画像分類を高精度で実行するものである。 この画像分類AIは、1枚の画像を1つの分類基準とする「疑似的な教師あり学習」を行う。これによって背景のように多くの画像に表れるものを除き、一部の画像にだけ存在する特徴を抽出できる。

                      教師なし学習でも「世界最高クラス」の精度で不良品を見分ける画像分類AI
                    • 技術の鍵は「トランスフォーマー」と「自己教師あり学習」 松尾豊氏が、第3次AIブームからひもとく“AIの歴史”

                      日本CTO協会が主催の「Developer eXperience Day 2023」は、“開発者体験” をテーマに、その知見・経験の共有とそれに関わる方々のコミュニケーションを目的としたカンファレンスです。ここで登壇したのは、東京大学の教授である松尾豊氏。LLMの技術的な概要について解説するとともに、今後の技術的な進展について発表しました。全3回。1回目は、AIの技術について。 松尾豊氏の自己紹介 松尾豊氏:よろしくお願いします。45分ほど、お話をします。 (スライドを示して)私の自己紹介ですが、人工知能の研究をずっとやっています。もう26年ぐらい、ずっと人工知能の研究をやっています。 2017年に日本ディープラーニング協会を作って、2021年からは、「新しい資本主義実現会議」の有識者構成員をしています。 また、2023年5月からは、政府が立ち上げたAI戦略会議の座長も務めています。 AI

                        技術の鍵は「トランスフォーマー」と「自己教師あり学習」 松尾豊氏が、第3次AIブームからひもとく“AIの歴史”
                      • 画像データに対するActive learningの現状と今後の展望 ~最新の教師なし学習を添えて~ - ABEJA Tech Blog

                        1, はじめに こんにちは, Researcher Intern の中野です. 新型コロナウイルスが世界中で猛威をふるい、個人の生活スタイルのみならず社会全体に変革が迫られているのを感じます。 医療従事者の方々には頭が上がりませんが, 機械学習のコミュニティでもKaggleのコンペ, SIGNATEのコンペ等, なんとか状況の改善に貢献しようという動きが見られます. このような直近の例にも見られるように, 機械学習はデータを扱うあらゆる分野での応用が考えられます. 自分も, 大学での専攻は物質プロセス工学(材料工学系)なのですが, 材料工学に機械学習を応用するマテリアルズインフォマティクスという分野での研究を行っています. 軽く内容を紹介させていただくと, 研究では新素材の製造プロセスを, ガウス過程回帰に基づいたActive Learning アプローチを用いて, 低コストかつ高速に最適

                          画像データに対するActive learningの現状と今後の展望 ~最新の教師なし学習を添えて~ - ABEJA Tech Blog
                        • 自動運転AI、常識破りの「教師なし学習」による超進化

                          自動運転の実現に欠かすことのできないAI(人工知能)技術。深層学習(ディープラーニング)や強化学習(Reinforcement Learning/RL)などさまざまな学習方法のもと研究開発が進められている。 中には、「教師なし学習」に注目する企業も現れたようだ。この手法を活用することにより、学習にかかるコストや時間を大幅に削減することが可能という。AI開発におけるイノベーションはまだまだ続いているようだ。 今回は、AIにおけるさまざまな学習方法を整理しつつ、自動運転分野における教師なし学習の可能性を探ってみよう。 ■そもそもAIとは?AIは「Artificial Intelligence」の略で、明確な定義はないものの、一般的に人間の脳が行っている判断や推測、学習などをコンピュータがおこない、再現するソフトウェアやシステムを指す。コンピュータそのものが学習能力を持つイメージだ。 自動運転関

                            自動運転AI、常識破りの「教師なし学習」による超進化
                          • 教師なし学習の性能評価は雰囲気でやるしかない

                            はじめに 2020年のGWはオライリーの「Pythonではじめる教師なし学習」とOutlier Analysisという2冊の本を読んでいたのですが、その過程で私が数年前から持っていた、教師なし学習についての大きな疑問に対する答えが得られました。これは個人的には「年に1度、あるかないか」というくらい大きな衝撃を伴うイベントだったので、ここでブログにまとめたいと思います。なお、もしかしたら、知っている人には当たり前の話なのかもしれません...(もしそうだったらすみません)。 また、オライリー「Pythonではじめる教師なし学習」で行われているハイパーパラメータのチューニングには致命的な間違いがあるので、それも合わせて紹介します。 セキュリティと機械学習における教師なし学習 WAFのように日々大量の通信が発生し、かつ少しずつ内容は変わっていく可能性がある場面では、大量のデータにラベルをいちいち付

                              教師なし学習の性能評価は雰囲気でやるしかない
                            • 自然言語を「特徴量」ととらえる、教師あり学習の効率を劇的に高めた若手AI開発者

                              2016年に新卒でNTTデータに入社。同氏が所属するData&Intelligence事業部では法人顧客に対するコンサルティングを手掛け、データ分析からデータ分析の基盤提供などを含めて顧客のデータ活用を支援する。大学院では機械学習を研究。入社後、自然言語処理に面白さを感じ、文書読解エンジン「LITRON(リトロン)」の開発に携わる。(撮影:日経クロステック) AI(人工知能)が文書を読解し、そこから知識を抽出する――。こう書くと簡単そうに見えるが、適切な結果を得るための「読解し、抽出する」過程には開発者の技術が凝縮している。今回、本連載に登場するNTTデータ コンサルティング統括部 コンサルティング担当 主任の齋藤洋はこの過程、つまり自然言語データの構造化を効率化する技術の開発に携わっている2016年入社の若手社員だ。 専門用語や独特の言い回しが頻出するビジネス文書・学術文書などを分析し、

                                自然言語を「特徴量」ととらえる、教師あり学習の効率を劇的に高めた若手AI開発者
                              • 教師なし学習の実践 主成分分析で高次元データを可視化する - DATAFLUCT Tech Blog

                                こんにちは!nakamura(@naka957)です。今回は、主成分分析(PCA)をご説明します。 主成分分析は教師なし学習の重要手法の1つです。教師なし学習は正解情報なしでデータのパターンを推測する手法です。その中でも、主成分分析は多数の特徴量を少数の特徴量で表現する手法です。言い換えれば、高次元のデータを低次元で表現するため、次元圧縮の手法とも呼ばれます。 本記事では、主成分分析の概要と実装例をご紹介します。実装例では、手書き数字の画像データを実際に次元圧縮してみます。手書き数字の画像データでパターンが観測されるか確かめてみましょう。 では、早速始めていきます。 主成分分析 実装例 データセットを準備 標準化でスケールを揃える 主成分分析の実行 結果の可視化 まとめ 参考 主成分分析 主成分分析(Principal Component Analysis: PCA)は、多数の特徴量のデー

                                  教師なし学習の実践 主成分分析で高次元データを可視化する - DATAFLUCT Tech Blog
                                • 脳科学と教師なし学習の関係。情報量最大化教師なし学習でMNIST:Google Colabratory(PyTorch) - Qiita

                                  脳科学と教師なし学習の関係。情報量最大化教師なし学習でMNIST:Google Colabratory(PyTorch) 本記事では、教師なし学習と脳科学、そして教師なし学習でMNISTで高性能を出すIICの実装を解説します。 本記事で着目する論文は、 Invariant Information Clustering for Unsupervised Image Classification and Segmentation です。 この論文では相互情報量と呼ばれる指標を活用し、教師なし学習のクラスタリングで手書き数字画像を分類します。 IIC(Invariant Information Clustering)と呼ばれます。 本記事では、脳科学と教師なし学習、IICのポイン、MNISTでの実装例を解説します。 目次は以下の通りです。 脳科学と教師なし学習 人工知能界隈での教師なし学習への着

                                    脳科学と教師なし学習の関係。情報量最大化教師なし学習でMNIST:Google Colabratory(PyTorch) - Qiita
                                  • 機械学習の主な手法、「教師あり学習」「教師なし学習」「強化学習」はどう違うのか

                                    ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナー アナリストらのブログサイト「Gartner Blog Network」から、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。 不正検知から画像認識、自動運転車まで、機械学習(ML)と人工知能(AI)は、あらゆる産業に革命を起こそうとしている。両者の組み合わせにより、われわれがデータを扱い、活用してデジタル成長を実現する方法が変わりそうだ。 機械学習は人工知能の下位領域であり、マシンが明示的なプログラミングに従うのではなく、データ内のパターンを識別することで問題解決モデルの構築を可能にする。機械学習ではアルゴリズムがデータ内のパターンを識別し、そのパターンを使ってモデルを微調整し

                                      機械学習の主な手法、「教師あり学習」「教師なし学習」「強化学習」はどう違うのか
                                    • Disentangled な表現の教師なし学習手法の検証 - Preferred Networks Research & Development

                                      本記事は、2019年インターンシップに参加された蕭喬仁さんによる寄稿です。 はじめまして。PFN の2019夏季インターンシップに参加した東京大学の蕭喬仁です。 大学では自然言語処理について研究しており、SNS からのマイニングに興味があります。 今回のインターンでは「Disentangled な表現の教師なし学習手法の検証 (Unsupervised Disentangled Representation Learning)」というテーマで研究を行いましたので、その紹介をいたします。 実験に使用したコードはこちら https://github.com/pfnet-research/chainer-disentanglement-lib で公開しています。 Disentangledな表現 映画 Star Wars がお好きな方は ”imperial entanglements” という表現

                                        Disentangled な表現の教師なし学習手法の検証 - Preferred Networks Research & Development
                                      • 副業はAIの教師 機械学習支える「ゴーストワーカー」 - 日本経済新聞

                                        ネットサービスの急成長を支え、日々進化する人工知能(AI)。人間の仕事を奪うとの懸念も強いが、実はそのAIを機能させるために驚くほどの手間と労力がかかっている。そんなAIを裏で支えるのが「ゴーストワーカー」だ。「AIの仕事って、こんなところに落ちてるんや。面白そう」関西に住む佐藤かおりさん(仮名、28)が、インターネットで副業を始めたのは2017年のこと。正社員としての年収は250万円。家で

                                          副業はAIの教師 機械学習支える「ゴーストワーカー」 - 日本経済新聞
                                        • 教師なし学習とは | 教師あり学習や強化学習との違い・活用事例・代表的なアルゴリズムを紹介 | Ledge.ai

                                          機械学習とは、コンピューターが大量のデータを学習し、分類や予測などのタスクを遂行するアルゴリズムやモデルを自動的に構築する技術です。現在のAIの中核技術であり、ディープラーニングも機械学習の一部です。 ここでは、機械学習の学習手法の1つである教師なし学習について紹介します。教師なし学習は「教師なし」という名前の通り、正解を与えずに学習を行います。データから共通する特徴を持つグループを見つけたり、データの構造やパターンなどを抽出できます。

                                            教師なし学習とは | 教師あり学習や強化学習との違い・活用事例・代表的なアルゴリズムを紹介 | Ledge.ai
                                          • 教師なし学習とは何か? クラスタリングやアルゴリズムをわかりやすく解説する

                                            AI関連技術の中でも、近年、著しい進化を見せているのが機械学習(マシンラーニング、Machine Learning)だ。機械学習とは「プログラム自体が自動で行う学習」の総称で、人間がプログラムした以上のことをコンピュータにさせることが目的となる。大きく「教師あり学習」と「教師なし学習」に分かれるが、今のマシンラーニングの進化は「教師なし学習」によるところが大きい。自動生成系のツールとして注目されるGAN(敵対的生成ネットワーク)もその1つだ。ここでは「教師なし学習」にフォーカスし、どのような技術があるのか、その特性と活用事例を解説する。 大内孝子 主に技術系の書籍を中心に企画・編集に携わる。2013年よりフリーランスで活動をはじめる。IT関連の技術・トピックから、デバイス、ツールキット、デジタルファブまで幅広く執筆活動を行う。makezine.jpにてハードウェアスタートアップ関連のインタ

                                              教師なし学習とは何か? クラスタリングやアルゴリズムをわかりやすく解説する
                                            • 【wav2vec 2.0】Facebook AIが新しい音声認識フレームワークを公開!自己教師あり学習により正解ラベルなしで高精度を達成!?

                                              3つの要点 ✔️ Facebook AIが新しい音声認識フレームワーク「wav2vec 2.0」を公開 ✔️ 自己教師あり学習により,少量の文字起こし音声と正解ラベルなし音声で学習 ✔️ ラベルなしデータ・ラベル付きデータのみの場合の両方で最高精度を達成 wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations written by Alexei Baevski, Henry Zhou, Abdelrahman Mohamed, Michael Auli (Submitted on 20 Jun 2020 (v1), last revised 22 Oct 2020 (this version, v3)) Comments: Accepted at NeurIPS 2020 Subject

                                                【wav2vec 2.0】Facebook AIが新しい音声認識フレームワークを公開!自己教師あり学習により正解ラベルなしで高精度を達成!?
                                              • 半教師あり学習を用いた精密農業のための雑草密度と分布推定

                                                Weed Density and Distribution Estimation for Precision Agriculture using Semi-Supervised Learning 雑草の制御されていない成長は、作物の収量と品質に深刻な影響を与える可能性があります。除草剤を無制限に使用すると、生物多様性が変化し、環境汚染を引き起こします。代わりに、雑草が蔓延している地域を特定することで、これらの地域の選択的な化学処理を支援できます。農場の画像分析の進歩により、雑草を特定するためのソリューションが生まれました。ただし、これらのアプローチの大部分は、手動で注釈を付けた大量の画像を必要とする教師あり学習方法に基づいています。結果として、これらの監視されたアプローチは、多種多様な植物種が栽培されているため、個々の農民にとって経済的に実行不可能です。この論文では、自律型ロボットから取得

                                                  半教師あり学習を用いた精密農業のための雑草密度と分布推定
                                                • 画像の半教師あり学習について整理した - 機械学習 Memo φ(・ω・ )

                                                  概要 勉強会で画像の半教師あり学習について取り上げられるたびに、あれ、これ似たやつなかったっけ?と混乱するので、整理してみました。同じような内容のネット記事や資料はありますが、自分のために記載します。 概要 半教師あり学習とは MixMatch MixUp ReMixMatch Distribution Alignment Augmentation Anchoring CTAugment FixMatch Pseudo-Label Consistency Regularization その他 VAT UDA RandAugment 終わり 参考 半教師あり学習とは 半教師あり学習 (Semi-supervised learning: SSL) とはラベル付きデータとラベルなしデータで学習を行う方法。ラベルなしデータを活用してモデルのパフォーマンスをあげます。 MixMatch MixMat

                                                    画像の半教師あり学習について整理した - 機械学習 Memo φ(・ω・ )
                                                  • 第3章 機械学習(教師あり学習)

                                                    - 37 - 第 3 章 機械学習(教師あり学習) 教師あり学習にはどのような手法があって、どんな課題解決に役立てられているのでしょうか。この章では、 実践例とともに、手法の種類とそのアルゴリズムについて学んでいきます。 教師あり学習の基本的な手法と実践例を理解する - 38 - 教師あり学習とは 教師あり学習とは、既知となった過去の入力データと出力データを機械学習アルゴリズムにあらかじめ与える ことで、それらを「正解データ」として計算する機械学習の手法です。 例えば、大量の動物の画像データが存在した時に、「これは“ネコ”」「これは“イヌ”」・・・といったようにあらかじ めラベリングをしておきます。十分な正解データを用意し、それらを教師(正解)として機械学習を行います。未 学習の画像を読み込ませた場合にも、正解の中から一致するデータを見つけ出し、“ネコ”か“イヌ”を判定するこ とができます

                                                    • 自己教師あり学習(Self-Supervised Learning:SSL)とは?

                                                      自己教師あり学習(Self-Supervised Learning:SSL)とは?:AI・機械学習の用語辞典 用語「自己教師あり学習」について説明。ラベルなしの大量データセットを使って、プレテキストタスク(疑似的なラベルが自動生成された代替のタスク)を解くための事前学習を行う学習方法のこと。その後、ターゲットタスクを解くために、(少量の)別のデータセットを使って事前学習済みモデルをファインチューニングする。 連載目次 用語解説 機械学習(厳密にはニューラルネットワーク)における自己教師あり学習(Self-Supervised Learning:SSL)とは、教師ラベルが付与されていない大量のデータセットを使って、プレテキストタスク(Pretext task)と呼ばれる「疑似的なラベルが自動生成された代替のタスク」を解くための事前学習を行う学習方法のことである。その後、本来の目的であるターゲ

                                                        自己教師あり学習(Self-Supervised Learning:SSL)とは?
                                                      • Facebook、Instagramのユーザー画像で自己教師あり学習したコンピュータビジョン「SEER」発表

                                                        米Facebookは3月4日(現地時間)、傘下のInstagramにユーザーが公開設定で投稿した10億点の写真データでトレーニングした自己教師あり学習コンピュータビジョン「SEER」(SElf-supERvised)を発表した。ImageNetのオブジェクト認識テストで既存のAIモデルを上回ったとしている。このテストの分類精度スコアは84.2%だった。 AIモデルの多くは人間がラベル付けしたデータセットでトレーニングする必要があるが、SEERはランダムでラベルなし、キュレーションもされていないInsgaramの投稿画像を分析することで写真内のオブジェクトを識別する方法を学ぶ、自己教師あり学習でトレーニングされた。 Facebookは「SEERの性能は、自己教師あり学習がコンピュータビジョンタスクに向いていることを示す」としている。SEERは研究プロジェクトだが、潜在的な用途は幅広いと同社は

                                                          Facebook、Instagramのユーザー画像で自己教師あり学習したコンピュータビジョン「SEER」発表
                                                        • 「教師あり学習」と「教師なし学習」は何が違う?イラストでわかる機械学習の基礎

                                                          人工知能(AI)技術において、核とも言える技術が「機械学習」です。そして、機械学習について調べると必ず現れる「教師あり学習」「教師なし学習」というキーワード。難しい話ではないのですが、AIについて語るなら、知らないと話についていけない必須単語ですので、簡単にご説明しましょう。 合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー(翔泳社)』『図解これだけは知っておきたいAIビジネス入門(成美堂)』、執筆協力『マンガでわかる人工知能(池田書店)』など。 「機械学習」とは

                                                            「教師あり学習」と「教師なし学習」は何が違う?イラストでわかる機械学習の基礎
                                                          • 何を学習するかさえも学習する!メタ学習を用いた自己教師あり学習に対するラベルの自動探索について

                                                            3つの要点 ✔️ 学習すべきラベルをニューラルネットワークに生成させるMAXLの提案 ✔️ クラスの階層構造に注目したMask SoftMaxの利用 ✔️ メタ学習を用いることで既存のラベルよりも優れた性能を示した Self-Supervised Generalisation with Meta Auxiliary Learning written by Shikun Liu, Andrew J. Davison, Edward Johns (Submitted on 25 Jan 2019 (v1), last revised 26 Nov 2019 (this version, v3)) Comments: Published by Neural Information Processing Systems 2019 (NIPS2019) Subjects: Machine Learn

                                                              何を学習するかさえも学習する!メタ学習を用いた自己教師あり学習に対するラベルの自動探索について
                                                            • Taku Kudo on Twitter: "今どきのNLPは生データから教師なし学習するサブワードを使い言語非依存になっています。英語に特化してるのではなくトークン数の差は学習データの量の差からくるものです。日本語データを増やせば自然にトークン数の差は減ります。日本語知識に「特化」するとかえって多言語処理の弊害になります。"

                                                              • ラプラス正則化(Laplacian Regularization)を用いた半教師あり学習をPythonで実装

                                                                ラプラス正則化(Laplacian Regularization)を用いた半教師あり学習をPythonで実装 2019/06/21 Python Tech プログラミング 機械学習 こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 今回は、半教師あり学習の手法の一つであるラプラス正則化について書いてみます。 半教師あり学習とは、データの一部のみラベル(正解データ)がついていて、残りは入力データしか与えられないような状況で、精度の良い予測を行うモデルを学習することを指します。 ラベルがついているデータは少量で、教師なしデータが大量にある、という問題設定はとても現実的です。 ラベルをつけるコストは大きく、簡単に用意できないということがよくあります。 ラプラス正則化に限らず、半教師あり学習では限られたラベルのつ

                                                                  ラプラス正則化(Laplacian Regularization)を用いた半教師あり学習をPythonで実装
                                                                • 半教師あり学習、何それ?ってなったので初心者ながらに整理してみた

                                                                  AIブームの熱にアチチアチチとなっているご時世ですから、AI(人工知能)を実現する技術である機械学習というワードはよく見聞きするものでご存知の方も多いことでしょう。しかし「半教師あり学習」というワードに出会う機会はそれに比べてずっと少なく、知っている方はかなり少ないのかもしれません。 実際、今みなさんがご覧になっているこのメディアAIZINEでは「半教師あり学習」というテーマで書いた記事はまだありませんし(実際に調べました)、機械学習の参考書に目を通していても中々登場しないワードです。 しかしAI(機械学習)エンジニアを目指している僕は、機械学習の腕を競い合ったりプロのコードを見て学べる場である「Kaggle」に取り組んでいて、最近「半教師あり学習」とやらに出会いました。半教師あり学習の存在は知っていたけれど別に知らなくても困らなかったので特に調べもしていませんでしたが(おいおい・・・)、

                                                                  • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "東大が無料公開しているPythonと機械学習の入門講義 https://t.co/WHjJ7R7ooQ 講義動画の視聴、資料のダウンロードも可能。 Python、統計学、自然言語処理、教師なし学習、教師あり学習などについて、入門… https://t.co/dMZNG2NdyZ"

                                                                    東大が無料公開しているPythonと機械学習の入門講義 https://t.co/WHjJ7R7ooQ 講義動画の視聴、資料のダウンロードも可能。 Python、統計学、自然言語処理、教師なし学習、教師あり学習などについて、入門… https://t.co/dMZNG2NdyZ

                                                                      QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "東大が無料公開しているPythonと機械学習の入門講義 https://t.co/WHjJ7R7ooQ 講義動画の視聴、資料のダウンロードも可能。 Python、統計学、自然言語処理、教師なし学習、教師あり学習などについて、入門… https://t.co/dMZNG2NdyZ"
                                                                    • SimSiamで自己教師あり学習(Self-Supervised Learning)に挑戦 - Qiita

                                                                      Predictorでペア画像に対するEncoderの出力を予測することになるが、学習が進めば平均的な出力を予想することになり、結果Encoderの出力も平均的な出力に近づいているので、結果的にBackboneも平均的(一般的)な特徴を学習したことになる。というような流れだと筆者は理解している。 図中のstop-gradは勾配計算を止めることで、これで"Collapsing Solutions"を防ぐらしい。 素人考えではProjectorの層を無くしてBackboneとPredictorを直結した方が早いんじゃないかと思うのだが、Projectorを入れてLoss計算用の空間に一旦投影する。この辺は先行研究であるSimCLRの論文で議論されているようだ。 実装 公式実装がありPyTorch派の方はこちらを使えばそれで終わりのように思うが、筆者はtf.keras派なので自前で実装しなければな

                                                                        SimSiamで自己教師あり学習(Self-Supervised Learning)に挑戦 - Qiita
                                                                      • 【機械学習】教師あり学習と教師なし学習の違い

                                                                        機械学習における「教師あり学習」と「教師なし学習」について解説します このチャンネルのスポンサーをこちらで募集しています↓ https://camp-fire.jp/projects/view/130136 --------------------------------------------------------------------------------------------------------- 【ヨビノリたくみの書籍一覧】 「難しい数式はまったくわかりませんが、微分積分を教えてください!」 https://amzn.to/33UvrRa →一般向けの微分積分の入門書です 「難しい数式はまったくわかりませんが、相対性理論を教えてください! https://amzn.to/33Uh9Ae →中学の易しい数学しか使わない相対性理論の解説本です 「予備校のノリで学ぶ

                                                                          【機械学習】教師あり学習と教師なし学習の違い
                                                                        • ずーみん on Twitter: "開発環境はOpenAI(GPT-3)。こちらは誰でもアカウントが作れます https://t.co/UYpmJHKncG この鑑賞の実験は、教師なし学習です。 プレトレーニングもしていません。 作品画像はこちらです。 カラカラ帝… https://t.co/UVFA2J3jF0"

                                                                          開発環境はOpenAI(GPT-3)。こちらは誰でもアカウントが作れます https://t.co/UYpmJHKncG この鑑賞の実験は、教師なし学習です。 プレトレーニングもしていません。 作品画像はこちらです。 カラカラ帝… https://t.co/UVFA2J3jF0

                                                                            ずーみん on Twitter: "開発環境はOpenAI(GPT-3)。こちらは誰でもアカウントが作れます https://t.co/UYpmJHKncG この鑑賞の実験は、教師なし学習です。 プレトレーニングもしていません。 作品画像はこちらです。 カラカラ帝… https://t.co/UVFA2J3jF0"
                                                                          • 半教師あり学習のこれまでとこれから - Qiita

                                                                            初めまして。新入社員の石川です。 大学と大学院では半教師あり学習を専門にしてきました。今回はそのこれまでの技術と今後についてご紹介します。 半教師あり学習(Semi-Supervised Learning)とは 半教師あり学習は機械学習の手法の一つで、教師あり学習で必要となるデータ形成においてコスト削減を目指します。 まず、機械学習は大きく * 教師あり学習 * 教師なし学習 * 強化学習 の3つが挙げられます。ここでは、教師あり学習と教師なし学習について簡単に説明した後に半教師あり学習について説明していきます。(強化学習は半教師あり学習とあまり関連がないため、別記事を参考にして下さい) 教師あり学習は、学習に必要となる教師データ(および評価データ)について全てのインスタンスにアノテーションと呼ばれるラベル付けの作業が必要です。 例えば、病院に来た患者のレントゲン写真をインプットしたときに

                                                                              半教師あり学習のこれまでとこれから - Qiita
                                                                            • ドメイン知識なし教師なし学習を実現したImage GPT、画像生成もすごい! (画像の表現学習2020夏特集1)

                                                                              3つの要点 ✔️ 未知ドメイン知識なし教師なし表現学習成功、価値ある実証実験(PoC)、計算量は度外視 ✔️ 生成モデルとしても驚きの画像生成能力 ✔️ 獲得した表現を用いた画像分類でSOTA性能 Generative Pretraining from Pixels written by Mark Chen, Alec Radford, Ilya Sutskever (OpenAI) (Submitted on 17 Jun 2020) Comments: Accepted at ICML2020 Subjects: Computer Vision and Pattern Recognition (cs.CV) Paper  Official Code COMM Code 今回から3回の予定で、ライター持ち込み特集企画「画像の表現学習2020夏」と題して、教師なし学習による各種手法をご紹介

                                                                                ドメイン知識なし教師なし学習を実現したImage GPT、画像生成もすごい! (画像の表現学習2020夏特集1)
                                                                              • 教師なし学習とは?覚えておきたい機械学習の学習手法概要|コラム|クラウドソリューション|サービス|法人のお客さま|NTT東日本

                                                                                2020.02.10| Writer:NTT東日本アベ 教師なし学習とは?覚えておきたい機械学習の学習手法概要 ビジネスへのAI活用に少しでも興味のある方は、NTT東日本へお気軽にお問い合わせください。 近年、さまざまな分野で活用されているAI(人工知能)ですが、その技術を支える技術の一つが機械学習です。機械学習によってコンピュータは大量のデータを学習して分類や予測などを実現しますが、その学習手法にはいくつか種類があることをご存知でしょうか。そのうちの一つが「教師なし学習」であり、この記事では教師なし学習について概要から活用例、メリット・デメリットなどについて解説していきます。 教師なし学習とは? 機械学習の学習手法の一つである教師なし学習はどのようなものなのでしょうか。ここでは、教師なし学習の概要から利用する目的、活用例を見ていきましょう。 教師なし学習の概要 教師なし学習は、学習データ

                                                                                  教師なし学習とは?覚えておきたい機械学習の学習手法概要|コラム|クラウドソリューション|サービス|法人のお客さま|NTT東日本
                                                                                • 集計作業のお悩みをAIで解決/第4話「文章自由回答データを効率的に集計する”教師なし学習AI”とは」|マクロミル公式note

                                                                                  前回は、意見や感想などの文章で記述された自由回答データの集計についてご紹介しました。今回はAIを活用して効率化するプロセスをご紹介します。 1.「教師なし学習AI」で行われる処理 今回もアンケートで得られた「作りたてコーヒーサービスがあったら利用したいか」という質問に対する以下のような文章での自由回答データを使用します。前回はアフターコーディングを人の手で行う方法をご紹介しましたが、今回はAIでアフターコーディングを効率的に行う過程を解説していきます。 今回は「教師なし学習」という種類のAIを活用して、分類分けを行います。ここでは大きく分けて3つの処理を経て文章のデータを分類します。 ※教師なし学習の定義やAIの分類については第3話 をご参照ください。 (1)文章分解:形態素解析などで文章を細かく分解 (2)ベクトル化:分解した文章を「複数の数値の組」でデータ化 (3)クラスタリング:デー

                                                                                    集計作業のお悩みをAIで解決/第4話「文章自由回答データを効率的に集計する”教師なし学習AI”とは」|マクロミル公式note

                                                                                  新着記事