並び順

ブックマーク数

期間指定

  • から
  • まで

441 - 480 件 / 583件

新着順 人気順

ディープラーニングの検索結果441 - 480 件 / 583件

  • 最近の物体検出 2019/05/30

    最近の物体検出 2019/05/30 1. 最近の物体検出 2019/05/30 2. お品書き •イントロ • 歴史の振り返り •最近の動向 • キーポイント系 • multi-scale対応 3. イントロ 4. https://twitter.com/RUSH1L/status/889963452143357952/photo/1https://www.youtube.com/watch?v=VOC3huqHrss 5. MegDet 詳細不明 (ensemble) 52.5 SNIP (R-FCN, DPN-98, DCN) (ensemble) 48.3 Mask R-CNN ResNeXt-152 32x8d CornerNet Hourglass-104 SNIPER (Faster R-CNN, R-101, DCN) NAS-FPN RetinaNet, AmoebaNe

      最近の物体検出 2019/05/30
    • ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ

      概要 背景・目的 実験 実験の概要 定量評価 定性評価 おわりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 類似商品検索の基盤となる複数の特徴抽出アルゴリズムについて、DROBEの保有するデータで評価した 定量評価によると、画像単体を入力とする ResNet-50(自己教師あり学習)とCLIPの性能が高かった 定性評価によって、取り扱うモーダルの違いによる各モデル出力の顕著な差異が確認できた 背景・目的 小売において、商品の在庫は無数に存在しています。そのため、消費者やサービス提供者が商品に紐づく情報(画像、商品の説明文など)を解釈して、特定の商品と類似したアイテムを人手で行うのは困難です。 この課題を解決するために、機械学習手法の活用が注目されています。 機械学習を用いた処理の流れは、 商品に紐づく情報を適切に 「要約」 し、 1.で 「要約」 した商品情

        ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
      • Python&AI・機械学習を無償の記事で学ぼう! @IT連載まとめ

        Python&AI・機械学習を無償の記事で学ぼう! @IT連載まとめ:@IT/Deep Insiderの歩き方 Pythonや機械学習(ディープラーニング)を学ぶための学習リソースとして、@IT/Deep Insider上にある連載(技術解説記事)を、「Python」「開発環境」「数学/統計/データサイエンス」「ディープラーニング/機械学習」という4つの分野で紹介する(全18連載)。

          Python&AI・機械学習を無償の記事で学ぼう! @IT連載まとめ
        • 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可

          AI活用のコンサルティング事業を手掛けるAPTO(東京都渋谷区)とエイアイ・フィールド(東京都品川区)は10月5日、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。「AI市場の加速に貢献できれば」(2社)という。 エイアイ・フィールドが自社の技術で自動生成した、実在しない10代~90代の男女の画像を提供。APTOが作成した年齢・性別などのアノテーション(画像を説明するテキスト情報)も付属する。申し込みは専用サイトで受け付ける。 もともとはエイアイ・フィールドが自社サービスで活用するために作成した画像だったが、6月に用途を研究目的に限った上で1000点を無料配布したところ、利用者からの反響があったことから、データを2000点追加し、商用利用を認めた上で再配布することを決めたという。 関連記

            実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可
          • UbuntuでのGPUディープラーニング環境の構築【Ubuntu 18.04 LTS対応】

            UbuntuでのGPUディープラーニング環境の構築【Ubuntu 18.04 LTS対応】:機械学習&ディープラーニング環境構築入門(1/3 ページ) GPUを活用したTensorFlow/PyTorch/Chainerなどによるディープラーニングを実践するための環境をUbuntu上に構築する際の選択ポイントと手順を説明する。 連載目次 0. ディープラーニングのOS環境の選択指針 TensorFlowやPyTorch、Chainerなどのライブラリを使ったディープラーニング(Deep Learning)/機械学習(Machine Learning)を始めようと思ったなら、本当の初心者/学習者であればGoogle Colaboratoryの活用をお勧めする(※参考「ディープラーニングを始めるための、作業環境の特長と使い分け指針:Google Colaboratory入門」)。しかし「本格的

              UbuntuでのGPUディープラーニング環境の構築【Ubuntu 18.04 LTS対応】
            • 機械学習/ディープラーニングの「数学」が学べるオススメ本

              機械学習やディープラーニングに必要な数学項目をピックアップし、そういった項目を教科書的~実践的にカバーしているオススメの「数学」本を紹介する。また中学~大学までの数学全体を学び直したい人向けの本も紹介。 連載目次 機械学習やディープラーニングを学んでいると、その内部の仕組みは計算式なので、やはりどこかしらで数式が出てくる。そこで数学の必要性を感じて本格的に学び始めるという人も少なくないだろう。 では、どのレベルから、どんな本で学べばよいのだろうか。これはケースバイケースで、あなたが大学生であれば大学レベルの本からスタートすればよいだろうが、大学から遠ざかって5年以上たつような社会人であれば、数学をもう少し基礎的なところから復習した方がいいかもしれない。 また、数学に10年以上のブランクがある場合、中学レベルの数学から部分的に記憶が欠落しているかもしれない。数学は積み上げ型の学問なので、一部

                機械学習/ディープラーニングの「数学」が学べるオススメ本
              • 画像拡大ならkakudaiAC

                汚い画像は、イメージが悪くなりますのでご注意ください。 画像をそのまま拡大すると、ほとんどの場合、画像が汚くなってしまいます。汚い画像は、あなたのイメージを損ねてしまうことに繋がりかねません。最新の人工知能技術を駆使したkakudaiACを使えば、美しい画質のまま画像を拡大することができます。 拡大サイズは、2倍・4倍・8倍・16倍の中から自由にお選びいただけます。ノイズ除去やシャープ機能も設定が可能です。 ESRGANを用いた超解像AIにより、高解像度の画像を生成します。 従来の画像編集ツールを使った画像の拡大では、ぼやけたりノイズが入ったりするなど、品質が低下します。これを修正するには多くの時間と人的リソースを必要とします。 拡大ACでは、ESRGANというディープラーニングを使ったAIモデルにより、写真の細かな部分を自動で生成し、品質を損なうことなく、最大16倍にまで写真を拡大します

                • PyTorchでの学習・推論を高速化するコツ集 - Qiita

                  本記事では、NVIDIAから発表されているPyTorchでのディープラーニングを高速化するコツ集を紹介します。 【※NEW】22年6月新記事:スクラム関連の研修・資格のまとめ & おすすめの研修受講方法 本記事について 本記事は、NVIDIAのArun Mallyaさんの発表、 「PyTorch Performance Tuning Guide - Szymon Migacz, NVIDIA」 に、説明やプログラムを追加して、解説します。 本記事のポイントは、Andrej KarpathyがTwitterで呟いている通りとなります。 good quick tutorial on optimizing your PyTorch code ⏲️: https://t.co/7CIDWfrI0J quick summary: pic.twitter.com/6J1SJcWJsl — Andrej

                    PyTorchでの学習・推論を高速化するコツ集 - Qiita
                  • ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog

                    こんにちは、Research Internの荒尾(@karolis_ml)です。 日進月歩の勢いで研究が進んでいる深層学習ですが、教師あり学習でもっとも大事なデータのアノテーション、応用分野ではまだまだ大変ですよね。例えば、犬の写真から犬種を判断する分類器を作ろうとして教師データが必要になったとき、あなたは以下の画像にどんなラベルをつけるでしょうか? 出典: Pixabay 犬好きの方は正しくアラスカンマラミュート、そうではない方は似た有名犬種であるシベリアンハスキーと答えられたことでしょう。マラミュートの茶色い目(かわいい)や小さめの尖った耳(かわいい)を見分けて正しくラベル付けをするのは、決して簡単ではありません。 このようなアノテーションの分野に関して当ブログでは以前、Bounding BoxやSegmentationの効率化についての研究サーベイを行いましたが、この犬種分類のような

                      ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog
                    • 理系大学生が暇でディープラーニングの勉強始めてみた - Qiita

                      僕の場合は1章は知っていたので飛ばしました.2章,3章を合わせて1日で読んで,ほかは1章ずつ読みました.計6日で読んだ感じですね.コードはまずは自分でどう書くか考えてみて,3分くらい思いつかなかったら写経しました.内容はとてもわかりやすかったです.題名通りゼロからニューラルネットワークを作るもので,ライブラリは基本的には使わないで実装する構成です.ただし,途中著者の書いたコードをインポートするように促されることがあります.納得がいかない人はコードは公開されているのでそれを見ればいいです.それにしてもニューラルネットワークが思っていたより単純だったのが少し驚きでした. この本でニューラルネットワーク内の処理のフローをおおまかに理解できたかなと思います.個人的な見解ですが,なにかに入門する際には内容を1つ1つ深堀りするよりは,全体像を捉えるほうが頭に残ると思います.この本は程よく深堀りしないの

                        理系大学生が暇でディープラーニングの勉強始めてみた - Qiita
                      • TensorFlow で機械学習ゼロからヒーローへ

                        .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                          TensorFlow で機械学習ゼロからヒーローへ
                        • Googleが高精度かつ高速にファイル形式を判別するツール「Magika」公開

                            Googleが高精度かつ高速にファイル形式を判別するツール「Magika」公開
                          • 第1回 難しくない! PyTorchでニューラルネットワークの基本

                            PyTorchの習得は、シンプルなニューラルネットワーク(NN)の、まずは1つだけのニューロンを実装することから始めてみよう。ニューロンのモデル定義から始め、フォワードプロパゲーションとバックプロパゲーションといった最低限必要な「核」となる基本機能に絞って解説。自動微分についても簡単に触れる。 連載目次 人気急上昇の「PyTorch」を使いたい。そう考えて、PyTorchの公式チュートリアルを開いて学習を始めてみた、という人は少なくないだろう。しかし、挫折してしまったり、なかなか進まなかったり、という人も少なくないのではないだろうか。 というのも、その公式チュートリアルの、最初の「テンソル」解説だけは(NumPyライクな直観的なAPIなので)難しくないとしても、次が「Autograd(自動微分)」、その次が「ニューラルネットワーク」……と言いつつも、いきなり「CNN(畳み込みニューラルネッ

                              第1回 難しくない! PyTorchでニューラルネットワークの基本
                            • GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

                              4 September 2023 - Version 1.7.1 Fix several compatibilities 25 May 2023 - Version 1.7.0 Add Apple Silicon support (thanks@rayeesoft and @ArtemBernatskyy, see PR) Fix several compatibilities 15 September 2022 - Version 1.6.2 Add CPU support for DBnet DBnet will only be compiled when users initialize DBnet detector. 1 September 2022 - Version 1.6.1 Fix DBnet path bug for Windows Add new built-in mo

                                GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.
                              • 経験ゼロから始めるAI開発 - Qiita

                                本記事について 本記事は2019/5/24に開催した「経験ゼロから始めるAI開発/イラスト評価AIの仕組み解説セミナー」の内容についてまとめたものです。 記事概要 本記事はAI・機械学習について素人の状態から、業務で使用するAIシステムを開発するまでのプロセスや勉強方法について解説します。また、実際に開発したイラスト評価AIの仕組みについても概要を説明します。 これからAI技術を使ったプロジェクトを始める方、AI・機械学習の勉強を始める方を対象とした記事になります。 何を作ったのか 制作されたキャラクターイラスト画像に使われている塗り方の割合判定や、背景画像の有無、描き込み量、制作難易度を解析し、それを元に想定制作価格の算出や制作可能なイラストレーターのレコメンドを行うアプリを作りました。 本アプリを2019年4月のAI・人工知能EXPOに出展したところ、ITメディア様に取り上げていただい

                                  経験ゼロから始めるAI開発 - Qiita
                                • Deep Tabnine - Tabnine Blog

                                  Update (August 19): We’ve released Tabnine Local, which lets you run Deep Tabnine on your own machine. TL;DR: Tabnine is an autocompleter that helps you write code faster. We’re adding a deep learning model which significantly improves suggestion quality. You can see videos below and you can sign up for it here. There has been a lot of hype about deep learning in the past few years. Neural network

                                    Deep Tabnine - Tabnine Blog
                                  • Microsoft、オープンソースのAIデバッグ/可視化ツール「TensorWatch」を発表

                                    Microsoft Researchは2019年6月25日(米国時間)、データサイエンスやディープラーニング、強化学習向けにオープンソースのデバッグ/可視化ツール「TensorWatch」を発表した。TensorWatchは「Jupyter Notebook」で動作し、機械学習(ML)トレーニングのリアルタイム可視化や、モデルとデータの重要な分析タスクを実行する。 Microsoft ResearchはTensorWatchを、「研究者やエンジニアの仕事に役立つ先進的機能を数多く提供する、デバッグツールのスイスアーミーナイフ」とうたっている。2019年6月にスペインのバレンシアで開催された「ACM SIGCHI Symposium on Engineering Interactive Computing Systems」で、TensorWatchのプレゼンテーションを行ったという。 Mic

                                      Microsoft、オープンソースのAIデバッグ/可視化ツール「TensorWatch」を発表
                                    • BERTによるニュース記事の構造化:企業名抽出

                                      はじめにMachine Learning部門の近江です。ストックマークでは、自然言語処理技術の研究開発を行っています。 先日、弊社のTech Blogにて弊社が公開している言語モデルを紹介しました。 ストックマークが公開した言語モデルの一覧と振り返り 今回は、言語モデルがプロダクトにおいて実際にどのように利用されているかについての一例を紹介します。 ニュース記事の構造化マーケティング、新規事業開発などの調査業務では、調査を行う人が書籍、ニュース記事、ホームページなどの情報を網羅的に調べ、整理し、報告書などにまとめていきます。その際に扱う情報は膨大であり、そのため調査業務には多くの時間と労力がかかります。 弊社のプロダクトである「Astrategy」は機械学習を用いてニュース記事から特徴となる情報を抽出し、構造化することで、大量のニュース記事を効率的に俯瞰し、さらに新規事業開発などに繋がりう

                                        BERTによるニュース記事の構造化:企業名抽出
                                      • スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する - Qiita

                                        手っ取り早く、やられたシーンを抽出したい人向け OBSと連携するWebアプリを作成しました 詳細はこちらの記事をご参照ください。 スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する 以前のWebアプリ スプラトゥーン2 やられたシーン自動頭出しツール「iKut」 Dockerイメージ こちらでDockerイメージを配布しています。 はじめに スプラトゥーン2を発売日からやりこんで3年になります。2年かけて全ルールがウデマエXに到達しましたが、そこからXパワーが上がらずウデマエX最底辺で停滞しています。最近は自分のプレイ動画を見て対策を立てるのですが、すべての動画を見るのは大変です。そこで敵にやられたシーンは特に修正すべき自分の弱点があると考え、そこだけを自動で抽出するシステムを作ってみました。 ↑このシーンを切り出します。 画像の引用 この記事では任天堂株式会社のゲ

                                          スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する - Qiita
                                        • NVIDIA新ドライバでStable Diffusionの処理能力が倍に

                                            NVIDIA新ドライバでStable Diffusionの処理能力が倍に
                                          • 2020年のおもしろかったDL/ML論文10選 - Qiita

                                            はじめに 2020年も,機械学習コミュニティでは多くの新しい成果が見られました.2019年に引き続き,1年を振り返ってもっとも面白かった論文を10本紹介したいと思います. * 本記事は,私のブログにて英語で書いた記事を翻訳し,適宜加筆修正したものです. ** 記事中の画像は,ことわりのない限り対象論文からの引用です. 論文10選(公開順) 普段から,読んだ論文を簡単にまとめてツイートしているので,それを使って公開日順に振り返っていきます.対象はおおまかに「2020年に公開された論文」と「2020年に学会・雑誌で発表されたもの」とします.全くの主観で選んでいるので,私の興味範囲である深層学習および応用研究に偏っている点はご容赦ください. 紹介するのはこちらの10本です! Rigging the Lottery: Making All Tickets Winners PIFuHD: Multi

                                              2020年のおもしろかったDL/ML論文10選 - Qiita
                                            • 【AI最新論文】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita

                                              <目次> はじめに 第1回:コンピュータビジョン編 第2回:自然言語処理編 第3回:強化学習編 第4回:実務応用編 次回予告 1. はじめに GAN(敵対的生成ネットワーク)講座 現場で使える XAI(Explainable AI)講座 現場で使える自然言語処理実践講座 ディープラーニング最新論文対策講座 スキルアップAIでは、上記の4講座を始めとして、現在、そしてこれから注目されるであろう最先端の機械学習/ディープラーニング技術に関する講座を開講しております。このような講座を開講していく中で、スキルアップAIの講師陣が注目している最先端技術をぜひ知りたいというお声を多くいただきました。 そこで、自動機械学習(AutoML)を専門としICMLなどのトップカンファレンスへの論文採択経験もある斉藤と、需要予測・異常検知など様々な分野で機械学習/ディープラーニングの産業応用に取り組んできた小縣が

                                                【AI最新論文】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita
                                              • ディープラーニングを活用したレコメンドエンジン改善への取り組み - ZOZO TECH BLOG

                                                はじめに こんにちは、推薦基盤部の与謝です。ECサイトにおけるユーザの購買率向上を目指し、レコメンデーションエンジンを研究・開発しています。最近ではディープラーニングが様々な分野で飛躍的な成果を収め始めています。そのため、レコメンデーション分野でも研究が進み、精度向上に貢献し始めています。本記事では、ディープニューラルネットワーク時代のレコメンド技術について紹介します。 目次 はじめに 目次 パーソナライズレコメンドとは 深層学習より前の推薦手法 協調フィルタリング Matrix Factorization SVD(Singular Value Decomposition) Factorization Machine 深層学習を使った推薦手法 ニューラルネットワーク推薦手法に対する警鐘 Recboleプロジェクト Recboleプロジェクトを用いた各アルゴリズムの検証 General Re

                                                  ディープラーニングを活用したレコメンドエンジン改善への取り組み - ZOZO TECH BLOG
                                                • 大規模言語モデル

                                                  2023年度統計関連学会連合大会チュートリアルセッション 言語モデルと自然言語処理のフロンティア

                                                    大規模言語モデル
                                                  • BLOGOS サービス終了のお知らせ

                                                    平素は株式会社ライブドアのサービスを ご利用いただきありがとうございます。 提言型ニュースサイト「BLOGOS」は、 2022年5月31日をもちまして、 サービスの提供を終了いたしました。 一部のオリジナル記事につきましては、 livedoorニュース内の 「BLOGOSの記事一覧」からご覧いただけます。 長らくご利用いただき、ありがとうございました。 サービス終了に関するお問い合わせは、 下記までお願いいたします。 お問い合わせ

                                                      BLOGOS サービス終了のお知らせ
                                                    • 「AIによる動画要約研究」に激震。今までの自動動画要約技術はランダム抽出と大差なかった? | Ledge.ai

                                                      画像認識におけるトップカンファレンス「CVPR 2019」で、AIでの自動動画要約の常識を根本的に覆す論文が発表された。最先端の動画要約手法が、ランダムで作成された動画要約と同等レベルでの要約しか作成できていないことを示したものだ。 本稿では、7月13日に開催された「CCSE 2019」でのサイバーエージェントAI Labの大谷まゆ氏による講演「ディープラーニング時代の性能評価」の講演内容、および同氏のCVPR 2019に採択された論文「Rethinking The Evaluation of Video Summaries」の内容をまとめた。 合わせて、動画要約技術で用いられてきた手法の簡単な説明と、「ランダム抽出での要約結果がAIと同等の結果を示した」とはどういうことか、解説する。 近年の動画要約手法とそのデータセットそもそも動画要約とは、もとの映像のなかで根幹をなす内容を捉えつつ、映

                                                        「AIによる動画要約研究」に激震。今までの自動動画要約技術はランダム抽出と大差なかった? | Ledge.ai
                                                      • 「論文は読むな」画像×AIの専門家から初心者へのアドバイス

                                                          「論文は読むな」画像×AIの専門家から初心者へのアドバイス
                                                        • グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

                                                            グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
                                                          • Pythonの実装やMicrosoftのAI講座が無料に | Ledge.ai

                                                            サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                              Pythonの実装やMicrosoftのAI講座が無料に | Ledge.ai
                                                            • 画像認識と深層学習

                                                              日本ロボット学会 ロボット工学セミナー 第126回 ロボットのための画像処理技術 講演資料 https://www.rsj.or.jp/event/seminar/news/2020/s126.html 2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては深層学習,その中でも特に畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなった.CNNはクラス分類をはじめとして,物体検出やセグメンテーションなど様々なタスクを解くためのベースネットワークとして広く利用されてきている.本講演では,CNNの発展を振り返るとともに,エッジデバイスで動作させる際に重要となる高速化等,関連する深層学習技術の解説を行う. 1. クラス分類向けモデルについて 1.1. ILSVRCで振り返る進化の歴史 1.2. その他重要なモデル 1

                                                                画像認識と深層学習
                                                              • なにこの技術…?画像解析ディープラーニングを使ってさまざまななものをノリノリにしてしまった人現る「これめっちゃ好き」「超笑ってる」

                                                                foka @foka22ok DeepLabをリアルタイムで動かすことができたので、TouchDesigner連携して強制的に音楽にノリノリにさせてみました。 #touchdesigner #deeplab #semanticsegmentation pic.twitter.com/uM72AhKSCk 2020-05-26 18:28:58 foka @foka22ok 思ったより見てくれる人が多いので少し補足。 これはTouchDesignerから映像送ってSegmentationで領域抽出し、その領域だけをリズムのバスドラムの音域使ってオーディオリアクティブで動かしてます。 映像はNHKクリエイティブライブラリーを使わせてもらいました。 リズムはAbleton使って作ってます。 2020-05-27 11:59:59 foka @foka22ok リアルタイムじゃなくても良いなら、同

                                                                  なにこの技術…?画像解析ディープラーニングを使ってさまざまななものをノリノリにしてしまった人現る「これめっちゃ好き」「超笑ってる」
                                                                • 日本ディープラーニング協会、「ディープラーニング開発標準契約書」を公開 | Ledge.ai

                                                                  日本ディープラーニング協会(JDLA)は「ディープラーニング開発標準契約書」を策定し、9月6日に公開した。 JDLAは、ディープラーニングを中心とする技術による日本の産業競争力の向上を目指す協会。理事長は東京大学大学院工学系研究科教授の松尾豊氏が務める。 スタートアップと大企業間での契約締結を円滑化するディープラーニング技術は、さまざまなビジネスでの活用、社会実装に向けた開発・検討が進みつつある。技術開発を担うスタートアップと業務の委託者である大企業との間で多くの議論が交わされている。 一方で、契約においては、当事者間の契約実務に関する経験・スキル、ディープラーニングに関する認識・理解のギャップがあり、契約の締結がなかなか進まないという課題がある。 JDLAの産業活用促進委員会では、これらの課題を踏まえ、スタートアップと大企業間での契約締結を円滑化しさらなるディープラーニング技術の産業活用

                                                                    日本ディープラーニング協会、「ディープラーニング開発標準契約書」を公開 | Ledge.ai
                                                                  • 半年後に将棋の神様が現れるかもしれない話──最強将棋ソフト開発者が語る“ディープラーニング勢の台頭による将棋ソフトの進化”

                                                                    棋聖、王位と立て続けにタイトルを取った藤井二冠の次の標的は、前期も挑戦者決定戦まで進んで挑戦まであと一歩だった王将戦。 将棋界最難関といわれる王将リーグといえども、今の藤井二冠を止める者は誰もいない……そんな予想はしかし、意外すぎる形で裏切られます。 何と……トップ棋士が立て続けに、藤井二冠に対して振り飛車をぶつけ始めたのです! しかもそれは、普段はあまり振り飛車を指さない、居飛車党の棋士たちでした。 結果的に、藤井二冠は王将戦の挑戦権を逃すどころか、リーグからも陥落……。 もともと将棋ソフトは振り飛車を『不利な戦法』と考えており、ソフトを研究に用いる藤井二冠はデビューから一度も振り飛車を採用していません。 そして藤井二冠以外のトップ棋士たちも、ソフトを使用して研究しているはず。 それなのにどうして、不利なはずの振り飛車を敢えて使い、しかも居飛車では止めることができなかった藤井二冠を倒すこ

                                                                      半年後に将棋の神様が現れるかもしれない話──最強将棋ソフト開発者が語る“ディープラーニング勢の台頭による将棋ソフトの進化”
                                                                    • 嘘だろ?深層学習が3Dゲームを再現|shi3z|note

                                                                      深層学習の世界では時折・・・と言っても、一ヶ月に一回くらいだが・・・信じられないようなことが起きる。 以前、ゲーム画面を見ただけでパックマンやらマリオやらを再現するAIが出現したと聞いたとき、「嘘だろ」と思ったのだが、まあ言うてパックマン。なんとなくできるのかもしれない。 しかしこの手のものはあまりにも直感に反するので自分の手で確かめないと本当かどうかわからない。 そんな時のために僕の仕事机には7台のGPUマシンがあるわけだが、たまたまRTXが遊んでいたので実行してみたら、「嘘だろ」としか言いようがない結果を目の当たりにすることになった。 GTAVこと「グランセフトオートV」は、自動車泥棒になって架空の街を走り回るゲームだ。 こいつをひたすらAIに学習させると、GTAVをAIが再現するという、全く直感に反することが行われるらしい。3Dゲームというのは、それを作った経験のある人なら誰でも、恐

                                                                        嘘だろ?深層学習が3Dゲームを再現|shi3z|note
                                                                      • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

                                                                        こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

                                                                          Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
                                                                        • M5StickVで超お手軽エッジAI画像認識 - karaage. [からあげ]

                                                                          超お手軽エッジAIデバイス「M5StickV」 ファブコア・カフェでお話しした「AIエッジデバイス入門」(詳細は以下記事参照下さい)。 主に、Jetson Nanoについてお話ししたのですが、小ネタとして使えないかなと、最近私のTL周りで話題の「M5StickV」も買っていました。初めて触ったのがプレゼン当日ということもあり、プレゼン自体には直接活かすことは無かったのですが(プレゼン後の質疑応答で少し話題に出しました)、なかなか予想外に面白いデバイスでした。 M5Stack UnitV Kendryte K210デュアルコア64ビットRISC-V CPUのAIカメラ最先端のニューラルネットワークプロセッサ (Stick V) メディア: エレクトロニクス 外観 ケースに描いてあるこの可愛い図が回路図(!?)らしい。まあソフト開発にはたしかにこれで良いですね このサイズで、カメラの写真をリア

                                                                            M5StickVで超お手軽エッジAI画像認識 - karaage. [からあげ]
                                                                          • GoogleのDeepMindが囲碁のルールを自ら学習することでAlphaZeroを凌駕する強化学習手法「Muzero」を提案。

                                                                            3つの要点 ✔️その1 DeepMindからAlphaZeroの進化版「MuZero」が登場 ✔️その2 モデルベース強化学習によりルールを与えなくてもAlphaZeroに勝利 ✔️その3 囲碁・チェス・将棋に加えてAtariでも同一モデルで最高性能を達成 続きを読むには (3155文字画像6枚) AI-SCHOLARに 登録いただく必要があります。 1分で無料で簡単登録する または ログイン

                                                                              GoogleのDeepMindが囲碁のルールを自ら学習することでAlphaZeroを凌駕する強化学習手法「Muzero」を提案。
                                                                            • 画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー

                                                                              画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recog

                                                                                画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
                                                                              • Papers with Code - Machine Learning Datasets

                                                                                CIFAR-10 (Canadian Institute for Advanced Research, 10 classes) The CIFAR-10 dataset (Canadian Institute for Advanced Research, 10 classes) is a subset of the Tiny Images dataset and consists of 60000 32x32 color images. The images are labelled with one of 10 mutually exclusive classes: airplane, automobile (but not truck or pickup truck), bird, cat, deer, dog, frog, horse, ship, and truck (but no

                                                                                  Papers with Code - Machine Learning Datasets
                                                                                • 【Gradio】爆速で機械学習アプリを作る -PyTorch・TensorFlow・scikit-learnの好きなモデルで遊ぼう-|はやぶさの技術ノート

                                                                                  【Step1】Google Colaboratory のノートブックを新規作成 Google Colab を起動して、ノートブックを新規作成します。 【Step2】Gradio インストール 以下のコマンドでPythonライブラリの Gradio をインストールします。

                                                                                    【Gradio】爆速で機械学習アプリを作る -PyTorch・TensorFlow・scikit-learnの好きなモデルで遊ぼう-|はやぶさの技術ノート