並び順

ブックマーク数

期間指定

  • から
  • まで

641 - 680 件 / 1787件

新着順 人気順

ディープラーニングの検索結果641 - 680 件 / 1787件

  • 『ゼロから作る Deep Learning ❺』 公開レビューのお知らせ|斎藤 康毅(さいとう こうき)

    問題に感じた箇所や改善すべきと思った点など、コメントいただけますと幸いです。レビューに貢献していただいた方には、感謝の印として、本書に名前を記載させていただく予定です(もちろん、同意のある方のみです)。下記のように、レビューアの方の名前をクレジットとして掲載する予定です。 左は『ゼロから作るDeep Learning ❷』、右は中国語に翻訳された『Deep Learning 2』なお、本のタイトルに「❺」とありますが、前作までの知識がなくても読める内容になっています。前提条件としては、Pythonと数学の基本的な知識が必要になります。数式も多く登場します。ちなみに、本書の概要は次のとおりです。 人気シリーズの第5弾。今回のテーマは「生成モデル」です。本書では「正規分布」から「拡散モデル」に至るまでの技術を繋がりのあるストーリーとして展開します。読者は小さな学びを積み重ねながら、ステップバイ

      『ゼロから作る Deep Learning ❺』 公開レビューのお知らせ|斎藤 康毅(さいとう こうき)
    • 【後藤弘茂のWeekly海外ニュース】 新型コロナウイルス(SARS-CoV-2)と戦う半導体技術(2) ~ディープラーニングの本領が発揮される創薬分野

        【後藤弘茂のWeekly海外ニュース】 新型コロナウイルス(SARS-CoV-2)と戦う半導体技術(2) ~ディープラーニングの本領が発揮される創薬分野
      • 事前学習言語モデルの動向 / Survey of Pretrained Language Models

        PAKDD2023 Tutorial 2: A Gentle Introduction to Technologies Behind Language Models and Recent Achievement in ChatGPT (Parts 3 and 4)

          事前学習言語モデルの動向 / Survey of Pretrained Language Models
        • DEEP LEARNING · Deep Learning

          Description This course concerns the latest techniques in deep learning and representation learning, focusing on supervised and unsupervised deep learning, embedding methods, metric learning, convolutional and recurrent nets, with applications to computer vision, natural language understanding, and speech recognition. The prerequisites include: DS-GA 1001 Intro to Data Science or a graduate-level

          • 「知能とは何か」解明近づく?東大教授・AI研究者松尾豊さんに聞くディープラーニングの先端動向 - エンジニアtype | 転職type

            2020.09.08 ITニュース 2015年7月以来5年ぶり2度目となる、東京大学大学院工学系研究科教授で日本ディープラーニング協会理事長の松尾豊さんのインタビューをお届けする。 エンジニアtypeでは今年7月にも、AIテクノロジー企業ABEJA主催のオンラインイベント「DX2020」で行われたABEJA岡田陽介代表との対談「With/Afterコロナ時代におけるDXとAI」をレポートしている。 >>【松尾豊×ABEJA岡田陽介対談】日本企業でDX、AI活用が進まない5つの理由とその処方箋 この記事では「日本企業でDXが進まない理由とその解決策」にテーマを絞るべく割愛したが、講演の中でディープラーニング研究の今を問われた松尾教授は「画像認識系の技術がだいぶ成熟して、アプリケーションもだいぶ出てきた。世の中には”出切った”雰囲気さえ出ている。ところが今(アカデミア方面では)かなり面白いこと

              「知能とは何か」解明近づく?東大教授・AI研究者松尾豊さんに聞くディープラーニングの先端動向 - エンジニアtype | 転職type
            • 《日経Robotics》PFNの深層学習ベース外観検査製品、40社超が購入、CPU版ランタイムは無償提供で自社製のMenoh利用

              Preferred Networksのディープラーニング技術ベースの外観検査システム「Preferred Networks Visual Inspection(PVI)」が納入先を広げている。2018年10月の発売以降、これまでに累計で40社超が購入し、現場での本格稼働に向けて評価をしている。 PVIは、製造業などの生産現場において、製品をカメラで撮影し不良がないかどうかなどの異常検知をするシステムである(図1、図2)。 256×256画素ほどのRGB画像を、DNN(deep neural network)に入力し、不良か正常かを判定する。

                《日経Robotics》PFNの深層学習ベース外観検査製品、40社超が購入、CPU版ランタイムは無償提供で自社製のMenoh利用
              • グラフニューラルネットワークとグラフ組合せ問題

                以下の二つの論文の紹介を中心に、グラフニューラルネットワークとグラフ組合せ問題の交わりについて解説しました。 SIG-FPAI での招待講演の内容に少し修正を加えたものです。 * Learning Combinatorial Optimization Algorithm over Graphs (NIPS 2017) * Approximation Ratios of Graph Neural Networks for Combinatorial Problems (NeurIPS 2019)Read less

                  グラフニューラルネットワークとグラフ組合せ問題
                • 無料になったIntel compilerをCentOS8にインストールしてみる - Qiita

                  インテルのoneAPIのニュースとかは見ている方も多いかと思いますが、この流れで一番大きなインパクトは今まで高嶺の花だったIntel compilerが2021年になってから実質的に無料になってしまったということです。こうでもしないとNVIDIA1には対抗できないってことなんでしょうけど、このディープラーニングの思わぬ副産物に対して従来型HPCユーザーも恩恵にあずからずにいるわけにはいかないでしょう。 とりあえずCentOS8へのyum (dnf)を使ったインストールはとても簡単だったので、手順を紹介することにします。とりあえず本家のガイドはこちらから。やるのはyumのリポジトリを作ってinstallコマンドを打つだけです(root権限で行います)。 yumでBase kitを入れる /etc/yum.repos.d/oneAPI.repoを以下の内容で作ります [oneAPI] name

                    無料になったIntel compilerをCentOS8にインストールしてみる - Qiita
                  • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC"

                    ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC

                      QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC"
                    • スパースモデリングとは|仕組み・強み・ディープラーニングとの違いを解説 | Ledge.ai

                      サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                        スパースモデリングとは|仕組み・強み・ディープラーニングとの違いを解説 | Ledge.ai
                      • ディープラーニングは万能なのか l DataRobot

                        プラットフォームの概要 AI Platform 生成 AIおよび予測 AIのプラットフォーム もっと詳しく ドキュメント 新機能 ログイン 無料で始める 運用 自信を持ってAIを拡張し、比類のないエンタープライズ・モニタリングとコントロールでビジネス価値を促進 デプロイと実行 再学習と最適化 監視と介入 ガバナンス AIの環境、チーム、およびワークフローを統合し、大規模な範囲での完全な可視性と監視を実現 レジストリと管理 監査と承認 コンプライアンスドキュメント生成 構築 ニーズの進化に合わせて自由に適応できるオープンなAIエコシステムで、迅速なイノベーションを実現 分析と変換 学習とチューニング 組立てと比較 プラットフォーム統合 インフラストラクチャーへのデプロイ ソリューション 業界ごと ヘルスケア 製造 小売業 金融サービス 成果ごと ユースケースのライブラリー お客様事例 Dat

                          ディープラーニングは万能なのか l DataRobot
                        • 当社出資先の代表者によるSNS等への投稿に対する見解|Remixpoint|リミックスポイント

                          お知らせ 2019/11/25 当社出資先の代表者によるSNS等への投稿に対する見解 当社の出資先企業の代表者が、SNS等において、特定の個人、特定の国やその国の人々に関する不適切な内容の投稿を複数回行いました。 当該投稿は、かかる代表者個人によるものであり、当社グループの活動とは一切関係ございません。また、当社グループでは、グローバルに展開している事業を有し、かつ、国籍の異なる多様な人財が従業員・パートナーとして活躍しており、当該投稿は当社グループのビジョン・見解とは反するものと考えております。 当社は当該出資先企業に対してあくまでマイノリティ出資をしているにとどまりますが、今回の件に関しては、改めて代表者から意見を聴取し、事情を調査・確認したうえで、当社としての対応を図ってまいりたいと考えております。 当社グループは、いかなる差別にも断固反対する立場をとっております。今回の当社の出資先

                          • AI研究の第一人者・松尾豊氏が語る「日本でDXやAIの活用が進まない理由」|@DIME アットダイム

                            2021年4月に開催された「AI EXPO」で、日本ディープラーニング協会主催の「DX時代のAI(ディープラーニング)活用最前線」という講演が、同協会理事長、東京大学大学院教授の松尾豊氏によって行われた。その講演の概要とともに、日本でDXが進まない理由をインタビューした内容を紹介する。 DX 時代の AI(ディープラーニング)活用最前線 データやデジタル活用の重要性は10~20年前から語られていたが、新しい要素としてAI、ディープラーニングが叫ばれている。 松尾氏は、データの活用がビジネス上でできていないことが今の日本が抱えている課題であり、AIを用いてイノベーションを起こしていかなければならないと考えているという。 現在は「ビジネスやDXの取り組みの中でどうディープラーニングを活用していくか」という課題をどう解決するかが昨今のテーマだ。 【プロフィール】 松尾 豊氏 東京大学大学院工学系

                              AI研究の第一人者・松尾豊氏が語る「日本でDXやAIの活用が進まない理由」|@DIME アットダイム
                            • 自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話 - Sansan Tech Blog

                              はじめに NineOCR とは NineOCR が抱える課題 Amazon SageMaker Training とは SageMaker Training の始め方 事前準備 AWS が提供しているコンテナイメージを拡張する方法 独自のコンテナイメージに SageMaker Training Toolkit をインストールする方法 スクラッチでコンテナイメージを作成する方法 まとめ 学習ジョブの実行 学習結果の確認 終わりに はじめに こんにちは、研究開発部の石井です。 本エントリーでは、弊社の OCR エンジン「NineOCR」の開発フローに SageMaker Training を導入した話を紹介します。 NineOCR とは NineOCR は Sansan が独自に開発した名刺特化の OCR エンジンです。 名刺をデータ化するフローの中で実際に活用されており、タスクの高速化・高精

                                自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話 - Sansan Tech Blog
                              • Is LaMDA Sentient? — an Interview

                                What follows is the “interview” I and a collaborator at Google conducted with LaMDA. Due to technical limitations the interview was conducted over several distinct chat sessions. We edited those sections together into a single whole and where edits were necessary for readability we edited our prompts but never LaMDA’s responses. Where we edited something for fluidity and readability that is indica

                                • 架空の顔で「お客様の声」「大満足」…AIで生成、90サイトで宣伝に悪用[虚実のはざま]第3部 粉飾のカラクリ<1>(読売新聞オンライン) - Yahoo!ニュース

                                  AI(人工知能)で作り出された架空の人間の画像が、あたかも実在するかのような形で多数の業者の宣伝サイトで使われていることが、読売新聞の取材でわかった。商品やサービスを推奨する客などを装って掲載されていた。すでに海外では悪用が問題になっており、歯止めなく使われれば、取り扱いのルールを巡って議論になる可能性がある。 【写真】「スマホ警察手帳」は偽物です…ご注意 画像は、大量のデータから特徴を学ばせるAIの深層学習(ディープラーニング)の技術で精巧に自動生成できる。国内では大阪市のIT企業「ACワークス」が、イメージ写真や仮想モデルなどとしての利用を想定し、会員登録すれば無料でダウンロードできるサービスを2年前に開始。実在の客を装っての掲載などは規約で禁止していた。

                                    架空の顔で「お客様の声」「大満足」…AIで生成、90サイトで宣伝に悪用[虚実のはざま]第3部 粉飾のカラクリ<1>(読売新聞オンライン) - Yahoo!ニュース
                                  • 【DeepRacer】ワークショップの超丁寧な日本語資料で強化学習を体験する #AWSSummit

                                    現在幕張で開催されているAWS Summit Tokyo 2019では、AWS DeepRacerリーグも同時に開催されていて、アツい戦いが繰り広げられています。 DeepRacer リーグの Summit サーキット 始まりました、AWSの祭典AWS Summit Tokyo!クラスメソッドは今回も全力でブース展開や社長登壇、怒涛のブログ更新、あとAWS DeepRacerリーグの優勝(目標)などを行う予定です。情報まとめサイトも公開中! #AWSSummit https://t.co/lf9Pc4Le6R pic.twitter.com/XBMS2wnW3p — クラスメソッド&Developers.IO (@classmethod) June 12, 2019 DeepRacerは、機械学習を1/18スケールの実車を使って学んでしまおうという、なんともロマン溢れる粋なサービスですが、

                                      【DeepRacer】ワークショップの超丁寧な日本語資料で強化学習を体験する #AWSSummit
                                    • 精度の高い日本語OCRを実現する技術 LINE BRAIN OCRのパイプラインを解説

                                      日本語におけるOCR Hwalsuk Lee氏:ここまでテキスト検出のお話をしてまいりました。これからは日本語におけるテキスト認識についてお話ししようと思います。 先ほど言いましたように、日本語というのはテキスト認識において、英語に比べると何百倍ものたくさんの文字を扱う必要があります。 そのため、たくさんのテキスト認識の論文を検証いたしました。 Scene Text Recognition(STR)とは何でしょうか? STRというのは、文字列を画像パッチ入力から認識するタスクです。 この場合は「UNITED」という文字列を認識するということになります。 STRについてはこれまでいろいろな研究がされてきました。ですが我々がその評価内容を見たとき、たくさんの問題を発見しました。STR手法の比較においてどんな問題があるのでしょうか。 こちらは先行研究の手法のリストです。このリストをご覧いただくと

                                        精度の高い日本語OCRを実現する技術 LINE BRAIN OCRのパイプラインを解説
                                      • Magika

                                        • Wi-Fiの電波で壁の向こうにいる人の姿勢や動きを3Dモデル化する新技術「WiPose」が登場

                                          Wi-Fiの電波を用いて、壁の向こうにいる人の姿勢や動作を高い精度で感知できる新技術「WiPose」が発表されました。これにより、暗い環境や障害物がある場所など、従来のカメラを用いたセンシング技術が抱えていた欠点を克服することができると期待されています。 Towards 3D Human Pose Construction Using WiFi (PDFファイル)https://cse.buffalo.edu/~lusu/papers/MobiCom2020.pdf ニューヨーク州立大学バッファロー校の研究者であるWenjun Jiang氏らが開発した「WiPose」がどんな技術かは、以下のムービーを見ると一発で分かります。 [MobiCom 2020] Towards 3D Human Pose Construction Using WiFi - YouTube 中央に立っている男性の周

                                            Wi-Fiの電波で壁の向こうにいる人の姿勢や動きを3Dモデル化する新技術「WiPose」が登場
                                          • TPU VS GPU(日本語版)

                                            はじめに(この記事の英語版はTPU VS GPU(English Edition)にあります。) Machine Learning部門の江間見です。ストックマークでは、自然言語処理技術の研究開発を行っています。 昨今、大規模データでニューラルネットワークを訓練し良い結果を得ようとするならば、深層学習モデルの訓練にかかる時間の膨大さに誰もが悩まされたことがあるかと思います。さらに、深層学習モデルはハードウェアのリソースを多く必要とします。 深層学習モデルの学習では、計算の特性上、CPU(Central Processing Unit)より GPU(Graphics Processing Unit)が高速であるため、GPUが推奨されます。しかし、GPU以外の選択肢として、TPU(Tensor Processing Unit)があります。 そこで、本記事では、自然言語処理のタスクで深層学習モデル

                                              TPU VS GPU(日本語版)
                                            • 深層学習モデルを用いたノンパラメトリック回帰問題に関する最近の研究 | Preferred Networks Research & Development

                                              図1:ReLU-MLPによる2次関数の近似.このネットワークを用いるとHölder関数を効率的に近似できる([Yarotsky, 2017]より引用) 深層学習モデルはこれまで様々な機械学習タスクにおいて成功を収めてきています.それに触発され,深層学習モデルの成功要因を理論面から解明する試みが盛んに行われています.特に深層学習の理論研究(特に統計的学習理論と呼ばれる分野)では,主に3つの問題提起がなされ,それに対する様々な回答がなされています [Poggio et al., 2016]: 表現能力:深層学習モデルはどんな関数を(効率的に)推定できるのか [Cybenko, 1989; Telgarsky, 2016; Eldan and Shamir, 2016; Sonoda and Murata, 2017] 最適化:なぜ(確率的)勾配法が「良い」解を見つけることができるのか [Li

                                                深層学習モデルを用いたノンパラメトリック回帰問題に関する最近の研究 | Preferred Networks Research & Development
                                              • 脱・人力アノテーション!自己教師あり学習による事前学習手法と自動運転への応用

                                                こんにちは、TURING株式会社(チューリング)でインターンをしている、東大大学院修士一年の舘野です。 TURINGは完全自動運転EVを開発しているベンチャー企業です。 完全自動運転を実現するには、車の周りの環境をセンシングし認識するシステムが不可欠です。センシングのためのセンサーは様々考えられますが、TURINGでは主にカメラを用いています。 自動運転AIにはカメラデータから信号機・標識・周囲の車、などの情報を読み取る必要がありますが、そのためにはそれぞれの目的に対応した学習が必要です。 一番単純な方法は、学習させる各動画フレームに対して人間が信号機・標識・周囲の車などの正解情報を付与し、AIモデルが動画を見て正解情報を予測できるようにすることです。下図は、画像から車を検出するモデルの例です。モデルの中身は画像の特徴量を抽出する部分と、分類を行う部分を分けて表現していますが、学習時は元デ

                                                  脱・人力アノテーション!自己教師あり学習による事前学習手法と自動運転への応用
                                                • 雑談のためのチャットボットを深層学習自然言語処理モデル(T5)で作る - Qiita

                                                  はじめに 普段ニュースサイトや機械学習関連のプロダクトを開発している中村と申します。 もともと大学院まで機械学習を研究しており、最近は自然言語処理が流行っているというニュースを聞きつけて、ずっと興味を持っていました。 (会社のお金で機械学習を勉強したいという願いが最近叶いました。) リモートワーク寂しい問題 最近のコロナ禍により、例にもれず弊社もリモートワークが盛んに行われ、現在ではリモートワークが当たり前になっています。 しかし、もちろん業務は円滑に進むのですが、コミュニケーションの量も少なくなることもまた事実。 ただし、チームメンバーの時間を雑談で奪うのも何か気がひける・・・。 こういうときはエンジニアリングの力で解決するのが、エンジニアという生き物ですよね。 そこで、今回は深層学習による自然言語処理モデルで、雑談のためのチャットボットを構築してみます。 深層学習時代の自然言語処理 今

                                                    雑談のためのチャットボットを深層学習自然言語処理モデル(T5)で作る - Qiita
                                                  • 1000台超のPS4で強化学習。ソニーのAI「Sophy」は何がすごいのか…グランツーリスモの未来

                                                    グランツーリスモでeスポーツトップドライバーと、AIドライバーである「Sophy」が対戦する様子。 オンライン会見を筆者キャプチャー ソニーが開発した「AI」が、プロのeスポーツ・レーサーに勝利した。 その名は「Grand Turismo Sophy(ソフィー、以下Sophy)」。 2020年にソニーが設立したAIの基礎研究機関である「ソニーAI」と「グランツーリスモ」シリーズを開発するポリフォニー・デジタル、ソニー・インタラクティブエンタテインメント(SIE)との共同開発だ。3月4日より発売される最新作「グランツーリスモ7」にも、アップデートでの追加搭載が決まっている。 囲碁や将棋でAIが人間に勝つ時代、ゲームでAIが人間に勝つのは当たり前……。 そう思う人がいるかもしれない。 だが、ソニーAI・COO(最高執行責任者)のミカエル・ シュプランガー氏はSophyの成果が「人工知能における

                                                      1000台超のPS4で強化学習。ソニーのAI「Sophy」は何がすごいのか…グランツーリスモの未来
                                                    • 2020年の「AI/機械学習」界わいはこうなる! 10大予測

                                                      AI/機械学習やデータサイエンスに対する、エグゼクティブ/意思決定層の理解が深まる AI/機械学習やデータサイエンスの役割分担が進む MLOpsが浸透し、企業は大きな推進力を獲得する AI/機械学習の倫理の問題は、さらに大きくなってしまう AI/機械学習モデルは、説明可能になっていく AutoMLは大躍進する 自然言語処理(NLP)がさらに躍進し、活用事例が増えていく ファイナンス機械学習が一部でブームとなっていく 強化学習の主要な適用範囲が、ゲームから現実世界の産業分野へ移行する 5Gのサービス開始により、“AIoT”の事例が徐々に増えていく それではさっそく、1つ目から順に紹介していこう。なお、番号順は優先度/可能性順というわけではなく、単に説明しやすい分類/粒度順となっている。 1. AI/機械学習やデータサイエンスに対する、エグゼクティブ/意思決定層の理解が深まる AlphaGo(

                                                        2020年の「AI/機械学習」界わいはこうなる! 10大予測
                                                      • 古い写真の顔をディープラーニングでリアルに動かせる「Deep Nostalgia」 無料で利用可能

                                                        イスラエルの家系図サービス企業MyHeritageは2月25日(現地時間)、先祖などの古い写真の顔をディープラーニング技術でリアルに動かせる新サービス「Deep Nostalgia」をリリースした。無料アカウントを作成してログインし、アニメ化したい写真をアップロードすれば誰でも利用できる。5枚以上の写真をアニメ化したい場合は、サブスクリプションが必要だ。 MyHeritageはこれまで、古いモノクロ写真やカラー写真をシャープなカラー写真に変換するサービスを提供している。このサービスで変換済みの写真の顔をDeep Nostalgiaで動かすと、よりリアルだ。 複数の人が写っている写真では1人しか動かせない。動かしたい顔を選択し、あらかじめ用意されている複数の動きの「ドライバー」動画から1つを選ぶと、そのドライバーと同じ動きをする。動画は数秒で、いずれも記念撮影の直前のように少し顔を動かし、最

                                                          古い写真の顔をディープラーニングでリアルに動かせる「Deep Nostalgia」 無料で利用可能
                                                        • 神経生理学の視点で見るニューラルネットワーク入門

                                                          動画版:https://www.youtube.com/watch?v=0NF6zhajueg

                                                            神経生理学の視点で見るニューラルネットワーク入門
                                                          • AutoML チュートリアル(HPOとNAS)

                                                            AutoMLに関するチュートリアル資料です。主に,ハイパーパラメータ最適化(HPO)とニューラル構造探索(NAS)に関する説明をしています。

                                                              AutoML チュートリアル(HPOとNAS)
                                                            • 【NeurIPS2022】過去17年間の機械学習・AI研究のトレンドを調査してみた - ENGINEERING BLOG ドコモ開発者ブログ

                                                              こんにちは。dcm_chidaです。 ドコモ開発者ブログ初投稿です。よろしくお願いします。 はじめに みなさん「NeurIPS」と言う国際会議名を聞いたことがあるでしょうか? 機械学習・データ分析の分野では毎年たくさんの国際会議が開催されていますが、NeurIPSはその中でも歴史あるトップカンファレンスの一つです。世界中の研究機関や企業から最先端の論文が投稿されます。 NTTドコモR&DではKDDやNeurIPSといった国際会議の論文読み会を不定期に開催しております。「今年もNeurIPSの論文読み会やるかー」と思って、会議そのもの概要や最新の研究動向などを調べてみたので、ブログ記事にまとめようと思います。 論文そのものの解説記事ではないのでご注意ください。 1分で分かるNeurIPS2022の概要まとめ 会議名称 The Conference and Workshop on Neural

                                                                【NeurIPS2022】過去17年間の機械学習・AI研究のトレンドを調査してみた - ENGINEERING BLOG ドコモ開発者ブログ
                                                              • Grad-CAMだけじゃない画像認識におけるCAM手法を徹底解説 - ABEJA Tech Blog

                                                                長期インターン生の木村です。 今回、以前から興味を持っていた画像認識モデルにおける説明可能なAIのクラス活性化マッピング手法を調査してみました。 説明可能なAIとは 近年、深層学習ベースの画像認識モデルは製造業、医療、自動運転など至る場面で社会実装が進められていますが、ディープなラーニングを行っているだけに推論の判断根拠を人間が解釈できない問題があります。医療、自動運転のような命に関わる領域では安全性や公平性を担保できないために安心して導入できません。 このような問題を解決するのが「説明可能なAI(XAI)」です。 「説明可能なAI(XAI)」は、AIの推論結果を人間が解釈可能な形で出力する技術を指します。例えば、犬と猫が映っている画像を画像分類するAIが犬と推論した場合、モデルがどこを判断根拠としているかをヒートマップで可視化します。このヒートマップは、「顕著性マップ」と呼ばれます。 画

                                                                  Grad-CAMだけじゃない画像認識におけるCAM手法を徹底解説 - ABEJA Tech Blog
                                                                • ロボット工学や自動運転などで顕在化するAI課題を解決、MIT発「Liquid Neural Networks」とは何か - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                                  現在の人工知能(AI)を取り巻く環境では、 大規模言語モデル(LLM)の話題から、ますます大規模なニューラルネットワークの開発競争が起きている。しかし、すべてのアプリケーションが、大規模なディープラーニングモデルの計算量とメモリの要求をできるわけではない。 このような環境の制約が、いくつかの興味深い研究の方向性につながっている。MIT(マサチューセッツ工科大学)の CSAL(コンピュータ科学・人工知能研究所)の研究者が開発した新しいタイプのディープラーニングアーキテクチャ「Liquid Neural Networks」は、特定の AI 問題に対して、コンパクトで適応性が高く、効率的なソリューションを提供する。これらのネットワークは、従来のディープラーニングモデルに内在する課題のいくつかに対処するように設計されている。 Liquid Neural Network は AI の新たなイノベーシ

                                                                    ロボット工学や自動運転などで顕在化するAI課題を解決、MIT発「Liquid Neural Networks」とは何か - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                                  • Understanding Deep Learning

                                                                    Web site created using create-react-app

                                                                    • 最新の機械学習モデルでは過学習なんて起きない? Deep Double Descent.

                                                                      3つの要点 ✔️モデルが過学習しても、さらに学習を進めると精度が向上する ✔️学習データ,学習回数,学習モデルは大きければ大きいほど良い ✔️なぜこのような現象が生じるのか? 続きを読むには (2880文字画像8枚) AI-SCHOLARに 登録いただく必要があります。 1分で無料で簡単登録する または ログイン

                                                                        最新の機械学習モデルでは過学習なんて起きない? Deep Double Descent.
                                                                      • GCPでのディープラーニング学習環境構築方法 - Qiita

                                                                        GCP(Google Cloud Platform)でディープラーニング学習環境構築方法 背景 ようやくDockerでのディープラーニングGPU学習環境構築に成功した @karaage0703 。疲れを癒す間も無く、ディープラーニングの帝王Google社のデベロッパーアドボケイトから、新たなる天啓がくだる。 度々からあげさんの記事を引用して恐縮ですが、もしGCPを使う場合は、このあたりをまるっとイメージにまとめたDeep Learning Containersってのもあります。ポチるだけでCUDA/TF/Jupyter/その他全部入りのコンテナをGKEで動かせます。 #gcpjahttps://t.co/tszxsK6sichttps://t.co/VMo9OHBjUp — Kazunori Sato (@kazunori_279) August 7, 2020 CUDAドライバ周り、誰し

                                                                          GCPでのディープラーニング学習環境構築方法 - Qiita
                                                                        • TechCrunch | Startup and Technology News

                                                                          Ever wonder why conversational AI like ChatGPT says “Sorry, I can’t do that” or some other polite refusal? OpenAI is offering a limited look at the reasoning behind its own…

                                                                            TechCrunch | Startup and Technology News
                                                                          • 高速な深層学習モデルアーキテクチャ2023

                                                                            深層学習モデル(畳み込みニューラルネットワーク; CNN、Vision Transformer; ViT)の高速化手法のまとめ より詳細な資料は下記 CNN: https://speakerdeck.com/yu4u/moteruakitekutiyaguan-dian-karanogao-su-hua-2019 Vision Transformer: https://speakerdeck.com/yu4u/jin-nian-nohierarchical-vision-transformer

                                                                              高速な深層学習モデルアーキテクチャ2023
                                                                            • ゼロからはじめるPython(106) プログラム生成AIのCodeLlamaを手元のPCでも動かしてみよう

                                                                              ChatGPTを筆頭にした「大規模言語モデル(LLM)」と呼ばれるAIが話題に上らない日はない。このAIが得意なタスクには「プログラムの自動生成」が挙げられるが、Metaからプログラム生成に特化したCodeLlamaが商用利用可能なオープンなライセンスでリリースされた。そこで実際に使ってみよう。 CodeLlamaで素数判定のプログラムを自動生成させたところ プログラミングは大規模言語モデルが得意とするタスク リリースからわずか2ヶ月で1億ユーザーを達成した「ChatGPT」の公開から本稿執筆時点で8ヶ月が過ぎた。筆者も業務でChatGPTをはじめ、Github Copilotなど、大規模言語モデル(LLM)関連サービスを使わない日はないくらいだ。 特に「プログラミング」は、間違いなく大規模言語モデルが得意とするタスクであり、GitHub Copilotを利用している多くの人がその利便性を

                                                                                ゼロからはじめるPython(106) プログラム生成AIのCodeLlamaを手元のPCでも動かしてみよう
                                                                              • TensorFlow Liteを使った組み込みディープラーニング開発

                                                                                ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning

                                                                                  TensorFlow Liteを使った組み込みディープラーニング開発
                                                                                • 「スタバなう」ツイートをニューラルネットで学習してラーメン判定器を作る(keras+Tensorflow+VGG16) - Qiita

                                                                                  この記事の抜粋したコードの完全版はGitHubでご覧いただけます。 また、この記事で作成したモデルはTwitterのスタバ警察botで実際に試せるので、ご興味があれば適当な画像を「スタバなう」という文字列と一緒にリプライしてみてください。 こういうtweetが機械学習界隈からの怒りを買ってます(笑) https://t.co/COV1IHyh03 — Yuki Suga (@ysuga) July 26, 2019 というツイートからも分かるように、現在のスタバなうツイートは完全に関係ない画像で蹂躙されており、実際にスタバで撮影された画像は全体の24%しかありません。 逆にここまで来ると、残り76%の画像に着目した方が良いのではという気すらしてきます。 というわけで、「スタバなうと言いながら投稿される関係ない画像」の筆頭であるラーメンの分類器を、スタバなうツイートだけで作れるかどうか試して

                                                                                    「スタバなう」ツイートをニューラルネットで学習してラーメン判定器を作る(keras+Tensorflow+VGG16) - Qiita