並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 1838件

新着順 人気順

ディープラーニングの検索結果361 - 400 件 / 1838件

  • DALL·E 2 を早くも破る!超リアル画像生成モデル Imagen を解説

      DALL·E 2 を早くも破る!超リアル画像生成モデル Imagen を解説
    • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

      こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

        OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
      • 機械学習/統計学/データサイエンスの無償gacco動画、全まとめ【2021年秋版】:AI・機械学習の独学リソース(1/3 ページ) - @IT

        機械学習/統計学/データサイエンスの無償gacco動画、全まとめ【2022年秋版】:AI・機械学習の独学リソース(1/3 ページ) 2022年3月末の最新状況に合わせて改訂。はじめてのAIから、機械学習、深層学習、自然言語処理、統計学、社会人のためのデータサイエンス(実用知識)、大学生のためのデータサイエンス(理論知識)まで、全28個の講義内容を紹介。本稿独自に考察した、学習者対象やお勧めの学習方法についても示す。

          機械学習/統計学/データサイエンスの無償gacco動画、全まとめ【2021年秋版】:AI・機械学習の独学リソース(1/3 ページ) - @IT
        • 機械学習のための環境構築とその管理 - nykergoto’s blog

          機械学習プロジェクトでは python を始めとした言語 + それに付随したライブラリを使います。 僕も python 触りたての頃はローカルマシン上にひとつ python 環境を作り、必要なライブラリをインストールして使っていました。環境の分離ということはあまり意識しておらず、やったとしてもプロジェクトごとに anaconda や pyenv, venv などで個別環境を作って切り分けるレベルでした。 しかし上記の方法だと困ったことが起ることがあります。例えば… global な環境が壊れてしまってすべて壊れる。 これは各環境が global な環境に依存しているために起こります。 python 以外の変更で環境は突如として壊れます。例えば brew install hoge したら Mecab が使えなくなっちゃったとかはあるあるだと思います >_< linux / Mac / Win

            機械学習のための環境構築とその管理 - nykergoto’s blog
          • 大澤昇平🇺🇳 on Twitter: "越塚は中立です。主犯格はコイツです。 https://t.co/G0UQEAwSmH https://t.co/GkaxutJyfl"

            越塚は中立です。主犯格はコイツです。 https://t.co/G0UQEAwSmH https://t.co/GkaxutJyfl

              大澤昇平🇺🇳 on Twitter: "越塚は中立です。主犯格はコイツです。 https://t.co/G0UQEAwSmH https://t.co/GkaxutJyfl"
            • 40歳エンジニア管理職が「Deep Learning for ENGINEER(E資格)」に合格した話 - Qiita

              Deep Learning for ENGINEER(E資格)とは この記事は2020年1月時点の情報であることをご了承ください。 現在、この日本においてAIのスキルを証明する公的資格として下記が挙げられます。 JDLA Deep Learning for GENERAL(G検定) JDLA Deep Learning for ENGINEER(E資格) です。 位置付けとしては、G検定がAI関連技術に関する一般教養を問う試験。 E資格がAI関連技術に関する理論を理解し、AIを実装できるスキルを問う試験。 という理解です。 詳細というか、正確な定義については、日本ディープラーニング協会(JDLA)のサイトをご参照ください。 E資格の受験方法とJDLA認定プログラム とういうわけで、ここからはE資格のことを中心に話を進めていきたいと思います。 E資格を受験するチャンスは年に2回あり、2月と8

                40歳エンジニア管理職が「Deep Learning for ENGINEER(E資格)」に合格した話 - Qiita
              • 「食べログ」の運営会社に3800万円余の賠償命じる 東京地裁 | NHK

                大手グルメサイト「食べログ」が飲食店の評価の点数を算出するシステムを一方的に変更し、売り上げが大幅に減ったとして、都内の焼き肉チェーンの運営会社が賠償を求めていた裁判で、東京地方裁判所は「優越的地位の乱用にあたり独占禁止法に違反する」と判断し、「食べログ」を運営する会社に3800万円あまりの賠償を命じました。 東京都内を中心に焼き肉チェーン店を運営する「韓流村」は、飲食店の評価や感想を利用客が書き込む大手グルメサイト「食べログ」について「3年前、チェーン店の評価の点数を一律に下げるようシステムを変更され、サイト経由での来客が毎月およそ5000人以上減って売り上げが減少した」と主張して、サイトの運営会社「カカクコム」に6億円あまりの損害賠償などを求めました。 16日の判決で東京地方裁判所の林史高裁判長は「店側は食べログに会員登録をしていて、会員でなくなると経営に大きな支障をきたすため食べログ

                  「食べログ」の運営会社に3800万円余の賠償命じる 東京地裁 | NHK
                • 【AI動画生成】Animate Anyone 論文解説

                  はじめに 11月も終わり、今年も残るところあと一か月となりました。 今年ももう終わるから今年中に成果を上げとけ!と言わんばかりに最近は新技術の登場が多いです。 今回取り上げるのも11月最後の大砲として出てきた新技術、その名もAnimate Anyone Animate Anyoneとはなんぞや 文字で説明するより見たほうが早い 凄くざっくり説明すると、一枚の絵と動きをボーン動画として入力すると、入力した絵がボーン動画と同じ動きをしてくれるよ!というもの。 似たようなものは今までもReferenceOnly × openpose × animatediffとかで出来ましたが、特筆すべきはその精度。 動画生成の大敵であるちらつきは一切なく、入力画像にかなり忠実な動画を生成しています。 さてこの技術、動画生成にずっと注目している自分としてはいますぐにでも弄り倒したいのですが、残念ながらコードとモ

                    【AI動画生成】Animate Anyone 論文解説
                  • 金子勇さんのED法を実装してMNISTを学習させてみた - Qiita

                    追記:続きを書きました。 はじめに 先日以下の記事が投稿され、その斬新な考え方に個人的ながら衝撃を受けました。 内容をざっくり言うと、ニューラルネットワークの学習を現在の主流であるBP法(誤差逆伝播法)ではなく、ED法(誤差拡散法)という新しい学習手法を提案しているものです。 もし記事の内容が本当ならニューラルネットワークの学習がO(1)でできてしまう事になり、まさしく革命が起きてしまいます。 (結論からいうと速度面はそこまででもなかったです(それでも早くなる可能性あり)) (ただこの新手法のポテンシャルは革命を起こす可能性は秘めているといっても過言ではありません) ED法に関してネットを探すとインターネットアーカイブに情報が少し残っていました。 このページですがED法のサンプルプログラム(C言語)が残っており、このサンプルプログラムをベースにpythonで書き起こしたものが本記事となりま

                      金子勇さんのED法を実装してMNISTを学習させてみた - Qiita
                    • NVIDIA、1枚の静止画で動きを合成 GANを用いた手法を開発 ダビデ像も踊り出す

                      Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 NVIDIAが10月に発表した新技術は、映像内の動きを抽出して画像に転送することで、リアルな合成動画を生成する敵対的生成ネットワーク(Generative adversarial networks、GAN)を用いた手法だ。 人の全身運動や顔の輪郭運動など、領域分割マスクや線画スケッチを基に、動かしたい画像に合成し写実的な映像に仕上げる。 ベースとなる以前の研究「Video-to-video synthesis」(vid2vid)では、学習したドメインでしか合成できなかったが、今回の研究では訓練データセットに含まれてなくても合成が可能になり、より幅広い合成動画が作成できる。

                        NVIDIA、1枚の静止画で動きを合成 GANを用いた手法を開発 ダビデ像も踊り出す
                      • Intel、“脳”の模倣でCPUより1千倍高速な演算システム「Pohoiki Beach」

                          Intel、“脳”の模倣でCPUより1千倍高速な演算システム「Pohoiki Beach」
                        • 物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌

                          はじめに 先月、YOLOv4が公開されました。位置づけとしては、物体認識のポピュラーなモデルの1つであるYOLO系統の最新版となります。結果がすごいのはぱっと見分かりましたし、内容も既存の手法をサーベイ・実験頑張って、精度上げていったんだなあくらいのさら読みはしていましたが、もう少しちゃんと読んでおこうと思い、読んでみたので紹介します。 私自身は物体認識の研究者というわけではないですが、なんだかんだ物体認識周りの記事をいくつか書いているので興味のある方は以下もご参照下さい。 note.com note.com [DL輪読会]Objects as Points from Deep Learning JP www.slideshare.net さて、このYOLOv4ですが、元々のYOLOの作者であるJoseph Redmon氏は著者ではありません。Jeseph Redmon氏は研究の軍事利用や

                            物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌
                          • 手描きキャラクターに深層学習で影 カラーでも

                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米メリーランド大学ボルチモアカウンティ校とProject HATによる研究チームが開発した「Learning to Shadow Hand-drawn Sketches」は、キャラクターに影を自動的に追加できる、深層学習を用いた手法だ。 影付きスケッチを直接生成するのではなく、スケッチとは別に影画像だけを生成しているのが特徴。このため、スケッチと影を別々のレイヤーにし、それぞれを別個に編集できる。生成した影はそのまま使用でき、より高い品質を望む場合にはユーザーがさらに修正できる。 提案モデルは、 GAN(Generative Adversarial Network)をベースに、2次元スケッ

                              手描きキャラクターに深層学習で影 カラーでも
                            • Raspberry Pi 4のディープラーニングで画像認識する環境をゼロから1時間で構築する方法 - karaage. [からあげ]

                              「Raspberry Pi Advent Calendar 2019」の3日目記事です。 最新Raspberry Pi OS(Bullseye)でのセットアップ記事を追記しました 最新OSでの環境構築は、以下記事も合わせて参照ください。 ラズパイ4を入手しました ラズパイ4を入手しました。色々事情があり、ポケットに入れて叩いたら2台に増えてしまいました。 ラズパイ4が2つ 手に入ったものは仕方ないので、恒例のセットアップと洒落込みたいと思います。ラズパイ4からラズパイ始める人もいるかもしれませんしね。そして今までラズパイ使っていたユーザーとして、4でCPU・メモリが大幅にスペックアップしているので、せっかくならそれらを体感できて役に立ちそうなアプリを動かしてみることにしました。 というわけで、ほどよく処理が重く、役に立ちそう(?)なディープラーニングを使った画像認識(正確には物体検出)を試

                                Raspberry Pi 4のディープラーニングで画像認識する環境をゼロから1時間で構築する方法 - karaage. [からあげ]
                              • 機械学習・ディープラーニングの数学/技術の概要を理解できる厳選「無料動画」

                                今や無料の動画だけでも、AI・機械学習・ディープラーニングは手軽に楽しく学べる。「機械学習/ディープラーニングに必要な数学」「機械学習/ディープラーニングの概要」「ディープラーニングの技術理解」の観点で、初心者にお勧めの無料動画を紹介する。 連載目次 「そろそろAI・機械学習・ディープラーニングを学びたいと思っているが、きっかけがつかめない……」という人は少なくないのではないだろうか。今では無料の動画だけで、手軽で楽しく学べるようになってきている。 「でも動画を見るにも時間が……」という人もいるだろう。そこで本稿では、できるだけ短時間の日本語の動画で、できるだけ効率的に堅苦しくなく学べる動画を、筆者が考える「学ぶべき順」で並べてみた。 念のため断っておくが、今回の動画選択には、えこひいきは一切ない。人脈による友達メディア推しもない。「筆者がこのテーマで学ぶならこれがベストだ」と本心で思って

                                  機械学習・ディープラーニングの数学/技術の概要を理解できる厳選「無料動画」
                                • DALL·E: Creating images from text

                                  We’ve trained a neural network called DALL·E that creates images from text captions for a wide range of concepts expressible in natural language. DALL·E is a 12-billion parameter version of GPT-3 trained to generate images from text descriptions, using a dataset of text–image pairs. We’ve found that it has a diverse set of capabilities, including creating anthropomorphized versions of animals and

                                    DALL·E: Creating images from text
                                  • 自動プログラミングAIの「AlphaCode」をDeepMindが発表、競技プログラミングレベルのコード生成が可能

                                    DeepMindが競技プログラミングレベルのプログラミングが可能な人工知能(AI)の「AlphaCode」を発表しました。AlphaCodeのほかにも自動でプログラミングが可能なAIは存在しますが、AlphaCodeは414億ものパラメーターを保持した特に精度の高いAIに仕上がっているとのことです。 Competitive programming with AlphaCode | DeepMind https://deepmind.com/blog/article/Competitive-programming-with-AlphaCode Competition-Level Code Generation with AlphaCode (PDF)https://storage.googleapis.com/deepmind-media/AlphaCode/competition_leve

                                      自動プログラミングAIの「AlphaCode」をDeepMindが発表、競技プログラミングレベルのコード生成が可能
                                    • GANを用いた画像異常検知アルゴリズム - Qiita

                                      概要 ニューラルポケットは、正常品と異常品を高精度で判別する画像分析アルゴリズムを開発し、国際学会ACPRにて発表しました。複数のオープンデータセットによる評価で、世界最高の異常画像検出精度を達成しています。 正常品と異常品を画像から識別するアルゴリズムは、工場や農業、インフラ管理などの幅広い領域において活用が進められており、属人的な作業を機械化することによる、見逃し率の低減や作業の効率化などに、大きな期待が寄せられています。 この領域においては、従来、正常品とのパターンマッチングを中心としたアプローチが主流でしたが、近年、深層学習を用いたアプローチが広まり、正常品の中でも形状変化が大きい、食品や柔らかい素材の部品など含め、幅広く活用することが出来るようになってきました。 本手法は、その発展として開発されたものであり、以下のような特徴を持ちます: 従来の手法では大量に必要となっていた異常画

                                        GANを用いた画像異常検知アルゴリズム - Qiita
                                      • CUDAを一枚の絵にまとめてみた - OPTiM TECH BLOG

                                        まえがき 初めまして、R&Dチームの宮﨑です。趣味はFPSをやってます。150時間やってますが未だにドンかつを食べられていません。普段は深層学習のベンチマークを取ったりしています。 実はひと昔前からあった深層学習。近年実用性が増して一大ブームとなっています。実用的になった背景の一つとしてGPUを用いた高速化により深層学習の学習及び推論が実用的な時間で実行できるようになったことがあります。NVIDIAから提供されるCUDAを用いるとC言語に拡張を加えた形式でCPU+GPUのヘテロジニアスコンピューティングを記述できます。 CUDAを使用するにはCPU+GPUの環境がどのようなハードウェア構成をしており、その上でCUDAがどのようなシステムを構築しているのかを理解する必要があります。この理解なしに漫然とサンプルコードを真似するだけでは意図通りのパフォーマンスが出なかったり、そもそもAPIの意味

                                          CUDAを一枚の絵にまとめてみた - OPTiM TECH BLOG
                                        • 機械学習をゼロから学ぶための勉強法 (2020年3月版) - Qiita

                                          はじめに データサイエンスや機械学習っておもしろそう!と思いつつも、どうやって勉強をしたら良いかわからない......と感じた経験はありませんか? ちなみに自分もその一人です。 この記事では、機械学習ってそもそも何? AIという言葉は知ってるけど詳しいことはわからないというような初学者でも、知識・経験を積んで機械学習に取り組めるようにするために必要な基礎の基礎から学ぶための勉強法を自分の経験をもとに紹介します!(ここで紹介するものは機械学習の中級者以上の方でも基礎知識の復習として活用できるものかなとも思っています) この記事の続編(データサイエンスはじめて1か月以内で参加したコンペで銀メダル(上位3%)とるまで!)はこちら 概要 (基本的にはこの3stepです) 基礎知識をつける(単語・用語の理解) ライブラリの使い方を理解 実際にコンペに挑戦(Kaggle) 1.機械学習&ディープラーニ

                                            機械学習をゼロから学ぶための勉強法 (2020年3月版) - Qiita
                                          • iPhoneの自撮りで本物そっくりな動く3Dリアルアバター 米Metaが技術開発

                                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米MetaのReality Labsの研究チームが開発した「Authentic Volumetric Avatars from a Phone Scan」は、スマートフォンで自撮りした短時間のスキャン画像から、本物そっくりの3D頭部アバターを生成するシステムだ。異なる視点やフォトリアリスティックな表情を表現し、高い忠実度で再現する。 現在、実在する人物のアバターを作成するためには膨大な人物データを取得する必要があり、そのデータを収集するには大規模なマルチビューキャプチャーシステムを必要とする。そのため軽量なデータキャプチャー、低遅延、許容できる品質でのアバター作成プロセスを自動化することが

                                              iPhoneの自撮りで本物そっくりな動く3Dリアルアバター 米Metaが技術開発
                                            • わずか数行のJavaScriptで機械学習をフル活用できる無料Webサービス「StackML」を使ってみた! - paiza times

                                              どうも、まさとらん(@0310lan)です! 今回は、誰でも簡単に機械学習を活用したプログラムをJavaScriptで構築できる無料のWebサービスをご紹介します! 画像解析、顔検出、表情分析、骨格・姿勢解析、特徴分析…など、さまざまな用途において機械学習を活用したプログラムをJavaScriptで実現できるので、とてもユニークなWebコンテンツを簡単に開発することができます。 これまで漠然と機械学習に興味を持っていた方も含めて、ぜひ参考にしてみてください! なお、paizaラーニングでも機械学習を学べる「Python×AI・機械学習入門編」を公開していますので、合わせてチェックしてみてください。 Python×AI・機械学習入門編について詳しくはこちら 【 StackML 】 ■「StackML」の使い方 それでは、StackMLを使いながらどのようなことができるのかを見ていきましょう!

                                                わずか数行のJavaScriptで機械学習をフル活用できる無料Webサービス「StackML」を使ってみた! - paiza times
                                              • NVIDIA Docker って今どうなってるの? (19.11版) - Qiita

                                                大事なお知らせ NVIDIA Docker リポジトリでの 2020 年 9 月の変更により、この記事内容と最新の状況に割と大きな差ができてしまいました。最新の状況に合わせた改訂版を、エヌビディアジャパンの Medium ページに投稿しましたので、今後は是非 Medium のほうをご覧ください。 NVIDIA Docker って今どうなってるの? (20.09 版) 以下、2020 年 8 月までの内容です。 ※ 2020/07/09 CUDA 11 の正式リリースに伴い、CUDA のインストールコマンド例を 11.0 のものに更新しました。 ※ 2020/06/13 CUDA 11 RC のリリースに伴い、CUDA 10.2 のインストールページからインストールしても CUDA 11 RCがインストールされるケースが確認されたので、10.2 を明示的に指定するように例示コマンドを更新しま

                                                  NVIDIA Docker って今どうなってるの? (19.11版) - Qiita
                                                • BitNetから始める量子化入門

                                                  はじめに BitNet、最近話題になっていますね。 そもそも量子化って何?という方もいると思うので、この記事は DeepLearning の量子化から入り、その上で BitNet の触りについて見ていこうと思います。色々とわかってないことがあり、誤読してそうなところはそう書いてるのでご了承ください。 図を作るのは面倒だったので、様々な偉大な先人様方の図やスライドを引用させていただきます。 量子化 DeepLearning における量子化 DeepLearning の学習・推論は基本 float32 で行います。これを int8 や Nbit に離散化することを量子化といいます。 計算に使う値は、モデルの重み、アクティベーション(ReLUとか通した後)、重みの勾配等があります。 学習時については一旦置いておいて、この記事では推論における量子化について焦点をあてます。推論時に量子化の対象となる

                                                    BitNetから始める量子化入門
                                                  • 自作キーボードの聖地、遊舎工房に行ってみたら、そこは沼だった(小寺信良) | テクノエッジ TechnoEdge

                                                    18年間テレビ番組制作者を務めたのち、文筆家として独立。家電から放送機器まで執筆・評論活動を行なう傍ら、子供の教育と保護者活動の合理化・IT化に取り組む。一般社団法人「インターネットユーザー協会」代表理事。 もういい加減にしろよと読者から怒られかねないのだが、まだまだキーボードの話である。 KeychronのK11 Proを購入し、散々いじくり回していたわけだが、まあさすがに自作までは時間ないし、キーボード改造もここまでかなと思っていた。ところが先日、PFUのHHKB Studioのお話を聞く機会があり、1995年当時の秋葉原の話などが出て、懐かしく思い出した。この記事はまもなくITmedia MONOistに掲載されると思うので、お楽しみにしていただきたい。 そのインタビューの中で、秋葉原のキーボード専門店「遊舎工房」の話が出て、そういえばまだ一度も行ったことないなと気づいた。だいたいこ

                                                      自作キーボードの聖地、遊舎工房に行ってみたら、そこは沼だった(小寺信良) | テクノエッジ TechnoEdge
                                                    • Pythonのコード改善のためのツール5つを試してみた - minus9d's diary

                                                      Pythonのコードを改善するためのツールについて一通り試してみました。各ツールのインストール方法や使い方については Pythonのスタイルガイドとそれを守るための各種Lint・解析ツール5種まとめ! - Sider Blog に詳細にまとまっているのでおすすめです。 サンプルコード 以下のサンプルコードを対象に、各ツールの出力を確かめてみます。 import time import sys import fractions def func1(varA,varB): '''return sum of a and b''' varC = 42 return (varA + varB) print(func1(fractions.Fraction(1, 2), fractions.Fraction(1, 3))) 3 + 5 sys.exit(0) このスクリプトをsample.pyという名

                                                        Pythonのコード改善のためのツール5つを試してみた - minus9d's diary
                                                      • 畳み込み+Attention=最強?最高性能を叩き出した画像認識モデル「CoAtNet」を解説! - Qiita

                                                        1. CoAtNetの解説 1.1 畳み込みとSAの復習 コンピュータビジョンで用いられている大きな仕組みに畳み込みとSelf-Attention(=SA)があります。畳み込みではEfficientNet、SAではViTが有名ですね。EfficientNetについてはこちらの拙著記事、ViTについてはこちらの拙著記事をご参照ください。CoAtNetでは、この畳み込みとSAの良いとこ取りをしたブロックを作ることが一番の目的になっています。畳み込みとSAの式を復習しておきましょう。ここでは畳み込みの中でもDW(=Depthwise)畳み込みを取り扱います。そして、本論文では分かりやすさを優先しているのか、式の細かいところ(SAにおけるqkvの埋め込みなど)はあえて排除しているように見えるので、理解しやすいです。 1.1.1 畳み込みの式 本論文では、畳み込みの中でもDW(=Depthwise)

                                                          畳み込み+Attention=最強?最高性能を叩き出した画像認識モデル「CoAtNet」を解説! - Qiita
                                                        • 動く人をリアルに着せ替え合成 揺れる服の動きも詳細に再現

                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 独ブラウンシュヴァイク工科大学と独Max Planck Institute for Informaticsによる研究チームが開発した「High-Fidelity Neural Human Motion Transfer from Monocular Video」は、人物と服の細かな動きを別の人物に転写する深層学習フレームワークだ。動きに合わせて揺れる衣服のシワやひだなども忠実に再現し合成する。 今回のフレームワークは、ソース映像の人物の動きだけをターゲット映像の人物に転送し、それに伴う衣服の副次的動作も含めた写実的なアニメーション合成を目指す。 映像生成フレームワークは、4種類の深層学習ネ

                                                            動く人をリアルに着せ替え合成 揺れる服の動きも詳細に再現
                                                          • M1 Maxより速いディープラーニングに最適なノートPC「Tensorbook」

                                                            M1 Maxより速いディープラーニングに最適なノートPC「Tensorbook」2022.04.16 22:0045,208 大野恭希 AWSのlambdaにPythonのlambdaにLambda Labsに...世の中Lambda(ラムダ)だらけですね。 LambdaがRazerと共同開発したディープラーニング向けノートPC「Tensorbook(テンサーブック)」が発表されています。価格は3499ドル(約44万円)から。 構成は、駆け出しPythonエンジニア初学者でも分かる「これなら大丈夫だろうGPU」GeForce RTX 3080(VRAM16GB)と、Core i7 11800、メモリは64GB。GPU性能はアップルのM1 Maxより最大4倍近く速く、Google Colabを用いた学習モデルの構築と近くすれば最大10倍の差が出ているといいます。ま、RTX3080なんだからそ

                                                              M1 Maxより速いディープラーニングに最適なノートPC「Tensorbook」
                                                            • 連休のお供にいかが? 米Microsoftが「PyTorch」の初学者向け教材を無償公開中

                                                              米Microsoftは、機械学習ライブラリ「PyTorch」を使った、初学者向けのディープラーニングの教材を公式Webサイトで無償公開している。対応言語は英語のみだが、4時間13分で機械学習モデルの構築方法や自然言語処理、音声認識の概要などを学べるという。教材の利用に、外部ファイルのインストールは不要。Webページのみで完結する。 PyTorchは、米Facebookが2016年に開発したPython向けのオープンソースの機械学習ライブラリ。Microsoftは、2020年にWindows版PyTorchのメンテナーに就任し、2021年5月には「PyTorch Enterprise」を発表。Microsoft Azure上でPyTorchを使う企業へのサポートサービスの提供を始めていた。 無償公開している教材もMicrosoftとPyTorchが提携して作成しており、今後も企業とユーザー、

                                                                連休のお供にいかが? 米Microsoftが「PyTorch」の初学者向け教材を無償公開中
                                                              • YouTubeの推薦アルゴリズムの変遷を追う〜深層学習から強化学習まで〜

                                                                はじめにこの記事は「eureka Advent Calendar 2019」24日目の記事です。 こんにちは、Data Analystの @pacocat です! 私はeurekaには2019年11月に入社したばかりなのですが、毎日楽しく仕事させてもらっています。最近はプロダクト開発のための定性調査の仕組みづくりを手伝ったり、事業分析や組織開発をしていたりと、様々な定量・定性データを活用してどのように事業成長に貢献できるか考える日々です。 前職ではAI PdMとして、ゲームや強化学習領域でのAI活用を推進していました(興味ある方はGDC2019での発表や各種スライド slideshare / speakerdeck をご覧ください)。直近はがっつりAIに関わっているわけではありませんが、趣味で推薦×強化学習分野のサーベイをしていたら面白い話題がたくさんあったので、それらの中からYouTub

                                                                  YouTubeの推薦アルゴリズムの変遷を追う〜深層学習から強化学習まで〜
                                                                • Stable Diffusion 2-1 - a Hugging Face Space by stabilityai

                                                                  Discover amazing ML apps made by the community

                                                                    Stable Diffusion 2-1 - a Hugging Face Space by stabilityai
                                                                  • Deep Learning ideas that have stood the test of time

                                                                    Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably

                                                                    • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                                      画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ

                                                                        無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                                      • ゼロから作るDeep LearningシリーズはGoogle Colaboratoryで写経して学習するのがおすすめ - karaage. [からあげ]

                                                                        「ゼロから作るDeep Learningシリーズ」が最高 ゼロから作るDeep Learningは、TensorFlow、Keras、PyTorchといったディープラーニングのフレームワークを一切使わず、基本PythonとNumpyのみでディープラーニングのアルゴリズムを作って理解していくというハードコアな内容です。 シリーズは3冊出ていて、1が画像認識、2が自然言語、3がフレームワークに重点を置いた内容です。 ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 作者:斎藤 康毅発売日: 2016/09/24メディア: 単行本(ソフトカバー) ゼロから作るDeep Learning ❸ ―フレームワーク編 作者:斎藤 康毅発売日: 2020/04/20メディア: 単行本(ソフトカバー) ゼロから作るDeep Learning ❷ ―自然言語処理編 作

                                                                          ゼロから作るDeep LearningシリーズはGoogle Colaboratoryで写経して学習するのがおすすめ - karaage. [からあげ]
                                                                        • ディープラーニングは儲けてなんぼ! エンドユーザの付加価値を考えろ!松尾豊氏 | AI専門ニュースメディア AINOW

                                                                          最終更新日: 2019年7月10日 2019年6月8日、MicrosoftとPreferred Networksが協同で運営するディープラーニングのコミュニティ「DEEP LEARNING LAB(DLLAB)」が2周年記念のイベントを開催しました。 今回は東京大学大学院 教授で日本ディープラーニング協会理事長の松尾豊氏による基調講演の内容をお伝えします。 松尾氏は、ディープラーニングのビジネス活用において「儲かること」はとても重要で、そのためにユーザにしっかり付加価値を与えていかなければいけないと強調しました。 ビジネスになっていないディープラーニング 松尾教授は、まずはディープラーニングの技術が、事例が増える勢いに対してビジネスになっていないとディープラーニングの現状を振り返ります。 そこで、インターネットが誕生した当時と振り返りながら、ディープラーニングの活用が進んでいないことは、単

                                                                            ディープラーニングは儲けてなんぼ! エンドユーザの付加価値を考えろ!松尾豊氏 | AI専門ニュースメディア AINOW
                                                                          • 平井卓也の弟が社長「四国新聞」の“身内びいき”がすご過ぎる…「香川1区」対抗馬の“吊し上げ方” 《もうすぐ衆院選》 | 文春オンライン

                                                                            ドキュメンタリー映画『なぜ君は総理大臣になれないのか』(大島新監督 2020年)では、2017年の総選挙が描かれていた。印象深かったのは四国新聞の報道だった。香川1区で平井卓也の対立候補である小川淳也には厳しいが、平井のことは「地域貢献に汗流す」という見出しで報じるなど「家族の後押し」を感じられる報道スタイルだった。 デジタル大臣に就任したが… あれから4年。選挙がまたやってくる。四国新聞も張り切る季節だが、実は今年はすでに全開なのだ。平井氏が初代デジタル大臣に就任したからである。そう、ファミリーから大臣が出た! デジタル庁発足翌日(9月2日)は笑顔の平井先生の『国民目線で改革 透明、公正、迅速に』というインタビューを一面に。四国新聞はお祭り状態でテンション高め。連日にわたって大きく報道していた。 しかし、最近の紙面をのぞいてみると……。

                                                                              平井卓也の弟が社長「四国新聞」の“身内びいき”がすご過ぎる…「香川1区」対抗馬の“吊し上げ方” 《もうすぐ衆院選》 | 文春オンライン
                                                                            • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                                                                              OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                                                                                音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                                                                              • 効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog

                                                                                どうも緒方@conta_です。 みなさんAI頑張ってますか? きっと昼はGPUサーバーを回して、夜は結果待ちでビールサーバーを回してる人が多いことでしょう。 機械学習を実際のプロダクトに活用する場合、自分が解きたいタスクがそのままオープンなデータセットで解決できることは少ないので、まず最初に課題となるのはデータセット作成です。 実際にカメラやセンサーを取り付けて収集したり、Webからクローリングしてきたり、事業会社であれば自社のデータセットに教師ラベルをつけることで新しいタスクに取り組むことが可能になるでしょう。 よく疑問になるポイントとして、データセットの量と質は、多ければ多いほど良く、高品質であれば高品質であるほど良いのですが教師データを作成するのは一苦労です。 *下記アノテーションの量や質について実験した結果がまとまってます tech-blog.abeja.asia もちろん少数デー

                                                                                  効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog
                                                                                • AI×医用画像の現状と可能性_2022年版/AI×medical_imaging_in_japan_2022

                                                                                  AI×医用画像の現状と可能性_2020年上半期版/AI×medical imaging in japan (first half of 2020)

                                                                                    AI×医用画像の現状と可能性_2022年版/AI×medical_imaging_in_japan_2022