[10ページ] ディープラーニングの人気記事 1838件

361 - 400 件 / 1838件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ディープラーニングの検索結果361 - 400 件 / 1838件

DALL·E 2 を早くも破る！超リアル画像生成モデル Imagen を解説
- 125 users
- ja.stateofaiguides.com
- テクノロジー
- 2022/06/09
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
- 124 users
- dev.classmethod.jp
- テクノロジー
- 2022/09/23
こんちには。データアナリティクス事業本部機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…？と思っていたのですが… ですが… … … … おお！？(上記はGitHubにあるWER: Word Error Rateのグラフです) これは！？これは結構良さげな数値を出している！？(たぶん) ってことで元音声屋さんとしては、これは試すしかない！ということで動かしてみました！(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試
- 音声認識
- AI
- whisper
- あとで読む
- 機械学習
- OpenAI
- python
- 音声
- api
機械学習／統計学／データサイエンスの無償gacco動画、全まとめ【2021年秋版】：AI・機械学習の独学リソース（1/3 ページ） - ＠IT
- 124 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2019/11/07
機械学習／統計学／データサイエンスの無償gacco動画、全まとめ【2022年秋版】：AI・機械学習の独学リソース（1/3 ページ） 2022年3月末の最新状況に合わせて改訂。はじめてのAIから、機械学習、深層学習、自然言語処理、統計学、社会人のためのデータサイエンス（実用知識）、大学生のためのデータサイエンス（理論知識）まで、全28個の講義内容を紹介。本稿独自に考察した、学習者対象やお勧めの学習方法についても示す。
機械学習のための環境構築とその管理 - nykergoto’s blog
- 124 users
- nykergoto.hatenablog.jp
- テクノロジー
- 2019/08/07
機械学習プロジェクトでは python を始めとした言語 + それに付随したライブラリを使います。僕も python 触りたての頃はローカルマシン上にひとつ python 環境を作り、必要なライブラリをインストールして使っていました。環境の分離ということはあまり意識しておらず、やったとしてもプロジェクトごとに anaconda や pyenv, venv などで個別環境を作って切り分けるレベルでした。しかし上記の方法だと困ったことが起ることがあります。例えば… global な環境が壊れてしまってすべて壊れる。これは各環境が global な環境に依存しているために起こります。 python 以外の変更で環境は突如として壊れます。例えば brew install hoge したら Mecab が使えなくなっちゃったとかはあるあるだと思います >_< linux / Mac / Win
- docker
- 機械学習
- あとで読む
- CI
- 学習
- dockerfile
- python
- GitLab
- 環境
大澤昇平🇺🇳 on Twitter: "越塚は中立です。主犯格はコイツです。 https://t.co/G0UQEAwSmH https://t.co/GkaxutJyfl"
- 123 users
- twitter.com/Ohsaworks
- 政治と経済
- 2019/12/15
越塚は中立です。主犯格はコイツです。 https://t.co/G0UQEAwSmH https://t.co/GkaxutJyfl
40歳エンジニア管理職が「Deep Learning for ENGINEER(E資格)」に合格した話 - Qiita
- 123 users
- qiita.com/takayukiblue
- テクノロジー
- 2020/02/01
Deep Learning for ENGINEER（E資格）とはこの記事は2020年1月時点の情報であることをご了承ください。現在、この日本においてAIのスキルを証明する公的資格として下記が挙げられます。 JDLA Deep Learning for GENERAL（G検定） JDLA Deep Learning for ENGINEER（E資格）です。位置付けとしては、G検定がAI関連技術に関する一般教養を問う試験。 E資格がAI関連技術に関する理論を理解し、AIを実装できるスキルを問う試験。という理解です。詳細というか、正確な定義については、日本ディープラーニング協会（JDLA）のサイトをご参照ください。 E資格の受験方法とJDLA認定プログラムとういうわけで、ここからはE資格のことを中心に話を進めていきたいと思います。 E資格を受験するチャンスは年に2回あり、2月と8
「食べログ」の運営会社に3800万円余の賠償命じる東京地裁 | NHK
- 122 users
- www3.nhk.or.jp
- 暮らし
- 2022/06/16
大手グルメサイト「食べログ」が飲食店の評価の点数を算出するシステムを一方的に変更し、売り上げが大幅に減ったとして、都内の焼き肉チェーンの運営会社が賠償を求めていた裁判で、東京地方裁判所は「優越的地位の乱用にあたり独占禁止法に違反する」と判断し、「食べログ」を運営する会社に3800万円あまりの賠償を命じました。東京都内を中心に焼き肉チェーン店を運営する「韓流村」は、飲食店の評価や感想を利用客が書き込む大手グルメサイト「食べログ」について「3年前、チェーン店の評価の点数を一律に下げるようシステムを変更され、サイト経由での来客が毎月およそ5000人以上減って売り上げが減少した」と主張して、サイトの運営会社「カカクコム」に6億円あまりの損害賠償などを求めました。 16日の判決で東京地方裁判所の林史高裁判長は「店側は食べログに会員登録をしていて、会員でなくなると経営に大きな支障をきたすため食べログ
【AI動画生成】Animate Anyone 論文解説
- 119 users
- zenn.dev/mattyamonaca
- テクノロジー
- 2023/11/30
はじめに 11月も終わり、今年も残るところあと一か月となりました。今年ももう終わるから今年中に成果を上げとけ！と言わんばかりに最近は新技術の登場が多いです。今回取り上げるのも11月最後の大砲として出てきた新技術、その名もAnimate Anyone Animate Anyoneとはなんぞや文字で説明するより見たほうが早い凄くざっくり説明すると、一枚の絵と動きをボーン動画として入力すると、入力した絵がボーン動画と同じ動きをしてくれるよ！というもの。似たようなものは今までもReferenceOnly × openpose × animatediffとかで出来ましたが、特筆すべきはその精度。動画生成の大敵であるちらつきは一切なく、入力画像にかなり忠実な動画を生成しています。さてこの技術、動画生成にずっと注目している自分としてはいますぐにでも弄り倒したいのですが、残念ながらコードとモ
- AI
- あとで読む
- 動画
- StableDiffusion
- 論文
- 人工知能
- 画像
金子勇さんのED法を実装してMNISTを学習させてみた - Qiita
- 118 users
- qiita.com/pocokhc
- テクノロジー
- 2024/04/20
追記：続きを書きました。はじめに先日以下の記事が投稿され、その斬新な考え方に個人的ながら衝撃を受けました。内容をざっくり言うと、ニューラルネットワークの学習を現在の主流であるBP法（誤差逆伝播法）ではなく、ED法（誤差拡散法）という新しい学習手法を提案しているものです。もし記事の内容が本当ならニューラルネットワークの学習がO(1)でできてしまう事になり、まさしく革命が起きてしまいます。（結論からいうと速度面はそこまででもなかったです（それでも早くなる可能性あり））（ただこの新手法のポテンシャルは革命を起こす可能性は秘めているといっても過言ではありません） ED法に関してネットを探すとインターネットアーカイブに情報が少し残っていました。このページですがED法のサンプルプログラム（C言語）が残っており、このサンプルプログラムをベースにpythonで書き起こしたものが本記事となりま
NVIDIA、1枚の静止画で動きを合成　GANを用いた手法を開発　ダビデ像も踊り出す
- 118 users
- www.itmedia.co.jp
- テクノロジー
- 2019/12/16
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 NVIDIAが10月に発表した新技術は、映像内の動きを抽出して画像に転送することで、リアルな合成動画を生成する敵対的生成ネットワーク（Generative adversarial networks、GAN）を用いた手法だ。人の全身運動や顔の輪郭運動など、領域分割マスクや線画スケッチを基に、動かしたい画像に合成し写実的な映像に仕上げる。ベースとなる以前の研究「Video-to-video synthesis」（vid2vid）では、学習したドメインでしか合成できなかったが、今回の研究では訓練データセットに含まれてなくても合成が可能になり、より幅広い合成動画が作成できる。
- GAN
- あとで読む
- NVIDIA
- 画像
- 人工知能
- 機械学習
- AI
- 動画
- news
Intel、“脳”の模倣でCPUより1千倍高速な演算システム「Pohoiki Beach」
- 118 users
- pc.watch.impress.co.jp
- テクノロジー
- 2019/07/24
- intel
- あとで読む
- CPU
- 技術
- 脳
- システム
- PC
物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌
- 116 users
- blog.seishin55.com
- テクノロジー
- 2020/05/16
はじめに先月、YOLOv4が公開されました。位置づけとしては、物体認識のポピュラーなモデルの1つであるYOLO系統の最新版となります。結果がすごいのはぱっと見分かりましたし、内容も既存の手法をサーベイ・実験頑張って、精度上げていったんだなあくらいのさら読みはしていましたが、もう少しちゃんと読んでおこうと思い、読んでみたので紹介します。私自身は物体認識の研究者というわけではないですが、なんだかんだ物体認識周りの記事をいくつか書いているので興味のある方は以下もご参照下さい。 note.com note.com [DL輪読会]Objects as Points from Deep Learning JP www.slideshare.net さて、このYOLOv4ですが、元々のYOLOの作者であるJoseph Redmon氏は著者ではありません。Jeseph Redmon氏は研究の軍事利用や
- yolo
- 機械学習
- 物体認識
- あとで読む
- deep learning
- 画像処理
- 論文
- GPU
手描きキャラクターに深層学習で影　カラーでも
- 114 users
- www.itmedia.co.jp
- アニメとゲーム
- 2020/09/28
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米メリーランド大学ボルチモアカウンティ校とProject HATによる研究チームが開発した「Learning to Shadow Hand-drawn Sketches」は、キャラクターに影を自動的に追加できる、深層学習を用いた手法だ。影付きスケッチを直接生成するのではなく、スケッチとは別に影画像だけを生成しているのが特徴。このため、スケッチと影を別々のレイヤーにし、それぞれを別個に編集できる。生成した影はそのまま使用でき、より高い品質を望む場合にはユーザーがさらに修正できる。提案モデルは、 GAN（Generative Adversarial Network）をベースに、2次元スケッ
Raspberry Pi 4のディープラーニングで画像認識する環境をゼロから1時間で構築する方法 - karaage. [からあげ]
- 114 users
- karaage.hatenadiary.jp
- テクノロジー
- 2019/12/03
「Raspberry Pi Advent Calendar 2019」の3日目記事です。最新Raspberry Pi OS（Bullseye）でのセットアップ記事を追記しました最新OSでの環境構築は、以下記事も合わせて参照ください。ラズパイ4を入手しましたラズパイ4を入手しました。色々事情があり、ポケットに入れて叩いたら2台に増えてしまいました。ラズパイ4が2つ手に入ったものは仕方ないので、恒例のセットアップと洒落込みたいと思います。ラズパイ4からラズパイ始める人もいるかもしれませんしね。そして今までラズパイ使っていたユーザーとして、4でCPU・メモリが大幅にスペックアップしているので、せっかくならそれらを体感できて役に立ちそうなアプリを動かしてみることにしました。というわけで、ほどよく処理が重く、役に立ちそう（？）なディープラーニングを使った画像認識（正確には物体検出）を試
機械学習・ディープラーニングの数学／技術の概要を理解できる厳選「無料動画」
- 114 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2020/05/22
今や無料の動画だけでも、AI・機械学習・ディープラーニングは手軽に楽しく学べる。「機械学習／ディープラーニングに必要な数学」「機械学習／ディープラーニングの概要」「ディープラーニングの技術理解」の観点で、初心者にお勧めの無料動画を紹介する。連載目次「そろそろAI・機械学習・ディープラーニングを学びたいと思っているが、きっかけがつかめない……」という人は少なくないのではないだろうか。今では無料の動画だけで、手軽で楽しく学べるようになってきている。「でも動画を見るにも時間が……」という人もいるだろう。そこで本稿では、できるだけ短時間の日本語の動画で、できるだけ効率的に堅苦しくなく学べる動画を、筆者が考える「学ぶべき順」で並べてみた。念のため断っておくが、今回の動画選択には、えこひいきは一切ない。人脈による友達メディア推しもない。「筆者がこのテーマで学ぶならこれがベストだ」と本心で思って
- ディープラーニング
- AI
- 機械学習
- 数学
- 学習
- あとで読む
- 勉強
- 動画
- Python
DALL·E: Creating images from text
- 114 users
- openai.com
- テクノロジー
- 2021/01/06
We’ve trained a neural network called DALL·E that creates images from text captions for a wide range of concepts expressible in natural language. DALL·E is a 12-billion parameter version of GPT-3 trained to generate images from text descriptions, using a dataset of text–image pairs. We’ve found that it has a diverse set of capabilities, including creating anthropomorphized versions of animals and
- AI
- 機械学習
- 画像処理
- GPT-3
- image
- OpenAI
- technology
- deep learning
- DeepLearning
- あとで読む
自動プログラミングAIの「AlphaCode」をDeepMindが発表、競技プログラミングレベルのコード生成が可能
- 114 users
- gigazine.net
- テクノロジー
- 2022/02/03
DeepMindが競技プログラミングレベルのプログラミングが可能な人工知能(AI)の「AlphaCode」を発表しました。AlphaCodeのほかにも自動でプログラミングが可能なAIは存在しますが、AlphaCodeは414億ものパラメーターを保持した特に精度の高いAIに仕上がっているとのことです。 Competitive programming with AlphaCode | DeepMind https://deepmind.com/blog/article/Competitive-programming-with-AlphaCode Competition-Level Code Generation with AlphaCode (PDF)https://storage.googleapis.com/deepmind-media/AlphaCode/competition_leve
GANを用いた画像異常検知アルゴリズム - Qiita
- 114 users
- qiita.com/NPdev
- テクノロジー
- 2019/11/29
概要ニューラルポケットは、正常品と異常品を高精度で判別する画像分析アルゴリズムを開発し、国際学会ACPRにて発表しました。複数のオープンデータセットによる評価で、世界最高の異常画像検出精度を達成しています。正常品と異常品を画像から識別するアルゴリズムは、工場や農業、インフラ管理などの幅広い領域において活用が進められており、属人的な作業を機械化することによる、見逃し率の低減や作業の効率化などに、大きな期待が寄せられています。この領域においては、従来、正常品とのパターンマッチングを中心としたアプローチが主流でしたが、近年、深層学習を用いたアプローチが広まり、正常品の中でも形状変化が大きい、食品や柔らかい素材の部品など含め、幅広く活用することが出来るようになってきました。本手法は、その発展として開発されたものであり、以下のような特徴を持ちます：従来の手法では大量に必要となっていた異常画
CUDAを一枚の絵にまとめてみた - OPTiM TECH BLOG
- 112 users
- tech-blog.optim.co.jp
- テクノロジー
- 2019/08/15
まえがき初めまして、R&Dチームの宮﨑です。趣味はFPSをやってます。150時間やってますが未だにドンかつを食べられていません。普段は深層学習のベンチマークを取ったりしています。実はひと昔前からあった深層学習。近年実用性が増して一大ブームとなっています。実用的になった背景の一つとしてGPUを用いた高速化により深層学習の学習及び推論が実用的な時間で実行できるようになったことがあります。NVIDIAから提供されるCUDAを用いるとC言語に拡張を加えた形式でCPU+GPUのヘテロジニアスコンピューティングを記述できます。 CUDAを使用するにはCPU+GPUの環境がどのようなハードウェア構成をしており、その上でCUDAがどのようなシステムを構築しているのかを理解する必要があります。この理解なしに漫然とサンプルコードを真似するだけでは意図通りのパフォーマンスが出なかったり、そもそもAPIの意味
機械学習をゼロから学ぶための勉強法 (2020年3月版) - Qiita
- 112 users
- qiita.com/crinoid
- テクノロジー
- 2020/03/20
はじめにデータサイエンスや機械学習っておもしろそう！と思いつつも、どうやって勉強をしたら良いかわからない......と感じた経験はありませんか？ちなみに自分もその一人です。この記事では、機械学習ってそもそも何？ AIという言葉は知ってるけど詳しいことはわからないというような初学者でも、知識・経験を積んで機械学習に取り組めるようにするために必要な基礎の基礎から学ぶための勉強法を自分の経験をもとに紹介します！(ここで紹介するものは機械学習の中級者以上の方でも基礎知識の復習として活用できるものかなとも思っています）この記事の続編(データサイエンスはじめて1か月以内で参加したコンペで銀メダル(上位3%)とるまで！)はこちら概要 (基本的にはこの3stepです) 基礎知識をつける(単語・用語の理解) ライブラリの使い方を理解実際にコンペに挑戦(Kaggle) 1.機械学習&ディープラーニ
iPhoneの自撮りで本物そっくりな動く3Dリアルアバター　米Metaが技術開発
- 111 users
- www.itmedia.co.jp
- テクノロジー
- 2022/06/13
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米MetaのReality Labsの研究チームが開発した「Authentic Volumetric Avatars from a Phone Scan」は、スマートフォンで自撮りした短時間のスキャン画像から、本物そっくりの3D頭部アバターを生成するシステムだ。異なる視点やフォトリアリスティックな表情を表現し、高い忠実度で再現する。現在、実在する人物のアバターを作成するためには膨大な人物データを取得する必要があり、そのデータを収集するには大規模なマルチビューキャプチャーシステムを必要とする。そのため軽量なデータキャプチャー、低遅延、許容できる品質でのアバター作成プロセスを自動化することが
- vr
- 3DCG
- meta
- あとで読む
わずか数行のJavaScriptで機械学習をフル活用できる無料Webサービス「StackML」を使ってみた！ - paiza times
- 111 users
- paiza.hatenablog.com
- テクノロジー
- 2019/07/03
どうも、まさとらん（@0310lan）です！今回は、誰でも簡単に機械学習を活用したプログラムをJavaScriptで構築できる無料のWebサービスをご紹介します！画像解析、顔検出、表情分析、骨格・姿勢解析、特徴分析…など、さまざまな用途において機械学習を活用したプログラムをJavaScriptで実現できるので、とてもユニークなWebコンテンツを簡単に開発することができます。これまで漠然と機械学習に興味を持っていた方も含めて、ぜひ参考にしてみてください！なお、paizaラーニングでも機械学習を学べる「Python×AI・機械学習入門編」を公開していますので、合わせてチェックしてみてください。 Python×AI・機械学習入門編について詳しくはこちら【 StackML 】 ■「StackML」の使い方それでは、StackMLを使いながらどのようなことができるのかを見ていきましょう！
NVIDIA Docker って今どうなってるの？ (19.11版) - Qiita
- 110 users
- qiita.com/ksasaki
- テクノロジー
- 2019/11/14
大事なお知らせ NVIDIA Docker リポジトリでの 2020 年 9 月の変更により、この記事内容と最新の状況に割と大きな差ができてしまいました。最新の状況に合わせた改訂版を、エヌビディアジャパンの Medium ページに投稿しましたので、今後は是非 Medium のほうをご覧ください。 NVIDIA Docker って今どうなってるの？ (20.09 版) 以下、2020 年 8 月までの内容です。 ※ 2020/07/09 CUDA 11 の正式リリースに伴い、CUDA のインストールコマンド例を 11.0 のものに更新しました。 ※ 2020/06/13 CUDA 11 RC のリリースに伴い、CUDA 10.2 のインストールページからインストールしても CUDA 11 RCがインストールされるケースが確認されたので、10.2 を明示的に指定するように例示コマンドを更新しま
BitNetから始める量子化入門
- 110 users
- zenn.dev/minux302
- テクノロジー
- 2024/03/03
はじめに BitNet、最近話題になっていますね。そもそも量子化って何？という方もいると思うので、この記事は DeepLearning の量子化から入り、その上で BitNet の触りについて見ていこうと思います。色々とわかってないことがあり、誤読してそうなところはそう書いてるのでご了承ください。図を作るのは面倒だったので、様々な偉大な先人様方の図やスライドを引用させていただきます。量子化 DeepLearning における量子化 DeepLearning の学習・推論は基本 float32 で行います。これを int8 や Nbit に離散化することを量子化といいます。計算に使う値は、モデルの重み、アクティベーション（ReLUとか通した後）、重みの勾配等があります。学習時については一旦置いておいて、この記事では推論における量子化について焦点をあてます。推論時に量子化の対象となる
自作キーボードの聖地、遊舎工房に行ってみたら、そこは沼だった（小寺信良） | テクノエッジ TechnoEdge
- 108 users
- www.techno-edge.net
- テクノロジー
- 2024/03/11
18年間テレビ番組制作者を務めたのち、文筆家として独立。家電から放送機器まで執筆・評論活動を行なう傍ら、子供の教育と保護者活動の合理化・IT化に取り組む。一般社団法人「インターネットユーザー協会」代表理事。もういい加減にしろよと読者から怒られかねないのだが、まだまだキーボードの話である。 KeychronのK11 Proを購入し、散々いじくり回していたわけだが、まあさすがに自作までは時間ないし、キーボード改造もここまでかなと思っていた。ところが先日、PFUのHHKB Studioのお話を聞く機会があり、1995年当時の秋葉原の話などが出て、懐かしく思い出した。この記事はまもなくITmedia MONOistに掲載されると思うので、お楽しみにしていただきたい。そのインタビューの中で、秋葉原のキーボード専門店「遊舎工房」の話が出て、そういえばまだ一度も行ったことないなと気づいた。だいたいこ
Pythonのコード改善のためのツール5つを試してみた - minus9d's diary
- 108 users
- minus9d.hatenablog.com
- テクノロジー
- 2019/10/11
Pythonのコードを改善するためのツールについて一通り試してみました。各ツールのインストール方法や使い方については Pythonのスタイルガイドとそれを守るための各種Lint・解析ツール5種まとめ！ - Sider Blog に詳細にまとまっているのでおすすめです。サンプルコード以下のサンプルコードを対象に、各ツールの出力を確かめてみます。 import time import sys import fractions def func1(varA,varB): '''return sum of a and b''' varC = 42 return (varA + varB) print(func1(fractions.Fraction(1, 2), fractions.Fraction(1, 3))) 3 + 5 sys.exit(0) このスクリプトをsample.pyという名
畳み込み+Attention=最強？最高性能を叩き出した画像認識モデル「CoAtNet」を解説！ - Qiita
- 108 users
- qiita.com/omiita
- テクノロジー
- 2021/11/16
1. CoAtNetの解説 1.1 畳み込みとSAの復習コンピュータビジョンで用いられている大きな仕組みに畳み込みとSelf-Attention(=SA)があります。畳み込みではEfficientNet、SAではViTが有名ですね。EfficientNetについてはこちらの拙著記事、ViTについてはこちらの拙著記事をご参照ください。CoAtNetでは、この畳み込みとSAの良いとこ取りをしたブロックを作ることが一番の目的になっています。畳み込みとSAの式を復習しておきましょう。ここでは畳み込みの中でもDW(=Depthwise)畳み込みを取り扱います。そして、本論文では分かりやすさを優先しているのか、式の細かいところ(SAにおけるqkvの埋め込みなど)はあえて排除しているように見えるので、理解しやすいです。 1.1.1 畳み込みの式本論文では、畳み込みの中でもDW(=Depthwise)
- 機械学習
- あとで読む
- AI
- deeplearning
- Qiita
- 画像
動く人をリアルに着せ替え合成　揺れる服の動きも詳細に再現
- 107 users
- www.itmedia.co.jp
- テクノロジー
- 2021/10/11
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。独ブラウンシュヴァイク工科大学と独Max Planck Institute for Informaticsによる研究チームが開発した「High-Fidelity Neural Human Motion Transfer from Monocular Video」は、人物と服の細かな動きを別の人物に転写する深層学習フレームワークだ。動きに合わせて揺れる衣服のシワやひだなども忠実に再現し合成する。今回のフレームワークは、ソース映像の人物の動きだけをターゲット映像の人物に転送し、それに伴う衣服の副次的動作も含めた写実的なアニメーション合成を目指す。映像生成フレームワークは、4種類の深層学習ネ
M1 Maxより速いディープラーニングに最適なノートPC｢Tensorbook｣
- 107 users
- www.gizmodo.jp
- テクノロジー
- 2022/04/17
M1 Maxより速いディープラーニングに最適なノートPC｢Tensorbook｣2022.04.16 22:0045,208 大野恭希 AWSのlambdaにPythonのlambdaにLambda Labsに...世の中Lambda（ラムダ）だらけですね。 LambdaがRazerと共同開発したディープラーニング向けノートPC｢Tensorbook（テンサーブック）｣が発表されています。価格は3499ドル（約44万円）から。構成は、駆け出しPythonエンジニア初学者でも分かる｢これなら大丈夫だろうGPU｣GeForce RTX 3080（VRAM16GB）と、Core i7 11800、メモリは64GB。GPU性能はアップルのM1 Maxより最大4倍近く速く、Google Colabを用いた学習モデルの構築と近くすれば最大10倍の差が出ているといいます。ま、RTX3080なんだからそ
- PC
- あとで読む
- GPU
- python
- 人工知能
連休のお供にいかが？　米Microsoftが「PyTorch」の初学者向け教材を無償公開中
- 106 users
- www.itmedia.co.jp
- テクノロジー
- 2021/07/21
米Microsoftは、機械学習ライブラリ「PyTorch」を使った、初学者向けのディープラーニングの教材を公式Webサイトで無償公開している。対応言語は英語のみだが、4時間13分で機械学習モデルの構築方法や自然言語処理、音声認識の概要などを学べるという。教材の利用に、外部ファイルのインストールは不要。Webページのみで完結する。 PyTorchは、米Facebookが2016年に開発したPython向けのオープンソースの機械学習ライブラリ。Microsoftは、2020年にWindows版PyTorchのメンテナーに就任し、2021年5月には「PyTorch Enterprise」を発表。Microsoft Azure上でPyTorchを使う企業へのサポートサービスの提供を始めていた。無償公開している教材もMicrosoftとPyTorchが提携して作成しており、今後も企業とユーザー、
YouTubeの推薦アルゴリズムの変遷を追う〜深層学習から強化学習まで〜
- 106 users
- medium.com
- テクノロジー
- 2019/12/24
はじめにこの記事は「eureka Advent Calendar 2019」24日目の記事です。こんにちは、Data Analystの @pacocat です！私はeurekaには2019年11月に入社したばかりなのですが、毎日楽しく仕事させてもらっています。最近はプロダクト開発のための定性調査の仕組みづくりを手伝ったり、事業分析や組織開発をしていたりと、様々な定量・定性データを活用してどのように事業成長に貢献できるか考える日々です。前職ではAI PdMとして、ゲームや強化学習領域でのAI活用を推進していました（興味ある方はGDC2019での発表や各種スライド slideshare / speakerdeck をご覧ください）。直近はがっつりAIに関わっているわけではありませんが、趣味で推薦×強化学習分野のサーベイをしていたら面白い話題がたくさんあったので、それらの中からYouTub
Stable Diffusion 2-1 - a Hugging Face Space by stabilityai
- 106 users
- huggingface.co
- テクノロジー
- 2022/08/23
Discover amazing ML apps made by the community
- AI
- Stable Diffusion
- 人工知能
- アート
- 素材
- StableDiffusion
- 画像
- デザイン
- image
Deep Learning ideas that have stood the test of time
- 105 users
- dennybritz.com
- テクノロジー
- 2020/07/30
Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably
- 機械学習
- deeplearning
- あとで読む
- machinelearning
- PyTorch
- DL
- AI
- programming
無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
- 105 users
- gigazine.net
- テクノロジー
- 2022/09/29
画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ
- AI
- 音声
- whisper
- 機械学習
- 文字
- 文章
- 人工知能
- あとで読む
ゼロから作るDeep LearningシリーズはGoogle Colaboratoryで写経して学習するのがおすすめ - karaage. [からあげ]
- 104 users
- karaage.hatenadiary.jp
- テクノロジー
- 2020/05/27
「ゼロから作るDeep Learningシリーズ」が最高ゼロから作るDeep Learningは、TensorFlow、Keras、PyTorchといったディープラーニングのフレームワークを一切使わず、基本PythonとNumpyのみでディープラーニングのアルゴリズムを作って理解していくというハードコアな内容です。シリーズは3冊出ていて、1が画像認識、2が自然言語、3がフレームワークに重点を置いた内容です。ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者:斎藤康毅発売日: 2016/09/24メディア: 単行本（ソフトカバー）ゼロから作るDeep Learning ❸ ―フレームワーク編作者:斎藤康毅発売日: 2020/04/20メディア: 単行本（ソフトカバー）ゼロから作るDeep Learning ❷ ―自然言語処理編作
ディープラーニングは儲けてなんぼ！エンドユーザの付加価値を考えろ！松尾豊氏 | AI専門ニュースメディア AINOW
- 103 users
- ainow.ai
- テクノロジー
- 2019/06/08
最終更新日： 2019年7月10日 2019年6月8日、MicrosoftとPreferred Networksが協同で運営するディープラーニングのコミュニティ「DEEP LEARNING LAB（DLLAB）」が2周年記念のイベントを開催しました。今回は東京大学大学院教授で日本ディープラーニング協会理事長の松尾豊氏による基調講演の内容をお伝えします。松尾氏は、ディープラーニングのビジネス活用において「儲かること」はとても重要で、そのためにユーザにしっかり付加価値を与えていかなければいけないと強調しました。ビジネスになっていないディープラーニング松尾教授は、まずはディープラーニングの技術が、事例が増える勢いに対してビジネスになっていないとディープラーニングの現状を振り返ります。そこで、インターネットが誕生した当時と振り返りながら、ディープラーニングの活用が進んでいないことは、単
平井卓也の弟が社長「四国新聞」の“身内びいき”がすご過ぎる…「香川1区」対抗馬の“吊し上げ方” 《もうすぐ衆院選》 | 文春オンライン
- 102 users
- bunshun.jp
- 政治と経済
- 2021/10/12
ドキュメンタリー映画『なぜ君は総理大臣になれないのか』（大島新監督　2020年）では、2017年の総選挙が描かれていた。印象深かったのは四国新聞の報道だった。香川1区で平井卓也の対立候補である小川淳也には厳しいが、平井のことは「地域貢献に汗流す」という見出しで報じるなど「家族の後押し」を感じられる報道スタイルだった。デジタル大臣に就任したが… あれから4年。選挙がまたやってくる。四国新聞も張り切る季節だが、実は今年はすでに全開なのだ。平井氏が初代デジタル大臣に就任したからである。そう、ファミリーから大臣が出た！デジタル庁発足翌日（9月2日）は笑顔の平井先生の『国民目線で改革　透明、公正、迅速に』というインタビューを一面に。四国新聞はお祭り状態でテンション高め。連日にわたって大きく報道していた。しかし、最近の紙面をのぞいてみると……。
- 選挙
- 新聞
- 政治
- マスコミ
- 自民党
- 報道
- 四国
- 香川
- 機械学習
音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
- 101 users
- ysdyt.hatenablog.jp
- テクノロジー
- 2022/10/13
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。配信中のpodcast番組白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。最初に結論インストール実行方法結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果まとめ追記カタカナ英語完全制覇 whisperくんせんでんせんでん最初に結論 whisperは異なるモデルサイズが5種が利用可能であ
効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog
- 101 users
- tech-blog.abeja.asia
- テクノロジー
- 2019/05/23
どうも緒方@conta_です。みなさんAI頑張ってますか？きっと昼はGPUサーバーを回して、夜は結果待ちでビールサーバーを回してる人が多いことでしょう。機械学習を実際のプロダクトに活用する場合、自分が解きたいタスクがそのままオープンなデータセットで解決できることは少ないので、まず最初に課題となるのはデータセット作成です。実際にカメラやセンサーを取り付けて収集したり、Webからクローリングしてきたり、事業会社であれば自社のデータセットに教師ラベルをつけることで新しいタスクに取り組むことが可能になるでしょう。よく疑問になるポイントとして、データセットの量と質は、多ければ多いほど良く、高品質であれば高品質であるほど良いのですが教師データを作成するのは一苦労です。＊下記アノテーションの量や質について実験した結果がまとまってます tech-blog.abeja.asia もちろん少数デー
AI×医用画像の現状と可能性_2022年版/AI×medical_imaging_in_japan_2022
- 100 users
- speakerdeck.com/tdys13
- テクノロジー
- 2022/12/29
AI×医用画像の現状と可能性_2020年上半期版/AI×medical imaging in japan (first half of 2020)
- AI
- あとで読む
- 画像
- 研究
- 機械学習
- 気になるよ