[B! DeepLearning] Nyohoのブックマーク

Nyoho id:Nyoho

DeepLearningに関するNyohoのブックマーク (106)

GitHub - radames/Real-Time-Latent-Consistency-Model: Demo showcasing ~real-time Latent Consistency Model pipeline with Diffusers and a MJPEG stream server
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.
Nyoho 2023/11/05
確かにinferenceが高速みたい

DeepLearning

機械学習
リンク
#73 Nyohoさんをゲストに Scratchからディープラーニングや数学の話 | terapyon channel podcast
# Note Guest: Nyohoです。普通にNyoho(にょほう)などと呼んでください。Pythonを含めてプログラミング言語大好き、数学大好き、サイエンス大好きな日曜プログラマです。Twitterは @NeXTSTEP2OSX でやってます。著作『目からうろこの機械学習』を鋭意執筆中です!広島のテレビ局広島テレビのテレビ派のコーナー『もてなしジーセブン』(のYouTube版)のプレイリスト【テレビ派・G7広島サミット企画】もてなしジーセブンにナレーターで出演 Contents: 00:00:00 Podcast73回スタート 00:00:13 ゲストNyohoさん紹介 00:02:28 広島とG7サミットの話 00:11:37 Nyohoさんが東京に来た主目的が5月20日土曜日にあったScratch Day 2023 in Tokyoに参加 200人くらい集まったみたい htt
Nyoho 2023/05/24
podcast

scratch

機械学習

DeepLearning
リンク
Stable Diffusion Public Release — Stability AI
It is our pleasure to announce the public release of stable diffusion following our release for researchers [https://stability.ai/stablediffusion] Over the last few weeks, we all have been overwhelmed by the response and have been working hard to ensure a safe and ethical release, incorporating data from our beta model tests and community for the developers to act on. In cooperation with the tirel
Nyoho 2022/08/23
🎉

機械学習

DeepLearning
リンク
誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王公式サイト
いま大会上位に位置するDeep Learning系の将棋 AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック数を大きくしていくのが一つの潮流としてある。ブロック数が多いと言うことは、より層の数が増え(よりdeepになり)、1局面の評価に、より時間を要するようになるということである。それと引き換えに評価精度がアップするから、トータルでは得をしていて、棋力が向上するというわけである。ところが大きいブロック数になればなるほど学習に要する教師局面の数が増える。学習もブロック数に応じた時間を要するようになるから、そう簡単に大きくはできない。しかし囲碁AIの方は、中国テンセント
Nyoho 2022/06/29
機械学習

DeepLearning

将棋
リンク
Huge “foundation models” are turbo-charging AI progress
Huge “foundation models” are turbo-charging AI progress They can have abilities their creators did not foresee The “Good Computer” which Graphcore, a British chip designer, intends to build over the next few years might seem to be suffering from a ludicrous case of nominal understatement. Its design calls for it to carry out 1019 calculations per second. If your laptop can do 100bn calculations a
Nyoho 2022/06/23
「The blessings of scale AI training runs, estimated computing resources used Floating-point operations, selected systems, by type, log scale」プロット図あり

機械学習

DeepLearning
リンク
嘘だろ?深層学習が3Dゲームを再現｜shi3z｜note
深層学習の世界では時折・・・と言っても、一ヶ月に一回くらいだが・・・信じられないようなことが起きる。以前、ゲーム画面を見ただけでパックマンやらマリオやらを再現するAIが出現したと聞いたとき、「嘘だろ」と思ったのだが、まあ言うてパックマン。なんとなくできるのかもしれない。しかしこの手のものはあまりにも直感に反するので自分の手で確かめないと本当かどうかわからない。そんな時のために僕の仕事机には7台のGPUマシンがあるわけだが、たまたまRTXが遊んでいたので実行してみたら、「嘘だろ」としか言いようがない結果を目の当たりにすることになった。 GTAVこと「グランセフトオートV」は、自動車泥棒になって架空の街を走り回るゲームだ。こいつをひたすらAIに学習させると、GTAVをAIが再現するという、全く直感に反することが行われるらしい。3Dゲームというのは、それを作った経験のある人なら誰でも、恐
Nyoho 2021/06/26
おもしろ

DeepLearning

機械学習
リンク
第11回配信講義計算科学技術特論A（2021）
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Nyoho 2021/06/24
「インテルのAVX-512と富岳のSVEを用いたSIMDプログラミングについて具体例を交えて解説する。それからJITアセンブラxbyakと深層学習ライブラリoneDNNでの利用例を紹介する。」

DeepLearning

機械学習

algorithm
リンク
CVPR 2021 Tutorial on Normalization Techniques in Deep Learning
CVPR 2021, Tutorial on Normalization Techniques in Deep Learning: Methods, Analyses, and Applications Saturday morning (10:00 AM - 13:30 PM EDT), June 19, 2021 Slides and videos are available on this website. Normalization methods can improve the training stability, optimization efficiency and generalization ability of deep neural networks (DNNs), and have become basic components in most state-of-
Nyoho 2021/06/19
機械学習

DeepLearning
リンク
Deep 3D Reconstruction / Completion
深層学習ベースの3D Reconstruction / Completionの手法およびデータセットの紹介。過去の有名どころから最新の手法まで。データセット NYU (ECCV 2012) ShapeNet (arxiv only) ModelNet (CVPR 2015) SUN CG (CVPR 2017) ScanNet (CVPR 2017) Pix3D (CVPR 2018) Scan2CAD (CVPR 2019 Oral) 手法 3D ShapeNets: A Deep Representation for Volumetric Shapes (CVPR 2015) 3D-R2N2 (ECCV 2016) Semantic Scene Completion from a Single Depth Image (CVPR 2017) Pixel2mesh (ECCV 2018
Nyoho 2021/06/04
3次元復元

機械学習

DeepLearning
リンク
【CVPR'19 / ICCV'19】3D Human Pose Estimationの最新研究動向まとめ｜Hiromi Nakagawa
はじめにPose Estimationとは、画像や動画から人物の姿勢（関節位置）を推定するタスクのことです。特殊なマーカーを身に着けたりせずに、一般的な動画像のみから人物の姿勢を推定できるため、例えば・スポーツにおける選手のフォーム分析・映画やアニメの制作におけるモーションキャプチャ・店舗の監視カメラ映像を元にした人物の行動解析など、様々なアプリケーションが考えられます。従来は画像上の関節位置のXY座標のみを推定する2D Pose Estimationの研究や応用が主流でしたが、近年のDeep Learningを中心とした画像認識技術の発展により、奥行方向も含めて3次元的に人物の姿勢を推定する3D Pose Estimationの研究が活発化しており、現実世界のヒトの動き・行動をよりリアルに認識することが可能になってきています。本記事では特に2019年のCVPRやICCVなど画
Nyoho 2021/04/10
3次元姿勢推定

機械学習

DeepLearning
リンク
キャラクター画像一枚でより表情豊かなアニメーションを生成するシステムを作ってみた
上の動画中のキャラクターはバーチャルYouTuberまたはそれに関連したキャラクターです。この記事中の画像や映像は彼らのファンアート・二次創作です。[footnote] ほとんどの動画内のバーチャルYouTuberはいちから、カバー、774 inc.、のりプロ、KMNZ等の企業様に所属してます。しぐれうい様、神楽めあ様、伊東ライフ様、兎鞠まり様、ノート竹花様、なつめえり様、名取さな様、ユキミお姉ちゃん様、聖女れりあ様、楪穂波様、幽ヶ崎海愛様、花雲くゆり様、ケリン様、ふくやマスター様の画像も使わせていただきました。誠に申し訳ございませんが、切り抜き動画やMADや同人ゲーム等の二次創作と同じように使用許可は全く取っておりません。2019年の記事を（まだ世に出ていない）学術論文にした時は一部の企業様に連絡して許可を頂きましたが、この記事で使用する許可は取っておりません。私は２０１９年に一枚のキ
Nyoho 2021/02/04
機械学習

DeepLearning
リンク
なぜGoogle Meetの背景ぼかしが最強なのか（一般公開版）
はじめに最近ついに、Google Meet に背景ぼかし機能が利用可能になりましたよね。日本語だとインプレスのケータイ Watchの記事などで紹介されてます。確か 2020 年 9 月末前後で順次リリースされていたと記憶しています。このときは「背景ぼかし」の機能しかなかったのですが、最近（私が気づいたのは 2020/10/30）更にアップデートされました。アップデートで「背景差し替え」機能が付いて、ぼかし機能もぼかし効果が強弱 2 つから選べるようになりました。まだ日本語のニュース記事は見てないですが、Googleによるアップデートの発表はちゃんとされています。そして、Google AI Blog でBackground Features in Google Meet, Powered by Web MLという記事が公開され、実装についての解説がされました。この記事はその解説記事を
Nyoho 2020/11/01
機械学習

DeepLearning
リンク
DEEP LEARNING · Deep Learning
Description This course concerns the latest techniques in deep learning and representation learning, focusing on supervised and unsupervised deep learning, embedding methods, metric learning, convolutional and recurrent nets, with applications to computer vision, natural language understanding, and speech recognition. The prerequisites include: DS-GA 1001 Intro to Data Science or a graduate-level
Nyoho 2020/10/11
Yann LeCun & Alfredo Canziani

DeepLearning

lecture

機械学習
リンク
深層学習を用いた文生成モデルの歴史と研究動向
[DL輪読会]Non-Autoregressive Machine Translation with Latent Alignments
Nyoho 2020/07/04
RNN, seq2seq, attention (transformer)、その後の展開も書かれている。GPT-3

DeepLearning

機械学習
リンク
AIセミナー「深層学習を使ったキュウリ選別機つくってみた」
講師：小池誠（農家）概要：農業人口の減少や高齢化が進む中，IoTやAIといった最新のIT 技術を農業に取り入れるスマート農業が注目されています．本講演では，深層学習を使ったきゅうり選別システムの開発についてご紹介します．どのようにして選別AIを開発したのか，なぜ深層学習を使うのか，開発を通して分かったことを苦労した点も含めて解説します．
Nyoho 2020/05/25
deep learning agriculture (・∀・)ｲｲ!!

DeepLearning

機械学習
リンク
画像認識と深層学習
日本ロボット学会ロボット工学セミナー第126回ロボットのための画像処理技術講演資料 https://www.rsj.or.jp/event/seminar/news/2020/s126.html 2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降，画像認識においては深層学習，その中でも特に畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなった．CNNはクラス分類をはじめとして，物体検出やセグメンテーションなど様々なタスクを解くためのベースネットワークとして広く利用されてきている．本講演では，CNNの発展を振り返るとともに，エッジデバイスで動作させる際に重要となる高速化等，関連する深層学習技術の解説を行う． 1. クラス分類向けモデルについて 1.1. ILSVRCで振り返る進化の歴史 1.2. その他重要なモデル 1
Nyoho 2020/05/23
サーベイ的

機械学習

DeepLearning
リンク
Inside Microsoft Teams' Background Blur: A Technical Explanation - PingWest
Nyoho 2020/05/06
Teamsで背景をぼかす機能の技術解説。CNNによるsemantic segmentation

DeepLearning

機械学習
リンク
Graph Neural Networksを完全に理解したい
社内の輪講で発表した資料です。 Graph Neural NetworksについてSpectral MethodとSpatial Methodについて代表的な手法を簡単に紹介し、更にDeep Graph Library (DGL)を用いた具体的な実装方法を紹介しています。
Nyoho 2020/04/11
機械学習

DeepLearning
リンク
深層生成モデルを巡る旅(2): VAE - Qiita
はじめに深層生成モデルを巡る旅をしています。前回はFlowについて理論と各種法の簡単な紹介をしました. 今回はまた別の深層生成モデルとして変分自己符号化器 (VAE; variational autoencoder) [1] を紹介します. VAEはGANに比べて安定した学習ができ, Flowと異なり潜在変数を低次元に落とすことができるので, その扱いやすさや解釈性から好まれることが多いように感じます. 一方で, 生成画像がぼやけがちである, 尤度の計算ができないといった欠点もあります. この1ヶ月くらいVAEについていろいろと調べてみましたが, GANやFlowのようなモデル乱立状態にはなっていなさそうだったので, 主要な手法を少し詳しめに紹介できればと思います. VAEの基本最初に, 本記事を読むのに必要な事項をまとめます. 全体像式での説明は少々長いので, 先にMNISTの
Nyoho 2019/11/03
“変分自己符号化器 (VAE; variational autoencoder) [1] を紹介します. VAEはGANに比べて安定した学習ができ, Flowと異なり潜在変数を低次元に落とすことができる”

機械学習

DeepLearning
リンク
リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました
はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS（オープンソースソフトウェア）として公開しました。ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。それは現時点で、声質変換を実際にリアルタイムで使えるフリーな仕組みが無いためだと考えました。そこで、自由に使えるリアルタイム声質変換アプリケーションを作り、ソースコードと合わせて公開しました。声質変換とは声を変える方法で有名なのは、声の高さや音色を変える手法、いわゆるボイスチェンジャーです。既存のボイスチェンジャーは、元の声を起点として、変換パラメータを自分で調整する必要があります。一方ここでの声質変換は、元の声と好きな声を用いて機械学習し、変換パラメータを自動で調整しま
Nyoho 2019/10/21
素晴らしい

DeepLearning

機械学習
リンク
1 2 3 4 5 6 次のページ