[9ページ] ディープラーニングの最新人気記事 1804件

321 - 360 件 / 1804件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ディープラーニングの検索結果321 - 360 件 / 1804件

PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks
- 20 users
- www.preferred.jp
- 学び
- 2022/12/14
株式会社Preferred Networks（本社：東京都千代田区、代表取締役最高経営責任者：西川徹、プリファードネットワークス、以下、PFN）は、深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2（エムエヌ・コア・ツー）を、東京ビッグサイトで開催されている SEMICON Japan 2022のキーノート講演において本日発表しました。深層学習の実用化は様々な分野で進展しており、それに応じてこれまで以上に多様かつ、大規模な計算処理が求められるようになっています。 PFNでは、2020年から稼働しているMN-Coreを搭載したスーパーコンピュータMN-3を活用して、材料化学やロボティクスなどの新分野において深層学習を応用した革新的な技術の開発および高速化に取り組んできました。今後、現実世界のより複雑な課題を解決していくには、深層学習モデルの精度と演算速度をさらに向
人生を狂わせるレベルの「ディープフェイク画像」を他人のSNS投稿から制作できるGoogleのAI技術 | AppBank
- 3 users
- www.appbank.net
- テクノロジー
- 2022/12/13
つい最近まで、フェイク画像を作る方法は、写真を切り貼りするか、フォトショップを使いこなして合成するしかありませんでした。しかし現在では、写真のようなリアルなディープフェイクが、誰でも出来る時代に入り始めています。この画像生成AIによるディープフェイクの精度と危険性を、テック系メディア「Ars Technica」が実験を通して解説しています。 *Category:テクノロジー Technology *Source：Ars Technica ,@natanielruizg(Twitter) ,@MikaelThalen(Twitter) 画像生成AIが「たった数枚のSNS画像」からディープフェイクを生成今回の「Ars Technica」の実験で、フェイク画像の対象となったのは「ジョン」というこちらの男性。もちろん彼は実在する人物ではなく、AIが合成した架空の人物です。「Ars Techn
- technology
話題爆発中のAI「ChatGPT」の仕組みにせまる！ - Qiita
- 294 users
- qiita.com/omiita
- テクノロジー
- 2022/12/12
オミータです。ツイッターで人工知能のことや他媒体の記事などを紹介しています。 @omiita_atiimoもご覧ください！話題爆発中のAI「ChatGPT」の仕組みにせまる！注意：ChatGPTはまだ論文が出ていないため、細かい箇所は不明です。本記事では公式から出た記事およびInstructGPTの論文をもとにChatGPTの仕組みを探っていきます本記事の流れ: 忙しい方へ ChatGPTとは GPT-3 InstructGPT ChatGPT まとめと所感参考 0. 忙しい方へ ChatGPTは、InstructGPTをベースとしたモデルだよ InstructGPTは、「人間の好みに合った文を出力するように微調整したGPT-3」だよ InstructGPTの学習では、以下の3つが重要だよ GPT-3の教師ありファインチューニング Reward Modelの学習 RLHF（＝Re
- AI
- ChatGPT
- あとで読む
- 機械学習
- 言語
- 学習
- 人工知能
- qiita
- ML
- 自然言語処理
コンピュータビジョン分野のトップカンファレンスであるECCV2022からワークショップの模様を紹介（前編） - NTT Communications Engineers' Blog
- 26 users
- engineers.ntt.com
- テクノロジー
- 2022/12/09
目次目次はじめに ECCV2022概要 Workshop Instance-Level Recognition Workshop Keynote talk: Image Search and Matching Kaggle Google Universal Image Embedding Challenge Keynote talk: Few-Shot Learning for Object Aware Visual Recognition Language Assisted Product Search Granularity aware Adaptation for Image Retrieval over Multiple Tasks Where in the World is this Image? Transformer-based Geo-localization in t
Perplexity AI
- 464 users
- www.perplexity.ai
- テクノロジー
- 2022/12/08
Bulletproof coffee, also known as butter coffee or keto coffee, is a high-calorie drink made with added fats, intended to fuel your start to the day. It was created by Dave Asprey, the originator of the Bulletproof Diet, and is popular among low-carb dieters and those following a ketogenic diet. The drink consists of coffee made from high-quality beans, unsalted butter, and a medium-chain triglyce
- AI
- webサービス
- search
- 検索
- perplexity
- 機械学習
- webservice
- openai
- SQL
- サービス
OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog
- 52 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2022/12/08
地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。【IIJ 2022 TECHアドベントカレンダー 12/8（木）の記事です】 Whisperの追加学習に挑む2022年の冬 2022年アドベントカレンダー企画だそうです。いかがお過ごしでしょうか。私はもう興味を引くものに没頭するしか楽しみがないもんで、PCに向かってぼんやり面白いネタはないかなーと探す日々です。最近はすっかりディープラーニングにズブズブで、とうとう数式かくのが面倒なあまり手書き入力のためのペンタブレットを買いました。てへ。今回は9月から10月にかけてStabl
- AI
- IIJ
- OpenAI
- 機械学習
- ディープラーニング
- Deep Learning
- GPU
世界一わかりやすい機械学習プログラミングチュートリアル - Qiita
- 281 users
- qiita.com/nuco_fn
- テクノロジー
- 2022/12/05
はじめにこの記事はNuco Advent Calendar 2022の5日目の記事です対象読者 Pythonが注目されている理由のひとつは機械学習プロジェクトの主要な開発言語であるからといってもよいでしょう。多くの企業の業務システムのAIの開発言語はPythonです。そんなPythonの学習を始めてある程度文法の理解が進んできて、機械学習に触れてみたい方を対象にしています。 Pythonの基本文法を理解している機械学習を始めてみたいチュートリアル概要 Pythonは長年機械学習で使用されているので、ライブラリも豊富にあります。本記事では機械学習用ライブラリのscikit-learn(サイキット・ラーン)を使用して教師あり学習を行い住宅価格を予測してみます。何ができるようになるか機械学習で使われる基本的な用語を理解し、学習の全体像をつかめるようになります。機械学習の目的機械学
- 機械学習
- あとで読む
- AI
- python
- 学習
- プログラミング
- ライブラリ
- qiita
- 勉強
【Python】PyTorch で作る Vertical Federated Learning - ENGINEERING BLOG ドコモ開発者ブログ
- 11 users
- nttdocomo-developers.jp
- テクノロジー
- 2022/12/01
NTTドコモ R&D Advent Calendar 2022 の1日目の記事です。井上と申します。アメリカのシリコンバレーにあるドコモの子会社，DOCOMO Innovations, Inc. (DII) でシニアデータサイエンティストとして機械学習の研究開発に従事しています。現在，DII は Amazon Web Services, Inc. とパートナーシップを組み，Federated Learning (連合学習, FL) の開発に取り組んでいます。 AWS Partner Network (APN) Blog の記事もご覧ください。本記事は，FL の中でも，特に Vertical Federated Learning (VFL) を PyTorch を用いて作り上げていくチュートリアルです。なお，本記事末尾に職場の紹介を載せていますので「シリコンバレーとか DII ってど
- あとで読む
ChatGPT
- 222 users
- chat.openai.com
- テクノロジー
- 2022/12/01
A conversational AI system that listens, learns, and challenges
- AI
- OpenAI
- ChatGPT
- chat
- GPT-3
- 人工知能
- 機械学習
- Webサービス
- Deep Learning
- これはすごい
2022年11月末、今からAI画像生成を触りたい未経験者向け記事｜852話
- 847 users
- note.com/852wa
- テクノロジー
- 2022/11/28
こんにちは、852話です。世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。記事は・パソコンを持っていなくても気軽に初められる・英語がわからなくてもなんとかなる・無料で体験できる・もっとカッコいいものを作りたい時などを書きました。今現在AIに触れている方向けの記事はまた次の機会にアップします。・そもそもAI画像生成って何？この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。現在話題になっているAIでの画像生成サービスの機能は、「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。サービス自体はDALL-E、Mi
AI絵師により新ジャンル「爆乳ルネサンス」が生み出される
- 610 users
- togetter.com
- テクノロジー
- 2022/11/28
リンク pixiv aiWaifumaker aiを使って美しい女性を描いています drawing beautiful gorgeus woman with stablediffusion Thankyou for watching! https://twitter.com/aiWaifumaker 1
- AI
- あとで読む
- 画像
- twitter
- ネタ
- togetter
- illust
- 人工知能
- イラスト
- 絵
ONNXモデルのチューニングテクニック (基礎編)
- 51 users
- cyberagent.ai
- テクノロジー
- 2022/11/15
基礎編 / 応用編１ / 応用編２サイバーエージェント AI Lab の Conversational Agent Teamに所属している兵頭です。今回は私が半年ほど蓄積したONNXのチューニングテクニックを全てブログに残したいと思います。皆さんが既にご存知であろう基本的なことから、かなりトリッキーなチューニングまで幅広くご紹介したいと思います。長文になりますがご容赦願います。このブログのメインターゲット層は「リサーチャーが実装したモデルを実環境へデプロイするタスクを有する方々」です。一部リサーチャーの方々の参考になる情報が混じっていることもあるかもしれませんが、あまり興味を引かない内容だとは思います。リサーチャーメインの組織に属しながらリサーチエンジニアの立ち位置で身を投じていますので、研究の観点の少し手前あるいは少しその先の部分を担っている立場からこのブログを記載しているものとご認
【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita
- 20 users
- qiita.com/xiao_ming
- テクノロジー
- 2022/11/13
QMULのBen Hayes氏らが、勾配降下法で周波数推定を行う手法を論文で発表しました。ICASSP2023に投稿したそうです。きわめてシンプルな手法なのですが、機械学習系音声合成にとってはたいへん重要な成果だと思うので、紹介します。論文リンク：Sinusoidal Frequency Estimation by Gradient Descent ソースコード：https://github.com/ben-hayes/sinusoidal-gradient-descent 背景：DDSPの限界 DDSP(Differentiable Digital Signal Processing)とは、微分可能な計算式を持つDSPモジュールをDNNに組み込んで機械学習をやる手法で、Google Magentaプロジェクトが最初に打ち出したアイデアです。今ではもうDDSPシリーズと呼べるほど多様
- 音声
- 論文
- 機械学習
- 音楽
- qiita
- music
予算30万円台の深層学習用PCの買い方｜shi3z
- 403 users
- note.com/shi3zblog
- 暮らし
- 2022/11/12
深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleやAmazon AWSのようなサービスを展開することができない本邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利
- pc
- あとで読む
- AI
- 機械学習
- GPU
- CPU
- Stable Diffusion
- 学習
- メモリ
- ディープラーニング
RTX3090Tiで機械学習マシンを自作しtensorflowを動かすまで - Qiita
- 24 users
- qiita.com/mikoaisa
- テクノロジー
- 2022/11/10
RTX3090を選んだのはもちろんVRAMサイズが理由です。バッチサイズを少しでも大きく取りたい。24GBはA100に比べれば落ちますが、ColabのV100は16GBなのでそれよりは大きいですし個人でなんとか買える価格の範囲ではこれが最大でした。 Tiになってしまったのはたまたま安かったのと成り行きですが、性能差は僅かですので消費電力の低い無印のほうがよかったような気はします。同じ学習をさせたときに消費電力がどれくらい違うのかは知る由もありませんが。 GPUだけは1年保証は怖いので延長保証をつけてみました。気休めかもしれませんが。玄人志向とかGigabyteとかだと保証が長いそうです。あとショップによっていろいろな延長保証があるので自分のような心配な人は調べてみたら少しは不安感が軽減されるかしれません。実際壊れたらちゃんと延長保証が役に立つかはわかりませんが、それを知らないで済むに越した
最近話題になった音楽生成AI まとめ｜npaka
- 507 users
- note.com/npaka
- テクノロジー
- 2022/11/05
最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod
- AI
- あとで読む
- 音楽
- DTM
- music
- 人工知能
- 機械学習
- audio
- note
- 作曲
マイナカード推進、「是非をいちいち国民に聞いて進めるものではない」平井卓也初代デジタル大臣（ITmedia NEWS） - Yahoo!ニュース
- 305 users
- news.yahoo.co.jp
- 世の中
- 2022/10/28
「マイナンバーカードの活用の是非をいちいち国民に聞いて進めるものではない。次の世代への責任としてやり切る。反対があってもやり切ることが重要だ」【画像】マイナンバーカードの未取得理由は？ 10月26日に幕張メッセで開催された「ブロックチェーンEXPO」の講演で、初代デジタル庁大臣を務めた平井卓也衆議院議員が、マイナンバーカードの普及に対してこう持論を語った。「どちらが国の財政にとっていいのか、どちらが本当の意味で個人情報をきっちり守れるのか、どちらが透明なのか、公平性を担保できるのか。これらは考えると当たり前のことだ」と、マイナンバーカードの意義を説明した。どんな政策にも反対意見はあるとし、テレビ地上波のデジタル化やETC導入の際の例を挙げ、「ETCは多くの人にとって社会インフラの1つになった。今でもどうしてもETCが嫌な人は、高くなるが現金で払える」とした。同じようにマイナンバーカ
CNN vs. ViT
- 40 users
- speakerdeck.com/yushiku
- テクノロジー
- 2022/10/23
第57回コンピュータビジョン勉強会＠関東 https://kantocv.connpass.com/event/260132/ で読みました。CNNとViTの争いの現時点の情報をお届けしています。ただECCV 2022の論文を読んだのかと言われると怪しい…（ECCV2022の論文「も」読んだというのが正しい）
Imagicを理解する
- 745 users
- birdmanikioishota.blog.fc2.com
- テクノロジー
- 2022/10/19
17 oct 2022に出たImagicという技術について、ペーパーとソースを見比べながら説明します。
Cloud GPUs Comparison Table
- 22 users
- fullstackdeeplearning.com
- テクノロジー
- 2022/10/18
Discussion of this page on Hacker News, May 21, 2023. Training and running neural networks often requires hardware acceleration, and the most popular hardware accelerator is the venerable graphics processing unit, or GPU. We have assembled cloud GPU vendor pricing all into tables, sortable and filterable to your liking! We have split the vendor offerings into two classes: GPU Cloud Servers, which
中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される
- 571 users
- togetter.com
- テクノロジー
- 2022/10/17
PROTO@AiArt @proto_jp AIイラスト界隈で話題の #元素法典のネガティブプロンプトらしきものを共有します。画像はダミー。ALTを確認なんと3000文字以上あって1つのALTには収まらないので4巻構成です。つなぎ合わせて大呪文にしてください。ご利用は自己責任で #NovelAI #NovelAIDiffusion docs.qq.com/doc/DWHl3am5Zb… pic.twitter.com/dA5QNiyqLa 2022-10-17 14:36:23
- AI
- イラスト
- あとで読む
- 中国
- NovelAI
- 画像
- 人工知能
- togetter
- 機械学習
- 技術
Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装／OpenAIの画像生成AI「DALL-E 2」ベース
- 298 users
- forest.watch.impress.co.jp
- テクノロジー
- 2022/10/13
- AI
- Microsoft
- 検索
- あとで読む
- 人工知能
- 技術
- 画像
- BING
- 検索エンジン
- webサービス
絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ
- 273 users
- pc.watch.impress.co.jp
- テクノロジー
- 2022/10/13
- AI
- あとで読む
- microsoft
- 画像
- イラスト
- 機械学習
- デザイン
- 画像生成
- 人工知能
- アプリ
音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
- 101 users
- ysdyt.hatenablog.jp
- テクノロジー
- 2022/10/13
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。配信中のpodcast番組白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。最初に結論インストール実行方法結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果まとめ追記カタカナ英語完全制覇 whisperくんせんでんせんでん最初に結論 whisperは異なるモデルサイズが5種が利用可能であ
Text2Light
- 3 users
- frozenburning.github.io
- テクノロジー
- 2022/10/11
Text2Light: Zero-Shot Text-Driven HDR Panorama Generation TOG 2022 (Proc. SIGGRAPH Asia) Abstract High-quality HDRIs (High Dynamic Range Images), typically HDR panoramas, are one of the most popular ways to create photorealistic lighting and 360-degree reflections of 3D scenes in graphics. Given the difficulty of capturing HDRIs, a versatile and controllable generative model is highly desired, whe
- 3DCG
- text
- ai
- 画像
Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】
- 598 users
- ja.stateofaiguides.com
- テクノロジー
- 2022/10/11
図解Stable Diffusion
- 586 users
- okuranagaimo.blogspot.com
- テクノロジー
- 2022/10/09
ジェイ・アラマールのブログより。 AIによる画像生成は、(私を含めて)人々の度肝をぬく最新のAIの能力です。テキストの説明から印象的なビジュアルを作り出す能力は、魔法のような品質を持ち、人間がアートを創造する方法の変化を明確に指し示しています。Stable Diffusionのリリースは、高性能(画質だけでなく、速度や比較的低いリソース/メモリ要件という意味での性能)なモデルを一般の人々に提供することになったのは、この開発における明確なマイルストーンです。 AI画像生成を試してみて、その仕組みが気になり始めた方も多いのではないでしょうか。ここでは、Stable Diffusionの仕組みについて優しく紹介します。 Stable Diffusionは、様々な使い方ができる汎用性の高いものです。まず、テキストのみからの画像生成(text2img)に焦点を当てます。上の画像は、テキスト入力と生
- AI
- あとで読む
- 画像
- 機械学習
- Stable Diffusion
- 学習
- イラスト
- 人工知能
- 勉強
- algorithm
AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある
- 524 users
- togetter.com
- テクノロジー
- 2022/10/05
トランプ @t0kri AIはちょっと破綻した美少女画しか描けないと勘違いしてる人が多すぎる、全力で破綻に振り切らせるべきなんだ pic.twitter.com/XcBzM9siwo 2022-10-03 23:48:55
- AI
- アート
- あとで読む
- togetter
- art
- 人工知能
- 芸術
- イラスト
- 画像
- twitter
GitHub - facebookincubator/AITemplate: AITemplate is a Python framework which renders neural network into high performance CUDA/HIP C++ code. Specialized for FP16 TensorCore (NVIDIA GPU) and MatrixCore (AMD GPU) inference.
- 3 users
- github.com/facebookincubator
- テクノロジー
- 2022/10/04
| | AITemplate (AIT) is a Python framework that transforms deep neural networks into CUDA (NVIDIA GPU) / HIP (AMD GPU) C++ code for lightning-fast inference serving. AITemplate highlights include: High performance: close to roofline fp16 TensorCore (NVIDIA GPU) / MatrixCore (AMD GPU) performance on major models, including ResNet, MaskRCNN, BERT, VisionTransformer, Stable Diffusion, etc. Unified, o
- performance
- python
AIで特定キャラを描く(DreamBoothで追加学習)｜lisa
- 609 users
- note.com/lisa_s
- テクノロジー
- 2022/10/02
概要DreamBoothとは追加学習することで、AI(StableDiffusion)で特定のキャラや物を描くためのモデル（データ）作るツールです。例えば、ドラゴンクエスト10オンラインというゲームのアンルシアというキャラがいます。ドラゴンクエスト10のアンルシア公式サイトより引用 https://hiroba.dqx.jp/sc/election/queen2021/vote/confirm/1/nologinこのキャラの画像を18枚ほどAIに読み込ませ、追加学習し、AIに描かせた絵が以下の絵になります。これ見ると、単なる髪型や顔が似ているレベルではなく、服の模様レベルまで再現できている事がわかります。今までStableDiffusionの欠点として、同じキャラを安定して描くのが苦手というのがありましたが、DreamBoothを使うことで克服することが出来ます。これにより、A
- AI
- あとで読む
- StableDiffusion
- 画像
- 機械学習
- イラスト
- Stable Diffusion
- 学習
- google
- 画像処理
Teslaはカメラを使ってどのように世界を認識しているか
- 187 users
- speakerdeck.com/inoichan
- テクノロジー
- 2022/10/01
TURINGの社内AI勉強会で発表した資料です。 Tesla AI Day 2021で紹介されたTesla車に搭載されているマルチカメラを用いた認識モデルの紹介と、それに関連しそうな論文の紹介をしています。
- AI
- あとで読む
- deeplearning
- 機械学習
- テスラ
- 自動車
- カメラ
Metaがテキストから動画を生み出すAI｢Make-A-Video｣を発表
- 3 users
- www.gizmodo.jp
- テクノロジー
- 2022/09/30
Metaがテキストから動画を生み出すAI｢Make-A-Video｣を発表2022.09.30 14:006,700 そうこ Metaが、テキストから高画質の動画を生成するAIシステム｢Make-A-Video｣を発表しました。Make-A-Videoのシステムは、画像を解説するテキストデータから世界の見え方を、動画から世界の動き方を学びます。クリエイターやアーティストの新しいツールとして、ユーザーが想像した世界をより簡単に形に表せるようにするのがMetaの目標。 Make-A-Videoのウェブサイトには、例として｢スーパーヒーローの服で赤いマントで空を飛ぶ犬｣とか｢手にリモコンを持ってテレビを見る猫｣とか｢火星に着陸する超リアルな宇宙船｣などが、サンプルとして公開されています。どれも非常に素晴らしい出来映えでびっくり！ 1枚の画像から動画を作成することもできるまた、テキストから動画化す
- 世界
- 動画
- 機械学習
- video
- 画像
DreamFusion: Text-to-3D using 2D Diffusion
- 131 users
- dreamfusion3d.github.io
- テクノロジー
- 2022/09/30
Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image
- AI
- 3DCG
- あとで読む
- 画像生成
- 3d
- デザイン
無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
- 105 users
- gigazine.net
- テクノロジー
- 2022/09/29
画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ
- AI
- 音声
- whisper
- 機械学習
- 文字
- 文章
- 人工知能
- あとで読む
GitHub - google-deepmind/educational
- 6 users
- github.com/google-deepmind
- テクノロジー
- 2022/09/25
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
- 124 users
- dev.classmethod.jp
- テクノロジー
- 2022/09/23
こんちには。データアナリティクス事業本部機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…？と思っていたのですが… ですが… … … … おお！？(上記はGitHubにあるWER: Word Error Rateのグラフです) これは！？これは結構良さげな数値を出している！？(たぶん) ってことで元音声屋さんとしては、これは試すしかない！ということで動かしてみました！(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試
- 音声認識
- AI
- whisper
- あとで読む
- 機械学習
- OpenAI
- python
- 音声
- api
Machine learning education | TensorFlow
- 3 users
- www.tensorflow.org
- テクノロジー
- 2022/09/21
Deploy ML on mobile, microcontrollers and other edge devices
『ポケモン』風画面を“見よう見まね”で生成する機械学習デモが公開。実際に歩ける狂気めいた世界 - AUTOMATON
- 183 users
- automaton-media.com
- アニメとゲーム
- 2022/09/17
ディープラーニング技術者であるOllin Boer Bohan氏が、『ポケットモンスター』風のゲーム画面を生成するデモを構築。プレイヤーの操作まで検知して“それっぽい”映像を再現することに成功し、実際にブラウザ上で操作できるよう公開されている。 Ollin Boer Bohan氏によるデモより『ポケットモンスター』（以下、ポケモン）は、任天堂の人気RPGシリーズだ。同作はポケモンを捕獲・育成してバトルに挑むシステムが特徴。また、初代『ポケモン赤・緑』から、メインシリーズ作品は長らく見下ろし視点で親しまれていた。描画としては2Dモノクロから、世代を重ねるごとに色鮮やか・高精細になっていき3D表現に移ったものの、見下ろしスタイルが深く印象に残っているファンも多いだろう。左がバーチャルコンソール版『ポケモン赤』、右が『ポケモンダイヤモンド・パール』そんな馴染みある見下ろし視点の『ポケ
- AI
- あとで読む
- 技術
- ゲーム
- ポケモン
- 学習
- game
- デモ
- 人工知能
- 機械学習
著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳
- 28 users
- snowman-88888.hatenablog.com
- 学び
- 2022/09/17
こんにちは、品川です。Vision Transformer入門という本の執筆に参加しました。いよいよ本格的な販売がはじまります。どんな本なのか注目してくださってる方もいらっしゃると思うので、著者陣の一人の視点から執筆の背景と書評を少しだけ書こうと思います。 gihyo.jp 執筆の背景書評第1章 TransformerからVision Transformerへの進化第2章 Vision Transformerの基礎と実装第3章実験と可視化によるVision Transformerの探求第4章コンピュータビジョンタスクへの応用第5章 Vision and Languageタスクへの応用第6章 Vision Transformerの派生手法第7章 Transformerの謎を読み解く第8章 Vision Transformerの謎を読み解く手薄になっている内容執筆の背
遅すぎるCNN処理、日立の自動運転研究部が原因と対処術を発表
- 28 users
- xtech.nikkei.com
- テクノロジー
- 2022/09/16
日立製作所研究開発グループ自動運転研究部は、GPUによるCNN（Convolutional Neural Network：畳み込みニューラルネットワーク）処理において期待したような性能が出ない理由やその対処方法について、「DAシンポジウム2022 −システムとLSIの設計技術−」（情報処理学会システムとLSIの設計技術研究会(SLDM)が2022年8月31日～9月2日に開催）で発表した。CNN処理は、ADAS（先進運転支援システム）や自動運転における画像認識でよく使われる演算である。発表した日立の島村光太郎氏によれば、CNN処理をGPUで実行すると、その演算性能がGPUメーカー発表のピーク性能より桁違いに低い場合があるという（図1）。例えば、データセンターでの推論処理でよく使われている米NVIDIA（エヌビディア）のGPUカード「Tesla T4」の16ビット浮動小数点演算（FP1