並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1819件

新着順 人気順

ディープラーニングの検索結果321 - 360 件 / 1819件

  • 【Python】PyTorch で作る Vertical Federated Learning - ENGINEERING BLOG ドコモ開発者ブログ

    NTTドコモ R&D Advent Calendar 2022 の1日目の記事です。 井上と申します。アメリカのシリコンバレーにあるドコモの子会社,DOCOMO Innovations, Inc. (DII) でシニアデータサイエンティストとして機械学習の研究開発に従事しています。 現在,DII は Amazon Web Services, Inc. とパートナーシップを組み,Federated Learning (連合学習, FL) の開発に取り組んでいます。 AWS Partner Network (APN) Blog の記事もご覧ください。 本記事は,FL の中でも,特に Vertical Federated Learning (VFL) を PyTorch を用いて作り上げていくチュートリアルです。 なお,本記事末尾に職場の紹介を載せていますので「シリコンバレーとか DII ってど

      【Python】PyTorch で作る Vertical Federated Learning - ENGINEERING BLOG ドコモ開発者ブログ
    • ChatGPT

      A conversational AI system that listens, learns, and challenges

        ChatGPT
      • 2022年11月末、今からAI画像生成を触りたい未経験者向け記事|852話

        こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi

          2022年11月末、今からAI画像生成を触りたい未経験者向け記事|852話
        • AI絵師により新ジャンル「爆乳ルネサンス」が生み出される

          リンク pixiv aiWaifumaker aiを使って美しい女性を描いています drawing beautiful gorgeus woman with stablediffusion Thankyou for watching! https://twitter.com/aiWaifumaker 1

            AI絵師により新ジャンル「爆乳ルネサンス」が生み出される
          • ONNXモデルのチューニングテクニック (基礎編)

            基礎編 / 応用編1 / 応用編2 サイバーエージェント AI Lab の Conversational Agent Teamに所属している兵頭です。今回は私が半年ほど蓄積したONNXのチューニングテクニックを全てブログに残したいと思います。皆さんが既にご存知であろう基本的なことから、かなりトリッキーなチューニングまで幅広くご紹介したいと思います。長文になりますがご容赦願います。 このブログのメインターゲット層は「リサーチャーが実装したモデルを実環境へデプロイするタスクを有する方々」です。一部リサーチャーの方々の参考になる情報が混じっていることもあるかもしれませんが、あまり興味を引かない内容だとは思います。リサーチャーメインの組織に属しながらリサーチエンジニアの立ち位置で身を投じていますので、研究の観点の少し手前あるいは少しその先の部分を担っている立場からこのブログを記載しているものとご認

              ONNXモデルのチューニングテクニック (基礎編)
            • 【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita

              QMULのBen Hayes氏らが、勾配降下法で周波数推定を行う手法を論文で発表しました。ICASSP2023に投稿したそうです。 きわめてシンプルな手法なのですが、機械学習系音声合成にとってはたいへん重要な成果だと思うので、紹介します。 論文リンク:Sinusoidal Frequency Estimation by Gradient Descent ソースコード:https://github.com/ben-hayes/sinusoidal-gradient-descent 背景:DDSPの限界 DDSP(Differentiable Digital Signal Processing)とは、微分可能な計算式を持つDSPモジュールをDNNに組み込んで機械学習をやる手法で、Google Magentaプロジェクトが最初に打ち出したアイデアです。 今ではもうDDSPシリーズと呼べるほど多様

                【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita
              • 予算30万円台の深層学習用PCの買い方|shi3z

                深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleやAmazon AWSのようなサービスを展開することができない本邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利

                  予算30万円台の深層学習用PCの買い方|shi3z
                • RTX3090Tiで機械学習マシンを自作しtensorflowを動かすまで - Qiita

                  RTX3090を選んだのはもちろんVRAMサイズが理由です。バッチサイズを少しでも大きく取りたい。24GBはA100に比べれば落ちますが、ColabのV100は16GBなのでそれよりは大きいですし個人でなんとか買える価格の範囲ではこれが最大でした。 Tiになってしまったのはたまたま安かったのと成り行きですが、性能差は僅かですので消費電力の低い無印のほうがよかったような気はします。同じ学習をさせたときに消費電力がどれくらい違うのかは知る由もありませんが。 GPUだけは1年保証は怖いので延長保証をつけてみました。気休めかもしれませんが。玄人志向とかGigabyteとかだと保証が長いそうです。あとショップによっていろいろな延長保証があるので自分のような心配な人は調べてみたら少しは不安感が軽減されるかしれません。実際壊れたらちゃんと延長保証が役に立つかはわかりませんが、それを知らないで済むに越した

                    RTX3090Tiで機械学習マシンを自作しtensorflowを動かすまで - Qiita
                  • 最近話題になった 音楽生成AI まとめ|npaka

                    最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod

                      最近話題になった 音楽生成AI まとめ|npaka
                    • マイナカード推進、「是非をいちいち国民に聞いて進めるものではない」平井卓也初代デジタル大臣(ITmedia NEWS) - Yahoo!ニュース

                      「マイナンバーカードの活用の是非をいちいち国民に聞いて進めるものではない。次の世代への責任としてやり切る。反対があってもやり切ることが重要だ」 【画像】マイナンバーカードの未取得理由は? 10月26日に幕張メッセで開催された「ブロックチェーンEXPO」の講演で、初代デジタル庁大臣を務めた平井卓也衆議院議員が、マイナンバーカードの普及に対してこう持論を語った。 「どちらが国の財政にとっていいのか、どちらが本当の意味で個人情報をきっちり守れるのか、どちらが透明なのか、公平性を担保できるのか。これらは考えると当たり前のことだ」と、マイナンバーカードの意義を説明した。 どんな政策にも反対意見はあるとし、テレビ地上波のデジタル化やETC導入の際の例を挙げ、「ETCは多くの人にとって社会インフラの1つになった。今でもどうしてもETCが嫌な人は、高くなるが現金で払える」とした。 同じようにマイナンバーカ

                        マイナカード推進、「是非をいちいち国民に聞いて進めるものではない」平井卓也初代デジタル大臣(ITmedia NEWS) - Yahoo!ニュース
                      • CNN vs. ViT

                        第57回 コンピュータビジョン勉強会@関東 https://kantocv.connpass.com/event/260132/ で読みました。CNNとViTの争いの現時点の情報をお届けしています。ただECCV 2022の論文を読んだのかと言われると怪しい…(ECCV2022の論文「も」読んだというのが正しい)

                          CNN vs. ViT
                        • Imagicを理解する

                          17 oct 2022に出たImagicという技術について、ペーパーとソースを見比べながら説明します。

                            Imagicを理解する
                          • Cloud GPUs Comparison Table

                            Discussion of this page on Hacker News, May 21, 2023. Training and running neural networks often requires hardware acceleration, and the most popular hardware accelerator is the venerable graphics processing unit, or GPU. We have assembled cloud GPU vendor pricing all into tables, sortable and filterable to your liking! We have split the vendor offerings into two classes: GPU Cloud Servers, which

                              Cloud GPUs Comparison Table
                            • 中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される

                              PROTO@AiArt @proto_jp AIイラスト界隈で話題の #元素法典 のネガティブプロンプトらしきものを共有します。画像はダミー。ALTを確認 なんと3000文字以上あって1つのALTには収まらないので4巻構成です。つなぎ合わせて大呪文にしてください。ご利用は自己責任で #NovelAI #NovelAIDiffusion docs.qq.com/doc/DWHl3am5Zb… pic.twitter.com/dA5QNiyqLa 2022-10-17 14:36:23

                                中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される
                              • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                                  Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                                • 絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ

                                    絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ
                                  • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                                    OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                                      音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                                    • Text2Light

                                      Text2Light: Zero-Shot Text-Driven HDR Panorama Generation TOG 2022 (Proc. SIGGRAPH Asia) Abstract High-quality HDRIs (High Dynamic Range Images), typically HDR panoramas, are one of the most popular ways to create photorealistic lighting and 360-degree reflections of 3D scenes in graphics. Given the difficulty of capturing HDRIs, a versatile and controllable generative model is highly desired, whe

                                        Text2Light
                                      • Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】

                                          Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】
                                        • 図解Stable Diffusion

                                          ジェイ・アラマールのブログより。 AIによる画像生成は、(私を含めて)人々の度肝をぬく最新のAIの能力です。テキストの説明から印象的なビジュアルを作り出す能力は、魔法のような品質を持ち、人間がアートを創造する方法の変化を明確に指し示しています。Stable Diffusionのリリースは、高性能(画質だけでなく、速度や比較的低いリソース/メモリ要件という意味での性能)なモデルを一般の人々に提供することになったのは、この開発における明確なマイルストーンです。 AI画像生成を試してみて、その仕組みが気になり始めた方も多いのではないでしょうか。 ここでは、Stable Diffusionの仕組みについて優しく紹介します。 Stable Diffusionは、様々な使い方ができる汎用性の高いものです。まず、テキストのみからの画像生成(text2img)に焦点を当てます。上の画像は、テキスト入力と生

                                            図解Stable Diffusion
                                          • AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある

                                            トランプ @t0kri AIはちょっと破綻した美少女画しか描けないと勘違いしてる人が多すぎる、全力で破綻に振り切らせるべきなんだ pic.twitter.com/XcBzM9siwo 2022-10-03 23:48:55

                                              AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある
                                            • GitHub - facebookincubator/AITemplate: AITemplate is a Python framework which renders neural network into high performance CUDA/HIP C++ code. Specialized for FP16 TensorCore (NVIDIA GPU) and MatrixCore (AMD GPU) inference.

                                              | | AITemplate (AIT) is a Python framework that transforms deep neural networks into CUDA (NVIDIA GPU) / HIP (AMD GPU) C++ code for lightning-fast inference serving. AITemplate highlights include: High performance: close to roofline fp16 TensorCore (NVIDIA GPU) / MatrixCore (AMD GPU) performance on major models, including ResNet, MaskRCNN, BERT, VisionTransformer, Stable Diffusion, etc. Unified, o

                                                GitHub - facebookincubator/AITemplate: AITemplate is a Python framework which renders neural network into high performance CUDA/HIP C++ code. Specialized for FP16 TensorCore (NVIDIA GPU) and MatrixCore (AMD GPU) inference.
                                              • AIで特定キャラを描く(DreamBoothで追加学習)|lisa

                                                概要DreamBoothとは追加学習することで、AI(StableDiffusion)で特定のキャラや物を描くためのモデル(データ)作るツールです。 例えば、ドラゴンクエスト10オンラインというゲームのアンルシアというキャラがいます。 ドラゴンクエスト10のアンルシア 公式サイトより引用 https://hiroba.dqx.jp/sc/election/queen2021/vote/confirm/1/nologinこのキャラの画像を18枚ほどAIに読み込ませ、追加学習し、AIに描かせた絵が以下の絵になります。 これ見ると、単なる髪型や顔が似ているレベルではなく、服の模様レベルまで再現できている事がわかります。 今までStableDiffusionの欠点として、同じキャラを安定して描くのが苦手というのがありましたが、DreamBoothを使うことで克服することが出来ます。 これにより、A

                                                  AIで特定キャラを描く(DreamBoothで追加学習)|lisa
                                                • Teslaはカメラを使ってどのように世界を認識しているか

                                                  TURINGの社内AI勉強会で発表した資料です。 Tesla AI Day 2021で紹介されたTesla車に搭載されているマルチカメラを用いた認識モデルの紹介と、それに関連しそうな論文の紹介をしています。

                                                    Teslaはカメラを使ってどのように世界を認識しているか
                                                  • Metaがテキストから動画を生み出すAI「Make-A-Video」を発表

                                                    Metaがテキストから動画を生み出すAI「Make-A-Video」を発表2022.09.30 14:006,700 そうこ Metaが、テキストから高画質の動画を生成するAIシステム「Make-A-Video」を発表しました。Make-A-Videoのシステムは、画像を解説するテキストデータから世界の見え方を、動画から世界の動き方を学びます。クリエイターやアーティストの新しいツールとして、ユーザーが想像した世界をより簡単に形に表せるようにするのがMetaの目標。 Make-A-Videoのウェブサイトには、例として「スーパーヒーローの服で赤いマントで空を飛ぶ犬」とか「手にリモコンを持ってテレビを見る猫」とか「火星に着陸する超リアルな宇宙船」などが、サンプルとして公開されています。どれも非常に素晴らしい出来映えでびっくり! 1枚の画像から動画を作成することもできるまた、テキストから動画化す

                                                      Metaがテキストから動画を生み出すAI「Make-A-Video」を発表
                                                    • DreamFusion: Text-to-3D using 2D Diffusion

                                                      Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image

                                                        DreamFusion: Text-to-3D using 2D Diffusion
                                                      • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                        画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ

                                                          無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                        • GitHub - google-deepmind/educational

                                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                            GitHub - google-deepmind/educational
                                                          • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                                                            こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                                                              OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                                                            • Machine learning education  |  TensorFlow

                                                              Deploy ML on mobile, microcontrollers and other edge devices

                                                                Machine learning education  |  TensorFlow
                                                              • 『ポケモン』風画面を“見よう見まね”で生成する機械学習デモが公開。実際に歩ける狂気めいた世界 - AUTOMATON

                                                                ディープラーニング技術者であるOllin Boer Bohan氏が、『ポケットモンスター』風のゲーム画面を生成するデモを構築。プレイヤーの操作まで検知して“それっぽい”映像を再現することに成功し、実際にブラウザ上で操作できるよう公開されている。 Ollin Boer Bohan氏によるデモより 『ポケットモンスター』(以下、ポケモン)は、任天堂の人気RPGシリーズだ。同作はポケモンを捕獲・育成してバトルに挑むシステムが特徴。また、初代『ポケモン 赤・緑』から、メインシリーズ作品は長らく見下ろし視点で親しまれていた。描画としては2Dモノクロから、世代を重ねるごとに色鮮やか・高精細になっていき3D表現に移ったものの、見下ろしスタイルが深く印象に残っているファンも多いだろう。 左がバーチャルコンソール版『ポケモン 赤』、右が『ポケモン ダイヤモンド・パール』 そんな馴染みある見下ろし視点の『ポケ

                                                                  『ポケモン』風画面を“見よう見まね”で生成する機械学習デモが公開。実際に歩ける狂気めいた世界 - AUTOMATON
                                                                • 著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳

                                                                  こんにちは、品川です。Vision Transformer入門という本の執筆に参加しました。いよいよ本格的な販売がはじまります。どんな本なのか注目してくださってる方もいらっしゃると思うので、著者陣の一人の視点から執筆の背景と書評を少しだけ書こうと思います。 gihyo.jp 執筆の背景 書評 第1章 TransformerからVision Transformerへの進化 第2章 Vision Transformerの基礎と実装 第3章 実験と可視化によるVision Transformerの探求 第4章 コンピュータビジョンタスクへの応用 第5章 Vision and Languageタスクへの応用 第6章 Vision Transformerの派生手法 第7章 Transformerの謎を読み解く 第8章 Vision Transformerの謎を読み解く 手薄になっている内容 執筆の背

                                                                    著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳
                                                                  • 遅すぎるCNN処理、日立の自動運転研究部が原因と対処術を発表

                                                                    日立製作所 研究開発グループ 自動運転研究部は、GPUによるCNN(Convolutional Neural Network:畳み込みニューラルネットワーク)処理において期待したような性能が出ない理由やその対処方法について、「DAシンポジウム2022 −システムとLSIの設計技術−」(情報処理学会 システムとLSIの設計技術研究会(SLDM)が2022年8月31日~9月2日に開催)で発表した。CNN処理は、ADAS(先進運転支援システム)や自動運転における画像認識でよく使われる演算である。 発表した日立の島村光太郎氏によれば、CNN処理をGPUで実行すると、その演算性能がGPUメーカー発表のピーク性能より桁違いに低い場合があるという(図1)。例えば、データセンターでの推論処理でよく使われている米NVIDIA(エヌビディア)のGPUカード「Tesla T4」の16ビット浮動小数点演算(FP1

                                                                      遅すぎるCNN処理、日立の自動運転研究部が原因と対処術を発表
                                                                    • ブラウザなどのツール操作を簡単に自動化できるAI「ACT-1」が登場

                                                                      AIスタートアップのAdeptが、デジタルツールを使用するように訓練された大規模なTransformerモデル「ACT-1」を発表しました。ACT-1はブラウザで何が起こっているかを監視し、クリック・入力・スクロールなどの特定アクションを実行できるChrome拡張機能に接続されており、操作を自動化できます。 ACT-1: Transformer for Actions https://www.adept.ai/act ACT-1は、ユーザーの高度な要求を受け止め、それを実行することができます。ユーザーはテキストボックスにコマンドを入力するだけで、あとはACT-1が実行します。 ACT-1への指示は、ブラウザ上に表示されるポップアップに英語で入力して行います。例えば「ヒューストンで4人家族が住む家を探してほしい、予算は60万ドル(約8400万円)」と入力します。 すると、物件の検索サイトでヒ

                                                                        ブラウザなどのツール操作を簡単に自動化できるAI「ACT-1」が登場
                                                                      • LiDARのないiPhoneで3Dスキャン可能に 米Nianticの「Scaniverse」

                                                                        「Pokemon GO」(ポケモンGO)などのARゲームで知られる米Nianticは9月14日(現地時間)、iOS向け3Dスキャンアプリ「Scaniverse」がLiDARを持たないiPhoneにも対応すると発表した。iPhone XS以降の全てのiPhoneと過去4年間に発売されたほとんどのiPadで利用できるという。 LiDARに代わり、ニューラルネットワークを活用してカメラ画像から奥行きを推測する「ManyDepth」技術を搭載した。建物など大きな空間に適した「Areaモード」と人物やオブジェクトの細部を捉える「Detailモード」があり、DetailモードならScaniverseフォトグラメトリ処理を活用してLiDAR搭載デバイスと同等の高品位なスキャン結果が得られるとしている。 「LiDARを搭載していない端末でもScaniverseを利用したいという要望が多かった。(ManyD

                                                                          LiDARのないiPhoneで3Dスキャン可能に 米Nianticの「Scaniverse」
                                                                        • 言語処理のニューラルネットワークモデルが脳の働きと同じ構造をしているという仮説

                                                                          脳がどのように時間を把握するのかという研究や選択的に恐怖やトラウマなどの記憶を消去する実験など、「脳がどのように機能して、脳のどこで何をするのか?」という疑問は依然として不明な点が多くなっています。そのような脳の働きについて、言語処理の深層学習モデルであるTransformerが、脳の機能を追跡する類似モデルとして役に立つことが示されました。 Quanta Magazine https://www.quantamagazine.org/how-ai-transformers-mimic-parts-of-the-brain-20220912/ Relating transformers to models and neural representations of the hippocampal formation | OpenReview https://openreview.net/f

                                                                            言語処理のニューラルネットワークモデルが脳の働きと同じ構造をしているという仮説
                                                                          • Danbooru(イラスト転載サイト)で学習したWaifu Diffusion

                                                                            高杉 光一🦋 @14:59 @kuronagirai Cry… 基本箱推し 画像生成AIで作った画像の供養先@AI_Rushia 生成した画像は商用利用と人が嫌がるようなこと以外の用途であれば好きに使って構いません syosetu.org/?mode=user&uid… 高杉 光一🦋 @kuronagirai 私が把握してる今のところの各画像生成AIの相関図 Stable Diffusionのオープンソース化は間違いなくターニングポイントの一つだけどWaifu Diffusionがどこまで影響を与えるかはこれ次第 Midjourneyも十分影響あったんだけど芸術や背景特化感否めない ERNIE-ViLGはどうなるんだろう…? mimicはうん… pic.twitter.com/ykyDSkltPE 2022-09-09 04:17:01 高杉 光一🦋 @kuronagirai 素人目

                                                                              Danbooru(イラスト転載サイト)で学習したWaifu Diffusion
                                                                            • クッキー画像でサクッと異常検知AIを作る - Qiita

                                                                              動機 AIを使って異常検知(製品の良品・不良品を見分ける等)を行いたいと考えたことがある人は多いのではないでしょうか?実際にAIが得意とする分野ではありますが、実際に取り組んでみると、不良画像のデータが十分に収集できない、異常判定の可視化が難しいなど、躓くポイントが多かったりします。 今回は、シンプルな実装かつ最小のリソースで異常検知を実現するための手法の一つとして「オートエンコーダ」と呼ばれるAIモデルを、実際のコードサンプルや動作例と共に紹介したいと思います。 オートエンコーダ(自己符号化器)1 オートエンコーダはニューラルネットワーク構造のパターンの一つで、入力データを一度低次元データに変換するパート(エンコーダ)と低次元データから画像を復元するパート(デコーダ)で構成されます。モデル全体の目的としては、入力データをなるべくそのままに出力することです。 入力データがそのまま出力データ

                                                                                クッキー画像でサクッと異常検知AIを作る - Qiita
                                                                              • 【メタサーベイ】Video Transformer

                                                                                cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/ Read less

                                                                                  【メタサーベイ】Video Transformer
                                                                                • Stable DiffusionでSeedを固定して同じ絵を生成できるのか問題を検証

                                                                                  Stable Diffusionでseedを固定して同じ絵を生成できるのか問題 Stable Diffusionでseed値を固定すると同じ絵を生成できるのかが(私の中で)話題です。 きっかけは、shi3zさんとdrikinさんの動画のラストの1,2分。 Seedを固定すると同じ絵が出ると主張するdrikinさんと、そんなことはないんじゃないかといい、その場で実践して確かめるshi3zさん。 自分も、GPUを多用するディープラーニングの演算だと、seed固定しても経験的に完全再現できないことを体感していたのと、当時調べたら「GPUでは完全再現は難しい」という情報が多かったので、seed値を固定しても、結果は再現できないものとずっと思っていました。 でも、Stable Diffusionの実験して挙動みてると、同じpromptとseed値から同じ絵が再現できていそうなんですよね。 その後も繰

                                                                                    Stable DiffusionでSeedを固定して同じ絵を生成できるのか問題を検証