並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1804件

新着順 人気順

ディープラーニングの検索結果321 - 360 件 / 1804件

  • PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks

    株式会社Preferred Networks(本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、プリファードネットワークス、以下、PFN)は、深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2(エムエヌ・コア・ツー)を、東京ビッグサイトで開催されている SEMICON Japan 2022のキーノート講演において本日発表しました。 深層学習の実用化は様々な分野で進展しており、それに応じてこれまで以上に多様かつ、大規模な計算処理が求められるようになっています。 PFNでは、2020年から稼働しているMN-Coreを搭載したスーパーコンピュータMN-3を活用して、材料化学やロボティクスなどの新分野において深層学習を応用した革新的な技術の開発および高速化に取り組んできました。今後、現実世界のより複雑な課題を解決していくには、深層学習モデルの精度と演算速度をさらに向

      PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks
    • 人生を狂わせるレベルの「ディープフェイク画像」を他人のSNS投稿から制作できるGoogleのAI技術 | AppBank

      つい最近まで、フェイク画像を作る方法は、写真を切り貼りするか、フォトショップを使いこなして合成するしかありませんでした。しかし現在では、写真のようなリアルなディープフェイクが、誰でも出来る時代に入り始めています。 この画像生成AIによるディープフェイクの精度と危険性を、テック系メディア「Ars Technica」が実験を通して解説しています。 *Category:テクノロジー Technology *Source:Ars Technica ,@natanielruizg(Twitter) ,@MikaelThalen(Twitter) 画像生成AIが「たった数枚のSNS画像」からディープフェイクを生成 今回の「Ars Technica」の実験で、フェイク画像の対象となったのは「ジョン」というこちらの男性。 もちろん彼は実在する人物ではなく、AIが合成した架空の人物です。「Ars Techn

        人生を狂わせるレベルの「ディープフェイク画像」を他人のSNS投稿から制作できるGoogleのAI技術 | AppBank
      • 話題爆発中のAI「ChatGPT」の仕組みにせまる! - Qiita

        オミータです。ツイッターで人工知能のことや他媒体の記事など を紹介しています。 @omiita_atiimoもご覧ください! 話題爆発中のAI「ChatGPT」の仕組みにせまる! 注意:ChatGPTはまだ論文が出ていないため、細かい箇所は不明です。本記事では公式から出た記事およびInstructGPTの論文をもとにChatGPTの仕組みを探っていきます 本記事の流れ: 忙しい方へ ChatGPTとは GPT-3 InstructGPT ChatGPT まとめと所感 参考 0. 忙しい方へ ChatGPTは、InstructGPTをベースとしたモデルだよ InstructGPTは、「人間の好みに合った文を出力するように微調整したGPT-3」だよ InstructGPTの学習では、以下の3つが重要だよ GPT-3の教師ありファインチューニング Reward Modelの学習 RLHF(=Re

          話題爆発中のAI「ChatGPT」の仕組みにせまる! - Qiita
        • コンピュータビジョン分野のトップカンファレンスであるECCV2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog

          目次 目次 はじめに ECCV2022概要 Workshop Instance-Level Recognition Workshop Keynote talk: Image Search and Matching Kaggle Google Universal Image Embedding Challenge Keynote talk: Few-Shot Learning for Object Aware Visual Recognition Language Assisted Product Search Granularity aware Adaptation for Image Retrieval over Multiple Tasks Where in the World is this Image? Transformer-based Geo-localization in t

            コンピュータビジョン分野のトップカンファレンスであるECCV2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog
          • Perplexity AI

            Bulletproof coffee, also known as butter coffee or keto coffee, is a high-calorie drink made with added fats, intended to fuel your start to the day. It was created by Dave Asprey, the originator of the Bulletproof Diet, and is popular among low-carb dieters and those following a ketogenic diet. The drink consists of coffee made from high-quality beans, unsalted butter, and a medium-chain triglyce

            • OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog

              地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 【IIJ 2022 TECHアドベントカレンダー 12/8(木)の記事です】 Whisperの追加学習に挑む2022年の冬 2022年アドベントカレンダー企画だそうです。 いかがお過ごしでしょうか。 私はもう興味を引くものに没頭するしか楽しみがないもんで、PCに向かってぼんやり面白いネタはないかなーと探す日々です。 最近はすっかりディープラーニングにズブズブで、とうとう数式かくのが面倒なあまり手書き入力のためのペンタブレットを買いました。てへ。 今回は9月から10月にかけてStabl

                OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog
              • 世界一わかりやすい機械学習プログラミングチュートリアル - Qiita

                はじめに この記事はNuco Advent Calendar 2022の5日目の記事です 対象読者 Pythonが注目されている理由のひとつは機械学習プロジェクトの主要な開発言語であるからといってもよいでしょう。多くの企業の業務システムのAIの開発言語はPythonです。そんなPythonの学習を始めてある程度文法の理解が進んできて、機械学習に触れてみたい方を対象にしています。 Pythonの基本文法を理解している 機械学習を始めてみたい チュートリアル概要 Pythonは長年機械学習で使用されているので、ライブラリも豊富にあります。本記事では機械学習用ライブラリのscikit-learn(サイキット・ラーン)を使用して教師あり学習を行い住宅価格を予測してみます。 何ができるようになるか 機械学習で使われる基本的な用語を理解し、学習の全体像をつかめるようになります。 機械学習の目的 機械学

                  世界一わかりやすい機械学習プログラミングチュートリアル - Qiita
                • 【Python】PyTorch で作る Vertical Federated Learning - ENGINEERING BLOG ドコモ開発者ブログ

                  NTTドコモ R&D Advent Calendar 2022 の1日目の記事です。 井上と申します。アメリカのシリコンバレーにあるドコモの子会社,DOCOMO Innovations, Inc. (DII) でシニアデータサイエンティストとして機械学習の研究開発に従事しています。 現在,DII は Amazon Web Services, Inc. とパートナーシップを組み,Federated Learning (連合学習, FL) の開発に取り組んでいます。 AWS Partner Network (APN) Blog の記事もご覧ください。 本記事は,FL の中でも,特に Vertical Federated Learning (VFL) を PyTorch を用いて作り上げていくチュートリアルです。 なお,本記事末尾に職場の紹介を載せていますので「シリコンバレーとか DII ってど

                    【Python】PyTorch で作る Vertical Federated Learning - ENGINEERING BLOG ドコモ開発者ブログ
                  • ChatGPT

                    A conversational AI system that listens, learns, and challenges

                      ChatGPT
                    • 2022年11月末、今からAI画像生成を触りたい未経験者向け記事|852話

                      こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi

                        2022年11月末、今からAI画像生成を触りたい未経験者向け記事|852話
                      • AI絵師により新ジャンル「爆乳ルネサンス」が生み出される

                        リンク pixiv aiWaifumaker aiを使って美しい女性を描いています drawing beautiful gorgeus woman with stablediffusion Thankyou for watching! https://twitter.com/aiWaifumaker 1

                          AI絵師により新ジャンル「爆乳ルネサンス」が生み出される
                        • ONNXモデルのチューニングテクニック (基礎編)

                          基礎編 / 応用編1 / 応用編2 サイバーエージェント AI Lab の Conversational Agent Teamに所属している兵頭です。今回は私が半年ほど蓄積したONNXのチューニングテクニックを全てブログに残したいと思います。皆さんが既にご存知であろう基本的なことから、かなりトリッキーなチューニングまで幅広くご紹介したいと思います。長文になりますがご容赦願います。 このブログのメインターゲット層は「リサーチャーが実装したモデルを実環境へデプロイするタスクを有する方々」です。一部リサーチャーの方々の参考になる情報が混じっていることもあるかもしれませんが、あまり興味を引かない内容だとは思います。リサーチャーメインの組織に属しながらリサーチエンジニアの立ち位置で身を投じていますので、研究の観点の少し手前あるいは少しその先の部分を担っている立場からこのブログを記載しているものとご認

                            ONNXモデルのチューニングテクニック (基礎編)
                          • 【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita

                            QMULのBen Hayes氏らが、勾配降下法で周波数推定を行う手法を論文で発表しました。ICASSP2023に投稿したそうです。 きわめてシンプルな手法なのですが、機械学習系音声合成にとってはたいへん重要な成果だと思うので、紹介します。 論文リンク:Sinusoidal Frequency Estimation by Gradient Descent ソースコード:https://github.com/ben-hayes/sinusoidal-gradient-descent 背景:DDSPの限界 DDSP(Differentiable Digital Signal Processing)とは、微分可能な計算式を持つDSPモジュールをDNNに組み込んで機械学習をやる手法で、Google Magentaプロジェクトが最初に打ち出したアイデアです。 今ではもうDDSPシリーズと呼べるほど多様

                              【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita
                            • 予算30万円台の深層学習用PCの買い方|shi3z

                              深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleやAmazon AWSのようなサービスを展開することができない本邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利

                                予算30万円台の深層学習用PCの買い方|shi3z
                              • RTX3090Tiで機械学習マシンを自作しtensorflowを動かすまで - Qiita

                                RTX3090を選んだのはもちろんVRAMサイズが理由です。バッチサイズを少しでも大きく取りたい。24GBはA100に比べれば落ちますが、ColabのV100は16GBなのでそれよりは大きいですし個人でなんとか買える価格の範囲ではこれが最大でした。 Tiになってしまったのはたまたま安かったのと成り行きですが、性能差は僅かですので消費電力の低い無印のほうがよかったような気はします。同じ学習をさせたときに消費電力がどれくらい違うのかは知る由もありませんが。 GPUだけは1年保証は怖いので延長保証をつけてみました。気休めかもしれませんが。玄人志向とかGigabyteとかだと保証が長いそうです。あとショップによっていろいろな延長保証があるので自分のような心配な人は調べてみたら少しは不安感が軽減されるかしれません。実際壊れたらちゃんと延長保証が役に立つかはわかりませんが、それを知らないで済むに越した

                                  RTX3090Tiで機械学習マシンを自作しtensorflowを動かすまで - Qiita
                                • 最近話題になった 音楽生成AI まとめ|npaka

                                  最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod

                                    最近話題になった 音楽生成AI まとめ|npaka
                                  • マイナカード推進、「是非をいちいち国民に聞いて進めるものではない」平井卓也初代デジタル大臣(ITmedia NEWS) - Yahoo!ニュース

                                    「マイナンバーカードの活用の是非をいちいち国民に聞いて進めるものではない。次の世代への責任としてやり切る。反対があってもやり切ることが重要だ」 【画像】マイナンバーカードの未取得理由は? 10月26日に幕張メッセで開催された「ブロックチェーンEXPO」の講演で、初代デジタル庁大臣を務めた平井卓也衆議院議員が、マイナンバーカードの普及に対してこう持論を語った。 「どちらが国の財政にとっていいのか、どちらが本当の意味で個人情報をきっちり守れるのか、どちらが透明なのか、公平性を担保できるのか。これらは考えると当たり前のことだ」と、マイナンバーカードの意義を説明した。 どんな政策にも反対意見はあるとし、テレビ地上波のデジタル化やETC導入の際の例を挙げ、「ETCは多くの人にとって社会インフラの1つになった。今でもどうしてもETCが嫌な人は、高くなるが現金で払える」とした。 同じようにマイナンバーカ

                                      マイナカード推進、「是非をいちいち国民に聞いて進めるものではない」平井卓也初代デジタル大臣(ITmedia NEWS) - Yahoo!ニュース
                                    • CNN vs. ViT

                                      第57回 コンピュータビジョン勉強会@関東 https://kantocv.connpass.com/event/260132/ で読みました。CNNとViTの争いの現時点の情報をお届けしています。ただECCV 2022の論文を読んだのかと言われると怪しい…(ECCV2022の論文「も」読んだというのが正しい)

                                        CNN vs. ViT
                                      • Imagicを理解する

                                        17 oct 2022に出たImagicという技術について、ペーパーとソースを見比べながら説明します。

                                          Imagicを理解する
                                        • Cloud GPUs Comparison Table

                                          Discussion of this page on Hacker News, May 21, 2023. Training and running neural networks often requires hardware acceleration, and the most popular hardware accelerator is the venerable graphics processing unit, or GPU. We have assembled cloud GPU vendor pricing all into tables, sortable and filterable to your liking! We have split the vendor offerings into two classes: GPU Cloud Servers, which

                                            Cloud GPUs Comparison Table
                                          • 中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される

                                            PROTO@AiArt @proto_jp AIイラスト界隈で話題の #元素法典 のネガティブプロンプトらしきものを共有します。画像はダミー。ALTを確認 なんと3000文字以上あって1つのALTには収まらないので4巻構成です。つなぎ合わせて大呪文にしてください。ご利用は自己責任で #NovelAI #NovelAIDiffusion docs.qq.com/doc/DWHl3am5Zb… pic.twitter.com/dA5QNiyqLa 2022-10-17 14:36:23

                                              中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される
                                            • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                                                Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                                              • 絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ

                                                  絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ
                                                • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                                                  OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                                                    音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                                                  • Text2Light

                                                    Text2Light: Zero-Shot Text-Driven HDR Panorama Generation TOG 2022 (Proc. SIGGRAPH Asia) Abstract High-quality HDRIs (High Dynamic Range Images), typically HDR panoramas, are one of the most popular ways to create photorealistic lighting and 360-degree reflections of 3D scenes in graphics. Given the difficulty of capturing HDRIs, a versatile and controllable generative model is highly desired, whe

                                                      Text2Light
                                                    • Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】

                                                        Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】
                                                      • 図解Stable Diffusion

                                                        ジェイ・アラマールのブログより。 AIによる画像生成は、(私を含めて)人々の度肝をぬく最新のAIの能力です。テキストの説明から印象的なビジュアルを作り出す能力は、魔法のような品質を持ち、人間がアートを創造する方法の変化を明確に指し示しています。Stable Diffusionのリリースは、高性能(画質だけでなく、速度や比較的低いリソース/メモリ要件という意味での性能)なモデルを一般の人々に提供することになったのは、この開発における明確なマイルストーンです。 AI画像生成を試してみて、その仕組みが気になり始めた方も多いのではないでしょうか。 ここでは、Stable Diffusionの仕組みについて優しく紹介します。 Stable Diffusionは、様々な使い方ができる汎用性の高いものです。まず、テキストのみからの画像生成(text2img)に焦点を当てます。上の画像は、テキスト入力と生

                                                          図解Stable Diffusion
                                                        • AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある

                                                          トランプ @t0kri AIはちょっと破綻した美少女画しか描けないと勘違いしてる人が多すぎる、全力で破綻に振り切らせるべきなんだ pic.twitter.com/XcBzM9siwo 2022-10-03 23:48:55

                                                            AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある
                                                          • GitHub - facebookincubator/AITemplate: AITemplate is a Python framework which renders neural network into high performance CUDA/HIP C++ code. Specialized for FP16 TensorCore (NVIDIA GPU) and MatrixCore (AMD GPU) inference.

                                                            | | AITemplate (AIT) is a Python framework that transforms deep neural networks into CUDA (NVIDIA GPU) / HIP (AMD GPU) C++ code for lightning-fast inference serving. AITemplate highlights include: High performance: close to roofline fp16 TensorCore (NVIDIA GPU) / MatrixCore (AMD GPU) performance on major models, including ResNet, MaskRCNN, BERT, VisionTransformer, Stable Diffusion, etc. Unified, o

                                                              GitHub - facebookincubator/AITemplate: AITemplate is a Python framework which renders neural network into high performance CUDA/HIP C++ code. Specialized for FP16 TensorCore (NVIDIA GPU) and MatrixCore (AMD GPU) inference.
                                                            • AIで特定キャラを描く(DreamBoothで追加学習)|lisa

                                                              概要DreamBoothとは追加学習することで、AI(StableDiffusion)で特定のキャラや物を描くためのモデル(データ)作るツールです。 例えば、ドラゴンクエスト10オンラインというゲームのアンルシアというキャラがいます。 ドラゴンクエスト10のアンルシア 公式サイトより引用 https://hiroba.dqx.jp/sc/election/queen2021/vote/confirm/1/nologinこのキャラの画像を18枚ほどAIに読み込ませ、追加学習し、AIに描かせた絵が以下の絵になります。 これ見ると、単なる髪型や顔が似ているレベルではなく、服の模様レベルまで再現できている事がわかります。 今までStableDiffusionの欠点として、同じキャラを安定して描くのが苦手というのがありましたが、DreamBoothを使うことで克服することが出来ます。 これにより、A

                                                                AIで特定キャラを描く(DreamBoothで追加学習)|lisa
                                                              • Teslaはカメラを使ってどのように世界を認識しているか

                                                                TURINGの社内AI勉強会で発表した資料です。 Tesla AI Day 2021で紹介されたTesla車に搭載されているマルチカメラを用いた認識モデルの紹介と、それに関連しそうな論文の紹介をしています。

                                                                  Teslaはカメラを使ってどのように世界を認識しているか
                                                                • Metaがテキストから動画を生み出すAI「Make-A-Video」を発表

                                                                  Metaがテキストから動画を生み出すAI「Make-A-Video」を発表2022.09.30 14:006,700 そうこ Metaが、テキストから高画質の動画を生成するAIシステム「Make-A-Video」を発表しました。Make-A-Videoのシステムは、画像を解説するテキストデータから世界の見え方を、動画から世界の動き方を学びます。クリエイターやアーティストの新しいツールとして、ユーザーが想像した世界をより簡単に形に表せるようにするのがMetaの目標。 Make-A-Videoのウェブサイトには、例として「スーパーヒーローの服で赤いマントで空を飛ぶ犬」とか「手にリモコンを持ってテレビを見る猫」とか「火星に着陸する超リアルな宇宙船」などが、サンプルとして公開されています。どれも非常に素晴らしい出来映えでびっくり! 1枚の画像から動画を作成することもできるまた、テキストから動画化す

                                                                    Metaがテキストから動画を生み出すAI「Make-A-Video」を発表
                                                                  • DreamFusion: Text-to-3D using 2D Diffusion

                                                                    Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image

                                                                      DreamFusion: Text-to-3D using 2D Diffusion
                                                                    • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                                      画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ

                                                                        無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                                      • GitHub - google-deepmind/educational

                                                                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                          GitHub - google-deepmind/educational
                                                                        • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                                                                          こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                                                                            OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                                                                          • Machine learning education  |  TensorFlow

                                                                            Deploy ML on mobile, microcontrollers and other edge devices

                                                                              Machine learning education  |  TensorFlow
                                                                            • 『ポケモン』風画面を“見よう見まね”で生成する機械学習デモが公開。実際に歩ける狂気めいた世界 - AUTOMATON

                                                                              ディープラーニング技術者であるOllin Boer Bohan氏が、『ポケットモンスター』風のゲーム画面を生成するデモを構築。プレイヤーの操作まで検知して“それっぽい”映像を再現することに成功し、実際にブラウザ上で操作できるよう公開されている。 Ollin Boer Bohan氏によるデモより 『ポケットモンスター』(以下、ポケモン)は、任天堂の人気RPGシリーズだ。同作はポケモンを捕獲・育成してバトルに挑むシステムが特徴。また、初代『ポケモン 赤・緑』から、メインシリーズ作品は長らく見下ろし視点で親しまれていた。描画としては2Dモノクロから、世代を重ねるごとに色鮮やか・高精細になっていき3D表現に移ったものの、見下ろしスタイルが深く印象に残っているファンも多いだろう。 左がバーチャルコンソール版『ポケモン 赤』、右が『ポケモン ダイヤモンド・パール』 そんな馴染みある見下ろし視点の『ポケ

                                                                                『ポケモン』風画面を“見よう見まね”で生成する機械学習デモが公開。実際に歩ける狂気めいた世界 - AUTOMATON
                                                                              • 著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳

                                                                                こんにちは、品川です。Vision Transformer入門という本の執筆に参加しました。いよいよ本格的な販売がはじまります。どんな本なのか注目してくださってる方もいらっしゃると思うので、著者陣の一人の視点から執筆の背景と書評を少しだけ書こうと思います。 gihyo.jp 執筆の背景 書評 第1章 TransformerからVision Transformerへの進化 第2章 Vision Transformerの基礎と実装 第3章 実験と可視化によるVision Transformerの探求 第4章 コンピュータビジョンタスクへの応用 第5章 Vision and Languageタスクへの応用 第6章 Vision Transformerの派生手法 第7章 Transformerの謎を読み解く 第8章 Vision Transformerの謎を読み解く 手薄になっている内容 執筆の背

                                                                                  著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳
                                                                                • 遅すぎるCNN処理、日立の自動運転研究部が原因と対処術を発表

                                                                                  日立製作所 研究開発グループ 自動運転研究部は、GPUによるCNN(Convolutional Neural Network:畳み込みニューラルネットワーク)処理において期待したような性能が出ない理由やその対処方法について、「DAシンポジウム2022 −システムとLSIの設計技術−」(情報処理学会 システムとLSIの設計技術研究会(SLDM)が2022年8月31日~9月2日に開催)で発表した。CNN処理は、ADAS(先進運転支援システム)や自動運転における画像認識でよく使われる演算である。 発表した日立の島村光太郎氏によれば、CNN処理をGPUで実行すると、その演算性能がGPUメーカー発表のピーク性能より桁違いに低い場合があるという(図1)。例えば、データセンターでの推論処理でよく使われている米NVIDIA(エヌビディア)のGPUカード「Tesla T4」の16ビット浮動小数点演算(FP1

                                                                                    遅すぎるCNN処理、日立の自動運転研究部が原因と対処術を発表