並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 1609件

新着順 人気順

deepLearningの検索結果121 - 160 件 / 1609件

  • 歌声合成ソフト【NEUTRINO】が公開、無調声でも人間っぽく歌唱してる様に聴こえる事に神前暁さん始め音楽家等から驚愕の声が! #AIきりたん

    技術はついにここまで来たか…!という感想です。 諸々ざっくりとまとめましたが、各地に既にこのソフトを使用して色々公開されているので、探してみてください。

      歌声合成ソフト【NEUTRINO】が公開、無調声でも人間っぽく歌唱してる様に聴こえる事に神前暁さん始め音楽家等から驚愕の声が! #AIきりたん
    • pythonを使った株価の自動収集 - Qiita

      Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

        pythonを使った株価の自動収集 - Qiita
      • 【一問一答】マヅコの知らない「異常検知」の世界 - Qiita

        これから異常検知を勉強される初心者、中級者の方のために一問一答集を作ってみました。 実際にあった質問も含まれますが、ほとんどの質問は、私が勉強しながら疑問に思ったことです。 なお、各質問には私の失敗談を添えております。皆さんは私のような失敗をしないよう 祈っております(^^)。異常検知に特化した内容となっておりますので、ご了承ください。 初心者の方向け 勉強の仕方編 Q:異常検知を勉強したいのですが、何から手をつけて良いのか分かりません。 A:書籍を買って読むのがおススメです。 最初、私はネット情報で勉強していました。しかし、それにも限界があります。 ところが、書籍(入門 機械学習による異常検知)を買って読んだところ、かなり知識を 得ることができました。最初から、書籍を買っていれば、一年くらい得することができたのに... と思うこともあります(^^; ただ、こちらの本はディープラーニング系

          【一問一答】マヅコの知らない「異常検知」の世界 - Qiita
        • 女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?

          ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られた いままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。 彼女は X(Twitter)の自分のアカウントで1日1本のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな!」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。 目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

            女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?
          • エヌビディアがCPU参入 アームと組みAI計算10倍速く - 日本経済新聞

            【シリコンバレー=佐藤浩実】米半導体大手のエヌビディアは12日、CPU(中央演算処理装置)に参入すると発表した。英アームの基本設計を利用し、2023年に米欧のスーパーコンピューターに搭載する。人工知能(AI)計算を10倍速くできる見通しで、米インテルの主戦場に切り込む。AIの進化を左右する「頭脳」を巡り競争が激しくなる。12日に開いたAIイベントでCPU「Grace(グレース)」を発表した。エ

              エヌビディアがCPU参入 アームと組みAI計算10倍速く - 日本経済新聞
            • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

              自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

                AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
              • 「敬語をちょっと直すだけでほぼ完璧な翻訳」Google翻訳以上?DeepL翻訳がスゴいという話

                精神科医K @dwdaai DeepL翻訳ガチでやばい こら時代が変わるわ グーグル翻訳でもなんとか意味は取れるがDeepL翻訳は敬語をちょっと直すだけでほぼ完璧な翻訳 twitter.com/jaguring1/stat… 2020-03-20 19:31:09 小猫遊りょう(たかにゃし・りょう) @jaguring1 試しに、いま僕が読み返している、グーグルのAI開発を率いている大天才Jeff Deanの論文(2019年11月13日)の概要を、DeepL翻訳(1枚目)とグーグル翻訳(2枚目)に入れてみた。 Jeff Deanの論文 arxiv.org/abs/1911.05289 DeepL翻訳 deepl.com/translator グーグル翻訳 translate.google.com/?hl=ja pic.twitter.com/9o5VJkfm11 2020-03-20 18

                  「敬語をちょっと直すだけでほぼ完璧な翻訳」Google翻訳以上?DeepL翻訳がスゴいという話
                • 異常検知入門と手法まとめ - Qiita

                  異常検知について勉強したのでまとめておきます。 参考文献 下記文献を大いに参考にさせていただきました: [1] Ruff, Lukas, et al. "A Unifying Review of Deep and Shallow Anomaly Detection." arXiv preprint arXiv:2009.11732 (2020). [2] 井手. "入門 機械学習による異常検知―Rによる実践ガイド" コロナ社(2015) [3] 井手,杉山. "異常検知と変化検知 (機械学習プロフェッショナルシリーズ)" 講談社サイエンティフィク(2015) [4] 比戸. "異常検知入門" Jubatus Casual Talks #2(2013) [5] Pang, Guansong, et al. "Deep learning for anomaly detection: A rev

                    異常検知入門と手法まとめ - Qiita
                  • Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita

                    08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ

                      Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita
                    • ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

                      Anthropicは10月16日(現地時間)、同社が公開するAIチャットボット「Claude 2」の公開範囲を日本を含む世界95の国と地域に拡大したことを明らかにした。 リストにEU加盟国なし We’re rolling out access to https://t.co/RxKnLNNcNR to more people around the world. Starting today, users in 95 countries can talk to Claude and get help with their professional or day-to-day tasks. You can find the list of supported countries here: https://t.co/PbMuaqJcjU — Anthropic (@AnthropicAI) O

                        ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に
                      • AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す【藤本健のDigital Audio Laboratory】

                          AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す【藤本健のDigital Audio Laboratory】
                        • 「現状、人間はこの技術を制御しきれない」。読売新聞とNTTが生成AIのあり方に共同提言

                            「現状、人間はこの技術を制御しきれない」。読売新聞とNTTが生成AIのあり方に共同提言 
                          • マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた

                            これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ

                              マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた
                            • GitHub、「Copilot Workspace」テクニカルプレビューを開始。ほとんど全ての開発工程をAIで自動化

                              GitHub、「Copilot Workspace」テクニカルプレビューを開始。ほとんど全ての開発工程をAIで自動化 テクニカルプレビューは上記のCopilot Workspaceのページからウェイトリストボタンをクリックして申し込みます。 Copilot Workspaceはほとんど全ての工程を自動化 Copilot Workspaceは、自然言語で書かれたIssue(課題)を基に、Copilotが仕様案と実装計画を示し、コーディングや既存のコードの修正を行い、ビルドをしてエラーがあればデバッグも行うという、プログラミングのほとんど全ての工程をCopilotが自動的に実行してくれる、というものです。 人間は各工程でCopilotから示される内容を必要に応じて修正するか、そのまま見守ることになります。 GitHub CEOのThomas Dohmke(トーマス・ドムケ)氏は、Copilot

                                GitHub、「Copilot Workspace」テクニカルプレビューを開始。ほとんど全ての開発工程をAIで自動化
                              • AIが「架空のモデル画像」を生成 広告・ポスターで利用可能 スキャンダルでの降板リスクをゼロに

                                写真素材の販売などを手掛けるイメージナビは6月8日、AIが実在しないモデルの画像を生成するサービス「INAI MODEL」を始めた。画像を購入した企業は、架空のモデルをWeb広告やポスターなどに起用できる。モデルとの契約期間を気にせず永久に画像を使える他、モデルがスキャンダルを起こすリスクがなく、差し替えが発生しないのが特徴。 当初は若い女性の画像のみ生成・販売し、今後は男性やシニアにも対応する予定。同じモデルが異なるポーズをとっている画像や、異なるモデルが同じポーズをとっている画像なども生成できる。著名人に似せたモデルは作成しない。 サービス開発にはAIベンチャーのデータグリッドが協力。画像を生成するAIと画像を評価するAIを敵対させ、精度を向上させる技術「GAN」(敵対的生成ネットワーク)を利用する。 モデル画像を生成する際は、イメージナビが利用許諾を得た上で実在する人物の写真を撮影。

                                  AIが「架空のモデル画像」を生成 広告・ポスターで利用可能 スキャンダルでの降板リスクをゼロに
                                • IDEにChatGPTを統合、「この関数のテストコードはどこ?」「XXXを実装するならどう書けばいい?」など、AIでコードと対話できる「qqbot」登場

                                  IDEにChatGPTを統合、「この関数のテストコードはどこ?」「XXXを実装するならどう書けばいい?」など、AIでコードと対話できる「qqbot」登場 テキストから高度なイラストを生成するAIや、人間と自然な対話を可能にするAIが最近話題になっています。 この人間と自然な会話をするAIチャットの代表的なサービスであるChatGPTの派生サービス(Variant of ChatGPT)をVisual Studio CodeなどのIDEに統合し、開発中のコードについて「この関数のテストコードはどこ?」などと対話できる「qqbot」が登場しました。 開発したのはDan Robinson氏。 Introducing qqbot, a variant of ChatGPT that lives in your IDE. The cool thing about qqbot is that it k

                                    IDEにChatGPTを統合、「この関数のテストコードはどこ?」「XXXを実装するならどう書けばいい?」など、AIでコードと対話できる「qqbot」登場
                                  • 米OpenAI、サム・アルトマンCEOが退社へ 事実上の解任 - 日本経済新聞

                                    【シリコンバレー=中藤玲】生成AI(人工知能)「Chat(チャット)GPT」を手掛ける米新興オープンAIは17日、サム・アルトマン最高経営責任者(CEO)が退任すると発表した。現在、最高技術責任者(CTO)のミラ・ムラティ氏が暫定CEOに就く。新たなCEOの人選も進める。事実上の解任とみられ、アルトマン氏は退社する。同社は声明で、アルトマン氏の退任について「取締役会による審議プロセスを経たもの

                                      米OpenAI、サム・アルトマンCEOが退社へ 事実上の解任 - 日本経済新聞
                                    • お絵かきAI Disco Diffusionには解像度が上がる魔法の呪文があるらしい「入れるだけで自動的にこのクオリティ」

                                      リンク ゆるおた学習帳 イラスト自動生成AI「Disco Diffusion」に絵を描いてもらった - ゆるおた学習帳 絵を描いてくれるAI「Midjourney」をきっかけに、この世にはオープンソースのイラスト生成AIがあることを知りました。早速自分も試したい!と思ったのですが、今回の「Disco Diffusion」はイラスト生成まで少し難しかったので自分用備忘録です。 参考にさせていただいた記事はコチラ↓Get Started With Disco Diffusion to Create AI Generated Art イラスト自動生成AI「Disco Diffusion」の使い方 「Disco Diffusion 2 users リンク note(ノート) 魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)|note やればやるほど呪術化する、AI画像錬成につい

                                        お絵かきAI Disco Diffusionには解像度が上がる魔法の呪文があるらしい「入れるだけで自動的にこのクオリティ」
                                      • pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

                                        これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ

                                          pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama
                                        • 「視覴」の謎

                                          ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート(2023-06-08 08:51:02 JST)で知る。 すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。 映像・音声編集におけるノーマライズの重要性!(2023-05-11)「視覴的・聴覚的な一貫性」「視覴的な効果を最大化」「視覴的な混乱を避け」(2回)なお、このページは現在消えて視覴とは?AI(ChatGPT)が出力した新しい言葉なのか?(2023-06-08)にリダイレクトされ、「弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤

                                          • 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開

                                            株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 2023年1月18日 株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 ※音声コーパス: 音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右する。 ※2「ReazonSpeech」を用いた文字起こしサービスをプロジェクトwebサイトにて実際に試すことができます。 プロジェクトwebサイト:https://

                                              超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開
                                            • (数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門

                                              (数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理 複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ 概要: ChatGPT などで使われている Transformer モデルは、 ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。 本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。 実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、 その注釈版である The Annotated Transformer を参照のこと。 日本語では この解説 がわかり

                                              • サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―

                                                株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、最大68億パラメータの日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことをお知らせいたします。 近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。 一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および日本文化に強いLLMは少ない状況です。 ■最大68億パラメータの日本語LLM(大規模言語モデル)の公開について こうした背景のもと、当社は日本語LLMの開発に取り組んでおり、このたび一部モデルをHugging Face Hubにて公開いたしました。公開されたモデルはオープンな日本語データ※2で学習したもので

                                                  サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―
                                                • つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用

                                                  つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用 この本では、LangChain と Streamlit を用いて、ChatGPT APIを活用するAIアプリを開発していきます。つくりながら学ぶことを重視し、簡単なチャットアプリ開発から始めて、Embeddingを活用するアプリ開発まで、ステップバイステップで学べます。 AIアプリをローカル環境で開発した後は、WEB上にデプロイする方法も学びます。クラウドの知識もほぼ必要なく、ランニングコストも掛からない方法で行うため、ぜひ作ったアプリを公開することにチャレンジしてみましょう。 500円と設定していますが投げ銭用です。本文は全て無料で読めます。

                                                    つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用
                                                  • Stable Diffusionをいらすとやでファインチューニングする

                                                    巷で話題のStable Diffusion(以下SD)をファインチューニングする方法が公開されたので、早速やります。

                                                      Stable Diffusionをいらすとやでファインチューニングする
                                                    • 「ChatGPT」に浮かれる人が知らない恐ろしい未来

                                                      2022年11月の公開から瞬く間に大旋風を巻き起こしたAIチャットボット「ChatGPT」。その技術を自社の検索エンジン「Bing」に取り入れたマイクロソフトと、生成AIの進化に貢献した深層学習の手法「Transformer」を生んだグーグルによるAI競争も、熾烈さを増している。 一方で、こうした生成AIの回答には誤りも多く、社会にもたらす悪影響への懸念がくすぶる。このテクノロジーとどう向き合うべきなのか。国立情報学研究所 社会共有知研究センター長で、2011年にスタートした人工知能プロジェクト「ロボットは東大に入れるか」のプロジェクトディレクタを務めた新井紀子氏に聞いた。 ――ChatGPTやBingchatが続々と公開され、自然な受け答えを評価される一方、誤りの多さについて懸念も上がっています。 Transformerの登場以降、書き手が人か機械かの見分けがつかないほど、AIの生成する

                                                        「ChatGPT」に浮かれる人が知らない恐ろしい未来
                                                      • Google Colab で はじめる Stable Diffusion v1.4|npaka

                                                        2. ライセンスの確認以下のモデルカードにアクセスして、ライセンスを確認し、「Access Repository」を押し、「Hugging Face」にログインして(アカウントがない場合は作成)、同意します。 4. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハードウェアアクセラレータ」に「GPU」を選択。 (2) 「Stable Diffusion」のインストール。 # パッケージのインストール !pip install diffusers==0.3.0 transformers scipy ftfy(3) トークン変数の準備。 以下の「<HugginFace Hubのトークン>」の部分に、先程取得したHuggingFace Hubのトークンをコピー&ペーストします。 # トークン変数の準備 YOUR_TOKEN="<H

                                                          Google Colab で はじめる Stable Diffusion v1.4|npaka
                                                        • [速報]マイクロソフト、自然言語をプログラミング言語にAIで変換、新ノーコード機能をPower Appsに搭載。AI言語モデル「GPT-3」を採用。Microsoft Build 2021

                                                          [速報]マイクロソフト、自然言語をプログラミング言語にAIで変換、新ノーコード機能をPower Appsに搭載。AI言語モデル「GPT-3」を採用。Microsoft Build 2021 マイクロソフトは、オンラインで開催中の開発者向け年次イベント「Microsoft Build 2021」で、ローコード/ノーコード開発ツール「Power Apps」に、英語で説明すると自動的にその機能をプログラミング言語の「Power Fx」に変換してくれる新機能の搭載を発表しました。 Power FxはExcelの数式をベースにしたプログラミング言語で、今年の3月に発表されたばかりです。 参考:Excelの数式をベースにしたプログラミング言語「Microsoft Power Fx」登場。オープンソースで公開予定。Microsoft Ignite 2021 これによりプログラミングせずに、Power A

                                                            [速報]マイクロソフト、自然言語をプログラミング言語にAIで変換、新ノーコード機能をPower Appsに搭載。AI言語モデル「GPT-3」を採用。Microsoft Build 2021
                                                          • チャットできるAI、ChatGPTが「そこまですごくない」理由。見えてしまった限界

                                                            イーロン・マスクやマイクロソフトが出資するOpenAIが発表した、チャットできるAI「ChatGPT」が注目を集めている。公開からわずか6日目にして利用者が「100万ユーザを突破した」とサム・アルトマンCEOは公表した。 ChatGPT launched on wednesday. today it crossed 1 million users! — Sam Altman (@sama) December 5, 2022 すごいという気もするが、話題の割にあんまりという印象もある。 どんな質問にもそれっぽく答えてくれるのだが、同時にChatGPTを持ち上げすぎるのはいつものように危険だと、「AI」の研究・開発をしてきた経験から筆者は考える。

                                                              チャットできるAI、ChatGPTが「そこまですごくない」理由。見えてしまった限界
                                                            • 画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

                                                              0. 忙しい方へ 完全に畳み込みとさようならしてSoTA達成したよ Vision Transformerの重要なことは次の3つだよ 画像パッチを単語のように扱うよ アーキテクチャはTransformerのエンコーダー部分だよ 巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ 事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transformerの解説 Vision Transformer(=ViT)の重要な部分は次の3つです。 入力画像 アーキテクチャ 事前学習とファインチューニング それぞれについて見ていきましょう。 1.1 入力画像 まず入力画像についてです。ViTはTransformerをベースとしたモデル(というより一部を丸々使っている)ですが、

                                                                画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita
                                                              • 2023年、AIの影響で『絵に求められる事』が激変してきている話。|さいとう なおき|pixivFANBOX

                                                                クリエイターの創作活動を支えるファンコミュニティ「pixivFANBOX」

                                                                  2023年、AIの影響で『絵に求められる事』が激変してきている話。|さいとう なおき|pixivFANBOX
                                                                • データサイエンティストとして読んで役立った本たち@2020-07|だみ〜

                                                                  2016年10月に未経験・新人データサイエンティストで雇ってもらいました。当時はまだ業界が牧歌的だったのと、比較的書類上のスペックが高い若者だったのもあり、運良く拾ってもらえたのでした。今だと100%受かってないです。 そんな私が今までで読んだ本の中で、役に立った本をつらつら書いていきます。 現代の若者がどんどん優秀になっているので、これくらいでいまんとこいっぱしのデータサイエンティスト(@ビジネスサイド)になれるんだなあという基準を述べようかと思いました。何年か後に振り返りたいですね。 もちろん、これが誰かの学習の役に立てばと思っています。 ちなみに、アフィリエイト入れてないので気にせず買っていってください。 数学無難に解析学と線形代数学を勉強しておくといいと思っています。

                                                                    データサイエンティストとして読んで役立った本たち@2020-07|だみ〜
                                                                  • LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に | ニュース | LINE株式会社

                                                                    LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に 従来の特化型言語モデルとは異なる、汎用型言語モデルを実現予定。 処理インフラには世界でも有数の、700ペタフロップス以上の高性能スーパーコンピュータを活用 LINE株式会社(所在地:東京都新宿区、代表取締役社長:出澤剛)はNAVERと共同で、世界でも初めての、日本語に特化した超巨大言語モデル開発と、その処理に必要なインフラ構築についての取り組みを発表いたします。 超巨大言語モデル(膨大なデータから生成された汎用言語モデル)は、AIによる、より自然な言語処理・言語表現を可能にするものです。日本語に特化した超巨大言語モデル開発は、世界でも初めての試みとなります。 従来の言語モデルは、各ユースケース(Q&A、対話、等)に対して、自然言語処理エンジニアが個

                                                                      LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に | ニュース | LINE株式会社
                                                                    • 【2023年版】Stable Diffusion モデルまとめ | BLOG CAKE

                                                                      こんにちは、画像生成AIでひたすら猫のイラストを生成している じょじお(@jojio‗illust)です。 この記事にStable Diffusionのモデルをぼちぼちとまとめています。随時更新予定です。

                                                                        【2023年版】Stable Diffusion モデルまとめ | BLOG CAKE
                                                                      • ELYZA DIGEST

                                                                        ELYZA DIGEST

                                                                          ELYZA DIGEST
                                                                        • Googleを解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性

                                                                          Googleを解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性:Googleさん(1/2 ページ) 先週の金曜日、いつも巡回している米国のIT系メディアがいっせいに、GoogleのAI部門、Google AIのEthical Artificial Intelligence(倫理的AI)チーム共同リーダー、ティムニット・ゲブルさんがGoogleをクビになったと報じました。 ゲブルさんが2日の夜、自らのTwitterで、Googleがいきなり自分をクビにしたとツイートしたのです。 ゲブルさんは、AI研究分野では著名で尊敬されている研究者。黒人で女性。かつてMicrosoft Research在籍中、今の顔認識は学習データが白人男性の顔に偏っているので肌の色が白くないと認識率が下がるという有名な論文を共著で発表しました。著者名は覚えていなかったけれど、私もこの論文(の記事)は印

                                                                            Googleを解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性
                                                                          • AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|DTMステーション

                                                                            すでにご存じの方も多いと思いますが、2月22日にAIきりたんなるものが登場し、大騒ぎとなりました。正確にはSHACHI(@SHACHI_KRTN)さんという方が開発したNEUTRINOというAI歌声合成ソフトがフリーウェアで公開されるとともに、それで歌わせた楽曲が、くろ州さんなどによって公開され、話題になったのです。2月22日は、ちょうどMIDI 2.0の日米合意があった日で、そのドタバタでネットをチェックできておらず、私が気づいたのは24日になってから。その歌声を聴いて驚愕しました。 実際どんなものなのかと、さっそくNEUTRINOをダウンロードし、手元にあったMusicXMLデータを元に歌わせてみると、従来のVOCALOIDなどとは別次元の人間的な歌声で、東北きりたんが歌ってくれてさらに驚いたのです。どういうことなのか知りたいと思い、開発者のSHACHIさんに連絡してみたところ「種々の

                                                                              AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|DTMステーション
                                                                            • 東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講 松尾豊氏が講師を務める講座も | Ledge.ai

                                                                              TOP > Article Theme > AI(人工知能)ニュース > 東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講 松尾豊氏が講師を務める講座も 東京大学 松尾研究室は1月29日から、無料でディープラーニング(深層学習)や自然言語処理について学べる、短期間のオンライン講座の受講者を募集している。対象は学生(大学院、大学、高専、専門学校生、高校、中学など)。募集は2月8日(月)の10時00分まで。選考結果は2月15日(月)までに受講決定者にメールで連絡する。 今回、募集しているオンライン講座は「スプリングセミナー2021:深層強化学習」「プリングセミナー2021:深層生成モデル」「プリングセミナー2021:Deep Learning for NLP講座」の3つ。なお、人工知能(AI)研究の第一人者で、東京大学 松尾研究室を率いる松尾豊氏は企画・監修だけではなく、

                                                                                東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講 松尾豊氏が講師を務める講座も | Ledge.ai
                                                                              • 画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり

                                                                                画像生成AIでグラビアアイドルを作りたい。 でも実在する人と同じ顔が出たら困る。 そんなあなたに獣頭人身というソリューション。 AIでグラビアアイドルを作ったら 最近、画像生成AIでグラビアアイドルを作るのにハマっている。こういうやつだ。 カエル イカ サメ カマキリ Twitterで貼っていたらこれがバズる。 多少はウケるかなとは思っていたが、想像以上のバズりで驚いている。ネタとしては全く新しいものでもないし、色々と詰めの甘い部分も多い。それでも多くの人が興味を持ち、さらに画像生成AIネタなのに批判も少なかった。 だが、ツッコミが皆無というわけではない。その中にはもっともな内容もあるが、そもそも「目的が違う」と言いたいものもある。これはある意味で仕方ない。今回はTwitterでのバズなので、文脈が切り離された単体のツイートが広まっていくのだから。 なのでブログでまとめることにした。 そも

                                                                                  画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり
                                                                                • 「AIをどう習得したのか教えて」と大募集し、技術者から集まった記事49本を紹介

                                                                                  出典:日経クロステック、2020年2月7日 (記事は執筆時の情報に基づいており、現在では異なる場合があります) 日経 xTECH内に人工知能(AI)専門チャネル「ビジネスAI」を2019年10月に立ち上げたのを機に、知識共有サイト「Qiita」上でAI/機械学習の記事を同年12月に募集したところ、49本もの記事が集まった。投稿いただいた皆さん、ありがとうございました。 今回、ビジネスAIの編集担当として私が設定した「お題」は以下の3つ。各テーマについて日経 xTECHがQiitaアドベントカレンダーのスポンサーとなり、2019年12月1日~25日まで1日1本ずつ記事を募集した。 AI道場「Kaggle」への道 機械学習をどう学んだか 機械学習ツールを掘り下げる この結果、機械学習を独習するお薦めの書籍やサービス、Kaggleなどの機械学習コンペに入門する方法など、AIや機械学習に興味がある

                                                                                    「AIをどう習得したのか教えて」と大募集し、技術者から集まった記事49本を紹介