並び順

ブックマーク数

期間指定

  • から
  • まで

561 - 600 件 / 2906件

新着順 人気順

"Stable Diffusion"の検索結果561 - 600 件 / 2906件

  • 『ゼロから作る Deep Learning ❺』 公開レビューのお知らせ|斎藤 康毅(さいとう こうき)

    問題に感じた箇所や改善すべきと思った点など、コメントいただけますと幸いです。レビューに貢献していただいた方には、感謝の印として、本書に名前を記載させていただく予定です(もちろん、同意のある方のみです)。下記のように、レビューアの方の名前をクレジットとして掲載する予定です。 左は『ゼロから作るDeep Learning ❷』、右は中国語に翻訳された『Deep Learning 2』なお、本のタイトルに「❺」とありますが、前作までの知識がなくても読める内容になっています。前提条件としては、Pythonと数学の基本的な知識が必要になります。数式も多く登場します。ちなみに、本書の概要は次のとおりです。 人気シリーズの第5弾。今回のテーマは「生成モデル」です。本書では「正規分布」から「拡散モデル」に至るまでの技術を繋がりのあるストーリーとして展開します。読者は小さな学びを積み重ねながら、ステップバイ

      『ゼロから作る Deep Learning ❺』 公開レビューのお知らせ|斎藤 康毅(さいとう こうき)
    • Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表

      英Stability AIは4月17日(現地時間)、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。 Stable Diffusion 3に「Awesome artwork of a wizard on the top of a mountain, he's creating the big text "Stable Diffusion 3 API" with magic, magic text, at dawn, sunrise.」(夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に

        Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
      • Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models | Amazon Web Services

        AWS News Blog Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models Update October 10, 2023 — Amazon Bedrock is now available in 3 regions globally: US East (N. Virginia), US West (Oregon), and Asia Pacific (Tokyo). This April, we announced Amazon Bedrock as part of a set of new tools for building with generative AI on AWS. Amazon Bedrock is

          Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models | Amazon Web Services
        • アサヒビール、「Stable Diffusion」によるオリジナルAIアート画像が作成できる新サービスを発表/生成AIを新商品「スーパードライ ドライクリスタル」のプロモに活用

            アサヒビール、「Stable Diffusion」によるオリジナルAIアート画像が作成できる新サービスを発表/生成AIを新商品「スーパードライ ドライクリスタル」のプロモに活用
          • AIイラストの「AIっぽさ」を少しでも改善するためのテクニックまとめ【Stable Diffusion】

            それぞれ詳しく見ていきましょう。 原因1:いわゆる「マスピ顔」をしている まず一番にして最大の原因は、イラストのキャラクターが「マスピ顔」をしていることだと思います。マスピ顔というのは「マスターピース顔」の略で、例えば下記のイラストのようなAIイラストに典型的な顔立ちのことを言います。 使うモデルによって顔立ちに違いはあるものの、人気のモデルを使っている場合はよく上記のような顔立ちになります。なので見る人が見たら「あ~、これはAI製だな」ってすぐに判別できます。 …まあこれはこれで綺麗でかわいい顔立ちですから、決してマスピ顔を否定するわけではありません。しかしどのイラストも似たような顔立ちだとさすがに飽きてしまいます。 正直この辺は何とかしたいところですが、「こういう顔立ちがいいんだな」と学習しているモデルを使う限りはマスピ顔になるのは避けられないかもしれません。これは解決が難しい問題です

              AIイラストの「AIっぽさ」を少しでも改善するためのテクニックまとめ【Stable Diffusion】
            • 線画から疑似3D画像を出力するアプリ『Line2Normalmap』&それをライティングするアプリ『NormalmapLighting』公開!|とりにく

              2024/04/06フリー公開しました!!! 新しいアプリを作ったので機能の紹介です。こちらのアプリは現在(2024/4/3時点)でfanboxのみで公開(ソースコード自体はgithubで公開)しています。 3日後の2024/04/06にはフリー公開しますので、それまでお待ちください。 【DL先】https://drive.google.com/file/d/1_LPHAFgs4lzDYGdZmv23aVDiTMnV9Y3t/view?usp=sharing ファンボックスで支援者様にのみ先行公開しています! 【モデル開発協力者様】月須和・那々 (2vXpSwA7)様 【必要スペック】理論上、CUDAに対応したGPU搭載PCなら動きます。 むしろどのスペックなら動くのか教えてください。 自分の環境だと、ゲーミングノートPC AMD Ryzen 7 5800HS 16GB 512GB RTX

                線画から疑似3D画像を出力するアプリ『Line2Normalmap』&それをライティングするアプリ『NormalmapLighting』公開!|とりにく
              • 画像や文章の生成などを行う「ジェネレーティブAI」はなぜ急に発展したのか?

                文章(プロンプト)を入力するだけで高精度な画像を生成できる「Stable Diffusion」や対話形式で高精度な文章を作成する「ChatGPT」などのいわゆる「ジェネレーティブAI」がしばしば話題になっています。近年急速に発展したように見えるジェネレーティブAIはどのような仕組みで、なぜ急速に広まっているのか、投資家・起業家のハオミャオ・ファン氏が解説しています。 I got interested in how Generative AI actually works, and where the tech came from, so I wrote an article about it. Tl;dr - we are at another of those inflection points where model+data+compute come together to make

                  画像や文章の生成などを行う「ジェネレーティブAI」はなぜ急に発展したのか?
                • 【Ubuntu日和】 【第25回】Stable DiffusionをUbuntuとGTX 1650で動作させる方法

                    【Ubuntu日和】 【第25回】Stable DiffusionをUbuntuとGTX 1650で動作させる方法
                  • 画像生成AI「Stable Diffusion」をKritaで使えるようにするオープンソースのプラグイン登場

                    オープンソースのペイントソフト「Krita」で、テキストや画像から自動で画像を生成することができる話題のAI「Stable Diffusion」を利用できるようになるプラグインが複数登場しています。 Stable Diffusionは、入力したテキストに沿って画像を生成する「text2img」や、大まかな線画のようなラフな画像からでも精細な画像を生成することができる「img2img」で、画像生成が可能なAIです。Stable Diffusionはウェブ上で使えるデモ版が存在するだけでなく、Creative ML OpenRAIL-Mライセンスの下で配布されているものをローカル環境で実行することも可能。実際にStable Diffusionを使う方法はさまざまあるのですが、低スペックPCでも無料かつ待ち時間なしで使う方法が以下の記事の通り。 画像生成AI「Stable Diffusion」を

                      画像生成AI「Stable Diffusion」をKritaで使えるようにするオープンソースのプラグイン登場
                    • ジム・ケラーのAIチップ企業「Tenstorrent」がAI推論に特化したPCIe拡張カード「Grayskull e75」と「Grayskull e150」をリリース&日本のLSTCやRapidusとの協力も発表

                      RyzenのZenアーキテクチャやiPhone向けSoCの設計に携わったアーキテクトのジム・ケラー氏がCEOを務めるAIスタートアップのTenstorrentが、2024年3月5日にAI推論に特化したPCIe拡張カード「Grayskull e75」と「Grayskull e150」を発表しました。 Cards - Tenstorrent https://tenstorrent.com/cards/ Today we are officially launching our Grayskull Dev Kit, available for purchase on our website. This is our 1st gen AI PCIe card - an inference-only hardware kit we are releasing alongside TT-Metalli

                        ジム・ケラーのAIチップ企業「Tenstorrent」がAI推論に特化したPCIe拡張カード「Grayskull e75」と「Grayskull e150」をリリース&日本のLSTCやRapidusとの協力も発表
                      • Stable Diffusion を Colab で Web アプリ化する - 詩と創作・思索のひろば

                        Stable Diffusion が来てるねってことで貧者の GPU であるところの Colaboratory でいろいろ試したいのだけどノートブック上で Python のコードをこまごまいじりながら試行錯誤するのは微妙に体験が悪い。 ちょっとしたウェブサービスとして立てて実行できるとよいけれど、なかなかクラウドサービスも帯に短し襷に長しという感じで GPU を気軽に借りられるところはなさそうだ……と思ったら、Colab 上に HTTP サーバを立てられることを知ったので、その方法でやってみることにする。 やってみたソースは以下。 GitHub - motemen/stablediffusion-server-on-colab README にあるノートブックを開いて Huggingface のトークンを埋め、GPU を選択して実行するとサーバが起動する。サーバが起動する前のセルに表示され

                          Stable Diffusion を Colab で Web アプリ化する - 詩と創作・思索のひろば
                        • NovelAIの所感と生成物を見分ける方法|大江戸ウメコ

                          AIイラストを自分が描いたと偽って販売する人間がちらほら出てきたと聞いたので、イラストを依頼することがある側の人間として、AIイラストの特徴と見分け方は知っておきたいなと思い、記事を描きました。 NovelAIについては、正直かなり思うところがあるのですが、それでも、まず自分の手で一度試してみないことには分からん! と思ったので、1ヶ月だけ試してみることにしました。 NovelAIについて従来のStable Diffusion との違い 二次元イラストに特化されている印象です。 あと、絵柄を安定させるための独自の補正が強いなと感じました。 特に細かくプロンプト指定しなくても、信じられないくらい安定した二次イラストができます。 ただ、上記を見ていただいても分かるようにimgによる指定やプロンプトによる指定が効きづらいです。 たとえば、同じStrengthでも1.4では緑のスーツを着た金髪にな

                            NovelAIの所感と生成物を見分ける方法|大江戸ウメコ
                          • 画像生成AI「Stable Diffusion web UI(AUTOMATIC1111版)」で元画像と似た構図や色彩の画像を自動生成したり指定した一部だけ変更できる「img2img」の簡単な使い方まとめ

                            画像生成AI・Stable Diffusionを手軽にWindows環境あるいはGoogle Colabに導入でき、コマンドラインではなくユーザーインターフェース(UI)から簡単に操作可能な「AUTOMATIC1111版Stable Diffusion web UI」は他のUIには搭載されていない機能も盛り込まれた決定版とも言えるツールです。毎日驚くべきスピードでアップデートが行われ改善が進むAUTOMATIC1111版Stable Diffusion web UIで、入力した画像から新しい画像を生成できる「img2img」を実際にAUTOMATIC1111版Stable Diffusion web UIで使う方法をまとめてみました。 GitHub - AUTOMATIC1111/stable-diffusion-webui-feature-showcase: Feature showca

                              画像生成AI「Stable Diffusion web UI(AUTOMATIC1111版)」で元画像と似た構図や色彩の画像を自動生成したり指定した一部だけ変更できる「img2img」の簡単な使い方まとめ
                            • Stability AIがChatGPTと同等の性能を持つオープンソースの大規模言語モデル「FreeWilly」を公開

                              画像生成AI「Stable Diffusion」などの開発で知られるStability AIが、ChatGPTに使用される大規模言語モデルの「GPT-3.5」に匹敵する性能の大規模言語モデル「FreeWilly1」と「FreeWilly2」を公開しました。 Meet FreeWilly, Our Large And Mighty Instruction Fine-Tuned Models — Stability AI https://stability.ai/blog/freewilly-large-instruction-fine-tuned-models stabilityai/FreeWilly1-Delta-SafeTensor · Hugging Face https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor

                                Stability AIがChatGPTと同等の性能を持つオープンソースの大規模言語モデル「FreeWilly」を公開
                              • 文章で指示するだけで音楽を作れる音楽生成AI「Stable Audio 2.0」が登場したので使ってみた

                                画像生成AI「Stable Diffusion」の開発元として知られるStability AIが音楽生成AI 「Stable Audio 2.0」を公開しました。すでに日本からも利用可能になっていたので、実際にStable Audio 2.0を使って音楽を生成する手順をまとめてみました。 Stable Audio 2.0 のご紹介 — Stability AI Japan https://ja.stability.ai/blog/stable-audio-20 ◆Stable Audio 2.0で作れる音楽の例 Stable Audio 2.0はテキストで指示するだけで音楽を生成できるAIです。以下のムービーを再生すると、「Cinematic Synthwave(映画風のシンセウェイヴ)」というプロンプトで生成した音楽の例を聴けます。 Stable Audio 2.0 - YouTube

                                  文章で指示するだけで音楽を作れる音楽生成AI「Stable Audio 2.0」が登場したので使ってみた
                                • NovelAI、“リークモデル”に「法的措置を取る可能性」 SNSで方針明かす

                                  画像生成AIサービス「NovelAI Diffusion」(NovelAI)を提供する米Anlatanは6月23日、流出した同社のAIモデルや、それを改変したモデルの利用について、公式Twitterアカウントで注意喚起した。「リークモデルを見かけた場合、法的措置を取る場合もある」(同社)という。 NovelAIは、高品質な二次元イラストの生成に特化したサービス。22年10月の公開時、「二次元の美少女に強い」「とんでもなくハイクオリティー」などと話題になった。 しかし開発元のAnlatanは、同月に不正アクセスを受け「独自のソフトウェアとソースコードが流出した」と発表。ネット上では、同時期からNovelAIのものとみられるAIモデルや、それを改変した“NAIリークモデル”が数多く流通するようになった。 画像生成AIのコミュニティーでも、NovelAIで使用していたモデルデータが漏えいしたので

                                    NovelAI、“リークモデル”に「法的措置を取る可能性」 SNSで方針明かす
                                  • チャットAI「StableLM」発表 オープンソースモデルで商用可 「Stable Diffusion」開発元から

                                    英Stability AIは4月19日(英国時間)、オープンソースの大規模言語モデル「StableLM」を発表した。α版として30億と70億パラメータの2モデルを公開。今後150億パラメータから650億パラメータのモデルも公開予定としている。ライセンスはCC BY-SA-4.0で、商用や研究目的で自由に利用できるとしている。 現状で対応しているのは英語のみ。できることとしてはチャット、フォーマルな文書作成、創作、プログラミングコードの提示などを例に挙げている。 サービスではなくローカルで実行可能なモデルとして公開しているが、AI関連のコミュニティーWebサイト「HuggingFace」上でチャットを試すこともできる。 ローカル実行環境の要件について言及は見つからないが、米Googleの機械学習向けクラウド実行環境「Google Colaboratory」で実行できるサンプルも用意されている

                                      チャットAI「StableLM」発表 オープンソースモデルで商用可 「Stable Diffusion」開発元から
                                    • AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能

                                      2023年4月にアナウンスされていた生成AIをAWSで使えるようにするツール「Amazon Bedrock」が2023年9月28日に正式リリースされ、一般ユーザーへの提供が開始されました。 基盤モデル API サービス – Amazon Bedrock – AWS https://aws.amazon.com/jp/bedrock/ Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models | AWS News Blog https://aws.amazon.com/jp/blogs/aws/amazon-bedrock-is-now-generally-available-build-and-scale-generative-a

                                        AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能
                                      • 【Ubuntu日和】 【第42回】RadeonだってStable Diffusionは高速だ。そう、Ubuntuならね

                                          【Ubuntu日和】 【第42回】RadeonだってStable Diffusionは高速だ。そう、Ubuntuならね
                                        • rinna、日英バイリンガル大規模言語モデルをオープンソースで公開|rinna株式会社

                                          rinna株式会社(本社:東京都渋谷区/代表取締役:ジャン"クリフ"チェン、以下rinna)は、日本語と英語のバイリンガル大規模言語モデルを開発し、商用利用可能なライセンス*1でオープンソースとして公開したことを発表します。さらに、対話形式のテキストを生成する対話言語モデル*1、テキストと画像のマルチモーダル入力を実現する画像対話モデル、長いテキストの入力を可能とする長期コンテキスト言語モデルも開発し、公開しました。 ■ rinnaのオープンソース活動 OpenAI社から提案された大規模言語モデル (Large Language Model; LLM) であるGPT (Generative Pre-trained Transformer) シリーズは、大量のデータから高速かつ高精度に大規模モデルが学習できるTransformerとテキストデータから自己教師あり学習を可能とする枠組みを採用し

                                            rinna、日英バイリンガル大規模言語モデルをオープンソースで公開|rinna株式会社
                                          • 和製生成AIをサイバーエージェントが作る理由。“無償公開の狙い”をAI開発チームに聞く

                                            サイバーエージェントが突如、オープンソースとして無償公開した大規模言語モデル(LLM)「OpenCALM(オープンカーム)」が話題を呼んでいる。 国内の大手IT企業が、研究、商用など目的を問わず使用できる大規模言語モデルを公開するのは非常に珍しい試みだからだ。 今、国内の生成AI業界では、日本を軸にした新たな動きが活発化している。 サイバーエージェントと同日の5月17日にrinna社からも独自のLLMがオープンソースで登場したり、22日には東京工業大学と富士通などが2023年度中にスーパーコンピューター「富岳」を使い、和製生成AIを開発すると公表した。 なぜサイバーエージェントがLLMを作り、オープンソース化したのか。その狙いをAI事業本部の開発チームに聞いた。 —— 5月17日の発表を見て、少なからず「なぜサイバーエージェントからLLMを?」と考えた人もいそうです。大規模言語モデルを自社

                                              和製生成AIをサイバーエージェントが作る理由。“無償公開の狙い”をAI開発チームに聞く
                                            • Microsoft創業者のビル・ゲイツが「AIはグラフィカルユーザーインターフェース以来の革命的な進歩」だと語る

                                              by Chris Boland Microsoftの創業者であり慈善団体のビル&メリンダ・ゲイツ財団の活動に携わっているビル・ゲイツ氏が、「The Age of AI has begun(AIの時代が始まった)」と題したブログを公開しました。ゲイツ氏はブログの中で、AIはグラフィカルユーザーインターフェース(GUI)以来の革命的なテクノロジーの進歩であり、慈善活動にも役立てられる可能性があると主張しています。 The Age of AI has begun | Bill Gates https://www.gatesnotes.com/The-Age-of-AI-Has-Begun The development of AI is as fundamental as the creation of the microprocessor, the personal computer, the

                                                Microsoft創業者のビル・ゲイツが「AIはグラフィカルユーザーインターフェース以来の革命的な進歩」だと語る
                                              • Adobe、画像生成AIを開発へ 倫理や法律面で“透明性”高めたクリエイターのためのツール目指す

                                                米Adobeは10月19日(現地時間)、クリエイター本位の画像生成AIを開発すると発表した。同社は「クリエイターとその作品を尊重した、責任ある画像生成AIの開発と利用における標準を定義する」と説明。倫理や法律面などで透明性を持つ画像生成AIツール開発し、クリエイターが正当な利益を得られる仕組みの構築を目指す。 Adobeは「近年、画像生成AIは実用性を高め、クリエイターのアイデア出しやバリエーション検討の方法に変革を起こした」と説明する。一方、未成熟な技術のため、倫理や法律などで懸念があるとも言及。今後画像生成AIが普及することでクリエイターは“この作品は人間が作ったものである”と証明する必要があると警鐘を鳴らしている。 Adobeは2019年にコンテンツ認証イニシアチブ(Content Authenticity Initiative:CAI)を設立し、オンライン上の誤報や偽情報の氾濫を防

                                                  Adobe、画像生成AIを開発へ 倫理や法律面で“透明性”高めたクリエイターのためのツール目指す
                                                • AIによる画像生成を30倍高速化する手法をマサチューセッツ工科大学が開発

                                                  DALL-E 3やStable Diffusionといった人気の画像生成AIの拡散モデルを簡素化し、生成される画像の品質を維持しつつ生成スピードを最大で30倍加速させる技術を、アメリカ・マサチューセッツ工科大学(MIT)の研究チームが公開しました。 [2311.18828] One-step Diffusion with Distribution Matching Distillation https://arxiv.org/abs/2311.18828 AI generates high-quality images 30 times faster in a single step | MIT News | Massachusetts Institute of Technology https://news.mit.edu/2024/ai-generates-high-quality-i

                                                    AIによる画像生成を30倍高速化する手法をマサチューセッツ工科大学が開発
                                                  • チャットAI、うちもやります。Stable Diffusion開発元が語る、ジェネレーティブAIと「Stable Chat」の未来 | テクノエッジ TechnoEdge

                                                      チャットAI、うちもやります。Stable Diffusion開発元が語る、ジェネレーティブAIと「Stable Chat」の未来 | テクノエッジ TechnoEdge
                                                    • 【やじうまPC Watch】 Stable DiffusionでQRコードが機能する「絵」を生成

                                                        【やじうまPC Watch】 Stable DiffusionでQRコードが機能する「絵」を生成
                                                      • Stable Diffusionの最新モデル「SDXL 1.0」と過去モデルの生成画像をひたすら比較して進化を実感してみた - Qiita

                                                        Stable Diffusionの最新モデル「SDXL 1.0」と過去モデルの生成画像をひたすら比較して進化を実感してみたPythonPython3StableDiffusion Supershipの名畑です。週刊少年ジャンプ34号に掲載された小園江ナツキ先生の読切漫画「殺陣ロール」好きです。 はじめに 7月27日についにStable Diffusionの新モデルSDXLの1.0がリリースされました。当初の予定よりは遅れたものの、0.9がリリースされた6月23日から1月程度での高速リリースです。 SDXL 0.9の際に「Stable Diffusionの最新モデルSDXL 0.9と過去モデルで生成画像を比較してみた」という記事でStable Diffusionにおける生成画像の変遷をまとめましたが、今回もSDXL 1.0でどのように変わったのかを記録に残します。 画像の生成はPythonで

                                                          Stable Diffusionの最新モデル「SDXL 1.0」と過去モデルの生成画像をひたすら比較して進化を実感してみた - Qiita
                                                        • Blenderで画像生成AI「Stable Diffusion」が使える無料アドオン

                                                            Blenderで画像生成AI「Stable Diffusion」が使える無料アドオン
                                                          • 【西川和久の不定期コラム】 PhotoshopとStable Diffusionで生成AI対決。ジェネレーティブ塗りつぶしを試してみた

                                                              【西川和久の不定期コラム】 PhotoshopとStable Diffusionで生成AI対決。ジェネレーティブ塗りつぶしを試してみた
                                                            • ネットワークプログラミングの練習にインターネット自由協会の電子公告表示プログラムを作ろう - きしだのHatena

                                                              登さんがインターネット自由協会の電子公告をTELNETで公開されていました。 TELNETであれば簡単に内容を見れるので、誰でも見れることを目指すべき電子公告には適していますね! 登さんがこういうツイートをされていました。 最近の法務局登記官のインターネット・リテラシは、極めて高くなってきたようだ。インターネットにおける Telnet の歴史的重要性を、理解されている。大変に素晴らしいことなのである。 pic.twitter.com/WUN4nC48oZ— Daiyuu Nobori (登 大遊) (@dnobori) 2023年9月4日 TELNETを使う理由のひとつに次のようなことがあげられています。 HTTP を用いて電子公告を公開していると、外国人の意志ひとつで、突然日本人の電子公告を閲覧者が事 実上閲覧できない状態になってしまうリスクがあります。他方、TELNET プロトコルは、

                                                                ネットワークプログラミングの練習にインターネット自由協会の電子公告表示プログラムを作ろう - きしだのHatena
                                                              • 生成AIで3D化して整形。ローカルでも超高速で3Dデータ生成できる「TripoSR」を試す | テクノエッジ TechnoEdge

                                                                今回は同じくStablity AIが、独自の3D生成サービスを提供してきたTripo AIと共同開発した「TripoSR」を紹介します。 低品質ながら圧倒的に高速TripoSRは「Large Reconstruction Model」という3D生成の手法を実装したもので、特徴はその速度にあります。筆者がテストしている環境はWindowsのRTX 4060 Ti 16GBと、ゲーム向けのビデオカードでもあまり高速ではありませんが、10~30秒程度で1枚の画像から3Dデータが生成できます。CUIを使えばVRAMも8GBに収まるため、多くのローカル環境でかなり手軽に3Dデータの生成が行えます。 ただし生成される3Dデータの品質は高くなく、そのままゲームやXRに利用できるものではありません。CSMやTripoといった商用サービスに比べれば形状もテクスチャも不正な結果が多く、がっかりするかもしれませ

                                                                  生成AIで3D化して整形。ローカルでも超高速で3Dデータ生成できる「TripoSR」を試す | テクノエッジ TechnoEdge
                                                                • 「誰もが思いのまま創作を」“画像生成AI”が描く未来 無料公開した企業テレビ初取材

                                                                  言葉から画像を作り出す『画像生成AI』を発表し、世界を席巻している企業に、日本のテレビとして初めて独占取材しました。 画像生成AIとは、キーワードを打ち込むと、大量の画像と言葉を結びつけて学習したAIが、そのイメージにあった画像を作り出してくれるものです。 そんな画像生成AIのなかで、いまや世界で100万人が利用する大人気のAIが『Stable Diffusion』です。 今まで大手IT企業は、こうした高性能なAIを企業秘密として厳密に管理してきましたが、Stable Diffusionを開発した企業『Stability AI社』は全世界に無料で公開しました。 高性能なAIをタダで使えるということで、人気は爆発的に広まり、公開からわずか2カ月たった先月、150億円の出資を受けました。 AI界の常識を破り続ける企業を率いる社長とは、一体どんな人なのでしょうか。 イギリス・ロンドンの街角にある

                                                                    「誰もが思いのまま創作を」“画像生成AI”が描く未来 無料公開した企業テレビ初取材
                                                                  • 生成AIに取り組む全事業者が見るべき「State of AI 2023レポート」解説|梶谷健人 / Kent Kajitani

                                                                    AdeptやWayveなどに投資するAI特化のベンチャーキャピタル「Air Street Capital」が160ページ以上に渡って、AIの現状をまとめたレポート、「State of AI」の2023年版が、2023年10月12日に公開された。 このレポートには今押さえておくべき生成AI市場や技術の状況が豊富な事例やデータとともにまとまっており、生成AIに事業として取り組む関係者は一度は目を通すべき内容になっている。 とはいえボリューミーなレポートを読む時間をなかなか確保できないという方も多いだろう。本記事では、そんな方々向けに特に興味深いスライドをピックアップして紹介していく。 State of AIについてこのレポートは、英国のAIに特化したベンチャーキャピタル「Air Street Capital」が2018年から毎年発行している、AIの現状を、豊富な統計データとともに網羅的にまとめ

                                                                      生成AIに取り組む全事業者が見るべき「State of AI 2023レポート」解説|梶谷健人 / Kent Kajitani
                                                                    • Stable Diffusionなどの画像生成AIが出力する画像に電子透かしを埋め込んで追跡可能にする技術「Tree-Ring Watermarks」が提案される

                                                                      「画像に透かしを入れる」と聞くと、人間が制作したコンテンツの転載や悪用を防ぐためのものだと認識している人が多いかもしれませんが、近年はAIが生成したコンテンツに透かしを入れて帰属を示す試みも進行中です。新たに、AIが生成した画像を追跡可能にする「Tree-Ring Watermarks(年輪透かし)」という技術を、メリーランド大学の博士課程でコンピューターサイエンスを研究しているユーシン・ウェン氏らが発表しました。 [2305.20030] Tree-Ring Watermarks: Fingerprints for Diffusion Images that are Invisible and Robust https://arxiv.org/abs/2305.20030 GitHub - YuxinWenRick/tree-ring-watermark https://github.c

                                                                        Stable Diffusionなどの画像生成AIが出力する画像に電子透かしを埋め込んで追跡可能にする技術「Tree-Ring Watermarks」が提案される
                                                                      • 画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言(第1版)

                                                                        背景 近年、人工知能(AI)は加速度的に進化を続け、ノイズから画像を生成する拡散モデルの開発と、それを基盤技術とする画像生成AIモデルであるStable Diffusionの登場により、画像生成AIの一般における使用が爆発的に広がった。一方、このような新しい技術の使用に関する適切なガイドラインや法制度は未成熟であり、様々な問題が生じている。 具体的には、①特定のイラストレーター等創作者の著作物を、他者が著作者に無断で画像生成AIに学習させ、その創作者の制作物の特徴を模倣した画像及びそれを生成できる学習済みAIモデルを公開する1)、又は、②他者が無断で著作物を画像生成AIで直接的に改変し、異なる著作物のように公開する2)といった行為が後を絶たない。Stable Diffusionや派生する画像生成AIモデルが使用した学習用データには無断転載が問題視される画像投稿サイトであるDanbooruの

                                                                          画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言(第1版)
                                                                        • 【Stable Diffusion】negative_handを使った綺麗な手

                                                                          「手を綺麗に表示したい!!」 「Negative Embeddingを使うと、スタイルが大きく変わってしまう・・・」 このような場合には、negative_handがオススメです。 この記事では、negative_handについて解説しています。 本記事の内容 negative_handとは?negative_handの利用方法negative_handの動作検証 それでは、上記に沿って解説していきます。 negative_handとは? negative_handとは、手を綺麗に表示するNegative Embeddingです。 ネガティブプロンプトに設定することで利用します。 手を綺麗に表示するNegative Embeddingと言えば、以下が人気です。 bad-hands-5badhandv4bad_prompt(bad_prompt_version2) これらは、みなさんもインス

                                                                            【Stable Diffusion】negative_handを使った綺麗な手
                                                                          • 数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                                            2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第13回目は、画像生成AIを高品質にする手法、画像と文章を中間言語を用いずに入出力するモデルなど5つの論文をまとめました。 生成AI論文ピックアップ数行のコード追加でStable Diffusionなどの生成画像を高品質にする手法「FreeU」 大規模言語モデルのトークンを効率よく増やす手法「LongLoRA」 Llama2を10万トークンに 2.6兆トークンで訓練された、130億のパラメータを持つ多言語モデル「Baichuan 2」 スマホで物体検出をリアルタイムかつ高精度で行う新モデル「Gold-YOLO」 画像と文章を“そのまま”入出力できる生成モデル「Drea

                                                                              数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                                                            • 自分のイラストや写真を画像生成AIが学習するのを妨害する電子透かしを入れるツール「Mist」

                                                                              Stable DiffusionやMidjourneyなどの画像生成AIはデータセットの画像から学習していますが、このデータセットに含まれる画像の著作権については議論があり、「自分のイラストや写真をAIに学習されたくない」という人も多くいます。上海交通大学の研究チームが発表した「Mist」は画像に見えない透かしを入れることで、AIによって画像を認識できなくさせ、学習を防ぐ処理ツールです。 Mist https://mist-project.github.io/index_en.html [2302.04578] Adversarial Example Does Good: Preventing Painting Imitation from Diffusion Models via Adversarial Examples https://doi.org/10.48550/arXiv.23

                                                                                自分のイラストや写真を画像生成AIが学習するのを妨害する電子透かしを入れるツール「Mist」
                                                                              • 【簡単】ローカル環境でStable Diffusionを実行する方法

                                                                                「精度の高いAIアートをPythonで試したい」 「GoogleのColaboratoryではなく、ローカル環境でStable Diffusionを動かしたい」 このような場合には、この記事の内容が参考になります。 この記事では、ローカル環境で簡単にStable Diffusionを実行する方法を解説しています。 本記事の内容 Stable Diffusionとは?Stable DiffusionをDiffusersで利用する方法学習済みモデルのダウンロード【動作確認】テキストからの画像生成 それでは、上記に沿って解説していきます。 Stable Diffusionとは? Stable Diffusionとは、オープンソース化された高性能画像生成AIです。 Stable Diffusionを用いると、テキストから画像を出力することが可能となっています。 例えば、「Cyberpunk old

                                                                                  【簡単】ローカル環境でStable Diffusionを実行する方法
                                                                                • アーティストの作品でAI訓練 「無断で複製された」米国で集団提訴(朝日新聞デジタル) - Yahoo!ニュース

                                                                                  アーティストのカーラ・オルティスさん。女神のような女性の絵(右)をまねた多くの画像がネット上で見つかったという=2023年3月20日、サンフランシスコ、五十嵐大介撮影 対話型AI(人工知能)「ChatGPT(チャットGPT)」など生成AIの開発と利用が急速に進むなか、AIの訓練に使われるデータの著作権をめぐり、アーティストらが提訴に乗り出した。判決次第では、企業のAI開発や、音楽など他の創作活動に関わるデータの扱いにも影響する可能性がある。 【写真】生成AIでアーティストが失業するのは「まだ始まり」。シカゴ大教授がみる生成AIの課題とは? 文章や画像を作り出す生成AIの普及で著作権が問題になるのは、最新AIを訓練するにあたり、すでにネット上にある画像や文章など膨大なデータを集める必要があるためだ。 米サンフランシスコに住むアーティスト、カーラ・オルティスさんは1月、仲間のアーティスト2人と

                                                                                    アーティストの作品でAI訓練 「無断で複製された」米国で集団提訴(朝日新聞デジタル) - Yahoo!ニュース