並び順

ブックマーク数

期間指定

  • から
  • まで

521 - 560 件 / 2906件

新着順 人気順

"Stable Diffusion"の検索結果521 - 560 件 / 2906件

  • DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事

    1.DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事まとめ ・拡散モデルは画像に加えたノイズを除去して元画像を復元する事を学習をする ・学習済モデルは純粋なノイズから画像を復元できるようになりこれが画像生成 ・学習時のノイズはガウスノイズの必要があると思われていたがそうではなかった 2.拡散モデルの動作原理とは? 以下、twitterのTom Goldstein(@tomgoldsteincs)さんの拡散モデルの動作原理に関する投稿の意訳です。昨日の調査をしている際に見つけた一連のtweetでわかりやすくとても興味深い解説でした。 アイキャッチ画像はstable diffusion #DALLEや#StableDiffusionのような拡散モデルは画像生成の最先端ですが、それらがどのようにして動作しているかの理解はまだ始まったばかりです。このスレッ

      DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事
    • 画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します (1/3)

      前回の記事では、StabilityAIの最新画像生成モデルStable Diffusion XL(SDXL)を簡単に使えるWebインターフェース「Fooocus」を紹介した。 画像生成AIの制御技術「ControlNet」でも知られる作者lllyasviel(Lvmin Zhang)氏の開発ペースはとても早い。前回の記事掲載後にも多くの便利な新機能が実装されたため、今回はこれらを紹介する。 「Fooocus」のインストール方法は前回記事を参照。一度インストールすればアップデートは起動時に自動でかかるため、利用者が意識することはない。 アップデートの内容についてはGitHub内のDiscussionsページを参照しよう。

        画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します (1/3)
      • キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた

        ロンドンとカリフォルニアを拠点とするスタートアップ・Stability AIが、まるで人間のアーティストが描いたような高クオリティの画像を生み出せる画像生成AI「Stable Diffusion」を一般公開しました。モデルはCreative ML OpenRAIL-Mライセンスの下でリリースされており、商用での利用も許可されています。 Stable Diffusion Public Release — Stability.Ai https://stability.ai/blog/stable-diffusion-public-release CompVis/stable-diffusion · Hugging Face https://huggingface.co/CompVis/stable-diffusion Stable Diffusionの公開デモンストレーションには以下のページで

          キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた
        • CPUだけで画像生成AI「Stable Diffusion」を動かせる環境をWindowsへ簡単にインストールできる「Stable Diffusion UI」を使ってみた

          2022年8月に一般公開された画像生成AIの「Stable Diffusion」はNVIDIA製GPUで計算を行うように設計されており、求められるマシンスペックも高いため、ローカル環境で行うには少し敷居が高いところがあります。プログラマーのcmdr2氏が開発した「Stable Diffusion UI」は誰でも簡単にStable Diffusionをローカル環境に導入可能な上に、GPUの代わりにCPUを使って処理を行うことができるので、高性能なGPUを積んでいないマシンでも画像を生成することが可能です。 GitHub - cmdr2/stable-diffusion-ui: A simple 1-click way to install and use Stable Diffusion on your own computer. Provides a browser UI for gene

            CPUだけで画像生成AI「Stable Diffusion」を動かせる環境をWindowsへ簡単にインストールできる「Stable Diffusion UI」を使ってみた
          • ゼロから始めるPaperspace Gradient【Google Colab代替サービス】 - Qiita

            はじめに こんにちは、kunishouです。先月2022年9月の末にGoogle Colabがサービス内容の大幅な変更を実施し、従来は無制限でGPUを使用できていたものが、クレジット制に移行しました。この変更を受けてこれまでGoogle Colabを利用してKaggleに取り組んできたり、Stable Diffusionなどでイラスト自動生成の実験をしてきた多くの方々から悲痛な声が聞こえてきました。そこで、本記事では 『Paperspace Gradient』というGoogle Colabに類似したクラウドGPU開発環境を定額で利用できるサービス を見つけたので、このサービスの詳細や使い方、使ってみた感想を紹介したいと思います。また、Paperspace Gradientはストレージ容量が少ない(Growthプランで50GB)という欠点がありますが、これをカバーする手段として インスタンス

              ゼロから始めるPaperspace Gradient【Google Colab代替サービス】 - Qiita
            • 画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」

              画像生成AI「Stable Diffusion」は「プロンプト」として文字列を入力することで、その文字列の内容に沿った絵や写真を自動で生成してくれます。しかし、自分の理想により近い画像を生成してもらうためには、多種多様な文字列を大量にプロンプトとして入力する必要があり、この複雑なプロンプトを探ることが画像を生成する工程の中でも特に大変な作業の1つです。「KREA」はAIで生成された画像とそのプロンプトをまとめたデータベースで、自分が理想とする画像を生成するためのプロンプトを探る作業がはかどります。 KREA — create better prompts. https://www.krea.ai/ KREAのトップページはこんな感じ。 上段の「search for prompt」に「anime」と入力してみると、以下のようにサジェストが表示されました。 今回はサジェストを無視し、「anim

                画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」
              • PyTorch vs TensorFlow in 2023

                Should you use PyTorch vs TensorFlow in 2023? This guide walks through the major pros and cons of PyTorch vs TensorFlow, and how you can pick the right framework. PyTorch and TensorFlow are far and away the two most popular Deep Learning frameworks today. The debate over which framework is superior is a longstanding point of contentious debate, with each camp having its share of fervent supporters

                  PyTorch vs TensorFlow in 2023
                • 【初心者向け】ControlNetでポーズを真似する方法。

                  こんにちは、画像生成AIでひたすら猫のイラストを生成している じょじお(@jojio‗illust)です。 Stable Diffusionユーザーは、思い通りのポーズを生成することがいかに難しいかを知っています。すべてがランダムです。 それを解決したのが、AIイラスト界の革命児ControlNetです。 この記事では、Controlnetの基本的な使い方について解説します。

                    【初心者向け】ControlNetでポーズを真似する方法。
                  • もうすぐ実写AITuber登場。Stable Diffusionでリアルタイム画像生成をしてみた | さくらのナレッジ

                    こんにちは、テリーです。ChatGPTに並んで進化の激しい「画像生成AI」を使ってみたことはありますか?ほしい画像を文章で指定すると、それに沿った画像を出力するAIです。かなりの計算量を必要とするため、画像1枚を出力するのに10~60秒かかりますが、世界中の技術者たちがより速く出力する方法を模索して、今まさに日進月歩の進化の最中です。 画像生成AIにもたくさんの種類があり、「Midjourney(ミッドジャーニー)」「DALL・E2(ダリツー)」「Stable Diffusion(ステーブルディフュージョン)」「Adobe Firefly(ファイアフライ)」の4つが特に有名です。この中で「Stable Diffusion」はオープンソースかつ商用利用可能なため、できたばかりのホットな関連技術を取り入れた使い方や、学習済みモデルの差し替え、自作モデルの生成など、自分好みの調整とカスタマイズの

                      もうすぐ実写AITuber登場。Stable Diffusionでリアルタイム画像生成をしてみた | さくらのナレッジ
                    • グラボを買い替えずとも画像生成AIの実行速度を高速化できる「Stable Diffusion WebUI Forge」を実際にインストールして生成速度を比較してみた

                      画像生成AI「Stable Diffusion」には、有志が作成したユーザーインターフェースが複数用意されています。「Stable Diffusion WebUI Forge」はControlNetの開発者であるLvmin Zhang氏が開発したユーザーインターフェースで、広く使われている「Stable Diffusion web UI(AUTOMATIC1111版)」と比べて画像を高速に生成できるとのこと。そこで、Stable Diffusion WebUI Forgeを実際にインストールする手順やStable Diffusion web UI(AUTOMATIC1111版)との生成速度の差を確かめてみました。 GitHub - lllyasviel/stable-diffusion-webui-forge https://github.com/lllyasviel/stable-dif

                        グラボを買い替えずとも画像生成AIの実行速度を高速化できる「Stable Diffusion WebUI Forge」を実際にインストールして生成速度を比較してみた
                      • すさまじい勢いで世界を変えている画像生成AI (1/2)

                        普段メタバースのトレンドを時評的に解説する「メタバース・プレゼンス」を連載していますが、画像生成AIがすごいことになっているので、今回は番外編としてそれをお話させてください。今年8月、画像生成AI「Stable Diffusion」が公開された影響がすさまじい勢いで出てきているんです。いま起きているのはStable Diffusionの派生技術が大量に出てきていること。大きく分けて2つのポイントがあるなと感じています。 Windows向けソフトで誰でも使えるStable Diffusion 1つのポイントは、Windowsローカル環境で使える、GUI形式の扱いやすいソフトが出てきたことです。 NMKD Stable Diffusion GUI 作者:N00MKRAD OS:Windows 10/11 64bit 推奨環境:最新版NVIDIA GPU(RTXシリーズ推奨)、メモリ16GB以上

                          すさまじい勢いで世界を変えている画像生成AI (1/2)
                        • ChatGPTの利用履歴から超詳細な性格診断を実施&ChatGPTに把握されている個人情報を可視化してくれる「ProfileGPT」使ってみたよレビュー

                          ChatGPTは超高性能なチャットAIとして注目されており、多くのユーザーに利用されています。そんなChatGPTの利用履歴を分析して性格診断を実施してくれるアプリが「ProfileGPT」です。ProfileGPTでは性格診断の他にChatGPTにどれだけの個人情報が渡っているかを知ることにも役立ちそうだったので、実際にインストールして使ってみました。 GitHub - sahbic/profile-gpt https://github.com/sahbic/profile-gpt ・目次 ◆1:ProfileGPTのインストール ◆2:OpenAIのAPIキーを取得 ◆3:ProfileGPTを起動 ◆4:ChatGPTの履歴データを用意 ◆5:ProfileGPTで性格診断 ◆1:ProfileGPTのインストール ProfileGPTを使うには、PCにPythonをインストールして

                            ChatGPTの利用履歴から超詳細な性格診断を実施&ChatGPTに把握されている個人情報を可視化してくれる「ProfileGPT」使ってみたよレビュー
                          • イラストに精緻なディテールを追加できる「flat LoRA」の紹介【Stable Diffusion】

                            をしていきます。 先日某所で情報をチェックしていたところ、LoRAモデルの画期的な活用方法を考案した方が登場して大変話題になっていました。なぜそんなに話題になったのかというと、その方が作成したLoRAモデルをうまく使えばイラストに圧倒的なディテールを追加できるからです。 ここではそのLoRAモデルである「flat LoRA」の概要や使い方をご紹介しますね。

                              イラストに精緻なディテールを追加できる「flat LoRA」の紹介【Stable Diffusion】
                            • 画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場

                              画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場2023.10.26 21:0081,577 Kyle Barr - Gizmodo US [原文] ( 岩田リョウコ ) AIに毒を盛る秘策。 アーティストが自分の作品をAIトレーニングに使用されることと戦う手段ってあるのでしょうか。それを研究している人たちがいます。 シカゴ大学のコンピュータサイエンスの教授Ben Zhao氏は、彼のチームが「Nightshade」という名前のツールを開発したとMIT Technology Reviewに語っています。 毒を盛った画像でトレーニングさせる作戦今のところ、アーティストがAI企業に対抗する唯一の選択肢は、訴訟を起こすこと。もしくは、開発者がアーティストが許諾しない意思に従ってくれることを願うことくらいしかできない状況です。 しかしこのツールは戦う姿勢を見せまくりです。なんとア

                                画像生成AIに「毒を盛る」。アーティストの権利を守るためのツール登場
                              • ChatGPTやらMidjourney…生成系AIって今年どうなる?

                                進化が進む一方で、いろんな戦いも表面化していきそう。 OpenAIのChatGPTには、記事の執筆も(一応)頼めるし、「クールなガチョウの子守唄を書いて」なんて頼むこともできます。MidjourneyやStable Diffusion、DALL-E 2などなどの画像AIには、そんなガチョウの絵を描いてもらうこともできます。 でも、そこには倫理的な問題があります。AIがガチョウの絵本を描いてくれたとしても、絵本作家みたいな労力をまったくかけてないのに、普通にその本を売ってもいいんでしょうか? その場合、著作権はどこに帰属すべきでしょうか? AIを学習させるのに使われた絵本の著作権はどうなるんでしょうか? とはいえ、技術は急速に進化していても、今のところ生成系AIだけで売り物にしていいようなものをコンスタントに作れるかっていうと、それはまだです。でも、それを乗り越えるのがまだまだ先なのかもうす

                                  ChatGPTやらMidjourney…生成系AIって今年どうなる?
                                • クリエイター注目!人工知能(AI)活用のすごい&無料ウェブサービス22選

                                  人工知能(AI)を活用したツールは、デザイナーなどクリエイティブな業種において、特におすすめです。 これまでは、夢物語と思われていたような未来のことが、誰でもほんの数クリックで実現、作成できるようになったのが、一番の理由でしょう。 実際、ここ数年のあいだに、AIテクノロジーは目覚ましい進歩を続け、2022年は大流行した年にもなりました。 今回は、クリエイターが活用したい、AI搭載の便利なウェブツールをまとめてご紹介します。 長い記事を要約したり、文字を画像や音声に変換できるAIツールをカテゴリ別にまとめたリストも参考にどうぞ。 クリエイターが活用したい、AI搭載の便利&無料ウェブツールまとめ Magic Eraser 写真に写り込んだ不要、邪魔なものや人を、なぞるだけで簡単に消すことができるツール。先発のCleanup.Picutresも、精度が高くてオススメ。 Dall-E-2 2022

                                    クリエイター注目!人工知能(AI)活用のすごい&無料ウェブサービス22選
                                  • Meta、戦略ゲーム「ディプロマシー」をプレイできるAI「キケロ」を公開

                                    米Metaは11月22日(現地時間)、戦略ゲーム「ディプロマシー」で「人間レベルのパフォーマンスを達成したAI」、「CICERO」(ローマの政治家キケロにちなむとみられる)を発表した。オンライン版ゲームで人間と対戦し、人間のプレイヤーの平均スコアの2倍以上を達成し、上位10%にランキングされたとしている。 ディプロマシー(外交)は、プレイヤー同士で協力したり騙し合ったりして欧州全土の補給地を奪い合うゲーム。文字通り外交センスが問われる。他のプレイヤーの動きの動機や視点を理解し、複雑な計画を立て、相手の動きによって戦略を調整する必要があるため、AIにはほぼ不可能なゲームとみられてきたとMetaは説明する。 また、他のプレイヤーとの交渉には自然言語での会話が必要だ。 「AIがこれまで征服してきたチェスや囲碁とは異なり、ディプロマシーは駒ではなく人間が相手のゲームだ」(Meta) ヒューマンモデ

                                      Meta、戦略ゲーム「ディプロマシー」をプレイできるAI「キケロ」を公開
                                    • 画像生成AIを使ってみて感じたこと

                                      所謂超ヘタレ底辺絵描き。「ペン持って自分で描くこと自体が楽しいので…」とかそんなことを思っているので画像生成AIブームはスルーし続けていたのだが、ここまでブームになり、かつ物凄い議論が日夜繰り広げられているのを全く知らないでいるのも如何なものかと思って、先日ローカル環境にStable Diffusionを導入した。 実際に使ってみて色々と思ったので、まだ全く使いこなせていないし完全に今更だが現時点での感想を書き残しておく。 まず結構パソコンのスペックを喰うということ。自分の場合持て余し気味だったゲーミングPCの有効利用にもなるかなというぐらいのノリで導入したのだが、2,3年前にPC屋の店員さんと色々相談してかなり盛ってもらったPCでも、導入には時間がかかった。 また、軽量化の措置を取っても、画像一つ出てくるまでにPCの箱の中身が結構な音を立てるので、寿命を消費しているなあとリアルに感じ取れ

                                        画像生成AIを使ってみて感じたこと
                                      • Hugging Face Pipelineを使ったお手軽AIプログラミング | IIJ Engineers Blog

                                        地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 Hugging Faceってご存じですか? AIを使用したプログラム・スクリプトを作る際、ゼロから起こす場合は以下のような部分を作り込んだり、Githubなどのリポジトリサイトからソースを入手したりする必要があったりします。 AIモデル トレーニングのためのロジック 評価・テストのためのロジック データローダ トレーニング・評価データを読み込むためのフォーマット、読み込み処理・変換処理など チェックポイントの書き出し Hugging Faceというサイトは、学習済みモデルやデータセッ

                                          Hugging Face Pipelineを使ったお手軽AIプログラミング | IIJ Engineers Blog
                                        • “業界トップレベルの画像生成AI”が近日中に無料配布? SNSで話題に 開発会社関係者はTwitterでカウントダウン

                                          業界トップレベルの画像生成AIが間もなく無料配布されるとTwitter上などで話題になっている。AIスタートアップ企業の英Stability AIは8月22日までに、画像生成AI「Stable Diffusion」(サービス名は「DreamStudio」)のβ版をWeb上で公開。先日話題になった画像生成AI「MidJourney」よりも高性能であるという。 同AIのβ版に当たる「DreamStudio Lite」は、アカウント登録すると2.00ポンド(約324円)の無料枠が与えられ、生成したい画像の指示を英語で入力することで画像を生成できる。画像のサイズや枚数、生成のための処理回数などの指定も可能で、設定によって画像生成に必要な費用が変化する。生成した画像は「History」(履歴)の項目に残り、Webブラウザのキャッシュを消さない限り保存される。

                                            “業界トップレベルの画像生成AI”が近日中に無料配布? SNSで話題に 開発会社関係者はTwitterでカウントダウン
                                          • Stable Diffusion web UIのインストールと使い方

                                            今回は、「Stable Diffusion web UI」をWindowsやMacにインストールする方法と、その使い方を紹介します。 Stable Diffusion web UIについて Stable Diffusion web UIは、ブラウザをインターフェースとして利用して、AIによる画像生成を行うことができるツールです。 GitHub[AUTOMATIC1111/stable-diffusion-webui](https://github.com/AUTOMATIC1111/stable-diffusion-webui) Stable Diffusion web UIでは、次のような画面をブラウザで動かすことができ、かんたんにAIによる画像生成を行うことができます。 この、ブラウザを使うというスタイルのおかげで、Windowsでも、Mac(Apple Silicon)でも、Linu

                                              Stable Diffusion web UIのインストールと使い方
                                            • ChatGPT・AI の教育関連情報まとめ

                                              このページでは、ChatGPT・AI の教育関連情報をまとめていきます。随時更新する予定です。 後半では ChatGPT・AI の全般的な情報もまとめています。 渾身の4時間イベント「教員向け ChatGPT 講座 ~基礎から応用まで~」の資料や動画を公開していますので、ChatGPTに関連する事項を一通り把握したい方はそちらもご覧ください。 また、文部科学省の情報モラルポータルサイトにて、生成AIに関する教員向け研修動画シリーズが公開され、その中で「生成AIの性質と限界」というタイトル(動画リンク)で26分ほどで、コンパクトに生成AIの教育活用について解説していますので、サクッと知りたい方はその動画をご覧ください。 主に先生方から質問いただくこともあり ChatGPT に関する Q&A を新設しました。 ChatGPT・AI の教育活用海外の対応(2024年2月16日時点)アメリカ202

                                                ChatGPT・AI の教育関連情報まとめ
                                              • AIアートと著作権:「Stable Diffusionを違法化するためのロジック」が人間のアーティストを苦しめるワケ | p2ptk[.]org

                                                AIアートと著作権:「Stable Diffusionを違法化するためのロジック」が人間のアーティストを苦しめるワケ投稿者: heatwave_p2p 投稿日: 2023/4/82023/4/8 Electronic Frontier Foundation アーティストたちは、Stabile Diffusionなどの自動画像生成ツールが自分たちの作品市場を縮小させる可能性を、当然のことながら懸念している。我々は自動化で仕事を奪われる人たちを見捨てるような社会に生きている。そして、ビジュアルアーティストという職業はすでに不安定な立場に置かれている。 こうした状況にあって、著作権にすがろうとするのは自然なことではある。著作権はアーティストが作品から対価を得られるよう保証するものだからだ。だが、一部のアーティストたちがStable Diffusionを相手取って起こした集団訴訟で主張している著作

                                                  AIアートと著作権:「Stable Diffusionを違法化するためのロジック」が人間のアーティストを苦しめるワケ | p2ptk[.]org
                                                • 画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた (1/3)

                                                  生成AIの進歩はマジで早い。Stable Diffusion関連だけでも毎日のように新規手法が発表され、せっかく身につけたスキルも数週間後には完全に時代遅れのものになっていることも珍しくはない。 中でも、ここ最近もっとも注目されているのは「LCM」だろう。 LCMとはLatent Consistency Model(潜在一貫性モデル)の略で、大雑把に言えば「画質を多少犠牲にすることで信じられないほど高速化」する仕組みだ。 さらにStable Diffusion開発元の本家Stability.aiからも、LCMとは異なるが「SDXL Turbo」という高速モデルが発表された。果たしてどれほど早くなったのか、それぞれ検証してみることにする。 LCMってどういう仕組? とはいえこれだけでは少し雑すぎるので、もう少し詳しく説明しよう。 Stable DiffusionはLDM(潜在拡散モデル)とい

                                                    画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた (1/3)
                                                  • AIで「普通のおじさん」を生成→実在した上に“普通ではなかった”と判明 あまりの珍事に本人も思わず「自分に見える」

                                                    画像生成AI「Stable Diffusion」で「普通のおじさん」の生成を試みたら……実在した!? まさかの珍事がTwitterで話題を呼んでいます。 AIが描いたおじさんと、実在するおじさんが完全に一致……! 事の起こりは、Web制作会社ベイジ代表のsogitaniさん(@sogitani_baigie)による実験。Stable Diffusionは2次元や美少女は得意ながら、ありふれた普通のおじさんを描くには向いておらず、その難題に挑んだといいます。 「おっさん作るのムズい」と言いつつ、出力されたおじさんの画像は、「確かに普通にいそうな感じがする」と話題に。ところが、その中にまさかの反応がありました。なんと、名作RPG「ハイドライド」を手掛けたゲームデザイナー、内藤時浩さん(@NAITOTokihiro)がツイートを引用し、生成画像が自分にそっくりだと発言したのです。 sogitan

                                                      AIで「普通のおじさん」を生成→実在した上に“普通ではなかった”と判明 あまりの珍事に本人も思わず「自分に見える」
                                                    • 対話型チャットAI「ChatGPT」開始から1週間も経たないうちにユーザーが100万人を突破、そもそもChatGPTとは一体何なのか?

                                                      AIの研究・開発を行う団体「OpenAI」のサム・アルトマンCEOが、2022年12月1日にテスト版が一般公開された「ChatGPT」のユーザー数が100万人を突破したと発表しました。 Explainer: What is OpenAI’s chatbot ChatGPT and what is it used for? | Reuters https://www.reuters.com/technology/chatgpt-what-is-openais-chatbot-what-is-it-used-2022-12-05/ OpenAI’s ChatGPT crosses 1 million users, CEO says they might have to monetise this at some point | Technology News,The Indian Expres

                                                        対話型チャットAI「ChatGPT」開始から1週間も経たないうちにユーザーが100万人を突破、そもそもChatGPTとは一体何なのか?
                                                      • 続・画像生成AIに自分の絵を描かせた|R-9

                                                        2023年の5月の連休の前後より、自作イラストの追加学習データ(LoRA)を元にローカル環境のStable Diffusion (SD1.5)を使ってAIに"自分の絵"を描かせるようになってから、おおよそ一年が経ちました。当時そのことについて書いた記事は、比較的多くの方に読んでいただけたようで、SNSなどを通じて今も時々リアクションがあります。 この一年間、多少の波はあっても、自分としてはこつこつとコンスタントに同じテーマに取り組んできました。成果の一部はX(@epxstudio_ai)で発表していましたが、その過程で新たに得られた知見や、画像生成AIの活用方法についてぼんやり考えたことなどがあるので、件の記事の続編として少し書いてみようと思います。 前提としてわたしはGペンとスクリーントーンの時代からの20年来のアマチュア同人作家で、普段絵とはまったく関係ない仕事をしており、かつ、イラス

                                                          続・画像生成AIに自分の絵を描かせた|R-9
                                                        • 集英社も取り下げた「AIグラビア」の問題点 (1/3)

                                                          オトコの理想をギュギュッと詰め込んだ“たぬき顔”の“妹系美少女”が誕生🩷 たとえ彼女は実在しなくても、芽生えた恋心はホンモノ 「AIグラビア」、あなたはアリですか? グラジャパ!限定カット付き💞 さつきあい@ai_satsuki_ai デジタル写真集『生まれたて。』https://t.co/X0yCy41KjFpic.twitter.com/bY8wLyldl1 — 週プレ@グラビア (@shupure) May 28, 2023 集英社のAIグラビア「さつきあい」写真集。びっくりしたと同時に、すぐ販売終了してしまったので「引っ込めるのか!」という感じもしましたよね。 終了の理由については推測するしかありませんが、プレイボーイ誌の企画で、時代ごとのグラビア画像で学習したことを明らかにしていたので、特定人物が出やすいLoRAを作成していた可能性は考えられると思います(Low-Rank A

                                                            集英社も取り下げた「AIグラビア」の問題点 (1/3)
                                                          • 「画像生成AIから自分のイラストを守る」学習・模倣の対策ツール「Glaze」無償公開へ

                                                            米シカゴ大学の学術研究グループが、「Midjourney」「Stable Diffusion」などの画像生成AIに画風や絵柄などのアートスタイルを学習・模倣されないようにするツール「Glaze」を発表した。 「Glaze」は、アートワークへ人間の目にはほとんど見えない微小な変更を加えるツール。それによって、画像生成AIがそのアートワークを学習する際、別の画風(例えばゴッホなど)に解釈させるものだという。 同研究グループは、今後数週間のうちにMacおよびWindows向けに「Glaze」のアプリケーションを無償でリリースするとしている。 画像生成AI対策「Glaze」 プロ1000人の内9割が評価 機械学習の“侵略的な使用”からインターネットユーザーを保護することに関心がある学術研究グループ・Glaze Projectによって発表された「Glaze」。 その技術の詳細については、米・コーネル

                                                              「画像生成AIから自分のイラストを守る」学習・模倣の対策ツール「Glaze」無償公開へ
                                                            • IntelのMeteor Lake搭載ノート、dGPUなしでStable Diffusionを高速処理

                                                                IntelのMeteor Lake搭載ノート、dGPUなしでStable Diffusionを高速処理
                                                              • 1つの大きなLLM(大規模言語モデル)を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog

                                                                地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 LLM群雄割拠の時代 昨今、ローカルGPUで駆動できるようなLLM(大規模言語モデル)もかなり増えてきて、キャッチコピー的に「ついに我が家にもGPT-4が!」とか言われるようになってまいりました。パラメータ規模で言えば70億~130億(7B-13B)パラメータ、700億(70B)パラメータ、1400億(140B)パラメータあたりのモデルが活発にリリースされているように見受けられます。 大きなモデルをGPU寄せ集めしつつ遊びたい! しかしながら、コンシュマー向けのGPUにおいては、7B

                                                                  1つの大きなLLM(大規模言語モデル)を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog
                                                                • 画像生成AI「Midjourney」のバージョン4が公開される、美麗な画像の生成が簡単過ぎて呪文の達人が嘆くほど

                                                                  2022年11月5日に、画像生成AI「Midjourney」のバージョン4(V4)がテスト公開されました。Midjourney V4を利用したユーザーからは「高品質な画像を作るのが簡単すぎる」といった感想が寄せられています。 “Too easy“—Midjourney tests dramatic new version of its AI image generator | Ars Technica https://arstechnica.com/information-technology/2022/11/midjourney-turns-heads-with-quality-leap-in-new-ai-image-generator-version/ 近年、「Stable Diffusion」や「DALL・E」などの入力した文章(プロンプト)に沿った画像を生成してくれるAIに大きな

                                                                    画像生成AI「Midjourney」のバージョン4が公開される、美麗な画像の生成が簡単過ぎて呪文の達人が嘆くほど
                                                                  • SVMを使った類似 embeddings 検索 - kNN ではない類似検索の選択肢 - A Day in the Life

                                                                    LangChain v0.0.141 に SVM Retriever という実装が入った。これは embeddings(集合)から、単一 embedding と類似しているもの top-K を SVM を使って見つけるという実装で、えっどうやってるの?と追っかけてみたら、知らない知識で面白かったのでメモ記事に。 kNN vs SVM この実装の元となった、knn_vs_svm.ipynbというnotebookがあって、冒頭を機械翻訳すると以下となる。 よくあるワークフローは、あるデータを埋め込みに基づいてインデックス化し、新しいクエリの埋め込みがあれば、k-Nearest Neighbor検索で最も類似した例を検索することです。例えば、大規模な論文コレクションをその抄録に基づいて埋め込み、興味のある新しい論文を与えると、その論文に最も類似した論文を検索することが想像できます。 私の経験では

                                                                    • OpenAI、テキストから3Dモデルを高速生成するAI「Point-E」をリリース

                                                                      米AI研究企業OpenAIの研究者らは12月19日(現地時間)、テキストプロンプトから3Dオブジェクトを生成するAIシステム「Point-E」をオープンソース化したと発表した。 同様のシステムとしては米Googleの「DreamFusion」などがあるが、発表論文によると、Point-Eは例えば単体のGPU(米NVIDIAの「V100」)でも3Dモデルを1~2分で生成できるという。 Point-Eは、点群(point cloud)で3Dオブジェクトを生成する。名称の「E」は点群を効率的(Efficiently)に生成することに由来するという。 3D生成は2段階で行われる。まずプロンプトを入力すると、レンダリングされた合成ビューが生成され、次に点群拡散スタックがこの画像を条件付けして3DのRGB点群を生成する。 「この方法は、最先端の他の類似技術よりも性能は劣る」が、DreamFusionの

                                                                        OpenAI、テキストから3Dモデルを高速生成するAI「Point-E」をリリース
                                                                      • 【決定版】DALL·E 3完全攻略ガイド|ChatGPT研究所

                                                                        ChatGPT に DALL·E 3が導入され、世界に激震が走っています。 ※ DALL·E 3で生成した画像ですChatGPT の自然な会話の流れからハイクオリティな画像を出力してもらうことができます。 今までの画像生成AIとの明確な違いは、圧倒的に使いやすいことです。 ChatGPT が代わりに画像生成プロンプトを組み立ててくれるため、難しいプロンプトは必要がありません。 その代わり、必要になってくるのがデザインそのものの知識、ディレクション能力などです。また、細かい制御にはシード値への理解が不可欠です。 この note ではそこにフォーカスしてDALL·E 3を解説します。 note の内容は受賞歴のある本職現役デザイナーの方に監修してもらっています。 無料部分で大体のことはわかります。 有料版はDALL·E 3やデザインをもっと理解して業務利用したいという方のために書いています。

                                                                          【決定版】DALL·E 3完全攻略ガイド|ChatGPT研究所
                                                                        • Stable DiffusionをDockerで動かす

                                                                          > wsl # wslを起動してshellにはいる $ wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin $ sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600 $ wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda-repo-wsl-ubuntu-11-7-local_11.7.1-1_amd64.deb $ sudo dpkg -i cuda-repo-wsl-ubuntu-11-7-local_11.7.1-1_amd64.

                                                                            Stable DiffusionをDockerで動かす
                                                                          • Radeon上でStable Diffusionの性能を9.9倍にする最適化手法。AMD公開

                                                                              Radeon上でStable Diffusionの性能を9.9倍にする最適化手法。AMD公開
                                                                            • 生成AIにアーティストが反撃、汚染データでモデルを壊す新技術

                                                                              AIによる画像の無断利用にアーティストたちが対抗する新たなツールが開発された。人間の目にはわからない加工を画像データに施すことで、この画像データを訓練に使った生成AIモデルを破壊できるという。 by Melissa Heikkilä2023.10.27 41 22 アーティストがこの新しいツールを使用すると、自分の作品をインターネット上にアップロードする前に、作品内のピクセルに対して目に見えない変更を追加できる。人工知能(AI)企業が、この変更を加えた作品を収集し、生成AI(ジェネレーティブAI)の訓練に使用すると、AI学習モデルが無秩序で予測不可能な状態に破壊される可能性がある。 「ナイトシェード(Nightshade)」と呼ばれるこのツールの目的は、アーティストの許可なく作品を使用してモデルを訓練しようとするAI企業に反撃する方法を提供することだ。「ダリー(DALL-E)」、「ミッドジ

                                                                                生成AIにアーティストが反撃、汚染データでモデルを壊す新技術
                                                                              • 画像の枠外を新たに描き足せるAIアプリ「Uncrop」が無料公開されたので使ってみた

                                                                                資料や作品を作成していると、「この写真の縦幅を広げたい」といった状況に遭遇しがちです。あの画像生成AI「Stable Diffusion」を用いた無料ウェブアプリ「Uncrop」を使えば、簡単に写真の枠外部分を生成して幅を広げられるとのことなので、実際に使ってみました。 ClipDrop - Uncrop https://clipdrop.co/uncrop Uncropのトップ画面はこんな感じ。 Uncropを使って画像の枠外を描画するには、まず編集したい画像をUncropの画面内にドラッグ&ドロップします。 すると画像編集ツールのクロップツールのような画面が表示されるので、通常のクロップツールとは逆に画像を広げるようにクロップ範囲を指定して「Next」をクリックします。 しばらく待つと、外側を描き足した画像が4枚生成されます。画面下部の矢印ボタンをクリックかサムネイルをクリックすれば各

                                                                                  画像の枠外を新たに描き足せるAIアプリ「Uncrop」が無料公開されたので使ってみた
                                                                                • 【無料】ChatGPTもClaudeもStableDiffusionも…生成AIをタダで使える「リートン」が太っ腹すぎる

                                                                                  テクノロジーライター、Gマーク・パートナーショップ「AssistOn」取締役。 スティーブ・ジョブズ、ビル・ ゲイツ、スティーブ・ウォズニアックのインタビュー記事をはじめ、IT、カメラ、写真、デザイン、自転車など様々な分野の文筆活動や、製品開発のアドバイスを行う。 主な著書・共著書に『成功する会社はなぜ「写真」を大事にするのか』(講談社現代ビジネスブック)、『インテル中興の祖 アンディ・グローブの世界』(同文舘出版)、『ICTことば辞典』(三省堂)など。主な訳書に『Apple Design 日本語版』(アクシスパブリッシング)、『スティーブ・ジョブズの再臨』(毎日コミュニケーションズ)など。 最新刊として、『ルンバをつくった男 コリン・アングル「共創力」』(小学館)。 AssistOnホームページ:https://www.assiston.co.jp ビジネスを変革するテクノロジー 今やテ

                                                                                    【無料】ChatGPTもClaudeもStableDiffusionも…生成AIをタダで使える「リートン」が太っ腹すぎる