並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 805件

新着順 人気順

"Stable Diffusion"の検索結果481 - 520 件 / 805件

  • Metaの無料AI画像生成ツール、試してみたら…こんな画像ができました | ライフハッカー・ジャパン

    4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

      Metaの無料AI画像生成ツール、試してみたら…こんな画像ができました | ライフハッカー・ジャパン
    • https://twitter.com/mm_mame_co/status/1566416584670789632

        https://twitter.com/mm_mame_co/status/1566416584670789632
      • Stable Diffusionを利用し、Apple Silicon Macローカルでテキストから画像を生成できるアプリ「AI Photo」がリリース。

        Stable Diffusionを利用し、Apple Silicon Macローカルでテキストから画像を生成できるアプリ「AI Photo」がリリースされています。詳細は以下から。 Stable Diffusionは独ミュンヘン大学のCompVisグループが開発したtext-to-imageモデルで、ディープラーニングを利用しテキストから画像を生成することができますが、このStable DiffusionのMacクライアントとなる「AI Photo」が新たにリリースされています。 Run Stable Diffusion locally on your Mac. AI Photo is a user-friendly text-to-image generator app that creates photos and artworks in literal seconds, all of

          Stable Diffusionを利用し、Apple Silicon Macローカルでテキストから画像を生成できるアプリ「AI Photo」がリリース。
        • Stable-Diffusionの学習設定まとめ|gcem156

          なんか学習設定について、よく分からんけどデフォルト!とかよく分からんけどこうしてみたらうまくいった!みたいな感覚で議論されていることが多い気がするので、学習設定についてまとめてみようと思います。機械学習のこと知らん人にも分かるようにするはずの記事でしたが多分そうなってないです。間違いもあると思いますが、私の記事が間違っていたとしても、悪いのは私よりも頭がいい人が分かりやすい説明をしないせいであって私のせいではありません。 機械学習の簡単な説明機械学習が分からない人にも!と思って難しい用語を避けようとしてみましたが、誤差逆伝搬のことをフィードバックって言いかえたところで分かりやすくなっているのでしょうか? 機械学習はモデルの数値を学習データに合うように少しずつ調整していく作業です。なぜ少しずつかというと、機械学習では改善する方向はなんとなくわかるけど、最適な数値の位置は分からないからです。位

            Stable-Diffusionの学習設定まとめ|gcem156
          • NVIDIA RTX環境での「Stable Diffusion」はVRAMを使い果たすとDRAMも使えるが、逆にVRAMだけにもできる

            NVIDIA RTX環境での「Stable Diffusion」はVRAMを使い果たすとDRAMも使えるが、逆にVRAMだけにもできる 米NVIDIAは10月31日、サポートページ内にあるナレッジベースに掲載する形で、「Stable Diffusion」に関する動作の仕様について情報を公開した。生成AIを手軽に楽しめる「Stable Diffusion」におけるTipsがまとまっている。 NVIDIA RTX環境での「Stable Diffusion」はVRAMを使い果たすとDRAMも使えるが、逆にVRAMだけにもできる Stable Diffusionは、利用にあたって大容量のGPUメモリ(VRAM)が必要になる。NVIDIAではおおよそ6GB以上必要であるとしているが、モデルやスクリプトによってはより大規模なGPUメモリが必要になることもある。これを受けてバージョン536.40以降のド

              NVIDIA RTX環境での「Stable Diffusion」はVRAMを使い果たすとDRAMも使えるが、逆にVRAMだけにもできる
            • The Ai Art - AI, Art, and everything in between

              AI is not the future, rather the present. Explore the potential and current abilities of combining Art and AI.

              • Stable DiffusionでSeedを固定して同じ絵を生成できるのか問題を検証

                Stable Diffusionでseedを固定して同じ絵を生成できるのか問題 Stable Diffusionでseed値を固定すると同じ絵を生成できるのかが(私の中で)話題です。 きっかけは、shi3zさんとdrikinさんの動画のラストの1,2分。 Seedを固定すると同じ絵が出ると主張するdrikinさんと、そんなことはないんじゃないかといい、その場で実践して確かめるshi3zさん。 自分も、GPUを多用するディープラーニングの演算だと、seed固定しても経験的に完全再現できないことを体感していたのと、当時調べたら「GPUでは完全再現は難しい」という情報が多かったので、seed値を固定しても、結果は再現できないものとずっと思っていました。 でも、Stable Diffusionの実験して挙動みてると、同じpromptとseed値から同じ絵が再現できていそうなんですよね。 その後も繰

                  Stable DiffusionでSeedを固定して同じ絵を生成できるのか問題を検証
                • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) | テクノエッジ TechnoEdge

                  lllyasviel氏復活第一弾のIC-Light前回(第23回)にControlNetやFooocus、stable diffusion webui forgeを作ったlllyasviel氏、ここ数ヶ月Xなどに書き込みが無いと書いたが、いきなり驚くべき仕掛けを提げての復活。その名もIC-Light(Imposing Consistent Light)。Stable Diffusionの技術を使って、照明を自由にコントロールできる仕掛けだ。 これまでStable Diffusionでは、SD 1.5、SDXLに関わらず、Promptで光や照明などの指示はできたのだが、どのように反映されるかは、Modelやその他の設定しだい。例えば backlight, soft bounced lighting, soft natural lighting, candolelight, neon ligh

                    生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) | テクノエッジ TechnoEdge
                  • 生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) | テクノエッジ TechnoEdge

                    API経由ながらStable Diffusion 3が利用可能に!今年、2024年2月24日に次世代Stable Diffusion、Stable Diffusion 3が発表された。いろいろな特徴があるのだが、画像品質の向上はもちろんのこと、Stable Diffusion (XL) が苦手だった文字 (但し日本語などは除く) にも対応し、早く使いたかったものの、まだ一般が試せる状態ではなかった。 ところがつい先日の4月17日、Stability AI Developer PlatformのAPI経由で利用可能となったので、使ってみたのが今回の内容となる。 APIを使うにあたって必要なAPI Keyは、Stability AI にアカウントを作ると用意され、自動的に24クレジットが付加される。1枚作って消費するクレジットは以下の通り。 Stable Diffusion 3は1枚6.5クレ

                      生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) | テクノエッジ TechnoEdge
                    • AI画像生成ツール「Stable Diffusion」のコツまとめ(text2image)|Matsuri

                      先日オープンソース化され、話題を集めている「Stable Diffusion」を使っている中で気が付いたメソッドやコツをまとめる。自分の備忘録的な意味も込められているため適宜加筆していく。 導入については他に分かりやすいガイドがたくさんあるので割愛する。すぐに使いたいという人はGoogle Colabで環境をセットアップしてみよう。 Midjourneyとの表現の違いについてまずMidjourneyのと違いについて気になる人が多いだろう。これについてはPromptに対する理解というか反応が異なるのと、出力される画像のタッチに基本的な違いがある。非常に端的に言うとStable Diffusionは生真面目な優等生タイプで、Midjourneyはどちらかというと独創的な自由奔放タイプだ。自分が作りたい画像のイメージによって適宜切り替えながら使うといいだろう。写真のようなリアルな造形をベースに画

                        AI画像生成ツール「Stable Diffusion」のコツまとめ(text2image)|Matsuri
                      • 生成AI悪用、中国発の偽情報「スパモフラージュ」日本で広がる…「日米関係にひびを入れる狙い」

                        【読売新聞】SNSの普及やデジタル技術の向上を背景に、偏った情報を広げ、民意を操ろうとする動きが加速している。生成AI(人工知能)の登場により、その勢いは一気に増幅し、民主主義が危機に直面している。 <ハワイ火災には大きな陰謀がある

                          生成AI悪用、中国発の偽情報「スパモフラージュ」日本で広がる…「日米関係にひびを入れる狙い」
                        • 多すぎて悩む生成AI、最新注目ツールはこの3つ!

                          コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕

                            多すぎて悩む生成AI、最新注目ツールはこの3つ!
                          • 画像生成AI「Stable Diffusion」を「Blender」のテクスチャに作成に利用できる「Dream Textures」を導入してみた【Blender ウォッチング】

                              画像生成AI「Stable Diffusion」を「Blender」のテクスチャに作成に利用できる「Dream Textures」を導入してみた【Blender ウォッチング】
                            • Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した | テクノエッジ TechnoEdge

                              Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。

                                Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した | テクノエッジ TechnoEdge
                              • 元AV女優・上原亜衣さん、自身のAIグラビア写真集発売 Kindleの絵画ランキングで1位に

                                画像生成AI「Stable Diffusion」と、上原さんの画像を学習したLoRA「AI uehara LoRA」を活用。上原さんを模したAI画像を全52ページにわたって掲載している。LoRAとは、AIモデルに数枚の写真を追加的に学習させることで画像を特定の絵柄に寄せる技術を指す。 上原さんは3月から「AI uehara project」と称し、画像生成AIで自身に似た画像を制作する取り組みを進めている。例えば、AIを活用するクリエイターのコミュニティーであるAI Verseを立ち上げ、AI uehara LoRAを作成。このLoRAを使い、自身そっくりの画像を生成できるか競うコンテストを開催していた。今回の写真集も、AIを活用するクリエイターやAI Verseと共作したという。 上原さんは「今回の写真集は、とにかくきれいでエポックメイキングな作品なので、私のファンの方はもちろん、AIに

                                  元AV女優・上原亜衣さん、自身のAIグラビア写真集発売 Kindleの絵画ランキングで1位に
                                • 画像生成AI・Stable Diffusionのエンコーダーに見つかった致命的な欠陥とは?

                                  画像生成AIのStable Diffusionは「潜在拡散モデル」と呼ばれるAIで、テキストを入力するだけで高精度な画像を生成することが可能です。このStable Diffusionに使われている「VAE」に致命的な欠陥があるという報告が、オンライン掲示板サイトのRedditに投稿されています。 The VAE used for Stable Diffusion 1.x/2.x and other models (KL-F8) has a critical flaw, probably due to bad training, that is holding back all models that use it (almost certainly including DALL-E 3). : StableDiffusion https://old.reddit.com/r/StableD

                                    画像生成AI・Stable Diffusionのエンコーダーに見つかった致命的な欠陥とは?
                                  • 「好きなキャラに近い絵をAIが量産」――ある概念を“単語”に圧縮し入力テキストに使える技術

                                    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 イスラエルのTel-Aviv UniversityとNVIDIAの研究チームが開発した「An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion」は、ある概念を新しい単語(論文ではnew pseudo-wordと表現している)に置き換え、その新しい単語を一部に用いた文章を画像生成AIの入力に使用するシステムだ。 指定したキャラクターや物、絵などが持つ概念(形、質感、雰囲気、構成、デザインなど)を単語に圧縮し、入力テキストに活用することでその概念に沿ったさまざまな画像を

                                      「好きなキャラに近い絵をAIが量産」――ある概念を“単語”に圧縮し入力テキストに使える技術
                                    • SD用快速webUI「Forge」公開!A1111版とどこが違う?導入と実践|スタジオ真榊【AIイラスト術解説】|pixivFANBOX

                                      こんにちは、スタジオ真榊です。支援者の皆様には連日、プロンプト超辞典の枝記事が生成されるたびに更新通知が行ってしまっているのではないかと思います。ご迷惑をおかけしておりますが、あと3分の1ほどで終わりますのでどうかご容赦ください。 さて、今日はControlnetの開発者lllyasviel(イリヤスフィール)氏が公開...

                                        SD用快速webUI「Forge」公開!A1111版とどこが違う?導入と実践|スタジオ真榊【AIイラスト術解説】|pixivFANBOX
                                      • Stable Diffusion 3発表、Soraで話題の拡散トランスフォーマーを採用

                                        英Stability AIは2月22日(現地時間)、画像生成機械学習モデルの新版「Stable Diffusion 3.0」の早期プレビューを発表した。新しいアーキテクチャを採用し、画質、マルチサブジェクト・プロンプトの処理、テキスト生成の精度が向上している。22日に早期プレビューのウエイティングリストへの登録受付が始まった。これは、一般公開に先駆けて性能と安全性を向上させるためのフィードバック収集を目的としている。 Stable Diffusion 3は、拡散トランスフォーマー・アーキテクチャにフローマッチングを組み合わせている。Stability AIは2022年8月以降、Stable Diffusion 1.4、1.5、2.0、2.1、XL 1.0、XL Turboを次々にリリースしてきたが、バージョン3.0は既存のモデルの強化版ではなく、アーキテクチャの刷新という点でオリジナル以来

                                          Stable Diffusion 3発表、Soraで話題の拡散トランスフォーマーを採用
                                        • Stable Diffusion入門-レンズ - 電通総研 テックブログ

                                          電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回のテーマはレンズです。 Stable DiffusionはAIカメラなので、どのようなレンズを使うかどうかはとても重要です。カメラの知識が必要ですが、基礎から丁寧に説明するので大丈夫です。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文編 美少女アニメ画編 美少女写真編 女性イラスト編 魅惑的な女アニメ画(トゥーンレンダリング)編 長い呪文は切り捨てられる編 レンズの属性 焦点距離 F値 SIGMA SIGMA 85 mm F

                                            Stable Diffusion入門-レンズ - 電通総研 テックブログ
                                          • 1枚の静止画からAIが人やキャラが動く動画を生成する「MagicAnimate」が公開/ソースコードに加え、Webブラウザー上で実際に動作するデモを利用できる

                                              1枚の静止画からAIが人やキャラが動く動画を生成する「MagicAnimate」が公開/ソースコードに加え、Webブラウザー上で実際に動作するデモを利用できる
                                            • AIがヒーロー作ったらすごいパチもん感を醸し出してきてもう笑うしかない「元ネタが分かるこの見た目」

                                              藤忍🔞☮🐤 @FujiShinobu じっくり眺めているとだんだん古の記憶がよみがえり、元ネタが次々判っていくのすごい。色やディテールがそのまま使われているし、何より特徴的なポーズは唯一無二の物だ。 twitter.com/picopicoshimbu… 2022-09-16 13:59:21

                                                AIがヒーロー作ったらすごいパチもん感を醸し出してきてもう笑うしかない「元ネタが分かるこの見た目」
                                              • AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?

                                                AIは実在していない人間の顔写真を生成することができ、その精度はすさまじい勢いで高まっています。AI製のスパイや実在しないエンジニアを活用したと疑われる例も報じられているほか、AIの生成した顔は本物の顔と区別がつかないだけではなく「本物の顔より信頼性が高い」とされる研究もあります。オーストラリア国立大学の上級講師であるエイミー・ダウェル氏は「AIは、本物の人間の顔よりも本物らしく見える顔を作成できる」ことを示した上で、そのようなAIの能力「ハイパーリアリズム」について解説しています。 AI Hyperrealism: Why AI Faces Are Perceived as More Real Than Human Ones - Elizabeth J. Miller, Ben A. Steward, Zak Witkower, Clare A. M. Sutherland, Eva G

                                                  AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
                                                • 人はよく似た絵がAI製なのか人間のものなのかを区別できず「AIだと思った絵」に嫌悪感を抱く

                                                  AIが生成した絵に異様なまでの忌避感を示す人がいますが、いざよく似た絵を見せられたとき、人間はその絵が誰(何)によって描かれたのかを判別できない可能性があることがわかりました。さらに、人間はAI製だと思い込んだ人間の絵に根拠もなく悪い評価を与えることも判明しています。 Understanding how personality traits, experiences, and attitudes shape negative bias toward AI-generated artworks | Scientific Reports https://www.nature.com/articles/s41598-024-54294-4 People liked AI art – when they thought it was made by humans https://www.scien

                                                    人はよく似た絵がAI製なのか人間のものなのかを区別できず「AIだと思った絵」に嫌悪感を抱く
                                                  • Stable DiffusionをローカルのGPU無しのWindows PC(Intel CPU)で動かす方法

                                                    Stable Diffusionをローカルで手軽に動かす方法 Stalbe Diffusion話題ですね。ただネックなのはGPUが必要な点です。GPUを持ってない人や、CUDAはよくわからない/絶対に入れたくないという人もいるでしょう。クラウドを使う方法もありますが、色々な事情で使えない/使いたくない人もいるでしょう。 そんな全世界のStable Diffusion難民に朗報です。Stable DiffusionがIntel CPUで動きます。しかもWLS2で動くので、大体のWindows PCで動きます。 以下のstable_diffusion.openvinoを使うだけです。 OpenVINOの説明は省略します。とにかくIntel CPUに最適化されたエッジコンピューティングのすごいヤツです(雑) セットアップ方法 前提 Intel CPU Windows OS 11にWSL2をインス

                                                      Stable DiffusionをローカルのGPU無しのWindows PC(Intel CPU)で動かす方法
                                                    • テキスト→画像生成AI「Stable Diffusion」を誰でも使えるようにする「NMKD Stable Diffusion GUI」/実行に必要なファイルのダウンロードも全て自動【レビュー】

                                                        テキスト→画像生成AI「Stable Diffusion」を誰でも使えるようにする「NMKD Stable Diffusion GUI」/実行に必要なファイルのダウンロードも全て自動【レビュー】
                                                      • としあきdiffusion Wiki*

                                                        AI進化に編集が追いついていません。 お気軽に編集にご協力ください。 (誤情報や旧情報でもとっしー達が直していきます)

                                                          としあきdiffusion Wiki*
                                                        • 【無料】GPUがなくてもStable Diffusionで遊びたい!

                                                          まえがき 「GPUを持ってないけどAI絵を描いてみたい!」というお悩みを抱えている皆さん、Google Colabで満足していませんか?この記事ではModalを使うことでGoogle Colabより(きっと)優れたAI絵生成体験をGETする方法をご紹介します。 What is Modal? イケメンなランディングページだね みんなが良く知るあの「モーダル」ではありません。名前の由来は謎ですが、「Your end-to-end stack for cloud compute」という謳い文句の通りクラウドコンピューティングツール(?)です。Colabみたいにリモートでプログラムを実行する環境を用意してくれるというわけですね。Colabとは違って対話的ではないのであまり初心者には優しくないですが、Pythonの関数の一部だけをリモートで実行するというような柔軟性があるので汎用性はそこそこ高いと思

                                                            【無料】GPUがなくてもStable Diffusionで遊びたい!
                                                          • 美少女イラストが上手なAIはどれだ! AIお絵描き選手権

                                                            8月に話題になった「Midjourney」を発端に、この2カ月間、画像生成AIサービスが注目を集め続けている。同月後半にはオープンソースで使える「Stable Diffusion」が登場。9月初頭には中国産の「ERNIE-ViLG」が話題になった他、29日には米OpenAIが手掛ける「DALL・E2」の順番待ちが解消するなど、サービスの選択肢も増えてきた。 各サービスはそれぞれ特色があり、得手不得手も異なる。中には現在進行形で改善を続けているサービスもあり、話題になった時点とはイラストのクオリティーが変わっているサービスも見られる。 そこでこの記事では、現時点で各サービスが出力するイラストのクオリティーを、全く同じキーワードを入力してみることで比較。それぞれの得手不得手を確かめてみる。お題は、SNSでも多くの人が自動生成にチャレンジしている「(二次元の)美少女」。各サービスはどんなイラスト

                                                              美少女イラストが上手なAIはどれだ! AIお絵描き選手権
                                                            • Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた

                                                              画像生成AI「Stable Diffusion」の開発元であるStability AIが画像生成モデル「Stable Diffusion XL 1.0(SDXL 1.0)」を公開しました。SDXL 1.0は2023年6月に研究目的で公開された「SDXL 0.9」をさらに強化したもので、すでにモデルデータが公開されている他、SDXL 1.0をサクッと使えるウェブアプリも用意されています。加えて、AmazonのAIサービス「Amazon Bedrock」でSDXL 1.0のAPIが利用可能になることも発表されています。 ANNOUNCING SDXL 1.0 — Stability AI https://stability.ai/blog/stable-diffusion-sdxl-1-announcement Stability AI Announces Stable Diffusion X

                                                                Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた
                                                              • 米画家ら、画像生成AI「Stable Diffusion」と「Midjourney」を提訴

                                                                  米画家ら、画像生成AI「Stable Diffusion」と「Midjourney」を提訴
                                                                • Google Colab で はじめる Stable Diffusion v1.4 (3) - Textual Inversionによるファインチューニング|npaka

                                                                  「Textual Inversion」による「Stable Diffusion」のファインチューニングに挑戦したので、その記録をまとめました。 RAMとGPUのメモリが必要なため「Colab (無料版)」では動きません。 「Colab Pro / Pro+」が必要です。 ・Stable Diffusion v1.4 ・rinongal/textual_inversion 前回 1. Textual Inversionによるファインチューニング「Textual Inversion」は、3~5枚の画像を使って「Stable Diffusion」のファインチューニングを行うことで、オリジナルの画風やキャラクターを追加学習させることができる手法です。 2. 学習用画像の準備ファインチューニングには5枚ほどの学習用画像が必要です。 ・画像サイズ は512×512。 ・Exifで回転してない画像。 ・

                                                                    Google Colab で はじめる Stable Diffusion v1.4 (3) - Textual Inversionによるファインチューニング|npaka
                                                                  • 絵下手マンがWaifu Diffusionでファンアートを描く方法 - Qiita

                                                                    2022/10/29 追記・注意事項 執筆から1ヶ月半ほどですが、この記事の内容は既にだいぶ古いです。お絵描きAI進歩速すぎる。 Waifu Diffusionは1.3からpromptソートが無意味になり、アンダーバーも不要になり、 ていうかそもそもモデル何でもいいならNovel AIの流出モデルを使った方が比べ物にならないほど質がいいです。 アプリもNMKDは最新トレンドについてこれてないのでAutomatic web ui一択になってます。 もういちいち更新する気も起きないのでこの記事は当時の状況を記す歴史資料として残します。 最新情報は他の記事を当たってください。 前置き この記事ではWaifu Diffusionを扱います。 意外と知らずに使っている方もいるようなのでここで念押ししておきますが、Waifu DiffusionはDanbooruという真っ黒もいいとこな無断転載天国サイ

                                                                      絵下手マンがWaifu Diffusionでファンアートを描く方法 - Qiita
                                                                    • [WebUI] Stable DiffusionベースモデルのCLIPの重みを良いやつに変更する

                                                                      簡単な記事なので前置きは省略します。 CLIPについて Stable Diffusionベースのモデルは、画像生成に際してテキストで条件づけを行う(a.k.a. txt2img)場合、CLIPという基盤モデルでテキストをベクトルに変換し、生成処理に渡しています。 つまり、入力したテキストをいかに的確に生成処理のモデルに伝えられるのかはCLIP(のようなテキストエンコーダー)の性能にかかっているわけですが、実はStable Diffusionに組み込まれているCLIPは、CLIPの中でも最強性能のものではありません。 適当に、画像のグラフに登場する点はそれぞれCLIPのバリアントで、上にあるモデルほど性能がいいと考えてください。 ここで、Stable Diffusion V1系に組み込まれているCLIPはL/14ですが、CLIPの中で最も性能の良いL/14@336pxに一歩遅れをとっているこ

                                                                        [WebUI] Stable DiffusionベースモデルのCLIPの重みを良いやつに変更する
                                                                      • 光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた

                                                                        ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。 GitHub - lllyasviel/IC-Light: More relighting! https://github.com/lllyasviel/IC-Light IC-Lightは画像の光源の種類や位置を指定しつつ背景を別物に置き換えられるAIツールです。IC-Lightはローカルにインストールして使用可能。さらに、インストール不要で使えるデモサイトも用意されていたので、実際にデモサイトでIC-Lightを使って画像を加工してみました。 IC-Lightのデモサイトには、以下のリンクをクリックするとアクセスできます。 IC Light - a Hugging Face Space by lllyasviel h

                                                                          光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
                                                                        • AI生成画像の美しさをAIに評価させてみた|IT navi|note

                                                                          最近、次々と新しい画像生成モデルが登場してくるので、どのモデルが高品質な画像を生成できるのか評価する方法はないかと頭を悩ませていたところ、画像の美しさを評価するAIがあると聞いたので調べてみました。 すると、Stable DiffusionやGoogleのImagenに画像データセットを提供しているドイツの非営利団体のLAIONがAesthetics Predictorという画像の美しさを評価するAIを公開していることが分かりました。 そこで、今回、いろいろな画像生成モデルで生成した画像をこのAIに評価させてみることにしました。 LAION-Aesthetics (Aesthetics Predictorによって抽出された高品質画像)

                                                                            AI生成画像の美しさをAIに評価させてみた|IT navi|note
                                                                          • 「AIと著作権に関する考え方」文化庁がパブリックコメント | NHK

                                                                            生成AIの開発や利用に伴って懸念されている著作権侵害に関連して、文化庁は、文化審議会の小委員会でまとめた「AIと著作権に関する考え方」の素案について、広く意見を求めるパブリックコメントを1月中に実施することになりました。 生成AIの利用が急速に広がり、クリエーターなどから、AIによるデータの学習や生成によって著作権が侵害されることを懸念する声があがる中、文化庁は、生成AIを利用したどのような行為が著作権の侵害にあたるのか、考え方を整理するため、有識者で作る文化審議会の小委員会で議論を行っていて、1月15日には、「AIと著作権に関する考え方」の素案が示されました。 この中では、AIが著作物を無断で学習することを原則として認めている著作権法30条の4について、「必要と認められる限度を超える場合」や、「著作権者の利益を不当に害する場合」を除くとする、ただし書きの対象範囲がわかりにくいとして、 ▽

                                                                              「AIと著作権に関する考え方」文化庁がパブリックコメント | NHK
                                                                            • TensorRTを使ってStableDiffusionを爆速にする

                                                                              どうもだだっこぱんだです。今までずっとjs,tsとかを触ってましたが、最近はpythonかなり触ってます。 AIなんも知らない人間ですがAIについて書いてみました。 まずは結果を 右は普通の生成方法。Diffusersにattention_slicingを有効にして生成した結果です。 真ん中はxformersを有効にした場合。 左は今から紹介するTensorRTを使用する方法です。 はじめに この記事では、技術関係なんも知らない!っという方向けのColabで試すだけの方法。 ある程度知識がある方向けのWindowsやLinuxで実際に動かす方法の二つを紹介します。 それいじょうのことはぼくはなにもわかりません🫠 Colabでお試し ノートブックを開く 👆のリンクからノートブックのリポジトリにアクセスし、OPEN IN COLABボタンをクリックしてノートブックを開きます。 事前ビルド済

                                                                                TensorRTを使ってStableDiffusionを爆速にする
                                                                              • Stable Diffusionの上位モデル「XL」ベータ版公開。画像の補完なども可能に

                                                                                  Stable Diffusionの上位モデル「XL」ベータ版公開。画像の補完なども可能に
                                                                                • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第八回:シンプルで高機能なSDXL専用インターフェースFooocusとFooocus-MREの使いかた (西川和久) | テクノエッジ TechnoEdge

                                                                                  生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧もっと簡単に高画質の絵を出したい!前回は画像生成AIなStable Diffusionを動かすにあたって、一番ポピュラーなインターフェースである AUTOMATIC1111のインストール方法と簡単な使い方をご紹介した。 AUTOMATIC1111はこれ一本で何でも出来る優れものなのだが、その分、設定項目が多く、ぱっと見、何が何だか分からない人も多いのではないだろうか。筆者も当初はそうだった。 AUTOMATIC1111の起動直後。正直これでは何から触って良いのかビギナーには分からない加えてStable Diffusion 1.5 (SD 1.5)標準Modelだと、画像生成を指示する呪文(Prompt)でいくら頑張っても大したものが出ないため、実用的に使うには別途Modelダウンロードする必要があるなど、初心者にとっては面

                                                                                    生成AIグラビアをグラビアカメラマンが作るとどうなる?第八回:シンプルで高機能なSDXL専用インターフェースFooocusとFooocus-MREの使いかた (西川和久) | テクノエッジ TechnoEdge