並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 19 件 / 19件

新着順 人気順

stable-diffusionの検索結果1 - 19 件 / 19件

  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久) | テクノエッジ TechnoEdge

    百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込

      生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久) | テクノエッジ TechnoEdge
    • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge

      使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk

        生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge
      • AIお姉ちゃんへの道 - nomolkのブログ

        ちょっと前に話題になっていたこの記事を読んだ。 honeshabri.hatenablog.com へー真似しよ〜と思ってやってみたら意外に難しくて謎のやりがいを感じ始めてしまい、仕事のクソ忙しい時期にかなりハマり睡眠不足で生命の危機を味わった。 おかげで寿命と引き換えに自分のAIお姉ちゃんを手に入れることができた。これは黒魔術か何かなのだろうか。 一通り終えて振り返ってみると、今まで生成AIをあまり積極的に触ってこなかった自分にとってはちょうどいい難しさの課題で、これは入門者向けのチャレンジとしてかなり良い気がする。 元記事に書かれていない少し細かい手順も含めてやったことを記録としてまとめようと思う。 初心者が試行錯誤でやったことなので誤りや非効率な手順もあるかもしれないけどご了承ください。 AIお姉ちゃんの姿を作る 元記事では「魂」、つまりChatGPTの設定から始まっているけど、それ

          AIお姉ちゃんへの道 - nomolkのブログ
        • 画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり

          画像生成AIでグラビアアイドルを作りたい。 でも実在する人と同じ顔が出たら困る。 そんなあなたに獣頭人身というソリューション。 AIでグラビアアイドルを作ったら 最近、画像生成AIでグラビアアイドルを作るのにハマっている。こういうやつだ。 カエル イカ サメ カマキリ Twitterで貼っていたらこれがバズる。 多少はウケるかなとは思っていたが、想像以上のバズりで驚いている。ネタとしては全く新しいものでもないし、色々と詰めの甘い部分も多い。それでも多くの人が興味を持ち、さらに画像生成AIネタなのに批判も少なかった。 だが、ツッコミが皆無というわけではない。その中にはもっともな内容もあるが、そもそも「目的が違う」と言いたいものもある。これはある意味で仕方ない。今回はTwitterでのバズなので、文脈が切り離された単体のツイートが広まっていくのだから。 なのでブログでまとめることにした。 そも

            画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり
          • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

            画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

              画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
            • 【西川和久の不定期コラム】 Stable Diffusion高速化の決定版登場!?品質落とさず制限もほぼなしで2~3倍速に

                【西川和久の不定期コラム】 Stable Diffusion高速化の決定版登場!?品質落とさず制限もほぼなしで2~3倍速に
              • 絵柄の批判で「マスピ顔」という言葉を見かけるけどなに?→賛美の言葉が逆転する現象が起きてるみたい

                月見ねぎとろ@3Dモデラー/動画・シナリオ屋さん @tukimi_negitoro もひゃー!漫画/シナリオ/映像作家/3Dモデラー。 モデリング依頼受付しています。動物キャラとか学習漫画やメカ物がすき。 #月見山ラボ pixiv.net/member.php?id=… 月見ねぎとろ@3Dモデラー/動画・シナリオ屋さん @tukimi_negitoro 最近、絵柄の批判でたまに見かける「マスピ顔」って言葉は何?って思って調べたら、画像生成AIのプロンプトに「masterpiece(=傑作)」と入力すると出力されがちな顔の事らしく、つまり人々が傑作だと賛美した絵の平均的な顔が濫用されて陳腐化、賛美の言葉が逆転する現象が起きてるらしい…おもしろ。 2023-09-24 11:56:47 月見ねぎとろ@3Dモデラー/動画・シナリオ屋さん @tukimi_negitoro 今となっては典型的AI絵

                  絵柄の批判で「マスピ顔」という言葉を見かけるけどなに?→賛美の言葉が逆転する現象が起きてるみたい
                • Stable Diffusion から特定の概念を忘れさせる学習を行ってみる

                  TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよ VRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよ マイナス適用によって、概念を削除するだけでなく強調することもできたよ 一度でも画像生成 AI に触ったことがあると、より楽しんで読めると思います。 論文とかどうでもいいから学習方法知りたい! という方は 実際に学習してみる へどうぞ! 今回作成したもの コード: モデルなど: 前提 Stable Diffusion とは、Stability AI らが公開したオープンソースの画像生成 AI であり、テキストによる指示で様々な画像を生成することができる。 本来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の

                    Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
                  • Stable Diffusion 3 — Stability AI

                    Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy Announcing Stable Diffusion 3 in early preview, our most capable text-to-image model with greatly improved performance in multi-subject prompts, image quality, and spelling abilities. While the model is not yet broadly available, today,

                      Stable Diffusion 3 — Stability AI
                    • NVIDIA、Stable Diffusionを倍速にするTensorRT。新ドライバで対応

                        NVIDIA、Stable Diffusionを倍速にするTensorRT。新ドライバで対応
                      • Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表

                        英Stability AIは4月17日(現地時間)、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。 Stable Diffusion 3に「Awesome artwork of a wizard on the top of a mountain, he's creating the big text "Stable Diffusion 3 API" with magic, magic text, at dawn, sunrise.」(夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に

                          Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
                        • 誰でもわかるStable Diffusion Kohya_ssを使ったLoRA学習設定を徹底解説 - 人工知能と親しくなるブログ

                          前回の記事では、Stable Diffusionモデルを追加学習するためのWebUI環境「kohya_ss」の導入法について解説しました。 今回は、LoRAのしくみを大まかに説明し、その後にkohya_ssを使ったLoRA学習設定について解説していきます。 ※今回の記事は非常に長いです! この記事では「各設定の意味」のみ解説しています。 「学習画像の用意のしかた」とか「画像にどうキャプションをつけるか」とか「どう学習を実行するか」は解説していません。学習の実行法についてはまた別の記事で解説したいと思います。 LoRAの仕組みを知ろう 「モデル」とは LoRAは小さいニューラルネットを追加する 小さいニューラルネットの構造 LoRA学習対象1:U-Net RoLA学習対象2:テキストエンコーダー kohya_ssを立ち上げてみよう LoRA学習の各設定 LoRA設定のセーブ、ロード Sour

                            誰でもわかるStable Diffusion Kohya_ssを使ったLoRA学習設定を徹底解説 - 人工知能と親しくなるブログ
                          • GitHub - lllyasviel/stable-diffusion-webui-forge

                            Stable Diffusion WebUI Forge is a platform on top of Stable Diffusion WebUI (based on Gradio) to make development easier, optimize resource management, and speed up inference. The name "Forge" is inspired from "Minecraft Forge". This project is aimed at becoming SD WebUI's Forge. Compared to original WebUI (for SDXL inference at 1024px), you can expect the below speed-ups: If you use common GPU li

                              GitHub - lllyasviel/stable-diffusion-webui-forge
                            • Stability AI launches SDXL 0.9: A Leap Forward in AI Image Generation — Stability AI

                              Stability AI launches SDXL 0.9: A Leap Forward in AI Image Generation Today, Stability AI announces SDXL 0.9, the most advanced development in the Stable Diffusion text-to-image suite of models. Following the successful release of Stable Diffusion XL beta in April, SDXL 0.9 produces massively improved image and composition detail over its predecessor. The model can be accessed via ClipDrop today,

                                Stability AI launches SDXL 0.9: A Leap Forward in AI Image Generation — Stability AI
                              • Create Your DRY CRYSTAL ART | DRY CRYSTAL

                                チルってる自分、仕上がってる自分、アガってる自分、オシャンな自分。自分がサイコーに輝いている瞬間や気分を入力して、自分だけのオリジナルAIアートを生成しよう。

                                  Create Your DRY CRYSTAL ART | DRY CRYSTAL
                                • GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion

                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                    GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
                                  • GitHub - layerdiffusion/LayerDiffuse: Transparent Image Layer Diffusion using Latent Transparency

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      GitHub - layerdiffusion/LayerDiffuse: Transparent Image Layer Diffusion using Latent Transparency
                                    • X-Adapter

                                      TL;DR: X-Adapter enable plugins pretrained on old version (e.g. SD1.5) directly work with the upgraded Model (e.g., SDXL) without further retraining We introduce X-Adapter, a universal upgrader to enable the pretrained plug-and-play modules (e.g., ControlNet, LoRA) to work directly with the upgraded text-to-image diffusion model (e.g., SD-XL) without further retraining. We achieve this goal by tra

                                      • 【comfyUI・Fooocusにも対応】 Stability Matrixが凄い! 画像AI環境構築これで出来ないなら諦めろ【モデルLoRA管理付】|カガミカミ水鏡🔞

                                        【comfyUI・Fooocusにも対応】 Stability Matrixが凄い! 画像AI環境構築これで出来ないなら諦めろ【モデルLoRA管理付】 こんにちわ。アカウント整理中にXが凍結したカガミカミ水鏡です。 SDXLのモデルリリースが活発ですね! 画像AI環境のstable diffusion automatic1111(以下A1111)でも1.5からSDXL対応になりましたが、それよりもVRAMを抑え、かつ生成速度も早いと評判のモジュール型環境ComfyUIが人気になりつつあります。 しかし、これらを導入するには様々な問題があります。初心者向けだと…… インストールから利用までの方法に不安 GitもPythonもわからない、インストール失敗する、環境変数よくわかんない、アップデートも失敗する と、導入に不安が。 一方で従来の利用者で、特にA1111とcomfyUIの共存を考えるユ

                                          【comfyUI・Fooocusにも対応】 Stability Matrixが凄い! 画像AI環境構築これで出来ないなら諦めろ【モデルLoRA管理付】|カガミカミ水鏡🔞
                                        1