並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 239件

新着順 人気順

SDXLの検索結果1 - 40 件 / 239件

  • 最近ローカルLLMがアツいらしい

    最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し

    • 【全体公開】AIイラストが理解る!StableDiffusion超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX

      こちらの記事は2023年版のものです。特に理由がなければ、SDXLやForgeにも対応した2024年版の「AIイラストが理解る」をお読みくださいませ。 こんにちは!2022年10月からAIイラストの技術解説記事を連載してます、サークル「スタジオ真榊」の賢木イオです。この記事は、これまで投稿してきた100本(約40万文字)を超える...

        【全体公開】AIイラストが理解る!StableDiffusion超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX
      • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

        Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

          画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
        • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge

          使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk

            生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge
          • 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 ちもろぐ

            月額料金なし、無制限の生成枚数でAIイラストをガシガシ描くなら、Stable Diffusionをローカル環境にインストールする「AUTOMATIC1111版Stable Diffusion WebUI」が必要です。 しかし、ローカル版AIイラストはグラフィックボードも必須です。 VRAM容量が多くないとダメ RTX 4000シリーズが良い Radeonは絶対にNG などなど・・・。いろいろな情報が飛び交っていますが実際のところはどうなのか? やかもちグラフィックボードをなぜか40枚ほど所有している筆者が、実際にStable Diffusionを動かして徹底的に検証します。 (公開:2023/3/8 | 更新:2024/4/3) この記事の目次 Toggle AIイラスト(Stable Diffusion)におすすめなグラボを検証 検証方法:AIイラストの生成速度をテストする AIイラスト

              【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 ちもろぐ
            • 世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)

              Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。 大きな違いは「2回生成する」こと SDXLがこれまで

                世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)
              • 画像生成AI「Stable Diffusion XL」登場。DreamStudioならもう使えて、日本らしい人物・風景が簡単に生成できる(CloseBox) | テクノエッジ TechnoEdge

                Stability AIは、同社が提供している画像生成AI「Stable Diffusion」を大幅に強化した「Stable Diffusion XL」(SDXL)をオープンソース公開する計画であることを明らかにしました。 学習データを従来の9億パラメータから、23億パラメータへと大幅に強化。これが次期バージョン3に組み込まれるとしています。現在パートナーに対するベータ版提供を行っていますが、パートナーでなくても、DreamStudioユーザーであれば利用できます。 DreamStudioは、Stability AIが提供するAI画像生成サービス。これまで、Stable Diffusionのバージョン1.5、2.1、そして2.1で768×768ピクセルの高解像度描画ができるモデルを利用できていましたが、これにSDXL Beta Previewが加わりました。 ▲DreamStudioならS

                  画像生成AI「Stable Diffusion XL」登場。DreamStudioならもう使えて、日本らしい人物・風景が簡単に生成できる(CloseBox) | テクノエッジ TechnoEdge
                • 無料でGPT4越え!?ついに来たXwin-LM|shi3z

                  今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。 大先生もまだ試してないというので番組内で一緒に試してみた。 もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023

                    無料でGPT4越え!?ついに来たXwin-LM|shi3z
                  • GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita

                    GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみたPythonAWSAzureOpenAIGoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行しています。 各モデルの詳細は以下のとおりです。 G

                      GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita
                    • ちょっと感動したw

                      やっと、何の絵心もなく、ごちゃごちゃ難しいプロンプトの呪文をいじくるセンスもないオレでも、わりとすんなり意図したとおりのイメージを生成できるようになってきたなーw https://imgur.com/a/ERmddCm これ20年以上前だったか、THE BOOMの島唄を聴いて思いついたショーモナイ駄洒落を絵に描いて見せようと思ったんだけど、全然絵心がなくてまったく描けなかったヤツ。 StableDiffusionが出始めの去年の夏か秋頃、やってみたけど思うような絵が出なくて「まだまだだな...」と落胆したんだが、SDXL1.0とやらになってどうやら及第点だわ(謎の上から目線ww シマウマよカメに乗り、トリとともに海を渡れ〜〜〜 ---240214追記--- リートンとやらが、japanese StableDiffusionXLだかって言って日本語でプロンプトすれば絵が生成できるって言うてた

                        ちょっと感動したw
                      • 【西川和久の不定期コラム】 次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」

                          【西川和久の不定期コラム】 次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」
                        • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久) | テクノエッジ TechnoEdge

                          Checkpointとはあとひと月ほどすると、前回ご紹介した次世代Stable Diffusion、SDXLの波が来そう(来るかも?)と言うこともあり、今回は一番の基本となるCheckpointと、筆者の興味の対象となっているリアル系モデルの遷移にふれておきたい。 まずStable Diffusionのバージョンは1.4、1.5、2.0、2.1などがあり、現在最もポピュラーなのは1.5 (SDXLは0.9、1.0)。基本、対応したバージョンでないとモデルは作動しない。 一言でモデルと言っても、Stable Diffusionが必要、もしくはオプションとして扱えるモデルは、Checkpoint、LoRA、LyCORIS、Embedding、 Hypernetwork…など、さまざまな種類がある。絵を作る上において最も重要(=絵の元になる)のがCheckpointで、他は無くても最低限これだけ

                            生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久) | テクノエッジ TechnoEdge
                          • 生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法 | テクノエッジ TechnoEdge

                            写真でも絵画でも3Dでも、人物を表現するモチーフとして圧倒的に人気なのは「若い女性」です。テクノエッジにも西川和久氏の「生成AIグラビアをグラビアカメラマンが作るとどうなる?」という大人気連載があります。やはり人物の見目の良さを象徴するのは女性的な美であり、信仰など特別な要因が無い限り、時代を問わず普遍的な価値なのでしょう。 一方でこの記事が対象とする「おじさん」は、不人気なモチーフの代表です。かっこいいとか強いとか、男性性に付加されやすい魅力を添えればともかく、漠然とありふれたおじさんを表現したいと思う人は少ないようです。 私はゲームとWebのエンジニアで、2022年8月頃立て続けに画像生成AIが公開されてからずっと、ゲーム開発に応用できないか色々試してきました。同時に子育てやもっと個人的なことにも画像の生成を試していて、そのひとつが「ありふれたおじさん」です。 少し前には生成したおじさ

                              生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法 | テクノエッジ TechnoEdge
                            • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第七回:自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久) | テクノエッジ TechnoEdge

                              半年ほど前までであればGoogle Colabと言うクラウドGPU環境が使え、無料でサクッと動かせたのだが、それが災いし、多くの人が生成AI画像目的で利用したため、リソースが足らなくなり、後述するAUTOMATIC1111は無料枠で使用禁止になってしまった。 AUTOMATIC1111をインストールして使ってみる画像生成AIは各社が提供しており、扱うためのサービスやアプリもいろいろあるが、デファクトスタンダードはStable Diffusionを利用するためのフロントエンドにあたる AUTOMATIC1111だろう。現在は、次世代Stable Diffusion (SDXL)に対応したv1.6.0が公開されている。 ここではOSがWindows 11で、先に提示したNVIDIAのGPUが装着済の前提で解説する。少し前まではPythonやGitを入れたり、いろいろ面倒だったが、現在はbatフ

                                生成AIグラビアをグラビアカメラマンが作るとどうなる?第七回:自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久) | テクノエッジ TechnoEdge
                              • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第九回:Fooocus-MREでimage-2-imageやControlNetを試す (西川和久) | テクノエッジ TechnoEdge

                                今回はそれだけでは面白く無いので、元画像を絵柄そのまま高精細なフルHDにアップスケールしたい、もしくはそのまま使って絵を変えたい、構図やポーズをある程度固定したい、Photoshopのジェネレーティブ塗りつぶし的な機能は?…と言った、もう少しStable Diffusionっぽい使い方を順に説明する。 image-2-image / UpscalePromptから画像を得る方法を一般的にText-2-Imageと呼んでいる(txt2imgやt2iとも)。文字通りテキストから画像を…と言う意味だ。 Stable Diffusionでは、加えて画像から画像を得る方法があり、これをImage-2-Imageと呼んでいる(img2imgやi2iとも)。言葉よりも画像の方がより多くの情報を持っているので、それを使おうと言う意図だ。 これまで生成した画像の解像度は、832✕1,216や1,024✕1,

                                  生成AIグラビアをグラビアカメラマンが作るとどうなる?第九回:Fooocus-MREでimage-2-imageやControlNetを試す (西川和久) | テクノエッジ TechnoEdge
                                • 商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)

                                  AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AI「Emi(Ethereal master of illustration)」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。 「Stable Diffusion XL(SDXL)」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。 なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。 モデルをダウンロードして指定フォルダーに入れるだけ まずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待と

                                    商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)
                                  • AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い | テクノエッジ TechnoEdge

                                    ゲームとWebのフリーランス開発者。3DCGからゲーム開発の世界に入り20年。今は生成AIの変化を追いかけて日々実験しています。 生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。 どのように作ったか今回のフェイク新聞、作り方はかなり手抜きです。こうした制作に慣れている方なら30分もかからないでしょう。今はまだ多少専門性を求められますが、1年もすると「頑張れば誰にでも」程度になっているかもしれません。 実験としては、ぱっと見新聞だと感じてもらえなければ成立しません。しかしフェイクを作るのではなく、フェイクが作れる可能性の提示が目的です。画像が単体で流れていく可能性を考えると何かしら対策が必要で、強固な透

                                      AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い | テクノエッジ TechnoEdge
                                    • 高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久) | テクノエッジ TechnoEdge

                                      SDXL 1.0をAUTOMATIC1111で動かすにはStability AIが画像生成AIのStable Diffusion 1.5をリリースしたのは2022年10月20日。そこから約9ヶ月経った本日2023年7月27日、高画質な最新バージョンSDXL 1.0の登場となった。まだ全く使いこなせていないが、速報と言うことで、その絵をご覧頂きたい。 Stable Diffusion 1.5とSDXL 1.0の大きな違いはザックリ2点。 学習ベースが512✕512ドットから1,024✕1,024ドットへ 1pass式からBase→Refinerと言う2pass式になった 学習ベースの解像度がこれだけ違うと、当然出てくる絵に差が出る。1passから2passになった技術的な理由はさておき、Baseのままでもそれなりに見れ、更にRefinerを通すと解像度や質感が向上する。 BaseとRefin

                                        高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久) | テクノエッジ TechnoEdge
                                      • 軽量イラスト生成ソフト「NGUI v2」 - やえ

                                        概要 NGUIはパラメータ調整を自動で行い、キーワードを入力するだけで鮮明なイラストを生成するソフトです。VRAMが2GB程度のローエンドGPUから動作します。AIモデルはNGUI独自の「Hina」か他のモデルを読み込んで使えます。スマホ等による遠隔生成に対応。Python、C#勉強のため無料にて公開します。コメント欄にて質問承ります。 ダウンロードリンク(v2.1.7)   2/15更新(2.1.9は複数GPU環境で不具合あり)NGUIv2 : インストーラー版 NGUIv2_local : ポータブル(非インストール)版 不具合報告フォーム https://forms.gle/aYmzJvNeL4t1LKaR9 過去の対応はコメント欄にて 基本的な使い方 ・ソフトをインストールして起動 ・AIモデル(通常版 or NSFW強化版)を選択してOKボタンを押す ・キーワードを入力して生成ボ

                                          軽量イラスト生成ソフト「NGUI v2」 - やえ
                                        • 欧州帰りの医師、テレ朝グッドモーニングにインタビュー編集され愕然 「PCR検査増やすべき」と真逆に : 痛いニュース(ノ∀`)

                                          欧州帰りの医師、テレ朝グッドモーニングにインタビュー編集され愕然 「PCR検査増やすべき」と真逆に 1 名前:ニーリフト(愛媛県) [US]:2020/05/07(木) 20:57:05.04 ID:v4Z0I1dc0 本日テレビ朝日の朝のニュース番組グッド!モーニングで私がコロナウイルス診療に関してインタビューされたものが放送されました。 昨日の朝、テレビ朝日の方から取材の依頼が来て、夕方にzoomを用いたリモートでの取材という形で依頼を受けました。取材の依頼内容としましては、コロナウイルスへのヨーロッパ と日本の対応に関して現場の生の声を聞きたいとのことでしたので、専門家でないので一医療従事者の声としてしか答えられませんとお断りした上で取材に応じさせていただきました。 が、編集で取材内容とはかなり異なった報道をされてしまい、放送を見て正直愕然としました。取材では、ヨーロッパ での感染状

                                            欧州帰りの医師、テレ朝グッドモーニングにインタビュー編集され愕然 「PCR検査増やすべき」と真逆に : 痛いニュース(ノ∀`)
                                          • 漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!|AICU media

                                            4月に入り、X や kindle インディーズで AI で漫画を見かける機会が増えてきました。最近のイラスト系画像生成 AI では、漫画が流行の兆しを見せてきているようです。 参考:SD黄色本 そこで AICU media では、「AI で漫画を作ってみたいけど、どのモデルを使えばいいんだろう…」という方向けに、白黒漫画制作に適した Stable Diffusion のモデルを調査しました! Animagine 3.1まずはアニメ系 SDXL の主流モデルとなっている「Animagine」の最新バージョンである Animagine 3.1 でモノクロイラストを生成してみましょう。 プロンプト「best quality , monochrome , lineart,1girl, bob cut, flat chest , short hair , school uniform, round_

                                              漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!|AICU media
                                            • 画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた

                                              2023年7月に公開された「Stable Diffusion XL 1.0(SDXL 1.0)」は既存のStability AI製モデルと比べて高品質な画像を生成できるだけでなく、LoRAによる生成画像の調整にも対応しています。データサイエンティストのマックス・ウルフ氏は「悪い例」を集めて作成したLoRAを用いてSDXL 1.0による生成画像の品質をさらに向上させる手法を考案し、LoRAファイルおよび誰でも試せるデモを公開しています。 I Made Stable Diffusion XL Smarter by Finetuning it on Bad AI-Generated Images | Max Woolf's Blog https://minimaxir.com/2023/08/stable-diffusion-xl-wrong/ LoRAは参考となる画像を集めて絵柄や服装などを追

                                                画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた
                                              • 架空のおじさん新聞と「普通」の生成

                                                架空のおじさん新聞と「普通」の生成 by kogu 2023年12月6日 生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。 AIで生成したおじさん使って適当な偽新聞のCGを作ったらとても危険な感じだった。文章だけでも危ないのに画像が入ると更に悪く、新聞っていう実績ある様式でもっと悪化する。 pic.twitter.com/ixKODQwxX5 — kogu (@koguGameDev) December 3, 2023 どのように作ったか 今回のフェイク新聞、作り方はかなり手抜きです。こうした制作に慣れている方なら30分もかからないでしょう。今はまだ多少専門性を求められますが、1年もすると「頑張れば誰

                                                  架空のおじさん新聞と「普通」の生成
                                                • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

                                                  2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

                                                    Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
                                                  • GPT-4無料使い放題「リートン」が「GPT-4 Turbo」を一般ユーザーにも無料公開/画像生成AI「SDXL」も追加、文書生成AIはGoogleの「PaLM2」など7種から選択可能に

                                                      GPT-4無料使い放題「リートン」が「GPT-4 Turbo」を一般ユーザーにも無料公開/画像生成AI「SDXL」も追加、文書生成AIはGoogleの「PaLM2」など7種から選択可能に
                                                    • イラストの無断AI学習の対抗策「Nightshade」とその反応

                                                      mirium @numatakeja 画像生成AIに対する新たな防御ツール、Nightshade。記事の内容通りならメチャクチャ凄いぞこれ!! ・わずか100枚の”毒入り”画像を学習させるだけでSDXLの出力がほぼ完全に崩壊する ・毒は伝播する。例えば毒入りの「犬」を学習させると「ハスキー」や「狼」の出力も崩壊する Glazeへの統合が楽しみだ twitter.com/TheGlazeProjec… pic.twitter.com/uKgeJYybvN 2023-10-24 23:29:46 Glaze at UChicago @TheGlazeProject By now, I'm guessing most have already seen the news on our new project, Nightshade. Lots of artists sharing it, but

                                                        イラストの無断AI学習の対抗策「Nightshade」とその反応
                                                      • Amazon Bedrock を利用して生成 AI でなにができるのか?を体験できる AWS のワークショップをやってみた | DevelopersIO

                                                        Amazon Bedrock を利用して生成 AI でなにができるのか?を体験できる AWS のワークショップをやってみた re:Invent 2023 で開催予定の Game Day の 1 つに「Amazon Bedrock: Building with Generative AI」があります。私はこちらのイベント参加予定なのですが Amazon Bedrock を触ったことがありません。現地で焦る前に最低限のことを把握するべくAWS が提供している「生成系 AI 体験ワークショップ」をやってみました。 生成系 AI 体験ワークショップ 以下の環境を構築し、文章を校正してもらったり画像生成したりしました。 画像引用: 生成系 AI 体験ワークショップ ワークショップで学べること Amazon Bedrock を利用して ChatGPT の様なチャット機能や、画像生成を Web UI を

                                                          Amazon Bedrock を利用して生成 AI でなにができるのか?を体験できる AWS のワークショップをやってみた | DevelopersIO
                                                        • 『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力 | テクノエッジ TechnoEdge

                                                          Stability AIは11月17日、「Japanese Stable Diffusion XL」(JSDXL)を公開しました。 JSDXLは、テキストで記述されたプロンプトに応じて画像を出力するText-to-Imageモデルの最新版であるStable Diffusion XL(SDXL)を日本向けに特化させたAIモデル。 日本語を翻訳ではなく直接扱うことができるため、日本語特有の表現を認識し、日本の伝統的なものから現代的なものまで文化やアートを反映した高品質の画像を生成できるとしています。 ▲男子高校生のプロフィール写真(左: DALLE-3, 中央: 翻訳+SDXL, 右: JSDXL) ▲海岸沿いを走るライダー(左: DALLE-3, 中央: 翻訳+SDXL, 右: JSDXL) なお、JSDXLの学習データは、クリエイターから要求のあったオプトアウト、robots.txtや利用

                                                            『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力 | テクノエッジ TechnoEdge
                                                          • Amazon Bedrock の Claude と Stable Diffusion を組み合わせて簡単に画像生成 - Taste of Tech Topics

                                                            こんにちは、肌寒い日が続くと南の島の暖かい海に行きたくなる菅野です。 AWS上で、 様々なAIモデルを利用できるようになるサービス、Amazon Bedrockがリリースされました。 Bedrockでは今までのブログで紹介してきた、テキスト生成以外にも、画像生成に利用できるモデルStable Diffusionも利用可能になっています。 Stable Diffusion自体はOSSとなっているので無料で利用できますが、自身のマシンにインストールして動かす必要があり、動かすマシンにはある程度の性能のGPUも必須になってきます。 手軽にStable Diffusionをオンデマンドで利用できるのは今までにないメリットなのではないでしょうか? 今回は、BedrockのClaudeV2モデルを用いて作成したプロンプトを使って、Stable Diffusionで画像生成をしていこうと思います。 Be

                                                              Amazon Bedrock の Claude と Stable Diffusion を組み合わせて簡単に画像生成 - Taste of Tech Topics
                                                            • 最新の画像生成AI「SDXL 1.0」実写系イラストのクオリティがすごい!! (1/3)

                                                              Stability AIは7月27日、待望の新たな画像生成AIモデル「Stable Diffusion XL 1.0(SDXL 1.0)」を公開した。 Stability AIが運営するAIウェブアプリ「Clipdrop」で試用できるようになっているが、Stable Diffusionの標準的なUIとなっているAUTOMATIC1111氏の「Stable Diffusion web UI」がさっそくSDXLに対応したとのことなので環境を構築してみた。 SDXL 1.0の詳細については速報記事を参照してもらうとして、一応機能的な面だけおさらいしておくと……。 標準画像解像度はこれまでの倍にあたる1024×1024ピクセル。2つのモデルを併用する仕組みになっており、まず3.5B(35億)パラメーターの「ベース(Base)」モデルで一度128×128ピクセルで生成した画像を、6.6B(66億)パ

                                                                最新の画像生成AI「SDXL 1.0」実写系イラストのクオリティがすごい!! (1/3)
                                                              • Stability AI, Stable Studio, Stable Diffusion — Stability AI Japan

                                                                Stable Diffusionのオリジナルリリース以来、DreamStudioはStability AIが新しいモデルや機能を使用する際の主要なインターフェースとして機能してきました。最近では、私たちの最新の画像生成モデルであるSDXLを使用するためにアップグレードされたことをご記憶の方も多いと思います。このアプリケーションは、生成AIの能力を多くの人たちに届けるためのプラットフォームとして最初に開発されました。 私たちの目標は、より広いコミュニティと協力して、ユーザーが自由に使える生成AIのためのワールドクラスのユーザーインターフェイスを作ることです。 StableStudioの機能拡張について DreamStudioは、当初Disco Diffusionのアニメーションスタジオとしてイメージしていました。2022年夏、Stable Diffusionの登場を目前に控え、フォーカスは画

                                                                  Stability AI, Stable Studio, Stable Diffusion — Stability AI Japan
                                                                • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第十回:実在モデルからSDXL用顔LoRAを作る (西川和久) | テクノエッジ TechnoEdge

                                                                  https://www.techno-edge.net/special/560/recent/%E7%94%9F%E6%88%90AI%E3%82%B0%E3%83%A9%E3%83%93%E3%82%A2%E3%82%92%E3%82%B0%E3%83%A9%E3%83%93%E3%82%A2%E3%82%AB%E3%83%A1%E3%83%A9%E3%83%9E%E3%83%B3%E3%81%8C%E4%BD%9C%E3%82%8B%E3%81%A8%E3%81%A9%E3%81%86%E3%81%AA%E3%82%8B%EF%BC%9F続きを読む » Modelに無い顔や彼女の顔を出したい!生成AIでポートレート写真やグラビアを作っていると、同じような雰囲気の顔ばかりが結構出るのに気付く。 もちろん何パターンもあるので、毎回同じでもないのだが、XやInstagramなどの生成AI画像

                                                                    生成AIグラビアをグラビアカメラマンが作るとどうなる?第十回:実在モデルからSDXL用顔LoRAを作る (西川和久) | テクノエッジ TechnoEdge
                                                                  • Stable DiffusionのLoRAのつくりかた|RedRayz

                                                                    はじめにこの記事は、初めてStable DiffusionのLoRAを作成する方に向けた解説です。わかりづらかったらすみません。 この解説ではSDXLベースのAnimagine-XL-3.1で二次元イラストのキャラクターのLoRAを作成します。 注意すでにWebUIの環境構築と生成ができていて生成に慣れている前提のガイドとなります。 Windows向けのガイドです。 また、NVIDIAのGeForce RTXグラフィックボードが搭載された高性能なパソコンが必要です。 そもそもLoRAってなんぞや?Low-Rank Adaptationが正式名称です。 難しくいうと、ウェイトとデータセットの差分を出力するものです。低ランクの行列に分解してからファインチューンすることで少ないメモリで学習できるようにしたものです。 簡単に言えば、LoRAはキャラ、衣装、シチュエーションや画風などを追加で学習した

                                                                      Stable DiffusionのLoRAのつくりかた|RedRayz
                                                                    • 【AI漫画実験/第2回】画像AIのSDXL+加筆で、手描きに近い白黒漫画を作れないか実験してみた|野火 城

                                                                      これは「今までガチガチに手描きで漫画を描いてきた奴が、AIをフルに作って従来の白黒漫画と同じフォーマットの原稿を作るとどうなるか」という実験の記録・第2弾です。 前回と、今まで製作したAI漫画のまとめ読みkindle(無料)はこちら。 前回は具体的なAI+クリスタ使用テクニックでしたが、今回は ・AI漫画のAIっぽい違和感の原因考察 ・手描きに近い自然な流れを作るにはどこをどう加筆修正したらいいか が中心の記事になります。 あとオマケで「ネームへの向上心を養うには」「AIに加筆する抵抗感」「AI導入への焦りについて」なども書きました。暇だったらどうぞ。 まずこれが今回描いた実験漫画です。 シリアスにしようと思ったのですが、良い具合にショートのシリアスネタが思いつかなかったのでまたコメディになりました。 今回の実験で試したのは ・AIがつけた影をそのまま生かしてトーン(グレースケール)化する

                                                                        【AI漫画実験/第2回】画像AIのSDXL+加筆で、手描きに近い白黒漫画を作れないか実験してみた|野火 城
                                                                      • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久) | テクノエッジ TechnoEdge

                                                                        ComfyUIが流行ってる?Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。 ところが最近、ComfyUIがちょっとした人気だ。以前軽くご紹介したが、カスタムNodeを組み合わせ自由にWorkflowを構築できる結構マニアックなアプリなのに何故? ComfyUI。カスタムNodeを接続してWorkflowを作る…と結構マニアックなアプリ。これは筆者が日頃使っているWorkflowの1つこれには理由があり、12月頃から以降、Stable Video Diffusion、Kohya's HiresFix、SDXL Turbo、LCM、FaceID、PhotoMaker、InstantID、様々なControlN

                                                                          生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久) | テクノエッジ TechnoEdge
                                                                        • クリーンな画像生成AI「Emi」商用利用可能で無償公開

                                                                          AI画像生成サービスなどを運営するAI Picassoは9月25日、追加学習において無断転載画像を学習していない画像生成AI、「Emi(Ethereal master of illustration)」を商用利用可能で無償公開。 あわせて、パブリックドメインの画像や著作権者から学習を許可された画像だけで学習させたクリーンな画像生成AI「Manga Diffusion」の概念実証版も開始したことを発表した。 無断転載画像を学習していないクリーンなAI Emiは、Stability.AIが開発する「Stable Diffusion XL 1.0(SDXL)」をベースにAI Picassoが追加学習をし、AIアートに特化した画像生成モデルだ。 Stable Diffusionベースのモデルの中には、権利処理されていない画像を使って学習された疑いのあるモデルも多く問題となっているが、本モデルは「D

                                                                            クリーンな画像生成AI「Emi」商用利用可能で無償公開
                                                                          • 【西川和久の不定期コラム】 爆速で画像生成するSDXL Turboと、画像1枚で動画を生成するStable Video Diffusionを試した

                                                                              【西川和久の不定期コラム】 爆速で画像生成するSDXL Turboと、画像1枚で動画を生成するStable Video Diffusionを試した
                                                                            • 画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します (1/3)

                                                                              前回の記事では、StabilityAIの最新画像生成モデルStable Diffusion XL(SDXL)を簡単に使えるWebインターフェース「Fooocus」を紹介した。 画像生成AIの制御技術「ControlNet」でも知られる作者lllyasviel(Lvmin Zhang)氏の開発ペースはとても早い。前回の記事掲載後にも多くの便利な新機能が実装されたため、今回はこれらを紹介する。 「Fooocus」のインストール方法は前回記事を参照。一度インストールすればアップデートは起動時に自動でかかるため、利用者が意識することはない。 アップデートの内容についてはGitHub内のDiscussionsページを参照しよう。

                                                                                画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します (1/3)
                                                                              • グラボを買い替えずとも画像生成AIの実行速度を高速化できる「Stable Diffusion WebUI Forge」を実際にインストールして生成速度を比較してみた

                                                                                画像生成AI「Stable Diffusion」には、有志が作成したユーザーインターフェースが複数用意されています。「Stable Diffusion WebUI Forge」はControlNetの開発者であるLvmin Zhang氏が開発したユーザーインターフェースで、広く使われている「Stable Diffusion web UI(AUTOMATIC1111版)」と比べて画像を高速に生成できるとのこと。そこで、Stable Diffusion WebUI Forgeを実際にインストールする手順やStable Diffusion web UI(AUTOMATIC1111版)との生成速度の差を確かめてみました。 GitHub - lllyasviel/stable-diffusion-webui-forge https://github.com/lllyasviel/stable-dif

                                                                                  グラボを買い替えずとも画像生成AIの実行速度を高速化できる「Stable Diffusion WebUI Forge」を実際にインストールして生成速度を比較してみた
                                                                                • Sakana AI

                                                                                  日本語プロンプト対応の高速画像生成モデルEvoSDXL-JPで生成した画像の例。プロンプトは「可愛いゾウの編みぐるみ」、「ラーメン、浮世絵、葛飾北斎」、「折り紙弁当」、「(下町ロケット、東京サラリーマン)、浮世絵」など 概要 Sakana AIは先日、進化的アルゴリズムを用いた基盤モデル構築の手法「進化的モデルマージ」を提案しました。また、進化的モデルマージにより構築された日本語の大規模言語モデルEvoLLM-JPと画像言語モデルEvoVLM-JPを公開しました。これらのモデルは、言語生成を目的とした自己回帰型Transformerモデルでした。今回私たちは、進化的モデルマージの可能性をさらに示すために、画像生成タスクで広く用いられる拡散モデルへの適用を行いました。 このリリースの要点は以下の通りです。 画像生成で昨今用いられている拡散モデルに進化的モデルマージを適用しました。言語生成モデ

                                                                                    Sakana AI