並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 2906件

新着順 人気順

"Stable Diffusion"の検索結果241 - 280 件 / 2906件

  • GitHubのトレンドで振り返る2022年のJavaScript/TypeScript

    今年も GitHub トレンドから 2022 年の JavaScript/TypeScript を振り返ります。去年の記事はこちらです。 — GitHub のトレンドで振り返る 2021 年の JavaScript | WEB EGG 集計方法 本記事の集計期間は 2022/01/01〜2022/12/07、対象言語は JavaScript および TypeScript です。 なお GitHub がそのリポジトリをなんの言語と見なしてトレンドに掲載したかをもとに集計対象を決定していることにご留意ください。 別言語で書かれた Rust 製の JS 向けのツールや CSS フレームワークなどは基本的に対象外となります。 集計に利用したデータですが、GitHub は過去のトレンドを閲覧する方法を提供していないため、独自の仕組みで GitHub トレンドのアーカイブを生成しそのデータを利用しまし

      GitHubのトレンドで振り返る2022年のJavaScript/TypeScript
    • 商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)

      AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AI「Emi(Ethereal master of illustration)」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。 「Stable Diffusion XL(SDXL)」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。 なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。 モデルをダウンロードして指定フォルダーに入れるだけ まずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待と

        商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)
      • Stable Diffusion から特定の概念を忘れさせる学習を行ってみる

        TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよ VRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよ マイナス適用によって、概念を削除するだけでなく強調することもできたよ 一度でも画像生成 AI に触ったことがあると、より楽しんで読めると思います。 論文とかどうでもいいから学習方法知りたい! という方は 実際に学習してみる へどうぞ! 今回作成したもの コード: モデルなど: 前提 Stable Diffusion とは、Stability AI らが公開したオープンソースの画像生成 AI であり、テキストによる指示で様々な画像を生成することができる。 本来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の

          Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
        • 画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み

          決済手段としても用いられるようになっている「QRコード」は、一部が破損・汚損していたり読み取り時に隠れていても大丈夫なように誤り訂正機能が盛り込まれています。これを活用して、QRコードと美麗なイラストを融合させる試みが行われています。 AI 生成可扫码图像 — 新 ControlNet 模型展示 https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw AIGC All in One https://aigc.ioclab.com/index.html Redditor creates working anime QR codes using Stable Diffusion | Ars Technica https://arstechnica.com/information-technology/2023/06/redditor-creates-

            画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み
          • オープンソースのチャットAI「StableVicuna」がリリース。「Stable Diffusion」の開発元が提供する、人間のフィードバックに基づく強化学習でチューニングしたAI

            Stability AIが、オープンソースのチャットボット 「StableVicuna」を発表 オンラインで「StableVicuna」との会話を試すことが可能 チャットボットインターフェースが近日公開予定 Stability AIは、現地時間2023年4月28日(金)にオープンソースのチャットボット「StableVicuna」 を発表しました。 Announcing StableVicuna, the AI World’s First Open Source RLHF LLM Chatbot!@CarperAI (in an effort led by @phungvanduy1) is releasing an RLHF-trained version of Vicuna-13B Learn more → https://t.co/fWk3N8Njg5 pic.twitter.com/

              オープンソースのチャットAI「StableVicuna」がリリース。「Stable Diffusion」の開発元が提供する、人間のフィードバックに基づく強化学習でチューニングしたAI
            • 漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

              発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。 話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新 清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。 生成AIは「アナログからデジタル」の変化と同じ ── 最初にそれぞれの会社について教えてください。 ジェームズ キム・ドンジュン 2022年下半期ごろから、生成AIに関心をもって、

                漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)
              • 何故日本のAI技術は中国人に完全敗北したのか?|瑞島フェレリ

                はじめに 自分は去年の今頃(2022年12月)に、「AIアートとMMDについて。金は著作権より重い。」という記事を書いた。 https://archive.is/l9iKV その記事を書いたら、「MMDは日本の3DCGを破壊してしまった 」という記事も合わせてバズった。 「MMDは日本の3DCGを破壊してしまった (2022年度版)2022/08/16加筆」 https://archive.is/DenAN 2018年に日本の3DCGがMMDでガラパゴス化したと指摘され、およそ3年が経過した。 現在の日本の3DCGはどうなってしまったのか? 結論から言えば中国(ビリビリ動画)に日本の3DCG(ニコニコ動画)は完全に追い抜かれてしまった。 日本の白物家電が中国・韓国製に駆逐されたのと同じように、世界から完全に取り残されてしまったのだ。 MMDは日本の3DCGを破壊してしまった (2022年度

                  何故日本のAI技術は中国人に完全敗北したのか?|瑞島フェレリ
                • 迫真AI部 movie2movieの裏技

                  話題のAI画像生成で動画を変換してみました。Stable Diffusion(AUTOMATIC1111)を魔改造してmovie2movie(動画→動画)変換してます。不安定に見えますが、試行錯誤を経てだいぶ絵っぽく見えてきてます。ただ迫真空手部しか変換してみてないので、今後色々やってみようかと思います。元動画の解像度が低いからか元とかけ離れた画像を生成しまくって、調整すっげぇキツかったゾ...。▼実現方法1. 動画→フレーム出力2. フレームをSwinIRで4倍高解像度化3. ポスタリゼーションをかけて境界をくっきりさせてみました(階調は10弱、ですかね...)4. 画像を512px * 512px にリサイズ5. img2img変換(余力があればここでもう一回高解像度化してみても良いかも。)6. フレーム→動画出力※プロンプトはシーン毎に少しずつ変えてみてます。すべてpythonで自動

                    迫真AI部 movie2movieの裏技
                  • 「われわれはNovelAIと関係ない」──海外のイラストサイト「Danbooru」が日本語で声明

                    海外のイラストサイト「Danbooru」は10月5日までに、画像生成AI「NovelAI Diffusion」(NovelAI)と無関係であると主張する声明を発表した。声明は英語と日本語で記載。「最近話題になっているNovelAIのことでお悩みになっている絵師様へ」とし、メッセージを公開している。 NovelAIは10月3日にサービスを開始した画像生成AIで、「二次元美少女をうまく生成できる」などと話題になった。その中で、NovelAIの公式Twitterアカウント(@novelaiofficial)は、データ学習元にDanbooruを使っていると投稿。Twitter上ではNovelAIの違法性を問う声も上がっており、ソース元としてNovelAIが明示したDanbooruにも批判の目が向いていた。 Danbooruはさまざまなユーザーが描いたイラストを掲載する海外サイト。同サイトを巡っては

                      「われわれはNovelAIと関係ない」──海外のイラストサイト「Danbooru」が日本語で声明
                    • “無限の柔軟性”を提供するM2搭載「Mac mini」という選択肢の魅力

                      Appleの「Mac mini」は、これまでMacとして主流の選択肢ではなかったかもしれない。しかし長引く円安の影響、M2搭載の「Mac Studio」や「Mac Pro」不在の状態の中で、新たにM2 Proを備えたMac miniが出ることにより、かなり魅力的な選択肢になっている Mac miniなら“最安値”も“高い性能”も選べる 2023年1月に、M2 Pro/M2 Maxを搭載した新型「MacBook Pro」と、M2/M2 Proを採用した「Mac mini」が相次いで発表されたが、この発表でMac miniが何とも面白い位置付けの製品に化けてしまった。 「Mac mini」がM2/M2 Proチップを搭載してモデルチェンジ さてここで、1つ問題を出したい。 今、2022年からの円安の影響でMac全モデルが少し割高に感じられる中、最も手頃な価格で購入できるのはどのモデルかご存じだ

                        “無限の柔軟性”を提供するM2搭載「Mac mini」という選択肢の魅力
                      • 革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた

                        中国のSNS「快手(Kuaishou)」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵(Kling)」を開発。多数のサンプル動画を掲載するデモサイトを公開した。 テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute videos at 30fps, 1080p quality, available on the KWAI iOS app with a Chinese phone number A few generations from their site: 1. pic.twitter.com/NEmWiqKHiO — Rowan Cheung (@rowancheung) June 6, 20

                          革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた
                        • AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い | テクノエッジ TechnoEdge

                          ゲームとWebのフリーランス開発者。3DCGからゲーム開発の世界に入り20年。今は生成AIの変化を追いかけて日々実験しています。 生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。 どのように作ったか今回のフェイク新聞、作り方はかなり手抜きです。こうした制作に慣れている方なら30分もかからないでしょう。今はまだ多少専門性を求められますが、1年もすると「頑張れば誰にでも」程度になっているかもしれません。 実験としては、ぱっと見新聞だと感じてもらえなければ成立しません。しかしフェイクを作るのではなく、フェイクが作れる可能性の提示が目的です。画像が単体で流れていく可能性を考えると何かしら対策が必要で、強固な透

                            AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い | テクノエッジ TechnoEdge
                          • AWS、API経由でジェネレーティブAIを利用する新サービス「Amazon Bedrock」を発表し、ジェネレーティブAIに本格参入。テキスト生成、文章要約、画像生成など

                            AWS、API経由でジェネレーティブAIを利用する新サービス「Amazon Bedrock」を発表し、ジェネレーティブAIに本格参入。テキスト生成、文章要約、画像生成など Amazon Web Services(AWS)は、ジェネレーティブAIをAPI経由で利用できる新サービス「Amazon Bedrock」を発表し、ChatGPTに代表されるジェネレーティブAI市場に本格参入することを明らかにしました。 合わせて、Amazonの20年にわたる機械学習の経験を基に開発されたとされる、人間と自然言語で対話し質問に回答でき、要求に応じた文章の生成や要約などが可能で、不適切な入力や出力を検出し拒否するように設定された大規模言語モデル「Amazon Titan」も発表しました。 下記はAWS CEO Aam Selipsky氏のツイート。 We’re announcing Amazon Bedro

                              AWS、API経由でジェネレーティブAIを利用する新サービス「Amazon Bedrock」を発表し、ジェネレーティブAIに本格参入。テキスト生成、文章要約、画像生成など
                            • 一番星はてののLINEスタンプっぽい画像を作ってみた - 一番星はての開発ブログ

                              StableDiffusionを使ってLINEスタンプを作ってみたかったのでとりあえず画像を作ってみた。使っているモデルはaiceKawaice_channel。ちび系キャラを生成するのにいいらしい。 (追記)このモデルは画像販売が不可なのでLINEスタンプには使えなさそうです。 AICE冰可 | KawAICE[幼态特化模型] - Channel | Stable Diffusion Checkpoint | Civitai よく見るといろいろ粗はあるがパッと見はけっこう使えそうな感じなんじゃないだろうか。 この中では「ファイトですわ」の元気な感じと「ブックマークですわ」の微妙に面白くなさそうな感じが気に入っている。 ブクマするときの表情ってこんなんだよね。 作り方 LoRAを何度か試したが作り方が悪いのか、画像のパターン数が足りないのか結局ReferenceOnlyの方がいいクオリティ

                                一番星はてののLINEスタンプっぽい画像を作ってみた - 一番星はての開発ブログ
                              • 骨しゃぶりさんと本屋を巡ったらめちゃくちゃ楽しかった話

                                きっかけは、骨しゃぶりさんの「人付き合いって大事かなと思ったら読みたい3冊」。 確かに人付き合いは大事やなと思い立ち、骨しゃぶりさんとサシオフ(差しでオフ会)してきたらめちゃくちゃ楽しかった。 重要なのは、「リアルで会って話する」こと。表情や相槌を見ながら言葉や事例を選ぶことができるし、こちらのレスポンスの影響も即座に分かる。「読むことは人を豊かにし、話すことは人を機敏にし、書くことは人を確かにする」というけれど、読み書きが達者なブロガー同士が「話す」となると、面白い化学反応が起こる。 ChatGPTとスタニスワフ・レム 興味深い話になったのは、流行りの生成AI(Generative AI)ネタ。 文章で指定して画像を生成するのだが、私がやってもイマイチなやつしか出てこない(私の呪文がイケていない自覚はある)。 骨しゃぶりさんも、似たような悩みを抱えていたみたいだ。まず、別ソフトで3Dでポ

                                  骨しゃぶりさんと本屋を巡ったらめちゃくちゃ楽しかった話
                                • 画像生成AI「Stable Diffusion」でイラストの要素を読み取ってオリジナルの要素を引き継いだイラストをサクッと生成可能にする「Tagger for Automatic1111’s Web UI」の使い方まとめ

                                  画像生成AI「Stable Diffusion」では、文章(プロンプト)を入力することで自由に画像を生成できます。しかし、自分好みの画像を生成するにはプロンプトにこだわる必要があり、慣れるまでは「好みの画像をサクッと生成」とはいきません。「Tagger for Automatic1111's Web UI」を使えば参考画像の要素を読み取ってDanbooruのタグを導き出し、「参考画像に似た画像」を生成可能なプロンプトを一発で作成できるとのことなので、実際に使ってみました。 GitHub - toriato/stable-diffusion-webui-wd14-tagger: Tagger for Automatic1111's Web UI https://github.com/toriato/stable-diffusion-webui-wd14-tagger Tagger for A

                                    画像生成AI「Stable Diffusion」でイラストの要素を読み取ってオリジナルの要素を引き継いだイラストをサクッと生成可能にする「Tagger for Automatic1111’s Web UI」の使い方まとめ
                                  • テキストから画像を生成できるオープンソースのStable Diffusionアプリ「Diffusers for Mac」がGPU/Neural Engine選択に対応し、Apple Silicon Macでは生成速度が最大2倍に。

                                    テキストから画像を生成できるオープンソースのMac用Stable Diffusionクライアント「Diffusers」がGPU/Neural Engine選択に対応し、Apple Silicon Macでは生成速度が最大2倍になっています。詳細は以下から。 DiffusersはiPhone用カメラアプリ「Camera+」などを開発するPedro Cuencaさんがオープンソースで開発していたStable Diffusionアプリで、現在はCuencaさんが学習済みの機械学習モデルやデータセットなどを公開/共有するHugging Face HubのMLエンジニアになられたことで、Hugging Faceの公式Macクライアントとなっていますが、このDiffusersのバージョン1.1アップデートがリリースされています。 Generate images up to twice as fast!

                                      テキストから画像を生成できるオープンソースのStable Diffusionアプリ「Diffusers for Mac」がGPU/Neural Engine選択に対応し、Apple Silicon Macでは生成速度が最大2倍に。
                                    • 無料お絵描きアプリ「Krita」に画像生成AIを組み込んで落書きから美麗イラストを作成する方法まとめ、Stable DiffusionとControlNetをコマンドなしでサクッと導入可能

                                      無料かつ高機能なペイントアプリ「Krita」に画像生成AI「Stable Diffusion」を組み込むプラグインが「krita-ai-diffusion(AI Image Diffusion)」です。Generative AI for Kritaを使えば落書きのような下描き画像から美麗イラストを生成できるとのことなので、インストール手順や使い方をまとめてみました。 GitHub - Acly/krita-ai-diffusion: Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. https://github.com/Acly/krita-ai-diffusion ・目次 ◆1

                                        無料お絵描きアプリ「Krita」に画像生成AIを組み込んで落書きから美麗イラストを作成する方法まとめ、Stable DiffusionとControlNetをコマンドなしでサクッと導入可能
                                      • 結局、AI創作とどう向き合うべき? 知られざる著作権の落とし穴と対策【弁護士解説】 - Workship MAGAZINE(ワークシップマガジン)

                                        骨董通り法律事務所弁護士。内閣府知的財産戦略推進事務局参事官補佐。エンタテインメント法務が専門。主にアニメ、ゲーム、AI、ロボット、VR業界の方をサポートしている。実はドラマーでもある。(Twitter:@hajime_idei) AIを使う側が気をつけなければいけないこと ぽな: 便利なAIツールが続々と登場する中、AIを作品づくりに取り入れる方も増えると思うんです。ただ、AI創作物には著作権が発生しないなど、非常にややこしい問題があるということですね。 では、実際に我々クリエイターがAIツールを活用していく場合、トラブルを避けるためにはどんなことに気をつければよいのでしょうか。 出井: まず、著作物性の問題についてですが、自分の著作物として保護したいのであれば、AIが生成した作品には全体的に人の手を加えることが重要だと考えています。 そうすることで、「AIが生成した作品だから著作権は発

                                          結局、AI創作とどう向き合うべき? 知られざる著作権の落とし穴と対策【弁護士解説】 - Workship MAGAZINE(ワークシップマガジン)
                                        • GPT-4版ChatGPTが無料で試せる「AIOne」

                                          Topaz合同会社は3月17日、OpenAIの最新型自然言語モデルGPT-4、画像生成モデルStable Diffusionといった複数のAIモデルを搭載したAIプラットフォーム「AIOne」を発表した。 「カスタマイズされていないGPT-4を無料登録で使えるWebサービス」としては日本初の提供と同社は主張している。 とりあえず無料でGPT-4を触ってみたい人に 現状利用できるサービスは画像生成(Stable Diffusion)、AIチャット(GPT-4, ChatGPT)のみのようだが、自動議事録作成AIが近日提供予定となっているほか、今後も最先端のAI技術を導入していくとしている。 料金プランは、無料(利用制限あり)で利用できる「Free」のほか、「Pro(490円/月、個人限定)」、「Business(990円/月)」、「Enterprise(価格応相談)」の4種類が用意されている

                                            GPT-4版ChatGPTが無料で試せる「AIOne」
                                          • 達人出版会

                                            探検! Python Flask Robert Picard, 濱野 司(訳) BareMetalで遊ぶ Raspberry Pi 西永俊文 なるほどUnixプロセス ― Rubyで学ぶUnixの基礎 Jesse Storimer, 島田浩二(翻訳), 角谷信太郎(翻訳) 知る、読む、使う! オープンソースライセンス 可知豊 きつねさんでもわかるLLVM 柏木餅子, 風薬 R/RStudioでやさしく学ぶプログラミングとデータ分析 掌田津耶乃 データサイエンティストのための特徴量エンジニアリング Soledad Galli(著), 松田晃一(訳) 実践力をアップする Pythonによるアルゴリズムの教科書 クジラ飛行机 スッキリわかるサーブレット&JSP入門 第4版 国本 大悟(著), 株式会社フレアリンク(監修) 徹底攻略 基本情報技術者教科書 令和6年度 株式会社わくわくスタディワール

                                              達人出版会
                                            • AIイラスト専用投稿サイト「chichi-pui」が登場 閲覧無料、会員登録でプロンプト開示 運営は個人

                                              関連記事 pixiv、AIイラスト急増で機能改修 検索フィルター、専用ランキングなど実装へ ピクシブが「pixiv」を、AI生成作品と人間の作品をすみ分けできるよう機能改修すると発表した。10月下旬に、検索時のフィルタリングやAI生成作品限定のランキング機能などを追加する。 「ファンアートは自分で描いて」 画像生成AIのイラストにVTuberが苦言 「ファンアートは自分で描いて」──画像生成AIが描いたAIイラストを巡って、バーチャルYouTuber(VTuber)の投稿が話題だ。SNS上などでは現在、3日にサービスを始めた画像生成AI「NovelAI Diffusion」などの影響から、AIイラストの投稿が相次いでいる。 「イラストやデザインの仕事は退屈」──Stable Diffusion開発元の代表インタビュー記事が話題 「イラストやデザインの仕事は退屈」──画像生成AI「Stabl

                                                AIイラスト専用投稿サイト「chichi-pui」が登場 閲覧無料、会員登録でプロンプト開示 運営は個人
                                              • 【速報】Stability AIはClipdropの新機能『Stable Diffusion Reimagine』を発表しました。|Stability AI 日本公式

                                                【速報】Stability AIはClipdropの新機能『Stable Diffusion Reimagine』を発表しました。 Stability AIは、 Stable Diffusion Reimagineを開始することを発表します!Stable Diffusion を通して、ユーザーが画像を試し、デザインを「再想像」するよう呼びかけます。 Stable Diffusion Reimagineは、新しい クリップドロップツール1つの画像から複数のバリエーションを無制限に生成できるようにしたものです。複雑なプロンプトは必要ありません。ユーザーは、アルゴリズムに画像をアップロードするだけで、好きなだけバリエーションを作成することができます。 下の例では、左上の画像がツールに投入されたオリジナルファイルで、その他の画像はオリジナルからインスピレーションを得た「再構築」された作品です。 寝

                                                  【速報】Stability AIはClipdropの新機能『Stable Diffusion Reimagine』を発表しました。|Stability AI 日本公式
                                                • めざせ爆速開発! ChatGPTの個人開発にGoogle Apps Scriptをオススメする理由

                                                  3月2日にChatGPTのAPIが公開されて企業だけでなく、個人による開発も積極的に行われています。ChatGPTの個人開発を行うにはGoogle Apps Script(GAS)がおすすめです。その理由を解説します。 本記事は、TechFeed Experts Night#16 〜 ChatGPT, GitHub Copilot…AIはエンジニアの仕事をどう変える?AI×開発最前線!のセッション書き起こし記事になります。 イベントページのタイムテーブルから、その他のセッションに関する記事もお読み頂けますので、一度アクセスしてみてください。 本セッションの登壇者 セッション動画 それでは、「ChatGPTの個人開発ではGoogle App Scriptがおすすめな理由」というタイトルで発表させていただきます。 今回お話しする内容はこちらになります。まず少しご紹介させていただいて、ChatG

                                                    めざせ爆速開発! ChatGPTの個人開発にGoogle Apps Scriptをオススメする理由
                                                  • ラズパイ4も対応しているCPU超高速Stable diffusionのFastSDCPUで爆速生成AI。標準4分/枚がOpenVINOでわずか18秒/枚。お金をかけずに爆速化最高。オススメ

                                                    Kapper@Linuxガジェヲタ&異世界小説家&電子工作大好き @kapper1224 CPUでStable diffusionが3分ちょっとかかるので、ラズパイ4も対応しているFastSDCPUを入れたら50秒になったw OpenVINOとか入っているらしい。AMDのCPUだけどw ターミナル画面左側が普通のSD、右側がFastSDCPU これだけ速度差があるとありがたい github.com/rupeshs/fastsd… pic.twitter.com/zflPRbldt4 2024-01-20 21:08:00

                                                      ラズパイ4も対応しているCPU超高速Stable diffusionのFastSDCPUで爆速生成AI。標準4分/枚がOpenVINOでわずか18秒/枚。お金をかけずに爆速化最高。オススメ
                                                    • 画像生成AIが「トレパク」していた? 学習画像と“ほぼ同じ”生成画像を複数特定 米Googleなどが調査

                                                      Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米Google、米DeepMind、スイスのETH Zurich、米プリンストン大学、米UC Berkeleyに所属する研究者らが発表した論文「Extracting Training Data from Diffusion Models」は、テキストから画像を生成する拡散モデルが学習データとほぼ同じ画像を生成していたことを実証した研究報告である。 これは学習データの各画像を拡散モデルが記憶し、生成時にほぼ同一を出力していたことになる。個人を特定できる顔写真や商標登録されたロゴも含まれていたため、今回の結果はプライバシーや著作権の問題も深く絡むことになる

                                                        画像生成AIが「トレパク」していた? 学習画像と“ほぼ同じ”生成画像を複数特定 米Googleなどが調査
                                                      • 画像生成AI「StableDiffusion」で得ておくべき知識を身に付けるのに役立つ「SD Toolset」

                                                        画像生成AI「Stable Diffusion」はモデルデータが一般公開されているため、自宅のPCで誰でも簡単に動かすことができます。しかし、Stable Diffusionを使って自分が望む通りの画像を生成するためにはさまざまな知識が必要になり、初心者は何から学べばいいのかわからなくなりがち。無償で公開されている「SD Toolset」にはStable Diffusionで得ておくべき知識が単元ごとにわけてまとめられているので、ピンポイントで必要な知識を学ぶことができます。 SD Toolset https://sdtools.org/ SD Toolsetはこんな感じで、左のカラフルな同心円に単元が視覚的にまとめられており、同心円の内側から気になるカテゴリをクリックしていきます。例えば、Stable Diffusionの根幹部分を知りたい場合は、「Core」をクリック。 すると、以下の

                                                          画像生成AI「StableDiffusion」で得ておくべき知識を身に付けるのに役立つ「SD Toolset」
                                                        • Stable DiffusionのリモートデスクトップとGPUボックスの使い勝手の違い - 勝間和代が徹底的にマニアックな話をアップするブログ

                                                          この記事を書いたところ、たくさんの方から「リモートデスクトップを使えばいいしゃん」とツッコミを受けたので、比較してみました katsumakazuyo.hatenablog.com 結論から言いますと私の14インチのノートパソコンだと画面が、NMKDのGUIの画面が小さすぎてちょっといろいろ工夫が必要でした。デフォルトだと、こんな感じ。 リモートデスクトップの画面が当たり前ですが、通常のノートより一回り小さくて、さらにその内周にNMKDがはいるので、フォントの文字が極小サイズになってしまいます。 デスクトップ側の画面を175%とかにしたら、ギリいける感じでしたので、たぶん、そういった工夫が必要みたいです。 あと、Promptに文字を入れるのも、日本語モードになっていると、キーボード入力受け付けないみたいです。これ、気をつけないと。 あと、超当たり前ですが、できあがったファイルもリモート側に

                                                            Stable DiffusionのリモートデスクトップとGPUボックスの使い勝手の違い - 勝間和代が徹底的にマニアックな話をアップするブログ
                                                          • GPUメモリが小さくてもパラメーター数が大きい言語モデルをトレーニング可能になる手法「QLoRA」が登場、一体どんな手法なのか?

                                                            GPT-1は1億1700万個のパラメーターを持つ言語モデルで、GPT-2では15億、GPT-3では1750億とパラメーター数が増加するにつれて言語モデルの性能が上がってきています。しかしパラメーター数が増加するにつれてトレーニングに必要なデータの数やトレーニング中に使用するメモリの量も増加し、トレーニングのコストが大きく増加してしまいます。そんな中、メモリの消費量を激減させつつ少ないデータでトレーニングできる手法「QLoRA」が登場しました。 [2305.14314] QLoRA: Efficient Finetuning of Quantized LLMs https://arxiv.org/abs/2305.14314 artidoro/qlora: QLoRA: Efficient Finetuning of Quantized LLMs https://github.com/art

                                                              GPUメモリが小さくてもパラメーター数が大きい言語モデルをトレーニング可能になる手法「QLoRA」が登場、一体どんな手法なのか?
                                                            • 高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久) | テクノエッジ TechnoEdge

                                                              SDXL 1.0をAUTOMATIC1111で動かすにはStability AIが画像生成AIのStable Diffusion 1.5をリリースしたのは2022年10月20日。そこから約9ヶ月経った本日2023年7月27日、高画質な最新バージョンSDXL 1.0の登場となった。まだ全く使いこなせていないが、速報と言うことで、その絵をご覧頂きたい。 Stable Diffusion 1.5とSDXL 1.0の大きな違いはザックリ2点。 学習ベースが512✕512ドットから1,024✕1,024ドットへ 1pass式からBase→Refinerと言う2pass式になった 学習ベースの解像度がこれだけ違うと、当然出てくる絵に差が出る。1passから2passになった技術的な理由はさておき、Baseのままでもそれなりに見れ、更にRefinerを通すと解像度や質感が向上する。 BaseとRefin

                                                                高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久) | テクノエッジ TechnoEdge
                                                              • Stability AI、言語モデルシリーズ「StableLM」の第1弾をリリース — Stability AI Japan

                                                                Stability AIは、新しいオープンソースの言語モデル StableLMをリリースしました。アルファ版は30億パラメータと70億パラメータのモデルが用意されており、今後150億パラメータから650億パラメータのモデルも用意される予定です。開発者は、CC BY-SA-4.0ライセンスの条件に従って、商用または研究目的で、私たちのStableLM ベースモデルを自由に検査、使用、適応することができます。 2022年、Stability AIは、プロプライエタリなAIに代わる透明でオープンで拡張性のある画期的な画像モデルである Stable Diffusionを一般公開しました。StableLM モデル一式のリリースにより、Stability AI は、基盤AI 技術をすべての人が利用できるようにすることを続けています。StableLMモデルは、テキストやコードを生成でき、様々なアプリケー

                                                                  Stability AI、言語モデルシリーズ「StableLM」の第1弾をリリース — Stability AI Japan
                                                                • 軽量イラスト生成ソフト「NGUI v2」 - やえ

                                                                  概要 NGUIはパラメータ調整を自動で行い、キーワードを入力するだけで鮮明なイラストを生成するソフトです。VRAMが2GB程度のローエンドGPUから動作します。AIモデルはNGUI独自の「Hina」か他のモデルを読み込んで使えます。スマホ等による遠隔生成に対応。Python、C#勉強のため無料にて公開します。コメント欄にて質問承ります。 ダウンロードリンク(v2.1.7)   2/15更新(2.1.9は複数GPU環境で不具合あり)NGUIv2 : インストーラー版 NGUIv2_local : ポータブル(非インストール)版 不具合報告フォーム https://forms.gle/aYmzJvNeL4t1LKaR9 過去の対応はコメント欄にて 基本的な使い方 ・ソフトをインストールして起動 ・AIモデル(通常版 or NSFW強化版)を選択してOKボタンを押す ・キーワードを入力して生成ボ

                                                                    軽量イラスト生成ソフト「NGUI v2」 - やえ
                                                                  • ジェネレーティブAIで美樹さやかさんを錬成できるのか?

                                                                    ぶっちゃけ、最近はひたすらSD関係のディスコードに張り付くだけの日々だった。 だって毎日しっちゃかめっちゃかなドラマが起きてて面白すぎるから。 面倒だからここでまたイチから経緯を書いたりしないが、とにかくEmad氏の謝罪によって揉め事もひと段落したようだ。 私もいつまでもディスコなんか監視してる場合ではない。 ハッキリ言って、今の自分が画像AIに相当のめり込んでる事を認めざるを得ない。 しかし、2週間前にブログ記事を書いた段階では、自分がどういう風に画像AIにコミットしていけばいいのかサーパリ分かってなかった。 というか、世の中で何が始まりつつあるのかを正確に捉え切れてなかったのだ。 それが何か?というと、世界でジェネレーティブAI(GAI)の時代が始まりつつあるという事だ。 アメリカを代表するベンチャーキャピタルである、セコイアキャピタルが、「GAIが今激アツ!!」みたいな記事を9/20

                                                                    • 話題の無料画像生成AI「Stable Diffusion」をオフラインのiPhoneのみで動かせるアプリ「Draw Things」を使ってみたよレビュー

                                                                      文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」が大きな注目を集めていますが、Stable Diffusionを使うには高性能GPUを搭載したマシンを用意する必要があるため興味はあっても使うのを諦めていた人も多いはず。そんな中、iPhoneに搭載されたチップを利用してオフラインでもStable Diffusionを用いた画像生成を可能にするアプリ「Draw Things」が公開されました。実際にDraw Thingsを使ってみたところ、モデルデータの切り替えやシード値の手動入力など高度な機能が山盛りの高性能画像生成アプリに仕上がっていたので、インストール手順や使い方をまとめてみました。 Draw Things: AI-assisted Image Generation https://draw.nnc.ai/ Draw Thingsを使うには、

                                                                        話題の無料画像生成AI「Stable Diffusion」をオフラインのiPhoneのみで動かせるアプリ「Draw Things」を使ってみたよレビュー
                                                                      • NovelAI Improvements on Stable Diffusion

                                                                        As part of the development process for our NovelAI Diffusion image generation models, we modified the model architecture of Stable Diffusion and its training process. These changes improved the overall quality of generations and user experience and better suited our use case of enhancing storytelling through image generation. In this blog post, we’d like to give a technical overview of some of the

                                                                          NovelAI Improvements on Stable Diffusion
                                                                        • 停止中のイラスト生成AI「mimic」が10月に再開へ 審査、追跡機能など不正対策を追加

                                                                          不正利用対策が不十分と指摘され、一時停止中のイラスト生成AIサービス「mimic」について、提供するラディウス・ファイブ(東京都新宿区)は9月14日、サービス再開に向けた改修方針を発表した。利用者の審査や追跡機能などの対策を施したベータ版2.0を10月中に公開する。 不正利用を防止するため、サービス連携するTwitterアカウントを事前に審査。アカウントに投稿されたイラストが本人によるものと判断した場合のみ利用を許可する。 学習のためにアップロードしたイラストは、透かし入りの状態で一般公開し、第三者が確認できるようにする。違反を発見した場合のために通報フォームも設ける。 出力画像の悪用防止のため、画像には透かしと追跡のための情報を付与する。悪用されないよう、追跡手法の詳細については公開しない。 mimicは、ユーザーがアップロードした画像を学習して、似た絵柄のイラストを生成するサービス。当

                                                                            停止中のイラスト生成AI「mimic」が10月に再開へ 審査、追跡機能など不正対策を追加
                                                                          • Stable Diffusion メモ(3): 絵の描けない人が顔ガチャを敢行する - jt_noSke's diary

                                                                            やりたいこと この前の記事で、 jtnoske.hateblo.jp 元絵そのままimg2imgにかけると しかし背景含めて全体が変わってしまうのは不都合が出できそう、画像の指定箇所のみ再度描き直すなんてことができるとたいへん便利になりますなぁ… Photoshopとかで切り抜いてやればうまくいったりするんだろうか? というアイデアが浮かんだので実際にやってみることにした。 元の絵の一部、今回は顔の部分だけを抜き出して、そこだけimg2imgにかけたらどういう結果が得られるか。 やったこと(1) この絵の顔を GIMPで顔だけ抜き出しまして(投げ縄ツールとかウン年ぶりに使った というかGIMP自体ウン年ぶりに使った…) 透過PNGで保存、prompt は前回、前々回とまったく同じでimg2imgをかけます、と次のようなエラーが… RuntimeError: Sizes of tensors

                                                                              Stable Diffusion メモ(3): 絵の描けない人が顔ガチャを敢行する - jt_noSke's diary
                                                                            • 画像生成AI「Midjourney」をオープンソースで再現する「OpenJourney」が登場

                                                                              入力した文字列(プロンプト)から画像を自動で生成するAI・Midjourneyと同等のものをオープンソースで人々に提供することを目的としたプロジェクトが「OpenJourney」です。OpenJourneyは同じ画像生成AIでオープンソースで開発されるStable Diffusion v1.5を調整し、Midjourneyに近い動作をするように開発されており、オンラインAIプラットフォームのHugging Faceにリポジトリが公開されています。 OpenJourney https://open-journey.github.io/ prompthero/openjourney · Hugging Face https://huggingface.co/prompthero/openjourney OpenJourneyの開発チームは「OpenJourneyの背後にある主な考えは、ツールや

                                                                                画像生成AI「Midjourney」をオープンソースで再現する「OpenJourney」が登場
                                                                              • 【Amazon Bedrock】AWSサービスのみを使ったシンプル構成のRAGアプリを作ってみた - NRIネットコムBlog

                                                                                はじめに RAGとは 構成図 作成リソース Lambda 1. PDFから文書抽出&Embedding取得Lambda 2. 回答作成用Lambda AWS SAM テンプレート Streamlit 動作確認 まとめ はじめに こんにちは堤です。 Amazon BedrockがGAとなり、AWS内で完結してLLMアプリケーションを構築できるようになりました。 試しにRAGアプリケーションを作成してみようと思いましたが、現状AWSでRetrievalするデータソースを作成しようとすると、Amazon OpenSearch Serverless やAmazon Kendraを使用するしかありません。これらのサービスを使うのはコストもそれなりにかかり少しハードルが高いなーと思っていたら以下のブログを見つけました。 aws.amazon.com 構成図を見ると分かるように、S3にembedding

                                                                                  【Amazon Bedrock】AWSサービスのみを使ったシンプル構成のRAGアプリを作ってみた - NRIネットコムBlog
                                                                                • Stable Diffusion発! 画像生成ブームに見るジェネラティブAIの人・もの・お金事情 - NTT Communications Engineers' Blog

                                                                                  この記事は NTTコミュニケーションズ Advent Calendar 2022 18日目です…が、少々遅れてお届けします。 はじめに PS本 5G&IoTサービス部 増田です。Advent Calendar参加も(たぶん)3年目となりました。 「テキスト指示をもとに、AIがお好みの画像を生成する(Text-to-Image)」「今ある画像へ、テキスト指示で編集を加える(Image-to-Image)」 -- そんな画像生成AIが注目を集めています。2022年の上半期、Open AIによるDALL-E 2の公開、Midjourneyの登場と盛り上がりを見せました。2022年8月23日のStable Diffusion一般公開からは、使ってみた報告、従来研究との融合、商用プロダクト応用と、研究者、アーティスト、プログラマなど様々な人の参加により、界隈はさらに活気づいています。 画像生成AIの

                                                                                    Stable Diffusion発! 画像生成ブームに見るジェネラティブAIの人・もの・お金事情 - NTT Communications Engineers' Blog