「これ、マストだわ」モニター購入して気づいた、あったほうがいい周辺機器4選 #Amazon新生活セール
AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG
昨日は新潟県長岡市に行って、市役所の職員向けと、一般向けに二回の講演を行った。 市役所の職員からの質問事項をよく読むと、ChatGPTを闇雲に何にでも使おうとして苦戦している姿が見てとれた。 たとえばこんな感じだ。 ⚪︎時に東京駅につく新幹線を予約したいとChatGPTに言ったが、公式サイトをチェックしろと言われた 我々からすればその回答は当たり前なのだが、闇雲になんでもChatGPTでやろうとするとこうなってしまうという典型的な例だった。当たり前だが、その目的ならえきねっと一択だ。 ChatGPTには限界がある。しかも低い。 だから通常はPluginと組み合わせたり、プログラムから呼び出したりするという「工夫」が必要になる。 GPTを使うプログラムを書くのはものすごく簡単だ。 たぶんプログラムの世界でも最も簡単な部類だろう。 たとえば僕がプログラムでGPTを使おうかなと思った時、こんなふ
※本ページは、アフィリエイト広告を利用しています。 「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました! Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。 また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。 本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗
Just another blog about manga, anime, video games, models, and the life of Dan Kanemitsu. NovelAI Stable Diffusion Midjourney 画像:2022年10月の段階で三つの作画AIに「女の子、キツネ耳、白耳、白尻尾、ぴっちりボディスーツ、だぼだぼジャケット、秋葉原、夜の街、雨、路面に反射」などと入力した出力した結果。絵柄は指定しておらずそれぞれの作画AIのデフォルトスタイルである。 ■今回の騒動の背景を少々…… 作画AIが及ぼす影響について日本のクリエーターや受け手側の間でかなり憂慮する声が広がっています。この10年、機械学習の躍進とそれが社会に及ぼした影響はすさまじいの一言としか言いようがないと思います。機械翻訳の質が飛躍的に向上したことによって一般的な会話であれば機械によ
Creapills 💊 @creapills Quand La Laitière de Nestlé utilise l'IA pour imaginer ce qu'il y a au-delà du célèbre tableau de Vermeer pic.twitter.com/hczSEBsAhq 2022-09-15 19:47:04 リンク Wikipedia 牛乳を注ぐ女 『牛乳を注ぐ女』(ぎゅうにゅうをそそぐおんな、蘭: Het melkmeisje)は、オランダ黄金時代の画家ヨハネス・フェルメールが1657年ごろに描いた絵画。キャンバスに油彩で描かれた作品で、オランダ・アムステルダムのアムステルダム国立美術館が所蔵している。アムステルダム国立美術館はこの作品のことを「疑問の余地なく当美術館でもっとも魅力的な作品の一つ」としている。 『牛乳を注ぐ女』の正確な制作年度は
こんにちは。一般イラストレーターです。今回は新しい情報ではないのですが、前々からやってみたかった「AIイラストを真面目に加筆修正する。」をやってみたのでそのまとめとなります。現在のAIイラストは細部描写の甘い部分が多く、真面目に作品に使っていこうとすると手作業での修正が不可欠となります。AI絵師を名乗る人々の中にはそういった加筆を行ってイラストをアップしている人も居るので、今後はそういうスタイルも定着するんじゃないかなと思っています。イラスト依頼系でも「このAI絵を加筆修正してくれ!」みたいなリクエストは普通にありそうですからね。まぁ、私は今回は単にやってみたかっただけなのでアレですが。 取りあえず今回のベースとなるAI生成物を見て下さい。使用AIは話題のniji journeyです。 insanely high quality masterpiece pixiv color illust
マンガやイラストをデジタル上で作画する際に使用されるお絵描きソフトウェアの「CLIP STUDIO PAINT(クリスタ)」上で、テキストから画像を自動で生成してしまうAI「Stable Diffusion」を動かすことが可能なプラグイン「NekoDraw」が登場しました。NekoDrawはGitHub上で公開されており、テキストから画像を生成する「text2img」と、画像からより高精細な画像を生成する「img2img」の両方に対応しています。 GitHub - mika-f/nekodraw: NekoDraw: CLIP STUDIO PAINT plugin for executing Stable Diffusion txt2img and img2img processor. https://github.com/mika-f/nekodraw 「Stable Diffusio
chilled_remixとは? chilled_remixはStableDiffusionとよばれる画像生成AIで動作する生成モデルの一つで、リアルなアジア系美少女の生成を得意としています。以下の画像はchilled_remixを使用して私が作成した画像です。 リアルなアジア系美少女が得意なStableDiffusion生成モデルには、他に有名なものとしてChilloutMixやChilled_re_genericなどがあります。しかし、これらのモデルは現在商用利用ができません。 一方でchilled_remixは商用利用が可能なため、とても重宝されるモデルとして注目を集めています。 chilled_remixのライセンス表記 chilled_remixはChilled_re_genericのレシピ発案者として知られる鎖城郎郭様によって4/19に公開されました。生成した画像の販売だけでな
大手半導体メーカーでありAI研究にも力を入れているNVIDIAが、新たな画像生成AIである「eDiffi」を発表しました。NVIDIAはeDiffiについて、世界中で話題となっている「Stable Diffusion」やOpenAIの「DALL・E2」といった従来の画像生成AIより入力テキストに忠実な画像を生成できると主張しています。 [2211.01324] eDiffi: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers https://arxiv.org/abs/2211.01324 eDiff-I: Text-to-Image Diffusion Models with Ensemble of Expert Denoisers https://deepimagination.cc/eDiffi/
もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと
英字新聞社ジャパンタイムズ、スタートアップメディア・テッククランチでの記者経験を経て、ダイヤモンド社のスタートアップ担当記者に。最近はフードテックやモビリティ領域に注目している。趣味はギターやシンセサイザーだが総じて下手。2020年7月よりダイヤモンド社「DIAMOND SIGNAL」記者。 From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 本記事では、インタビュアーを担当したTHE GUILD・
文章から画像を自動生成する DALL・E2 が先日一般公開された。画像の商用利用も可能とのことなので、うまくすれば note 記事のアイキャッチ作成に使えるかもしれない。 使用は基本無料だが申請制である。かなり待ち行列が長いらしく、僕は7月6日に申請したら7月30日に通った。住所や職業や使用目的などの面倒な入力欄はなかった。SMS 認証があるので電話番号を取られる点だけ注意されたし。 テキスト(英文)を入力すると、15秒ほどで1024×1024の画像を4枚生成してくれる。初月は無料で50回、それ以後は毎月15回分のクレジットが発行される。もっと使うには課金が必要で、15ドル115回なので1回17円。OpenAI とか名乗っていながらずいぶん商業的なフリーミアム形態だが、ちょっと遊んでみる分にはちょうどいい。 とりあえず触ってみるてっきり Python 等から API を叩くのだと思っていた
呪文(プロンプト)の生成方法 このページはAI画像生成をサポートするため制作しました 呪文(キーワード)を生成するためにから好みの条件を選択してくだい 条件が決まったらをクリック! 自動的にAI画像生成用にチューニングされた呪文(キーワード)が発行されるよ 呪文(プロンプト)の強化・弱体化 を押すと【NovelAI ⇔ Diffusion】を切り替わるよ で出てきた条件ボタンをクリック! NovelAIの場合は {} が追加でき、Diffusionの場合は () が追加されるよ をクリックすれば【効力up ⇔ 効力down】に切り替わるよ 効力downモードは [] がNovelAI・Diffusion のどちらでも条件ボタンを押すと追加されます ☆()や{}は呪文を強調させる☆ ☆[]は呪文を弱体化させる☆ NovelAIは{}、Diffusionは()で呪文強化 重ね掛けで効果up リ
画像生成AI「Stable Diffusion」を使ったLINEのAIチャットbotサービス「お絵描きばりぐっどくん」が8月28日に公開された。LINE上で文章を送ることで、AIが画像を生成する。英語の他、日本語にも対応している。九州工業大学情報工学部の4年生の西野颯真さん(@nishino_0719)が作成した。 LINEでbotを「友だち登録」することで利用可能。1日10枚まで画像を生成できる。生成した画像の著作権はStable Diffusionと同様、パブリックドメインとしている。西野さんは「Stable Diffusionを触る上で環境構築のハードルの高さへの課題を感じていて、そこを誰でも気軽に触れるLINEを使って解消できないかなと思った」と作成した経緯を話す。 リクエスト通りに画像を生成するコツについては「明言はできないが、人物の生成は苦手だけど風景の生成は得意などの特徴を把
852話さんには遠く及ばない... Gallery a samurai girl with japanese school uniform, japanese anime style A girl with wolf ear on silver hair, combat toon graphic, arknights, dolls frontline, pixiv girl's frontlineのつもりがdollsになってた...。その影響か人形っぽい雰囲気になっている。 concept idea of a kawaii girl with animal ear on her head, fantasy idle costume, equlip magic wand, beautiful face, thick coating painting, flower blooming, bir
昨日の続き。 jtnoske.hateblo.jp やはり構図を決めるにはimg2imgや、と思い立つ promptとキャンバス縦横比とかで構図のコントロールに挑戦したけど、いやこりゃ無理だわやっぱ構図を自分で決めるならimg2imgでいろいろ指定してやらないといかんのだろな、ということでimg2imgを導入する。 導入 導入方法は各所で上がっていますが、自分は↓のコードをコピペして、 github.com ↓ のコードを参考に実行をしました。 www.12-technology.com Hな方々は↓を(トラバ含めて)参照し、safety_checkerを切りましょう。変更箇所はStableDiffusionPipelineとほとんど同じです。 anond.hatelabo.jp 絵が描けないので img2img(1): 全身立ち絵 絵を用意しよう、なんだけどどう用意するか。 まず思いつい
Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ
より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion] こんにちは。今回はStableDiffusionのimg2imgと昔ながらのフォトバッシュを複合することで、より思い通りに、より完璧に近い画像を仕上げる手法について紹介します。SDやimg2imgについては過去記事を参照して下さい。まずこちらをご覧下さい。 ■『昼飯を食べるバットマンとジョーカー』を作る。『昼飯を食べるバットマンとジョーカー』A film still of Batman and Joker eating lunch in the diner, worm lighting, cinematic tone. The Dark Knight(2008)なんでしょうかこの凶悪な白塗りバットマンは。『昼飯を食べるバットマンとジョーカー』を生成させると高確率でこのような画
ユーチューブに公開された生成AIで作成・加工されたとみられる女性の動画。投稿したアカウントは現在停止されている 生成人工知能(AI)によって作成・加工されたとみられる若い女性の扇情的な動画が、交流サイト(SNS)上などで拡散されている。一見しただけでは生身に見えるほど精緻で、再生回数が数百万回に達するものも。より性的に過激な動画へ誘導するものもあり、専門家は「アクセスを稼いで収益をあげる仕組みが確立されていることが背景にある」と指摘する。 「ミス東大」モデルのような容姿の若い女性が、画面を向きながら公園や屋外を1人で歩く数分の動画。SNSのインスタグラムや動画投稿サイトのユーチューブなどに昨年から登場した、あるアカウントから投稿されたものだ。 「ノーブラ散歩」などの刺激的なタイトルがつけられ、プロフィル欄には東京大学の理系学生をうたい「ミス東大」を目指すなどと記載。他にも、服を着た状態で下
前回記事「Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権」は、おかげさまで沢山の方に読んで頂き、いろいろな意見や御質問や取材を頂きました。 それらの意見・御質問や取材を通じて、自分の中で新たな整理ができたので、続編の記事を書きたいと思います。 第1 どのような場合に著作権侵害になるのか みなさんの興味関心が強いトピックとして「画像自動生成AIを利用して画像を自動生成し、既存著作物の類似画像が生成された場合に著作権侵害に該当するか」があります。 前回の記事では「学習に用いられた画像と同一の画像が『偶然』自動生成された場合、著作権侵害に該当するか」について解説をしましたが、今回の記事では、もう少し多くのパターンについて検討をしたいと思います。 まず、その前提として「著作権侵害の要件」と「著作権侵害の効果」について説明をします。 この「要件」と「
ノクターンノベルズ(小説家になろうの18禁版)のランキングを「AI挿絵つき」が席巻し始めている。 今現在のランキングだと、1位と12位が全話AI挿絵付きの長編。 7位がAI挿絵の入った短編である。 1位と12位はNovel AIを使用していると明記されている。 7位は明記がないがおそらくNovel AIと見ている。 イラストの質についてパッと見た感想としてはおそろしくクオリティが高い。 AIイラストは、複数の生成イラスト間で同じ登場人物を同じように描くことが苦手だと思っていたが、それもできている。 これは、3Dカスタム少女やコイカツなどで3Dモデルを作っており、それに任意のポーズをとらせて出力した画像をimg2img機能で挿絵に変えているという考察があった。 確かにそれならば同一性はかなり担保される。 元々、3Dカスタム少女による画像を挿絵として入れている作者はノクターンノベルズに存在した
をご紹介するという内容になっています。 これまでAIイラストというと一貫性の問題、つまり「同じキャラクターを生成するのが難しい」という課題がありました。例えばあるイラストを生成して好みのキャラクターが出たとしても、別の呪文を使うとそのキャラクターを正確に再現できなくなってしまう…ということですね。 ただ最近はこの問題に対する対処法がいくつか登場しており、一貫性が重要なアニメーションや漫画への応用がより実用的になりつつあります。そのような中でこの問題に対して有効な「MasaCtrl」という手法を使えるweb UI用の拡張機能が登場し、一貫性の問題を解決できそうだと先日各所で話題になっていたので私も試してみることにしました。 ここではこのMasaCtrlの概要や使い方について解説していきますね。
どういうハードウェア構成でなんのOS使ってるのかとか知りたい。 GPUはNVIDIAでやるとして、OSはCUIだけでVRAM使わないようにするとかそういう工夫してるのかな。 俺はAMDのGPUでやってんだけど、やっぱNVIDIA使ったほうが色々と性能とかVRAM消費量とか効率的なんだろうか。 なんでAMDかっていうと、GPU買ったタイミングとStable Diffusion入れたタイミングが違うからだ。いやー苦労したわ。 でかい画像作ろうとするとすぐにメモリ足りなくてコケるし、果たして今作ってる画像サイズにかかる時間が適切なのかとか知りたいことは山ほどあるんだよな。 *** 追記 なんかたくさんブコメとかレスとかついてて驚いた、ありがとう。 今買うならNVIDIAの40番台というのがいいんだな。昔GeForceとか言って売ってた頃の知識しかないからイマイチ型番とかよくわからないおっさんでし
画像のノイズ除去やボケ除去、超解像といった従来の画像修復問題は、特定の劣化状態、既知の単純な劣化にのみ効果的であった。 これに対して、実際の環境下での多様な劣化を考慮した「Blind Image Restoration」(BIR)という手法が注目されている。BIRは、一般的な画像と、それが持つさまざまな劣化に対して、リアルな画像再構築を目指している。特に、BIRの研究は以下の3つのカテゴリーに分けられる。 (1)Blind Image Super-Resolution(BSR):低解像度で劣化が不明瞭な画像の超解像問題に取り組む技術、(2)Zero-Shot Image Restoration(ZIR):これは新しい研究の方向性で、劣化の前提条件を明確に定義した上で、クラシックな画像修復タスクで印象的なゼロショット復元を達成する方法、(3)Blind Face Restoration(BF
いい感じの画像を生成するコツ 話題の画像生成AI StableDiffusionですが、よくSNSで見るような高画質高品質リアリスティックな人物画像を生成するにはそれなりのコツがあります。 この記事では、どのような単語を使えば高品質な画像を生成できるか、例を紹介します。 StableDiffusionを使ってみるにはWebUIが便利です。以下のリンクから使い方がわかります。 ただ欲しい画像のテキストを入れるだけではだめ 例えば、女の子の画像が欲しいとします。 ただ"girl"と入力すると以下のような画像が出てきます。 悪くはないですが少しCGっぽいですよね、もう少し写真っぽい画像が欲しいです。 高画質を連想させる単語を入れる さて、ここで以下のように "best quality" や "high resolusion" など高画質を連想させる単語を嫌というほど入れます。 ちょっとびっくりす
前回、Stable Diffusionをdanbooruデータセットを使用して追加学習することを試した。 今回は、自分でデータセットを作成して追加学習することを試す。 データセットには、画像とキャプションが揃っている必要があり、キャプションがない場合はCLIPで疑似ラベルを生成するなどする必要がある。 今回は、画像に対するキャプションがある「いらすとや」をスクレイピングして、データセットを作成した。 データセット作成 「いらすとや」から全ての画像とキャプションを取得した。 画像に複数バリエーションがある場合は、1つ目の画像のみを使用した。 キャプションは、日本語になっているため、Googleスレッドシートで、「=GOOGLETRANSLATE(XX,"ja","en")」を使って英語に変換を行った。 合計で、22891枚の画像とキャプションのセットが用意できた。 画像サイズ変換 画像は、5
「Stable Diffusion web UI(AUTOMATIC1111版)」は他のUIには搭載されていない機能なども盛り込んだ、いわば決定版の「Stable Diffusion」のUIといえますが、それだけにやれることが多いので、どこをどう触ればよいか悩むこともあるはず。 この記事ではまず、「Stable Diffusion web UI(AUTOMATIC111版)」のうち、テキストから画像を生成する「txt2img」の基本的な使い方をまとめています。 ◆目次 ・1:最も簡単な使い方 ・2:「txt2img」タブ内の各項目はどういう意味なのか? Stable Diffusion web UI(AUTOMATIC1111版)は画像生成AI「Stable Diffusion」を使うためのUIの1つ。Stable Diffusionの利用にはNVIDIA製GPUが必要で、該当するPCにS
やっと、何の絵心もなく、ごちゃごちゃ難しいプロンプトの呪文をいじくるセンスもないオレでも、わりとすんなり意図したとおりのイメージを生成できるようになってきたなーw https://imgur.com/a/ERmddCm これ20年以上前だったか、THE BOOMの島唄を聴いて思いついたショーモナイ駄洒落を絵に描いて見せようと思ったんだけど、全然絵心がなくてまったく描けなかったヤツ。 StableDiffusionが出始めの去年の夏か秋頃、やってみたけど思うような絵が出なくて「まだまだだな...」と落胆したんだが、SDXL1.0とやらになってどうやら及第点だわ(謎の上から目線ww シマウマよカメに乗り、トリとともに海を渡れ〜〜〜 ---240214追記--- リートンとやらが、japanese StableDiffusionXLだかって言って日本語でプロンプトすれば絵が生成できるって言うてた
画像生成AI・Stable Diffusionを導入するにはNVIDIA製GPUを搭載したPCのほかにPythonやAnacondaなどの知識が必要で、ローカル環境に導入するには少し敷居が高いところがありました。しかし、2022年8月に一般公開されて以降、多くの開発者によって誰でも簡単にStable Diffusionをローカル環境に導入可能でかつGUIで操作できるツールが次々と開発されています。「Stable Diffusion web UI(AUTOMATIC1111版)」はその中でも他のUIには搭載されていない機能も盛り込まれた決定版とも言えるツールで、その中でも特に画像生成にお役立ちな機能である「Prompt matrix」と「X/Y plot」を実際に使ってみました。 GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Di
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く