物理情報工学ソフトウェア開発演習
コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕
lllyasviel氏復活第一弾のIC-Light前回(第23回)にControlNetやFooocus、stable diffusion webui forgeを作ったlllyasviel氏、ここ数ヶ月Xなどに書き込みが無いと書いたが、いきなり驚くべき仕掛けを提げての復活。その名もIC-Light(Imposing Consistent Light)。Stable Diffusionの技術を使って、照明を自由にコントロールできる仕掛けだ。 これまでStable Diffusionでは、SD 1.5、SDXLに関わらず、Promptで光や照明などの指示はできたのだが、どのように反映されるかは、Modelやその他の設定しだい。例えば backlight, soft bounced lighting, soft natural lighting, candolelight, neon ligh
Stable Diffusionはそのままでも十分きれいな画像を描いてくれますが、自分の好みに合った画風の絵を描いてくれなかったり、特殊な構図を指定しても理解してくれなかったり、いまいちかゆいところに手が届かない、と思うことがあるでしょう。 そんな時、Stable Diffusionに新たな絵柄や構図を教えて、自分の好みに近い絵柄や構図の画像を生成させることができます。 その仕組みが「追加学習」です。 追加学習の方法はいくつかありますが、今回は、現在主流になっている「LoRA」という手法について簡単に解説し、LoRA学習を行うのに必要なプログラムを導入する方法を説明します。 注意: 今回の解説にあるKohya_ssのインストール手順はWindow向けです。Mac/Linuxと共通する部分もありますが、手順はWindowsマシンにインストールすることを想定しています。 Loraとは Lora
PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀です。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。 【もっと写真を見る】 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカル
ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。 GitHub - lllyasviel/IC-Light: More relighting! https://github.com/lllyasviel/IC-Light IC-Lightは画像の光源の種類や位置を指定しつつ背景を別物に置き換えられるAIツールです。IC-Lightはローカルにインストールして使用可能。さらに、インストール不要で使えるデモサイトも用意されていたので、実際にデモサイトでIC-Lightを使って画像を加工してみました。 IC-Lightのデモサイトには、以下のリンクをクリックするとアクセスできます。 IC Light - a Hugging Face Space by lllyasviel h
画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ
こうした動きと並行して、OpenAIは一部の映像クリエイターにSoraを試用してもらい、その作品を積極的に公開しています。中でも僕が注目したのは、「パンクロック・ピクサー」の異名を持つshy kidsというカナダの映像プロダクションが制作した「Air Head」です。これは頭が黄色い風船で出来ている主人公が、自転車に乗ったり、サボテンだらけの通路を歩いたり、風に飛ばされた頭を胴体が追いかけるといった内容の、アイデアに満ちていてAI生成動画の可能性を示す1分21秒の小品でした。 ところが、4月半ばにfxguideというオンラインメディアがshy kidsを取材して、Soraの実際の使用感を語った”Actually Using SORA”という記事を掲載したのです。 それによると、Soraも他の動画生成AIと同じく、どのような映像が生成されるかはスロットマシン(昨今の日本風にいえば、ガチャ)の
すがやみつる @msugaya 私も試してみました。プロンプトは、以下のとおりです。 ***** 『ゲームセンターあらし』というタイトルのマンガがありますが、このマンガに関係なく、タイトルだけのイメージから、美少女がゲームセンターで激しくゲームをプレイする絵を、マンガタッチで描いてください。 ***** こちらの方が年齢が高そうですね(^_^)。 ChatGPT経由でDALL-E3に描いてもらいました。 2024-04-30 22:26:48 ジロー @i9r82k こんこんばんばん 本日夜便は、ゲームセンターあらしより「ゲームセンターあらし」です ゲーセンというか、カラオケじゃないか? 黒髪ショートカットって意外に珍しい気がする なんか悪友というか、腹を割って話せる関係っぽい感じがします #画像生成AI #美少女 pic.twitter.com/8SF9NJb1QR 2024-04-30
Googleは2024年第1四半期(1~3月)には広告関連で700億ドル(約11兆円)もの売上を記録しており、インターネット広告市場では依然としてトップのシェアを誇っています。そんなGoogleが広告ポリシーを更新し、「露骨な性的表現やヌードを含むように変更または生成された合成コンテンツの宣伝」を禁止するとしました。これにより、ディープフェイク(AI技術を用いて作成される本物と見紛うような偽画像・動画)で作成されたポルノコンテンツである「ディープフェイクポルノ」を作成することができるサービスの宣伝が禁止されることとなります。 Google bans advertisers from promoting deepfake porn services - The Verge https://www.theverge.com/2024/5/3/24148368/google-ad-policy-
stable-diffusion-webuiで使用しているpythonのバージョンを変更する2023年4月20日(木) 2時36分43秒 | 6583 view | stable-diffusion-webuiではpython3.10.6の利用が推奨されています。GitHub issueによると3.11.xでは動作しないようです。また3.10.x未満のバージョンでも動作するようですがxformersが使えなかったりといろいろ制限があったので3.10.6にpythonのバージョンを合わせ変更したところ、ハマったので共有します。 原因最初のlaunch.py実行時にtorchなどの依存関係をまとめてインストールしますがその際に別バージョンでのインストールしたものが残っている場合、pythonのバージョン変更をするとエラーが出てしまうようでした。 対処法stable-diffusion-webu
AIで生成した画像を使った漫画の著作権がアメリカで物議を醸したり、漫画の設定やあらすじを提案してくれるAIサービスが登場したりと、AIは絵やイラストの生成だけでなく漫画作品の制作にも活用されるようになってきています。中国のByteDanceと南開大学の研究チームが、ストーリーのある漫画を出力できるAIモデル「StoryDiffusion」を発表しました。 StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation https://storydiffusion.github.io/ StoryDiffusionは、統一感のある漫画キャラクターを出力することが可能です。例えば、以下は上からコマドリ、リス、ハリネズミのキャラクターを、左から順に「ベッドで起きる」「朝食を食べる」「道路にいる
はじめにこんにちは、AI Picasso社の開発チームです。ふたたび、皆様に重要なお知らせがあります。高品質AIアート用画像生成AI、Emi 2 を商用利用可能で無償公開します。この画像生成AIは商用利用が可能であり、追加学習において無断転載画像を学習していません。 Emi 2 は以下のURLにて無料で利用することができます。 Emi 2の特徴1.AIアートへさらに特化このモデルは、イラストやアニメ、マンガのようなAIアート生成に特化しています。GMOインターネットグループが提供する「ConoHa byGMO」のトライアル版の採用により最先端の開発機材NVIDIA H100によって作られた画像生成Emi、モデルマージやフルファインチューニングといったAI Picasso社のノウハウを用いて高品質な画像が生成されるように尽力しました。参考として簡単な生成例を以下に紹介します。 比較のために、
以前生成AIを使ってリアルな着用モデルの画像を作成する方法をご紹介しました。 AIで撮影モデルを生成して色んなロケ地でジュエリーの着用画像を作成してみた -Stable DiffusionとBRAV7- 今回は生成したモデルさんをベースに、複数の異なるジュエリーを身につけた着用画像の作成方法をご紹介します。Stable Diffusion等の使い方は以前の記事をご覧ください。 ベースのモデルを作成して異なる商品を身につけさせる 生成AIですと毎回異なる画像が生成されますが、顔や雰囲気は固定して、身につけている商品だけを変えてバリエーションを増やしたい時ってありますよね。基本となるモデルを作成し、色々なジュエリーを生成して身につけてみます。 1.まずはモデルさんを生成 まずはいつも通りベースとなるモデルさんを作成します。今回はこちらのモデルさんを生成しました。 シルバーのネックレスとリングを
AIは実在していない人間の顔写真を生成することができ、その精度はすさまじい勢いで高まっています。AI製のスパイや実在しないエンジニアを活用したと疑われる例も報じられているほか、AIの生成した顔は本物の顔と区別がつかないだけではなく「本物の顔より信頼性が高い」とされる研究もあります。オーストラリア国立大学の上級講師であるエイミー・ダウェル氏は「AIは、本物の人間の顔よりも本物らしく見える顔を作成できる」ことを示した上で、そのようなAIの能力「ハイパーリアリズム」について解説しています。 AI Hyperrealism: Why AI Faces Are Perceived as More Real Than Human Ones - Elizabeth J. Miller, Ben A. Steward, Zak Witkower, Clare A. M. Sutherland, Eva G
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く