内藤武弐(Parody)💉PPPMPMP @BuniNaitoh 画像生成AIの学習データが無許諾公衆送信データ(割れ)を峻別せずに少なからず利用しているであろうことは推定されるけれど、それを言い始めると生成テキストの学習用テキストだって同様だし、そもそもロボット型検索エンジンそのものがかなり怪しいもんなんだけどそこまで平等に取り扱いできるかい? 2023-11-24 07:58:34
OpenAIの画像生成AI「DALL·E 3」を用いて、自分の写真をもとに、アバターとして使えるプロフィール用画像を生成してくれる「Free Profile Picture Generator」が登場しました。 Free Profile Picture Generator using DALL-E 3 https://www.headshotpro.com/tools/free-pfp-generator サイトにアクセスすると、どんな画像が作れるのかというサンプルがずらっと並んでいます。 画像を作るには「Upload one photo」のボタンをクリック。 ダイアログが開くのでベースとして使いたい画像を選び、画像のスタイルを「Flat illustration」「3D rendered」「Comic book」「Anime」「Chibi Cartoon」の5つから選びます。今回は「Fl
この記事を改訂して見やすくした記事を新しく作っています。 こちらをご覧ください。 https://note.com/koseki_yamaki/n/n8383bb0bc0a0 以下の内容は旧記事です。 NovelAI V3では、イラストレーターの名前のプロンプトが明確に影響することが知られている。影響がある名前の人を探してみた。 これは作品として価値を高めるためにやっているわけではなく、単にNovelAIがどれぐらい情報を持っているのかを調べるために行っている。 そのため、絵としての仕上げはしていない。 まず、何の影響もないものを生成。これを基準とする。 プロンプト:1 girl ネガティブ:bad quality,low quality, bad anatomy, text,logo,nsfw 基準1 girl デフォルト。「女の子が一人」以上の指示はしていない。鳥山明toriyama
AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG
サガシモノカモ @sagashimonokamo 1年前、艦隊これくしょんのプロンプトで出力してるとえびふりゃさん(@ ebihurya332)のサインが出てくるという噂があった。 その時はプロンプトの指定で出てくるという話だったが。 今になってV3で検証、10回やって全部出てきた。 昔は読めなかったIDも鮮明に読めるようになった。 やってるねえ pic.twitter.com/ORu3bXk5Kr 2023-12-17 18:02:57 サガシモノカモ @sagashimonokamo 強調{}が問題であるという意見があったので補足。 無くても出ます。 10回出力して全てに再現されました。 サインを書かれている絵師様なら別の方でも再現可能です。 サインは10枚の内鮮明なものを参照。 プロンプト 1girl,ebifurya,kantai collection ネガティブプロンプト 無し
11月27日、中国の北京インターネット裁判所で出された判決は衝撃的でした。なんと画像生成AI「Stable Diffusion」で作られたイラストの著作物性が認められたんです。「春風がそよ風を送る」と名付けられたAI画像につけられたウォーターマークを消して商売に使ったことは著作権を侵害しているとして、被告に対して500元(約1万円)の賠償金を払うよう命じています。 判決について、中国語の資料をジャック・ランランさんという方が翻訳して公開されているんですが、非常に驚くところもあれば、「ああなるほど」と理解できるところもありました。 AIイラストは「独創的」な「知的創造の成果」? まず、判決としてはかなり大胆なことを言っています。 「中華人民共和国著作権法 第3条は、『この法律にいう「著作物」とは、文学的、美術的、および学術の分野における独創性を有し、かつ、一定の形式をもって表現することができ
4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】
「Midjourney」は、テキストから画像を生成する強力な人工知能(AI)で、ありとあらゆる画像を生成できると言ってもいいほどだ。しかし、これまではコミュニケーションサービス「Discord」経由でしか利用できず、特に使いやすいプラットフォームとは言えなかった。そのMidjourneyが今回、より簡単に素早く画像を生成できるという専用のウェブサイトを開設した。 Midjourneyの最高経営責任者(CEO)David Holz氏によると、このウェブサイトは現在アルファ版で、まずはDiscord上のMidjourneyで作成した画像が1万枚を超えるユーザーだけが利用できるという。Midjourneyを使ったことがある場合、生成した画像の枚数を確認するには、Midjourney Botが含まれるDiscordのチャンネルで「/info」と入力すればいい。 Midjourneyがサービスを開始
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
こんなんじゃ中国に勝てませんよ! いくつかの課題をクリアすると、「実行できるタスクはありません」状態になった。その下には、私の提出した内容はチェックを受け、48時間以内にフィードバックが送られてくると書いてある。 ノートパソコンを閉じる前に、参加可能になったRemotasksのドイツ語要員のチャットを覗いてみた。そこには質問と苦情が入り混じっていた。 私はコワーキングスペースの角のカフェに行き、テラス席に座った。ツイッターを見ると、私の上司に当たる人物が米下院の軍事委員会で発言している様子が中継されているというので、それを開いてみた。 いささかオーバーサイズのスーツを着たその人物、スケールAI創業者のアレクサンダー・ワンは、最初の挨拶をするところだった。 「新しいタイプの戦争がおこなわれる時代の幕開けに、ここでこうしてお話しできることを光栄に思います。これからの時代、AIが支配的になるなか
架空のおじさん新聞と「普通」の生成 by kogu 2023年12月6日 生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。 AIで生成したおじさん使って適当な偽新聞のCGを作ったらとても危険な感じだった。文章だけでも危ないのに画像が入ると更に悪く、新聞っていう実績ある様式でもっと悪化する。 pic.twitter.com/ixKODQwxX5 — kogu (@koguGameDev) December 3, 2023 どのように作ったか 今回のフェイク新聞、作り方はかなり手抜きです。こうした制作に慣れている方なら30分もかからないでしょう。今はまだ多少専門性を求められますが、1年もすると「頑張れば誰
ゲームとWebのフリーランス開発者。3DCGからゲーム開発の世界に入り20年。今は生成AIの変化を追いかけて日々実験しています。 生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。 どのように作ったか今回のフェイク新聞、作り方はかなり手抜きです。こうした制作に慣れている方なら30分もかからないでしょう。今はまだ多少専門性を求められますが、1年もすると「頑張れば誰にでも」程度になっているかもしれません。 実験としては、ぱっと見新聞だと感じてもらえなければ成立しません。しかしフェイクを作るのではなく、フェイクが作れる可能性の提示が目的です。画像が単体で流れていく可能性を考えると何かしら対策が必要で、強固な透
モデルは、Stable Diffusion(SD)のネットワーク設計と事前訓練された重みを継承し、Denoising UNetを複数フレームの入力に対応できるように変更している。 この方法には3つの重要なコンポーネントが組み込まれている。参照画像からキャラクターの外観的特徴をエンコードする「ReferenceNet」。骨格動画からキャラクターの動きを制御するためのモーションデータをエンコードする「Pose Guider」。キャラクターの動きの連続性を確保するための時間的関係を補う「Temporal layer」。 ReferenceNetで抽出した特徴は、Spatial-Attentionを用いてDenoising UNetに統合される。これにより、Denoising UNetはReferenceNetと同じ特徴空間にある関連する特徴を選択的に学習できる。また、CLIP画像エンコーダーを使
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」、3D Gaussian Splattingを使った新しい3D応用技術など、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」 アリババらが開発 話した言葉をリアルタイム翻訳できるシステムMeta「Seamless」 話し方や感情なども忠実に再現 リアルな動きを持つ高品質なアバターを生成するモデル「Animatable Gaussians」 写真から3D
Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー
ポイント SDXL Turboは、新しい蒸留技術によって最先端の性能を達成し、これまでにない品質のシングルステップ画像生成を可能にし、必要なステップ数を50から1に削減 非商用研究ライセンスでのリリース(Hugging Faceのモデルウェイトとコードをダウンロードしてください。) Clipdrop にてベータ版を公開中 新しいテキスト画像合成モードである SDXL Turbo をご紹介します。SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。技術的な詳細に興味のある研究者や愛好家のために、研究論文はこちらで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く