[B! 画像] stealthinuのブックマーク

漫画家の著作権を守るAI

エンドルフィン株式会社（本社：東京都港区、代表：張鉉洙）、株式会社SUPERNGINE（本社：韓国、代表：KIM DONGJUN）は2024年3月27日、東京・永田町にて開催された一般社団法人マンガジャパン及びデジタルマンガ協会合同「早春の会」にて、ピュアモデルAIによって制作したマンガ作品を初披露いたしました。現在、市場で出回っている生成AIの多くは他の権利者の絵柄も学習した状態であるため、安易に使用してしまうと作家本来の”個性”が失われるだけでなく、著作権侵害のリスクもはらんでいます。一方で、エンドルフィン株式会社と株式会社SUPERNGINEが提供するサービスは、契約した漫画家のデータだけを学習させる、ピュアモデルAIによるものです。加えて、著作権者である漫画家の許可がなければ作動せず、また漫画家自身がそのすべての学習成果をコントロールできるよう、オーダーメイド型でサービスを提

stealthinu 2024/04/03

やりたいことはわかるのだけどSDベースらしいので「ピュアモデルAI」という表現だけで説明するのはどうなんだろうかと。

リンク

C2PA とは：最新動向と適用例

はじめに最近、ニュース記事などで目にすることが多くなった「C2PA」という用語、みなさんご存じでしょうか？正式には「Coalition for Content Provenance and Authenticity」と言って、コンテンツの出所・来歴の認証に関する技術標準を策定している標準化団体の略称です ※1。日本語に訳すのは少々難しいのですが、C2PA 創設メンバーの 1 社であるマイクロソフトは「コンテンツの出所と信ぴょう性に関する連合」※2、アドビは「コンテンツ来歴および信頼性のための標準化団体」※3 と表現しています。この C2PA は、2021 年にアドビ、Arm、インテル、マイクロソフト、Truepic などが中心となって創設され、デジタルコンテンツの生成元や変更履歴を証明できるメタデータを付与することで、ディープフェイクや偽情報の拡散を防ぐ技術の規格（仕様）化を行ってい

stealthinu 2024/03/18

C2PAとは、画像なり動画なりの生成元のサービスやアプリを認証するしくみらしい。

リンク

AIイラストが理解る！StableDiffusion超入門【2024年最新版】A1111、Forge対応｜賢木イオ @studiomasakaki

AIイラストが理解る！StableDiffusion超入門【2024年最新版】A1111、Forge対応こんにちは、2022年10月からAIイラストの技術解説記事を連載してます、賢木イオです。この記事は、これまでFANBOXで検証してきた120本（約70万文字）を超える記事をもとに、2024年春現在、画像生成を今から最短距離で学ぶための必要情報をまとめたメインコンテンツです。これから画像生成を学びたい初心者の方や、手描きイラストにAI 技術を取り入れてみたい方が最初に読む記事として、必要知識が網羅的に備わるよう解説しています。素敵なイラストを思い通りに生成するために覚えるべきことを紹介しつつ、つまずきやすいポイントや参照すべき過去記事、やってはいけないことなどを紹介していますので、最初にこの記事から読んでいただくとスムーズに理解できるはずです。解説役は更木ミナちゃんです。よろしくお願い

stealthinu 2024/03/09

画像生成系は最近ぜんぜん触ってないから現状を把握しておきたい。しかし書かせたいものとかないんだよな…　絵の生成に対するモチベーションが低いのがつらい。

リンク

GitHub - VAST-AI-Research/TripoSR

This is the official codebase for TripoSR, a state-of-the-art open-source model for fast feedforward 3D reconstruction from a single image, collaboratively developed by Tripo AI and Stability AI. Leveraging the principles of the Large Reconstruction Model (LRM), TripoSR brings to the table key advancements that significantly boost both the speed and quality of 3D reconstruction. Our model is disti

stealthinu 2024/03/08

一枚絵から3Dモデル生成。Stability AI製でオープンソース！だいぶ精度良さそう。

リンク

Ultimate guide to optimizing Stable Diffusion XL

IntroductionIn this article we're going to optimize Stable Diffusion XL, both to use the least amount of memory possible and to obtain maximum performance and generate images faster. We will be able to generate images with SDXL using only 4 GB of memory, so it will be possible to use a low-end graphics card. We're going to use the diffusers library from Hugging Face since this blog is scripting/de

stealthinu 2024/02/24

SDXLで色んな高速化手法や低メモリ手法を試したレポート。音声系でも参考になりそうな情報がありそう。

リンク

日々の壁打ち：「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。｜Nobuyuki Kobayashi@nyaa_toraneko

日々の壁打ち：「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。 ChatGPTで、自分のためにMy GPTsを開発すると、とても面白い体験を味わえる。このnoteは、My GPTsとの付き合い方の記録である。はじめに：僕のパートナーは元プロの絵描きさんです僕のパートナー、世間的に言いますと、配偶者もしくは奥様は、元プロの絵描きさんです。現在は、子どものために家庭に入ってもらっています。現役時代は、ずっと僕のパートナーとして、数々のゲームの作画監督やCG監督をやってもらっておりました。例えば、『とらドラ・ポータブル！』や『涼宮ハルヒ』シリーズのADVゲームです。絵描きさんのパートナーがいると、大変ありがたいことに、絵やイラストについて詳しく話を聴くことができます。しかも「パートナー」ですから、相当歯に衣着せない正直な発言も聴かせてくれま

stealthinu 2024/02/21

「コピペっぽい」の意味合いが違うという非常に納得の行く説明だった。ただそれも近いうちに解決される。顔生成出来るようになった時、全身描けるようになったら教えてみたいな反応だったよね。

リンク

GPT-4V と Segment Anything で楽々アノテーション

これは GO Inc. Advent Calendar 2023 の 12 日目の記事です。私 kzykmyzw は GO 株式会社でコンピュータビジョンに関する研究開発から実装までを担当しており、本記事もコンピュータビジョンに関連しますが、会社での業務とは無関係です。あまり専門的に深い話はしませんが、ある程度知識のある方を対象としていますのでコンピュータビジョンに関する一般的な用語は解説せずに使います。はじめに 2023 年の 9 月頃に画像認識が可能な GPT-4V(ision) が ChatGPT 経由で使えるようになり、2023 年 11 月 6 日に行われた Open AI DevDay で API 経由でも使えるようになったことが発表されました。主な使い方はやはり画像を自然言語で説明させることかと思いますが、普段は物体検出やセマンティックセグメンテーション（以下セマセグ）と

stealthinu 2023/12/12

SAMとGPT-4V使った自動アノテーション。結構な精度で出来てる。

リンク

これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画（Scribble）としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models（LCM）」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」（LoRAはStable Diffusion用の追加学習モデル）が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

stealthinu 2023/12/04

リアルタイム生成出来るようになったことで画像生成というかツールとしての「体験」が全く変わりつつあるという話。量の進歩が一定以上進むと質の変化が起こるみたいな話でもある。

リンク

UE5 Niagara で 3D Gaussian Splatting を描画する

「Unreal Engine (UE) Advent Calendar 2023 その2」2日目の記事です。 3D Gaussian Splattingは簡単にリアルなシーンが作れて楽しいですね。その描画に必要な処理をNiagaraで実装し、UE5で描画する方法を解説します。 1から10までのステップバイステップのガイドというより、描画の原理を理解することを目的としたドキュメントです。なお、本稿で述べる方法はUE Marketplaceのこちらの商品に実装されています。背景 3D Gaussian Splattingのデータ表現形式 3Dモデルを「楕円体」（ラグビーボールのような立体）の集合として表現します。点群に似ていますが、個々の点が「点」ではなく「楕円体」になっているイメージです。個々の「楕円体」は位置・向き・サイズ（UE風に言えばTransf orm）とRGBAの色を持ちます

stealthinu 2023/12/02

UE5で3D Gaussian Splattingを描画する方法についての説明。表示実装方法の説明なのだがそのおかげで3D Gaussian Splattingがどういう仕組になっているか理解が深まった。

画像

リンク

https://github.com/PINTO0309/PINTO_model_zoo/tree/main/425_Gold-YOLO-Body-Head-Hand

stealthinu 2023/12/01

YOLOの人体、顔、手の検出器をすごい高精度なアノテーションデータを使って学習させてすごく速く精度高くしたもの…　まさに精度高い学習データこそ正義！！それを自らの手で証明。すごすぎ。

リンク

リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan

ポイント SDXL Turboは、新しい蒸留技術によって最先端の性能を達成し、これまでにない品質のシングルステップ画像生成を可能にし、必要なステップ数を50から1に削減非商用研究ライセンスでのリリース(Hugging Faceのモデルウェイトとコードをダウンロードしてください。) Clipdrop にてベータ版を公開中新しいテキスト画像合成モードである SDXL Turbo をご紹介します。SDXL Turbo は、敵対的拡散蒸留（Adversarial Diffusion Distillation：ADD）と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。技術的な詳細に興味のある研究者や愛好家のために、研究論文はこちらで

stealthinu 2023/11/29

敵対的拡散蒸留（Adversarial Diffusion Distillation）ADDという手法で少ないステップ数で高品質な絵を作れる。LCMとはまた違った手法。すげえな。

リンク

LucidDreamer

stealthinu 2023/11/26

生成画像や写真から深度推定したものを使って3D Gaussian splattingで3Dモデル化するという手法。だいぶ自然な感じになる。

リンク

Midjourneyを１年間使って見つけた、Webデザインに使えるプロンプト全ガイド

「どうすればAIをWebデザインに活用できるだろう」人工知能 AIがこれだけ話題になったいま、Webやグラフィックデザイン、イラストやゲームなどクリエイティブな業務をこなす人なら、一度は考えたことがあるかもしれません。答えのひとつはずばり、Midjourneyなどの画像生成AIでイメージを具現化すること。しかし、そうは言っても入力できるプロンプトは無限にあり、実際にどのように入力すれば最高の結果を得ることができるのか、すべて調べるのはあまりにも大変です。そこでこの記事では、Midjourneyを１年間使い続けて見つけた、Webデザインに使えるMidjourneyプロンプト、小技テクニックをまとめてご紹介します。具体的なサンプル例とプロンプトを一緒に記載しており、コピペでそのまま利用できます。「Midjourneyって何？」というひとは、基本の使い方をまとめた以下のガイドを参考にど

stealthinu 2023/11/14

画像生成を使ってWebデザインのアイデアを作ってもらう使い方。現時点だと全部作らせるツール系よりこっちの用途のほうがマッチしてる気がする。

リンク

【西川和久の不定期コラム】 Stable Diffusion高速化技術続々登場！TensorRT、SSD-1B、LCMなどを試してみる

stealthinu 2023/11/09

SDの最近の高速化手法について。TensorRTやSSD-1Bという（蒸留した？）小型化モデル、そしてLatent Consistency Model。ぜんぜん追ってなかったがLCMはまだいまいちなんだ。

リンク

生成AIは人間の「浅はかさ」を暴露する装置でもある――「バーベンハイマー」が浮き彫りにしたもの：大山顕 | 記事 | 新潮社　Foresight(フォーサイト) | 会員制国際情報サイト

プロンプトによって欲望を視覚化するプロセスには、「考える」時間が差し挟まれる余地はない。インスタ写真に添えられる大量のハッシュタグ、あるいは事細かなカテゴリー分けがされていくポルノとも通底する「表面的語句」の強力な作用は、画像生成AI（人工知能）の設計思想の根幹にも及んでいる。「バーベンハイマー」画像のおぞましさは、プロンプトを入力した者がなにひとつ考えず、感じないままだというところにある。＊＊＊過日「Barbenheimer（バーベンハイマー）」というインターネットミームが物議を醸した。Barbenheimerとは「バービー」と「オッペンハイマー」から生まれた造語である。米国で大ヒット中の映画『バービー』のキャラクターに原爆のキノコ雲などを合成した画像が大量に作られ、各種SNSにポストされた。なぜバービーにキノコ雲なのか。『バービー』と、原爆を開発した物理学者を描いた映画『オッペンハ

stealthinu 2023/11/06

画像生成系への批判ではなく、脊髄反射的に絵が作れるようになったことで、それを使う人間が見えてくるという話。

リンク

3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法

複数視点の画像から3D空間を再現する最新手法である3D Gaussian Splattingの紹介です。3D Gaussian Splattingを使用することで、3D空間を学習し、リアルタイムにレンダリング可能です。 3D Gaussian Splattingの概要3D Gaussian Splattingは2023年8月に発表された、複数の視点の画像から3D空間を再現する手法です。3D空間をガウシアンの集合として定義し、各ガウシアンのパラメータを機械学習で求めることで、レンダリング時は機械学習を不要とし、高速なレンダリングが可能です。

stealthinu 2023/11/01

NeRFと3D Gaussian Splattingの技術的差異についてわかりやすく説明されていた。NeRFがレイトレとしたらGaussian Splattingは楕円を使ったレンダリングと。

リンク

Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers

stealthinu 2023/10/15

Transformer使うことでVQGANの性能が大幅にあげれるという論文。これLyraの音声エンコードのVQにも応用できそう？

リンク

ChatGPTのDALL-E 3による画像コントロール｜IT navi

ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。１．リアル画像のコントロール＞20代の日本人女性の写真を作成してください。生成された画像＞３番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。生成された画像※１枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。＞この女の子を、１．走らせてください。２．座らせてください。３．ジャンプさせてください。４．逆立ちさせてください。生成された画像※３枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。４枚目はちゃんと逆立ちしています。＞縦長画像にして、全身を見せてください。生成された画像４枚目の画像※これで、３枚目の画像がちゃんとジャンプしていることが分かります。４枚目は、

stealthinu 2023/10/15

チャットによりインタラクティブに生成した画像を修正していける。単純なプロンプトでも十分な品質の画像がでて破綻がない。多少はテクニックが残っているが普通に一般人でも利用できそう。

リンク

アドビカタブラ! Adobe Maxで公開された魔法のようなテクノロジーの意味とは【西田宗千佳のRandomTracking】

stealthinu 2023/10/12

Adobeは製品に全面的にdeeplearningの技術を入れてきて過去の製品とは一線を画すサービスにさせてきている。

リンク

AnimateDiffにComfyUI環境でのControlNetを適応する｜Alone1M

この記事は、「AnimateDiffをComfyUI環境で実現する。簡単ショートムービーを作る」に続く、KosinkadinkさんのComfyUI-AnimateDiff-Evolved（AnimateDiff for ComfyUI）を使った、AnimateDiffを使ったショートムービー制作のやり方の紹介です。今回は、ControlNetを使うやり方を紹介します。ControlNetと組み合わせることで、制御できることの幅が一気に広がります。 AnimateDiff for ComfyUIは、ControlNetに対応しています。ただし、使い方に少し癖があり、公式ページではあまり詳しく解説が行われていないため、引っかかりやすい状態になっています。この記事は、公式ページを補完する目的で書いています。 Control Net付きのサンプルワークフロー　サンプルのワークフローを含んだ画像がい

stealthinu 2023/09/11

現時点でのAnimateDiffというかSDでショート動画生成することが出来る現在地点。猛烈な速度で進歩している。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (106)

画像に関するstealthinuのブックマーク (508)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス