タグ

画像に関するstealthinuのブックマーク (508)

  • 漫画家の著作権を守るAI

    エンドルフィン株式会社(社:東京都港区、代表:張鉉洙)、株式会社SUPERNGINE(社:韓国、代表:KIM DONGJUN)は2024年3月27日、東京・永田町にて開催された一般社団法人マンガジャパン及びデジタルマンガ協会合同「早春の会」にて、ピュアモデルAIによって制作したマンガ作品を初披露いたしました。 現在、市場で出回っている生成AIの多くは他の権利者の絵柄も学習した状態であるため、安易に使用してしまうと作家来の”個性”が失われるだけでなく、著作権侵害のリスクもはらんでいます。 一方で、エンドルフィン株式会社と株式会社SUPERNGINEが提供するサービスは、契約した漫画家のデータだけを学習させる、ピュアモデルAIによるものです。 加えて、著作権者である漫画家の許可がなければ作動せず、また漫画家自身がそのすべての学習成果をコントロールできるよう、オーダーメイド型でサービスを提

    漫画家の著作権を守るAI
    stealthinu
    stealthinu 2024/04/03
    やりたいことはわかるのだけどSDベースらしいので「ピュアモデルAI」という表現だけで説明するのはどうなんだろうかと。
  • C2PA とは:最新動向と適用例

    はじめに 最近、ニュース記事などで目にすることが多くなった「C2PA」という用語、みなさんご存じでしょうか? 正式には「Coalition for Content Provenance and Authenticity」と言って、コンテンツの出所・来歴の認証に関する技術標準を策定している標準化団体の略称です ※1。日語に訳すのは少々難しいのですが、C2PA 創設メンバーの 1 社であるマイクロソフトは「コンテンツの出所と信ぴょう性に関する連合」※2、アドビは「コンテンツ来歴および信頼性のための標準化団体」※3 と表現しています。 この C2PA は、2021 年にアドビ、Arm、インテル、マイクロソフト、Truepic などが中心となって創設され、デジタルコンテンツの生成元や変更履歴を証明できるメタデータを付与することで、ディープフェイクや偽情報の拡散を防ぐ技術の規格(仕様)化を行ってい

    C2PA とは:最新動向と適用例
    stealthinu
    stealthinu 2024/03/18
    C2PAとは、画像なり動画なりの生成元のサービスやアプリを認証するしくみらしい。
  • AIイラストが理解る!StableDiffusion超入門【2024年最新版】A1111、Forge対応|賢木イオ @studiomasakaki

    AIイラストが理解る!StableDiffusion超入門【2024年最新版】A1111、Forge対応 こんにちは、2022年10月からAIイラスト技術解説記事を連載してます、賢木イオです。この記事は、これまでFANBOXで検証してきた120(約70万文字)を超える記事をもとに、2024年春現在、画像生成を今から最短距離で学ぶための必要情報をまとめたメインコンテンツです。 これから画像生成を学びたい初心者の方や、手描きイラストAI技術を取り入れてみたい方が最初に読む記事として、必要知識が網羅的に備わるよう解説しています。素敵なイラストを思い通りに生成するために覚えるべきことを紹介しつつ、つまずきやすいポイントや参照すべき過去記事、やってはいけないことなどを紹介していますので、最初にこの記事から読んでいただくとスムーズに理解できるはずです。 解説役は更木ミナちゃんです。よろしくお願い

    AIイラストが理解る!StableDiffusion超入門【2024年最新版】A1111、Forge対応|賢木イオ @studiomasakaki
    stealthinu
    stealthinu 2024/03/09
    画像生成系は最近ぜんぜん触ってないから現状を把握しておきたい。しかし書かせたいものとかないんだよな… 絵の生成に対するモチベーションが低いのがつらい。
  • GitHub - VAST-AI-Research/TripoSR

    This is the official codebase for TripoSR, a state-of-the-art open-source model for fast feedforward 3D reconstruction from a single image, collaboratively developed by Tripo AI and Stability AI. Leveraging the principles of the Large Reconstruction Model (LRM), TripoSR brings to the table key advancements that significantly boost both the speed and quality of 3D reconstruction. Our model is disti

    GitHub - VAST-AI-Research/TripoSR
    stealthinu
    stealthinu 2024/03/08
    一枚絵から3Dモデル生成。Stability AI製でオープンソース!だいぶ精度良さそう。
  • Ultimate guide to optimizing Stable Diffusion XL

    IntroductionIn this article we're going to optimize Stable Diffusion XL, both to use the least amount of memory possible and to obtain maximum performance and generate images faster. We will be able to generate images with SDXL using only 4 GB of memory, so it will be possible to use a low-end graphics card. We're going to use the diffusers library from Hugging Face since this blog is scripting/de

    Ultimate guide to optimizing Stable Diffusion XL
    stealthinu
    stealthinu 2024/02/24
    SDXLで色んな高速化手法や低メモリ手法を試したレポート。音声系でも参考になりそうな情報がありそう。
  • 日々の壁打ち:「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。|Nobuyuki Kobayashi@nyaa_toraneko

    日々の壁打ち:「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。 ChatGPTで、自分のためにMy GPTsを開発すると、とても面白い体験を味わえる。このnoteは、My GPTsとの付き合い方の記録である。 はじめに:僕のパートナーは元プロの絵描きさんです僕のパートナー、世間的に言いますと、配偶者もしくは奥様は、元プロの絵描きさんです。現在は、子どものために家庭に入ってもらっています。現役時代は、ずっと僕のパートナーとして、数々のゲームの作画監督やCG監督をやってもらっておりました。 例えば、『とらドラ・ポータブル!』や『涼宮ハルヒ』シリーズのADVゲームです。 絵描きさんのパートナーがいると、大変ありがたいことに、絵やイラストについて詳しく話を聴くことができます。しかも「パートナー」ですから、相当歯に衣着せない正直な発言も聴かせてくれま

    日々の壁打ち:「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。|Nobuyuki Kobayashi@nyaa_toraneko
    stealthinu
    stealthinu 2024/02/21
    「コピペっぽい」の意味合いが違うという非常に納得の行く説明だった。ただそれも近いうちに解決される。顔生成出来るようになった時、全身描けるようになったら教えてみたいな反応だったよね。
  • GPT-4V と Segment Anything で楽々アノテーション

    これは GO Inc. Advent Calendar 2023 の 12 日目の記事です。 私 kzykmyzw は GO 株式会社でコンピュータビジョンに関する研究開発から実装までを担当しており、記事もコンピュータビジョンに関連しますが、会社での業務とは無関係です。あまり専門的に深い話はしませんが、ある程度知識のある方を対象としていますのでコンピュータビジョンに関する一般的な用語は解説せずに使います。 はじめに 2023 年の 9 月頃に画像認識が可能な GPT-4V(ision) が ChatGPT 経由で使えるようになり、2023 年 11 月 6 日に行われた Open AI DevDay で API 経由でも使えるようになったことが発表されました。主な使い方はやはり画像を自然言語で説明させることかと思いますが、普段は物体検出やセマンティックセグメンテーション(以下セマセグ)と

    GPT-4V と Segment Anything で楽々アノテーション
    stealthinu
    stealthinu 2023/12/12
    SAMとGPT-4V使った自動アノテーション。結構な精度で出来てる。
  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
    stealthinu
    stealthinu 2023/12/04
    リアルタイム生成出来るようになったことで画像生成というかツールとしての「体験」が全く変わりつつあるという話。量の進歩が一定以上進むと質の変化が起こるみたいな話でもある。
  • UE5 Niagara で 3D Gaussian Splatting を描画する

    「Unreal Engine (UE) Advent Calendar 2023 その2」2日目の記事です。 3D Gaussian Splattingは簡単にリアルなシーンが作れて楽しいですね。 その描画に必要な処理をNiagaraで実装し、UE5で描画する方法を解説します。 1から10までのステップバイステップのガイドというより、描画の原理を理解することを目的としたドキュメントです。 なお、稿で述べる方法はUE Marketplaceのこちらの商品に実装されています。 背景 3D Gaussian Splattingのデータ表現形式 3Dモデルを「楕円体」(ラグビーボールのような立体)の集合として表現します。点群に似ていますが、個々の点が「点」ではなく「楕円体」になっているイメージです。 個々の「楕円体」は位置・向き・サイズ(UE風に言えばTransform)とRGBAの色を持ちます

    UE5 Niagara で 3D Gaussian Splatting を描画する
    stealthinu
    stealthinu 2023/12/02
    UE5で3D Gaussian Splattingを描画する方法についての説明。表示実装方法の説明なのだがそのおかげで3D Gaussian Splattingがどういう仕組になっているか理解が深まった。
  • https://github.com/PINTO0309/PINTO_model_zoo/tree/main/425_Gold-YOLO-Body-Head-Hand

    stealthinu
    stealthinu 2023/12/01
    YOLOの人体、顔、手の検出器をすごい高精度なアノテーションデータを使って学習させてすごく速く精度高くしたもの… まさに精度高い学習データこそ正義!!それを自らの手で証明。すごすぎ。
  • リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan

    ポイント SDXL Turboは、新しい蒸留技術によって最先端の性能を達成し、これまでにない品質のシングルステップ画像生成を可能にし、必要なステップ数を50から1に削減 非商用研究ライセンスでのリリース(Hugging Faceのモデルウェイトとコードをダウンロードしてください。) Clipdrop にてベータ版を公開中 新しいテキスト画像合成モードである SDXL Turbo をご紹介します。SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。技術的な詳細に興味のある研究者や愛好家のために、研究論文はこちらで

    リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan
    stealthinu
    stealthinu 2023/11/29
    敵対的拡散蒸留(Adversarial Diffusion Distillation)ADDという手法で少ないステップ数で高品質な絵を作れる。LCMとはまた違った手法。すげえな。
  • LucidDreamer

    stealthinu
    stealthinu 2023/11/26
    生成画像や写真から深度推定したものを使って3D Gaussian splattingで3Dモデル化するという手法。だいぶ自然な感じになる。
  • Midjourneyを1年間使って見つけた、Webデザインに使えるプロンプト全ガイド

    「どうすればAIWebデザインに活用できるだろう」 人工知能AIがこれだけ話題になったいま、Webやグラフィックデザイン、イラストゲームなどクリエイティブな業務をこなす人なら、一度は考えたことがあるかもしれません。 答えのひとつはずばり、Midjourneyなどの画像生成AIでイメージを具現化すること。 しかし、そうは言っても入力できるプロンプトは無限にあり、実際にどのように入力すれば最高の結果を得ることができるのか、すべて調べるのはあまりにも大変です。 そこでこの記事では、Midjourneyを1年間使い続けて見つけた、Webデザインに使えるMidjourneyプロンプト、小技テクニックをまとめてご紹介します。 具体的なサンプル例とプロンプトを一緒に記載しており、コピペでそのまま利用できます。 「Midjourneyって何?」というひとは、基の使い方をまとめた以下のガイドを参考にど

    Midjourneyを1年間使って見つけた、Webデザインに使えるプロンプト全ガイド
    stealthinu
    stealthinu 2023/11/14
    画像生成を使ってWebデザインのアイデアを作ってもらう使い方。現時点だと全部作らせるツール系よりこっちの用途のほうがマッチしてる気がする。
  • 【西川和久の不定期コラム】 Stable Diffusion高速化技術続々登場!TensorRT、SSD-1B、LCMなどを試してみる

    【西川和久の不定期コラム】 Stable Diffusion高速化技術続々登場!TensorRT、SSD-1B、LCMなどを試してみる
    stealthinu
    stealthinu 2023/11/09
    SDの最近の高速化手法について。TensorRTやSSD-1Bという(蒸留した?)小型化モデル、そしてLatent Consistency Model。ぜんぜん追ってなかったがLCMはまだいまいちなんだ。
  • 生成AIは人間の「浅はかさ」を暴露する装置でもある――「バーベンハイマー」が浮き彫りにしたもの:大山顕 | 記事 | 新潮社 Foresight(フォーサイト) | 会員制国際情報サイト

    プロンプトによって欲望を視覚化するプロセスには、「考える」時間が差し挟まれる余地はない。インスタ写真に添えられる大量のハッシュタグ、あるいは事細かなカテゴリー分けがされていくポルノとも通底する「表面的語句」の強力な作用は、画像生成AI人工知能)の設計思想の根幹にも及んでいる。「バーベンハイマー」画像のおぞましさは、プロンプトを入力した者がなにひとつ考えず、感じないままだというところにある。 *** 過日「Barbenheimer(バーベンハイマー)」というインターネットミームが物議を醸した。Barbenheimerとは「バービー」と「オッペンハイマー」から生まれた造語である。米国で大ヒット中の映画『バービー』のキャラクターに原爆のキノコ雲などを合成した画像が大量に作られ、各種SNSにポストされた。なぜバービーにキノコ雲なのか。『バービー』と、原爆を開発した物理学者を描いた映画『オッペンハ

    生成AIは人間の「浅はかさ」を暴露する装置でもある――「バーベンハイマー」が浮き彫りにしたもの:大山顕 | 記事 | 新潮社 Foresight(フォーサイト) | 会員制国際情報サイト
    stealthinu
    stealthinu 2023/11/06
    画像生成系への批判ではなく、脊髄反射的に絵が作れるようになったことで、それを使う人間が見えてくるという話。
  • 3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法

    複数視点の画像から3D空間を再現する最新手法である3D Gaussian Splattingの紹介です。3D Gaussian Splattingを使用することで、3D空間を学習し、リアルタイムにレンダリング可能です。 3D Gaussian Splattingの概要3D Gaussian Splattingは2023年8月に発表された、複数の視点の画像から3D空間を再現する手法です。3D空間をガウシアンの集合として定義し、各ガウシアンのパラメータを機械学習で求めることで、レンダリング時は機械学習を不要とし、高速なレンダリングが可能です。

    3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法
    stealthinu
    stealthinu 2023/11/01
    NeRFと3D Gaussian Splattingの技術的差異についてわかりやすく説明されていた。NeRFがレイトレとしたらGaussian Splattingは楕円を使ったレンダリングと。
  • Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers

    stealthinu
    stealthinu 2023/10/15
    Transformer使うことでVQGANの性能が大幅にあげれるという論文。これLyraの音声エンコードのVQにも応用できそう?
  • ChatGPTのDALL-E 3による画像コントロール|IT navi

    ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。 1.リアル画像のコントロール>20代の日人女性の写真を作成してください。 生成された画像>3番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。 生成された画像※1枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。 >この女の子を、1.走らせてください。2.座らせてください。3.ジャンプさせてください。4.逆立ちさせてください。 生成された画像※3枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。4枚目はちゃんと逆立ちしています。 >縦長画像にして、全身を見せてください。 生成された画像4枚目の画像※これで、3枚目の画像がちゃんとジャンプしていることが分かります。4枚目は、

    ChatGPTのDALL-E 3による画像コントロール|IT navi
    stealthinu
    stealthinu 2023/10/15
    チャットによりインタラクティブに生成した画像を修正していける。単純なプロンプトでも十分な品質の画像がでて破綻がない。多少はテクニックが残っているが普通に一般人でも利用できそう。
  • アドビカタブラ! Adobe Maxで公開された魔法のようなテクノロジーの意味とは【西田宗千佳のRandomTracking】

    アドビカタブラ! Adobe Maxで公開された魔法のようなテクノロジーの意味とは【西田宗千佳のRandomTracking】
    stealthinu
    stealthinu 2023/10/12
    Adobeは製品に全面的にdeeplearningの技術を入れてきて過去の製品とは一線を画すサービスにさせてきている。
  • AnimateDiffにComfyUI環境でのControlNetを適応する|Alone1M

    この記事は、「AnimateDiffをComfyUI環境で実現する。簡単ショートムービーを作る」に続く、KosinkadinkさんのComfyUI-AnimateDiff-Evolved(AnimateDiff for ComfyUI)を使った、AnimateDiffを使ったショートムービー制作のやり方の紹介です。今回は、ControlNetを使うやり方を紹介します。ControlNetと組み合わせることで、制御できることの幅が一気に広がります。 AnimateDiff for ComfyUIは、ControlNetに対応しています。ただし、使い方に少し癖があり、公式ページではあまり詳しく解説が行われていないため、引っかかりやすい状態になっています。この記事は、公式ページを補完する目的で書いています。 Control Net付きのサンプルワークフロー サンプルのワークフローを含んだ画像がい

    AnimateDiffにComfyUI環境でのControlNetを適応する|Alone1M
    stealthinu
    stealthinu 2023/09/11
    現時点でのAnimateDiffというかSDでショート動画生成することが出来る現在地点。猛烈な速度で進歩している。