A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team
画像生成AI「Stable Diffusion」は入力したキーワードに沿って画像を出力してくれるAIで、簡単なお絵かきとキーワードを合わせて意図した画像を生成したり、「この画像っぽい○○」といった指示でイメージを形にできたりと、さまざまな機能や手法が生み出されています。そんなStable Diffusionについて、「画像を学習するAIは、ウェブ上のどのような画像を学習しているのか?」という疑問を解明するために、23億枚のデータセットから1200万枚を抜粋して集計した調査結果を、技術者・ブロガーのアンディ・バイオ氏が公開しています。 Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion's Image Generator - Waxy.org https://waxy.org/2022/0
今話題の画像生成モデル「Stable Diffusion」をいらすとやの画像でfinetuneしてみたところ、任意のテキストに対していらすとやっぽい画像を作れるモデルが出来上がりました。 Stable Diffusionとは Stable Diffusionは、指定されたテキスト(文字列)に対応する画像を生成する機械学習モデルのひとつです。ソースコードと学習済みモデルは無償で公開されていて、誰でも利用できるようになっています。 (Stable DiffusionのGitHubページより引用) 今回は、この画像生成モデルをいらすとやの画像でfinetune(微調整)することで、入力テキストに対応する画像をいらすとやのようなスタイルで出力させることを試みました。 開発環境 開発環境はGoogle Colab Pro+で、主にプレミアムGPU(NVIDIA A100)を使いました。Stable
2022年8月にオープンソースで一般公開された画像生成AI「Stable Diffusion」は通常コマンドラインで入力や制御を行いますが、初心者でも簡単に操作できるStable Diffusion向けGUIが数多く登場しています。その中でもブラウザから使えるウェブUIであるAUTOMATIC1111版Stable Diffusion web UIは特に開発が活発で精力的に更新されており、もはや画像生成AI向けGUIの決定版ともいえる存在です。そのAUTOMATIC1111版Stable Diffusion web UIをAdobe PhotoshopやKritaから使えるようになるプラグイン「defuser」が公開されています。 defuser | the Stable Diffusion Plugin for Photoshop and Krita https://internatio
高精度な画像生成AI「Stable Diffusion」をブラウザから簡単に使うことができるウェブサービス「Mage」が登場しました。Mageはブラウザから直接アクセスして無料でStable Diffusionを使えるだけでなく、生成される画像に含んで欲しくない要素を指定するネガティブプロンプトの設定もできるほか、成人向け描写を規制するセーフティーフィルターも解除されているとのことで、実際に使い勝手を確かめてみました。 Mage 🧙 | Free, Fast, Unfiltered Stable Diffusion https://www.mage.space/ Mageのトップページにはプロンプトの入力フォームが表示されています。試しにプロンプトを入力し、矢印アイコンをクリックしてみると…… 数十秒ほどの待ち時間の後、Stable Diffusionによって生成された画像が表示されまし
Stable Diffusionの開発会社の代表者がアーティストを軽視する言動をしたということで、画像AIに関する時計の針が加速しそうな予感がしたので未来予測的なことを呟いてみる。なお、自分は法や規制の専門家という訳ではなく、AIの専門家ですらなく、単なる素人インターネットウォッチャーの予想であるということは先に明記しておく。 発端はnalgamiさんのこのツイート。 BBCがEmad Mostaque氏(Stable Diffusionの開発会社代表)への取材記事を公開。https://t.co/XxJruwMZTR 将来を心配する若手アーティストに向けて 「イラストやデザインの仕事はとても退屈。芸術的かどうか以前に君たちは道具(ツール)だよ。」 もう少しクリエイターに敬意を払うべきだと思うけどなぁ😢 https://t.co/vL8yAuANle — なるがみ (@nalgami)
人類の愚かさもいい加減にしろやと思ったので、世の中のツイートに対して思っていたことを書きます。既に突っ込み入ってるものが殆どですが、言いたくなったので言います。なのでまとまった文章ではないです。 ちなみに私の立場は以下です。 技術そのものに善悪はない。 なお、今回話題になっているAIは「技術」ではなく「技術の産物」 今回行われた学習は法的にはセーフだが、倫理的には善くない。 画像生成AIを利用した絵をそうでないものと区別しようとするのは愚か。 「これは何である」みたいな決めつけるような発言は愚か。 絵師にはもっと誇りとかないんか? 努力は報われてはいけない。 人類が愚かなのは昔から。 人の眼がもっと良くなるしかない。 例え話だけで納得するのは良くないと思う。 嘘をつくやつは何をやってもダメ。 いきます。 1. 人間が描いたイラストをAI絵師が勝手に学習データに利用するのを防ぐ方法はある。
From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 「Midjourney」や「Stable Diffusion」の登場により、より身近な存在となった画像生成AI。ついにはデザインツール「Canva」もAIによる画像生成機能を実装するなど、今後は実用化がますます加速していきそうだ。 Stable Diffusionを開発する英国のスタートアップStability AIは1億100万ドル(約150億円
ホーム ニュース 禅リラックス無限ドライブ『Slow Roads』PCブラウザ向けに無料公開。のどかな丘から火星まで無心で走る 個人クリエイターのAnslo氏は、『Slow Roads』を公開した。Webブラウザ上でプレイできる、ドライブゲームだ。 『Slow Roads』はドライブゲームだ。自動生成される道をひたすら車両で走り続ける。数種類の車両のほか、季節や時刻、天候なども複数用意。夜道をヘッドライトで取らしながら駆けることも可能となっている。 「終わりなきドライビング禅(Endless Driving Zen)」と銘打たれているように、本作は終わりも分岐もない道をひたすら車両で走り抜けていく。車両の運転はキーボード操作でおこなうほか、自動運転への切り替えも可能だ。鳴り響くのは電気駆動と思われる車両から響く音と、風を切る音のみ。心を無にする瞑想のようなゲームプレイが本作の特徴といえそう
「フェイク画像」「無断アップロード」撲滅なるか? ニコンが「来歴記録カメラ」を試作:Adobe MAX 2022 Adobeとニコンは10月19日、撮影した写真データに出所や来歴などの情報を付加することで真正性確認をしやすくする「来歴記録機能」をデジタルカメラに実装する取り組みを発表した。Adobeが10月18日(米国太平洋夏時間)から実施しているイベント「Adobe MAX 2022」のリアル会場では、この機能を試験実装した「Nikon Z 9」が展示されている。 アドビ(Adobeの日本法人)が10月19日に開催したイベント「Adobe MAX 2022 Japan」のリアル会場でも、来歴記録機能を試験実装したNikon Z 9が展示されていたので、この記事で紹介する。 来歴記録機能の概要 写真(静止画)や動画がデジタルデータとなり、これらを編集するアプリが高機能化したこともあり、最近
10月6日、NovelAIのGitHubとかのプライベートリポジトリに第三者が侵入して、AIモデルやソースコードを丸っと盗んで流出させた。 [Announcement: Proprietary Software & Source Code Leaks] Greetings, NovelAI Community. On 10/6/2022, we experienced an unauthorized breach in the company's GitHub and secondary repositories. The leak contained proprietary software and source code for the services we provide. — NovelAI (@novelaiofficial) October 7, 2022
高精度な画像を生成できることで話題となっている「Stable Diffusion」が、どのように入力されたテキスト(プロンプト)からイラストを生成しているのかについて、機械学習関連のトピックについての解説動画などを投稿しているジェイ・アラマー氏が解説しています。 The Illustrated Stable Diffusion – Jay Alammar – Visualizing machine learning one concept at a time. https://jalammar.github.io/illustrated-stable-diffusion/ アラマー氏は、テキストから印象的な画像を生成するAIの登場が、人間がアートを作成する方法が変わることを示していると主張。Stable Diffusionのリリースにより、比較的安いリソースで使用で誰もが高性能なモデルを使
概要DreamBoothとは追加学習することで、AI(StableDiffusion)で特定のキャラや物を描くためのモデル(データ)作るツールです。 例えば、ドラゴンクエスト10オンラインというゲームのアンルシアというキャラがいます。 ドラゴンクエスト10のアンルシア 公式サイトより引用 https://hiroba.dqx.jp/sc/election/queen2021/vote/confirm/1/nologinこのキャラの画像を18枚ほどAIに読み込ませ、追加学習し、AIに描かせた絵が以下の絵になります。 これ見ると、単なる髪型や顔が似ているレベルではなく、服の模様レベルまで再現できている事がわかります。 今までStableDiffusionの欠点として、同じキャラを安定して描くのが苦手というのがありましたが、DreamBoothを使うことで克服することが出来ます。 これにより、A
8月には「Midjourney」や「Stable Diffusion」といった画像生成AIが世間を驚かせた。特にStable Diffusionは、Photoshop用プラグイン(非公式)に組み込まれるなど活用も進んでいる。 9月は、引き続き画像生成AIが話題に乗り続けたが、それ以上に音声合成AIがバズった。本記事では9月に登場して話題になったAIや、関連するニュースをまとめる。 「AIひろゆき」登場 無料で適当なことを喋らせられる 音声合成AIを開発するCoeFont(東京都港区)が、匿名掲示板「2ちゃんねる」の開設者として知られる西村博之(ひろゆき)さんの声を再現するAIサービス「おしゃべりひろゆきメーカー」を無料公開した。 <「AIひろゆきに適当なことを喋らせよう!」 無料のジェネレーター公開 本人公認> 140文字以内のせりふを入力して合成ボタンを押すと、ひろゆきさんが喋っているか
無料の作画AIモデル「Stable Diffusion」(ステーブル・ディフュージョン)が8月23日に公開されてから、1週間分の記憶はほぼない。次に気がついたのは、1週間後の8月30日の午前3時だった。 プログラミングに集中するといつもこうなる。その後まで含めて十数日間、ほとんどベッドで寝た記憶がない。 振り返れば8月23日、たまたま夜中に目が覚めてしまったのがまずかった。その直後にStable Diffusionが全世界に向けて公開され、どれほどの実力なのか確かめてやろうと、試しにプログラミング言語Pythonのコンソール(端末)を起動してしまった。 2時間後、朝日が昇る頃には、「日本語で言葉を入力すると、自動的に英語に翻訳して投入する」無名のWebサービスを立ち上げていた。 そこから怒濤(どとう)の日々が始まった。 「Stable Diffusion」にハマって身の上に起こったこと
英字新聞社ジャパンタイムズ、スタートアップメディア・テッククランチでの記者経験を経て、ダイヤモンド社のスタートアップ担当記者に。最近はフードテックやモビリティ領域に注目している。趣味はギターやシンセサイザーだが総じて下手。2020年7月よりダイヤモンド社「DIAMOND SIGNAL」記者。 From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 本記事では、インタビュアーを担当したTHE GUILD・
「Stable Diffusion web UI(AUTOMATIC1111版)」は他のUIには搭載されていない機能なども盛り込んだ、いわば決定版の「Stable Diffusion」のUIといえますが、それだけにやれることが多いので、どこをどう触ればよいか悩むこともあるはず。 この記事ではまず、「Stable Diffusion web UI(AUTOMATIC111版)」のうち、テキストから画像を生成する「txt2img」の基本的な使い方をまとめています。 ◆目次 ・1:最も簡単な使い方 ・2:「txt2img」タブ内の各項目はどういう意味なのか? Stable Diffusion web UI(AUTOMATIC1111版)は画像生成AI「Stable Diffusion」を使うためのUIの1つ。Stable Diffusionの利用にはNVIDIA製GPUが必要で、該当するPCにS
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く