ProductResearchCareersCompanyNewsTerms of ServicePrivacy PolicyYour Privacy ChoicesResponsible Disclosure PolicyComplianceThis site is protected by reCAPTCHA Enterprise. The Google Privacy Policy and Terms of Service apply.
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
このnoteのターゲットChatGPTを使ってるけど、イマイチ使いこなせていない人 ChatGPTにどんな指示をしていいか迷っている人 このnoteで得られることゴールシークプロンプトの概要を理解できる ゴールシークプロントの使い方が分かる ゴールシークプロンプトとは聞き慣れない単語だと思うので、まずはそれぞれの言葉を説明しますね。 ■ ゴール:AIを使ってユーザーが達成したい目標 ■ シーク:探す, 探し求める ■ プロンプト:AIに指示するために入力する文章 つまり、ゴールシークプロンプトとは「ゴールを自ら探しに行ってくれるプロンプト」のことです。 ゴールシークプロンプトがすごい理由ゴールシークプロンプトがすごい理由は、以下の3点。 1. 曖昧なゴール設定でも、AIが明確なゴールを探してくれる 2. AIと対話しながらゴールを探せる 3. 汎用性のある形に変更もできる ChatGPTに
面白いなと思った使い方、大事だなと思ったコツの個人的な備忘録です。 はじめに 前提 ChatGPTのTipsまとめ 基本編 鵜呑みにしない 途中で文章が途切れた時は "続けて" 汎用Tips 文脈を伝える 条件/制約や質問を明示する 相手の立場を指定する 回答の特性を指定する 英語で入力する 無茶振りする レビュアーや反論者を用意する おわりに はじめに ChatGPT、面白いですね。 難しく考えず素朴にChatGPTと会話するのも十分面白いですが、コミュニケーションを工夫することでより良い体験が得られたりします。 (対人コミュニケーションと同じですね) 今回は、個人的にChatGPTを使ってる中での好みのコツをまとめます。 ChatGPTのコツを書いているはずが、いつの間にか対人コミュニケーションの話みたいになってしまった ChatGPTの使い方のコツをまとめる - BioErrorLo
はじめにAITuberと書いて、アイチューバーと読みます。VTuberとは違って中の人が存在しないことが特徴です。 AITuber開発は高尚な深層学習のモデル開発ではまったくなく、むしろ、ただの推しの育成ゲームです。 なので、GPUもPythonもいりません。PCさえあれば今すぐはじめられます! この記事でできること以下のようなAITuberが作れます。可愛いですね(親バカ) 妹系AITuber🌸桜井りりか Twitter: https://twitter.com/Ririka_AIsister YouTube: https://www.youtube.com/@ririkasakurai 早い人で週末に2日で作れると思います! 土日に作ったAITuberをみんなに公開しちゃいましょう!!! AITuber作成手順立ち絵の生成 モデル・VAEの選定 Google ColabでStable
クリエイターに出会ったり、もっとファンになったり、noteで創作をつづけたくなるようなイベントを開催する「noteイベント」。今回は「チャットAI使いこなし最前線」をテーマに、黎明期からチャットAIを活用しているnote CXOの深津貴之氏が登壇しました。こちらの記事では、「検索」や「記事生成」ツールとしてのChatGPTの現状や、ChatGPTを効果的に使う質問などが語られました。 「たぶん日本で一番ChatGPTをフル活用している」深津貴之氏 徳力基彦氏(以下、徳力):こんにちは、noteの徳力です。本日はnoteのイベントにご参加いただきまして、ありがとうございます。今日のテーマは「あなたの仕事が劇的に変わる!?」というサブタイトルが入っていますが、「チャットAI使いこなし最前線」と題し、今非常に話題のChatGPTについて深掘りするイベントを開催したいと思います。 今日は案内人とし
賢木イオ🍀AIイラスト @studiomasakaki 水星の魔女が大好きなAIイラストレーター / 国内最大級の検証記事群「AIイラストが理解る!」「プロンプト超辞典」編集/過去のコンテンツは「ハイライト」、r-18はpixivにあります/自己紹介を兼ねた怪文書▶️ひたすらAI絵やってたら絵が描けるようになってた話ur0.jp/M2BtD studiomasakaki.fanbox.cc 賢木イオ@スタジオ真榊 @studiomasakaki AIイラストはControlnetの登場で完全にゲームチェンジしましたわ。線画から色塗りができるのは本当に素晴らしい機能!「あくまで自分の線のまま」にすることも、「AIに補正してもらう」こともできるのがポイントです。 これは色指定をしていませんが、「赤い髪・黒い服・黄色の目」と指定すると、 pic.twitter.com/V0flFRYmqp 2
Transformerに自分の好みのDLsite音声作品を学習させて、癖に刺さる新作を毎日通知するシステムを作った話 作ったもの DLsiteの新作音声作品をクローリング -> 好みかどうか推論 -> 好みならSlack通知をするシステムを完全サーバーレス(AWS SAM)で構築しました。さらなる精度向上のため、Slackメッセージのボタンをもとに教師データを蓄積する処理も作りました。 デモ(ぼかしMAX) とてもわかりにくいですが、好みであろう作品がPOSTされているSlackの画面です。各メッセージについている「興味あり!」「別に…」ボタンを押すとLambdaが起動し、DynamoDBに新たな教師データとして保存されます。 なぜ作ったのか DLsiteが好き、以上。 ・・・ もう少し真面目に書くと、 会社でテキストデータに触れることが多いので、うまく扱えるようになりたい 音声作品はシチ
AIでのイラスト生成時、キャラクターに自由なポーズを取らせることができる──そんな新技術が話題だ。その名は「ControlNet」。2月10日に論文が投稿されると、数日後にはStable Diffusion用WebUI向けの拡張機能がGitHubに登場。15日には、AIイラストに注目するTwitterユーザーの間で「革新的な変化」と話題になっている。 論文によれば、ControlNetはStable Diffusionなどの拡散モデルでテキストから画像を生成するときに、追加の入力条件を加えて生成結果を制御するニューラルネットワークという。Stable DiffusionとControlNetを併用することで、より容易に生成結果を制御できるとしている。
現状、ネットで調べ物をしたいときは、Googleなど検索サイトを利用することが多いだろう。その場合、検索結果にリストアップされる無数のサイトは、質の高い有用なサイトばかりとは限らない。 広告だらけで内容が薄いページや、反対に難解なページばかりを引き当て、目的の情報にスムーズにたどり着けなかったという経験は誰しもあるだろう。 一方、ChatGPTは、質問文を投げかけるだけで、必要な情報を教えてくれる。情報を求めて、複数のサイトをさまよう必要はない。 Google幹部は非常事態を宣言した ユーザーにとって非常に便利なツールだが、Google社には脅威になっている。 ニューヨーク・タイムズ紙は昨年12月、検索の未来を書き換える可能性があるとしてGoogle幹部が危機感を抱き、社内に「Code red(非常事態)」を宣言したと報じている。ChatGPTに太刀打ちすべく、社内の開発体制を根底から変更
萌(も)え声を出したくても出せない人でも簡単に簡単に萌え声を生成できる「Moe TTS」が公開されていたので利用してみました。Moe TTSは機械学習を用いて実際のゲームソフトの音声等を合成しており、機械学習でアプリケーションを開発するコミュニティ「Hugging Face」内で公開されています。 Moe TTS - a Hugging Face Space by skytnt https://huggingface.co/spaces/skytnt/moe-tts Moe TTSにアクセスするとこんな感じの画面が表示されます。 そのまま上にスクロールすると文字の入力ボックスが現れます。デフォルトで「こんにちは。」と入力されていたので、今回はこれに続けて「今日も寒いですね。」と入力。そして、「Generate」をクリックします。 すると、ページ下部に再生ボタンが現れます。そのまま再生ボタン
最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod
「とんでもなくハイクオリティー」 話題の画像AI「Novel AI」でひたすら二次元美少女と美少年を生成してみた(1/3 ページ) 10月3日にサービス提供が始まった画像生成AI「NovelAI Diffusion」が注目を集めている。有料会員しか利用できないにもかかわらず、Twitterではすでに「二次元美少女に強い」「とにかくハズレなくとんでもないハイクオリティーの画像がバンバン出てくる」などと話題に。午後5時時点で「Novel AI」が日本のトレンドに入っている。 記者も実際に加入して試してみたところ、少なくとも二次元の美少女・美少年を出力する場合は、自分が体験したどの先発の画像生成AIより手軽でハイクオリティーなイラストを手に入れられると感じた。この記事では、記者が出力した画像を紹介。このサービスが描けるイラストのクオリティーや得意苦手を検証してみる。 ただし後述するように、このA
概要DreamBoothとは追加学習することで、AI(StableDiffusion)で特定のキャラや物を描くためのモデル(データ)作るツールです。 例えば、ドラゴンクエスト10オンラインというゲームのアンルシアというキャラがいます。 ドラゴンクエスト10のアンルシア 公式サイトより引用 https://hiroba.dqx.jp/sc/election/queen2021/vote/confirm/1/nologinこのキャラの画像を18枚ほどAIに読み込ませ、追加学習し、AIに描かせた絵が以下の絵になります。 これ見ると、単なる髪型や顔が似ているレベルではなく、服の模様レベルまで再現できている事がわかります。 今までStableDiffusionの欠点として、同じキャラを安定して描くのが苦手というのがありましたが、DreamBoothを使うことで克服することが出来ます。 これにより、A
by Lexica 近年は「Stable Diffusion」をはじめとする高精度な画像生成AIが次々に登場しており、「AIが人間のアーティストに取って代わるのではないか」と考えている人もいます。そんな中、さまざまなイラスト投稿サイトでは「AIが生成したイラストの投稿禁止」をガイドラインで定める動きが進んでいると、テクノロジー系ブログのWaxy.orgを運営するAndy Baio氏は指摘しています。 Online Art Communities Begin Banning AI-Generated Images - Waxy.org https://waxy.org/2022/09/online-art-communities-begin-banning-ai-generated-images/ AIが非常に精度の高いイラストを生成できるほど進化を遂げる中で、AIを活用する人々とAIに否定
入力した文字列から高精度な画像を生成できるAI・Stable Diffusionは2022年8月に無料で一般公開され、「基本的に出力した画像は商用・非商用を問わず、自由に利用できる」というライセンスで大きな話題となりました。しかし、Stable DiffusionをローカルなWindows環境に導入して使うには、PythonやAnacondaなどを扱える技術や知識が求められるため、初心者にとっては敷居がやや高いといえます。そんなStable Diffusionを一発でWindows環境にインストール可能で、さらにシェルでのコマンド入力ではなくグラフィックユーザーインターフェース(GUI)で画像生成の指示も簡単にできる「NMKD Stable Diffusion GUI」が公開されました。 My easy-to-install Windows GUI for Stable Diffusion
画像生成AI「Stable Diffusion」は、「森で遊ぶクマ」「アイスクリームを食べる人間」といった文章を入力するだけで文章に沿った画像を出力してくれるAIです。そんなStable Diffusionには文章と共に「元となる画像」を入力することで出力画像の精度を向上させられるモード「img2img」が存在。このimg2imgを駆使して簡単なラフ画像から高品質なイラストを生成する手順について、ソフトウェアエンジニア兼フォトグラファーのアンディ・サレルノ氏が解説しています。 4.2 Gigabytes, or: How to Draw Anything https://andys.page/posts/how-to-draw/ Stable Diffusionに「森で遊ぶクマ」といった指示を与えた場合、「構図がイメージ通りではない」「夏の森ではなく、冬の森がいい」といったように、イメージ
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く