martonのブックマーク - はてなブックマーク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

marton 2024/05/27

あとで読む

リンク

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

marton 2024/05/10

あとで読む

リンク

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

カナダのAIスタートアップCohereは4月4日（現地時間）、ビジネス向けに最適化された最新の大規模言語モデル（LLM）「Command R+」を発表した。高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransf ormerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K（12万

marton 2024/04/09

あとで読む

リンク

画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。画像1枚で“似た顔”　Midjourneyの新機能「Creative Reference」使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ（cref）をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

marton 2024/03/26

あとで読む

リンク

昔はまったく売れなかった「電気の要らない自動ドア」が人気を集めているらしい

Newtonプラスが、3月2日、日本トーターグリーンドーム前橋で開催中の「UPDATE EARTH 2024 ミライMATSURI@前橋」で「電気を使わない自動ドア」を展示した。電気で開閉するから自動ドアなのに、電気を使わないとはどういうことか？　聞けば、床板に荷重がかかるとドアが開く構造を持った、機械式の自動ドアだという。電気によるランニングコストが発生しないことに加え、災害時や停電時でも開かなくなることがない安全性、人が乗っている限りは閉まることがないので、挟まれる心配もないなど、メリットは複数ある。建物の構造的に建築基準法をクリアできない場合を除き、既存の自動ドアを置き換える形で設置することも可能。主に自治体や、ビル内の授乳室、災害時の避難所の役割を果たしている地域の店舗やビルといった、公共性の高い場所への導入が進んでいるという。この製品、実は14年前に発売されているが、ほと

marton 2024/03/04

あとで読む

リンク

ChatGPTで画像生成するならコレ!　おすすめGPTs紹介 (1/6)

OpenAIは1月10日、カスタムバージョンのGPTを作成できる「GPTs」機能で作成した多様なGPTを探索できる「GPT Store」の公開を予告通り開始した。今回はストアーのラインアップから画像生成系の「DALL·E」カテゴリーを取り上げてみよう。「DALL·E」カテゴリー「DALL·E」カテゴリーには言うまでもなくOpenAIの画像生成AI「DALL·E 3」を便利に使うために作られたカスタムGPTが掲載されている。今回は上位6個のGPTを使ってみることにする。まずは「DALL·E」カテゴリーのトップ「image generator」というGPTを試してみよう。説明欄には「プロフェッショナルかつフレンドリーなトーンで画像を生成し、洗練させることに特化したGPT（A GPT specialized in generating and refining images with a

marton 2024/03/02

あとで読む

リンク

女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか？

ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られたいままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。彼女は X（Twitter）の自分のアカウントで1日1本のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな！」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

marton 2024/02/27

あとで読む

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

marton 2024/02/26

あとで読む

リンク

控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

marton 2024/02/17

あとで読む

リンク

「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。ノイズ除去をバッチ処理で高速化「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス（CFG）に代わり、残差分類器フリーガイダンス（RCFG

marton 2023/12/22

あとで読む

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

marton 2023/12/19

あとで読む

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

marton 2023/12/11

あとで読む

リンク

これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画（Scribble）としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models（LCM）」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」（LoRAはStable Diffusion用の追加学習モデル）が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

marton 2023/12/05

あとで読む

リンク

速報！ChatGPTに「引用して質問」機能が実装されていた！

sponsored B760M AORUS ELITE X AXをレビュー白基板マザーボードと技アリPCケースでコンパクトな液晶一体型ホワイトPCを自作！ sponsored 高級感あるデザインと、カスタムして柔軟に使えるマルチメディアキーにも注目！『VALORANT』はラピッドトリガーで勝つ！フルサイズで仕事にも役立つゲーミングキーボード「K70 MAX」 sponsored 動画編集からRAW現像、クリエイターの業務に合うタワー型PCがセールで購入のチャンス！ sponsored 自室で場所を取らずに最新FPSを本格プレイしたいなら、このゲーミングノート！セールで17万円台！ sponsored ファーウェイから登場の究極のスマートウォッチ究極の素材（ゴールド）と高度な技術の会遇　輝くスマートウォッチ「HUAWEI WATCH | ULTIMATE DESIGN」を徹底レポ

marton 2023/12/03

あとで読む

リンク

画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。画像から画像が作れる「Image Prompt」が便利です (1/2)

新機能が追加されると、Discussionsページに作者からのアナウンスが掲載されることがあるので、参考にするといいだろう。また、作者に質問したりフィードバックを残したい場合などにもこのページを利用できる。 Image Promptを活用する Image Promptとは、テキストの代わりに画像をプロンプトとして用いる手法だ。 Midjourneyでは以前から利用可能だが、Stable DiffusionではControlNetのIP-Adapterを使用するなど工夫が必要なうえに、プロンプトを無視したり複数の画像を使った生成がうまくいかなかったりといった問題があった。 FooocusのImage Promptでは、これらIP-Adapterの弱点がすべて解消しているとのことだ。

marton 2023/11/23

あとで読む

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

marton 2023/10/16

あとで読む

リンク

Stability AI、ノートPCでも動作する大規模言語モデル（LLM）を発表

Stabilty.AIは10月3日、ノートPCなど計算能力のあまり高くないPCでも動作するように設計されたコンパクトな大規模言語モデル（LLM）「Stable LM 3B」のリリースを発表した。ライセンスは商用利用も可能なオープンソースの「CC-By-SA 4.0」となっている。軽量・高速にもかかわらず高度な自然言語処理が可能 2023年4月20日に最初のバージョン（3Bおよび7Bパラメーター）が発表された同社のLLM「Stable LM」シリーズだが、今回のリリースは高速な実行速度を維持しながら、テキストを生成する能力が大幅に向上しているという。高品質なデータで複数回学習させた結果、30億パラメータ（業界で通常使用されるのは70億～700億パラメータ）にもかかわらず、一般的な自然言語処理ベンチマーク性能も向上しており、従来の30億パラメーター言語モデルはもちろん、70億パラメーター規

marton 2023/10/04

あとで読む

リンク

ChatGPTをめちゃくちゃ便利にする“プラグイン”の使い方「これを作って！」編 (1/4)

プラグインの基本を知ろう ChatGPTの有料プラン「ChatGPT Plus」には、「プラグイン（Plugin）」という、ChatGPTの機能を拡張するためのツールが多数用意されている。プラグインを導入することで無料版ではできなかった最新の情報へのアクセスや、サードパーティーのサービスを利用することができるようになるというのが売りだ。プラグインの導入方法については第10回の記事を参照してほしい。注：本記事はすべて筆者がChatGPT Plusでプロンプトを実行・検証している。「結果はこちら（クリックで拡大表示）」のリンクをクリックすることで、すべてのプロンプトと生成されたChatGPTの回答を見ることができる。なお、記事内で触れられていない質問や頓珍漢な回答も含まれているが、これはChatGPTとのリアルな対話記録であるため、そのあたりをお楽しみいただければと思う。 ChatGP

marton 2023/09/25

あとで読む

リンク

定番のHDD破壊方法　これであなたもドリル◯◯

世間ではあらためてHDDのドリルでの破壊が話題になっているようですが、では実際、どのようにしたらドリルで確実にHDDを破壊できるのでしょうか？　そこは筆者、ドリル北村にお任せください。確実に破壊する方法をレクチャーしましょう。 HDDの破壊には、ドリルで穴を開ける穿孔破壊のほか、打撃衝撃による粉砕破壊、磁気を照射する磁気消去という3つの方法があります。なかでも一番簡単なのが穿孔破壊です。電動ドリルは、金属を貫通する必要があるので5N・m以上のトルクがあるものが望ましく、ドリルビット（替芯）は鉄工用が必要です。筆者はカインズのACドリルドライバー「KT-01」（3280円）と、直径6mmの鉄工用ドリルビット（2本で578円）を使用しました。単純にドリルでHDDに穴を開ければ破壊はできますが、穴を開ける場所を間違えるとデータの復元ができてしまう可能性があります。データの復元を阻止するために

marton 2023/09/20

あとで読む

リンク

アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒

marton 2023/09/12

あとで読む

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (60)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス