nekopunch222のブックマーク - はてなブックマーク

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる (1/6)

こんにちは、漫画界の生き恥こと野火城と申します。「画像AI使ってみた／AI 漫画実験企画」第2回です！ ■第1回はこちら　実録：AIで描く漫画の実際～体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日本の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。「画像AIの技術がすごいという賞賛記事はよく見るが、それは本当に創作活動で実戦的に使えるものなのか？　『AIに仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは？　実際はどっちなんだ？」「画像AIを試し

nekopunch222 2024/05/30

あとで読む

リンク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

nekopunch222 2024/05/27

あとで読む

リンク

ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）

5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。実はこんなとこにある無課金ユーザー向けのモデル選択まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

nekopunch222 2024/05/17

あとで読む

リンク

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

nekopunch222 2024/05/10

あとで読む

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

nekopunch222 2024/02/26

あとで読む

リンク

日本発の画像生成AIサービスがすごい　無料アップスケーラー「カクダイV1」 (1/4)

「カクダイV1」でアップスケールした画像（左）、「Midjouney v6」で作成したオリジナル画像（右）画像の描き込みを増やして高画質にする、日本発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかったカクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI 技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

nekopunch222 2024/02/19

あとで読む

リンク

控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

nekopunch222 2024/02/17

相変わらず異世界文字になってる…

あとで読む

リンク

「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。ノイズ除去をバッチ処理で高速化「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス（CFG）に代わり、残差分類器フリーガイダンス（RCFG

nekopunch222 2023/12/23

あとで読む

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

nekopunch222 2023/12/11

あとで読む

リンク

爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに (1/5)

このところ画像生成AI界隈で話題になっているのが、「Latent Consistency Models（レイテント・コンシステンシー・モデル」（以下「LCM」）。10月6日に中国精華大学のシミアン・ルオさんが中心となって発表された論文で、日本語にすると「拡散的一貫性モデル」。新しいタイプの効率性の高い生成モデルを使い、Stable Diffusion＝安定拡散モデルより高速に画像を生成。結果としてビデオメモリーの少ないローレベルのPCでも画像生成AIを動かせるようにしようというものです。 0.5秒で4枚出力。Stable Diffusionの5倍 Stable Diffusionの拡散モデルは、ランダムなノイズ情報から、学習済みの特徴点データを利用することで、段々と画像を生み出していくサンプリングプロセスを繰り返します。それによって画像を生成する仕組みです。通常、1枚の画像を生み出すのに必

nekopunch222 2023/11/13

あとで読む

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

nekopunch222 2023/10/16

あとで読む

リンク

NTTドコモ、各料金プランで楽天カード利用不可に　受付再開時期は「楽天カード側と調整」

NTTドコモがオンライン上での一部手続きに関して、「楽天カード」の受付を停止していることが9月6日わかった。編集部の取材に対し同社は「楽天カード側とも協議の上でオンラインの受付を停止している」と回答。受付停止の理由や再開の時期については回答を差し控えた。「ahamo」を含む各プランが対象同日17時現在、楽天カードの受付が停止されているオンライン手続きは、以下の通り。影響範囲は「ahamo」を含むNTTドコモの各料金プランだ。 ●楽天カードを利用できないオンライン手続き月々の料金支払い方法の登録または変更手続き（新規契約、他社からの乗り換え、既存ユーザーの決済方法変更など）店舗や電話窓口、郵送での手続きであれば楽天カードの登録も可能だが、オンライン専用プランのahamoは対象外。同プランについては受付再開まで待つ必要がある。過去には11ヵ月に渡る「臨時システムメンテナンス」も本件

nekopunch222 2023/09/07

あとで読む

リンク

ドコモ回線、品質低下の一因は“通信技術”か (1/3)

先週末に東京ビッグサイトで開催された「コミケ」。個人的には「各キャリアのネットワーク品質は大丈夫かな」という心配をしながら、SNSをチェックしていた。案の定、NTTドコモのネットワーク品質がすこぶる不評なのがわかった。ダウンロード速度をチェックするアプリのキャプチャ画面が何枚も上がっており、NTTドコモのネットワークは「10年前の速度かと思った」と揶揄されているほどであった。ただ、昔と違ってネットで簡単にサブ回線を調達できるということもあり、楽天モバイルやpovoの回線で、しのいだ人も多いようだ。 NTTドコモのネットワーク品質に関しては、今年に入って「ターミナル駅周辺で遅い」と指摘されていた。同社では4月に「この夏までに対策する」と発表。先日、基地局にあるアンテナの角度や出力、指向性などの調整などをして、都内の新宿、渋谷、池袋、新橋において、概ね、ネットワーク品質が改善しているとの発

nekopunch222 2023/08/16

あとで読む

リンク

なぜRISC-Vは急速に盛り上がったのか？　RISC-Vプロセッサー遍歴 (1/2)

最近x86とArmに続く第3の勢力として、RISC-V(リスクファイブ)の名前を聞くことが多くなった。RISC-Vの場合、x86とArmと異なるのはさまざまなベンダーがさまざまなコアを用意していることで、まだ現状はIPを販売しているレベルの企業の方が多いが、チップの提供を開始しているメーカーも出始めている。イメージとしては、1980年代末～90年代のx86市場を考えれば良い。インテルとAMD以外にCyrix/IDT/TI/IBM/NexGenなど多数のメーカーが、独自の実装に基づくx86プロセッサーを市場投入していた時代に近い。もちろんいろいろ異なる点もあるのだが、2010年代前半はプロセッサーといえばx86とArm、それにPowerPC/POWERといった程度がせいぜいだったのに、なぜ2010年代後半から急速にRISC-Vが盛り上がったのか、という一連の流れを数回に分けて説明しよう。

nekopunch222 2023/08/15

あとで読む

リンク

日本発売に期待！シャオミのタブレット「Xiaomi Pad 6」がヨーロッパで発売

日本でも人気だったシャオミのタブレットニューモデルは日本に導入されるのか!? シャオミが4月に中国で発売したタブレット「Xiaomi Pad 6」が、7月からヨーロッパでも発売になりました。前モデル「Xiaomi Pad 5」は2021年の登場ですから、約2年ぶりのタブレット新製品の投入となります。Xiaomi Pad 5は日本でも発売されたことからXiaomi Pad 6の日本投入もいよいよ現実的なものとなりそうです。 Xiaomi Pad 6はチップセットがSnapdragon 870、ディスプレーは11型（2880×1800ドット）でリフレッシュレートは144Hz。Xiaomi Pad 5と比べるとディスプレーサイズ以外はすべてスペックアップしています。特に144Hz駆動によりゲームもより快適にプレイできるのではないでしょうか。本体カラーはブラック、ブルー、ゴールドの3色。本体サイ

nekopunch222 2023/07/22

あとで読む

リンク

「撮影罪」はじまる、同意のない撮影は禁止　飛行機内の撮影にも注意を (1/2)

本日7月13日から「撮影罪」が施行される。これにより性的姿勢等のひそかな撮影（盗撮）、それらを第三者に提供する行為、インターネットや動画配信などで公開する行為、保管する行為がすべて処罰対象となり、盗撮に対して最大3年の拘禁または最高300万円の罰金が、不特定多数への提供行為に対してはさらに重い最大5年の拘禁、または最高500万円の罰金が科されることとなる。法律改正のきっかけとなった事例のひとつに、飛行機内での客室乗務員の盗撮行為がある。高速で飛行する航空機の特性が都道府県ごとの法制度の抜け穴を生み、特定できない場所での盗撮行為を処罰できず、客室添乗員の盗撮が法の抜け穴となってしまうといった実態があった。 ANAは「撮影罪」についてのポスターを羽田空港に掲示し、空港の利用客に向けて撮影罪の法制化、無断撮影禁止についての周知を始めている。「撮影罪」とは何か？「撮影罪」は正式名称を「性的な

nekopunch222 2023/07/13

あとで読む

リンク

PHS終了、代わりとして期待の「sXGP」とは (1/4)

sponsored イラスト感覚で光が“描ける”　パナソニックのマイクロLEDを活用した次世代照明がすごい sponsored Core i7-14700KF搭載「LEVEL-R779-LC147KF-TTX」をチェック性能・コスパで考える、超快適ゲーミングに最適なRTX 4070 SUPERのBTOゲーミングPCがコチラ！ sponsored 大きくて組みやすい、自作erのかゆいところに手が届く細かな配慮にも注目 PC自作慣れしてなくても組みやすいピラーレスケース「CORSAIR 6500X」、iCUE LINKでより簡単に！ sponsored JN-PCY238FHDR180-Hシリーズをレビュー色鮮やかな180Hz駆動ディスプレーが約2万円台！ゲーム環境にパステルカラーはいかが？ sponsored アプリの乱立、情報システム部の負荷増、セキュリティインシデントを防ぐ kint

nekopunch222 2023/07/13

あとで読む

リンク

画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

nekopunch222 2023/05/23

あとで読む

リンク

Blenderに挫折する前に見てほしい、日本語の解説動画を紹介

みなさんBlenderやってますか?? 私は大好きです。どうも花田です。前にもBlenderについて書きましたが、今回は挫折した、若しくはBlender分からんッッ！って人に話します。 Blender日本語で解説してくれている人いるよ～います。中でも、本当に本当に初期にお世話になった人たちを2人紹介します。 M design - YouTube 話してくれる声は少なめで、動画を止めてゆっくり進めていく方式です。情報量が少なく、作っている動画なので見よう見まねでできました。 3D Bibi - YouTube 簡単なモデルを細かく教えてくれるため、モデルが挫折しない。 YouTubeでBlenderで検索すると他の動画も沢山出てきます。作りたいものを作りたいんだ！作りたいものを検索しても、日本語版が出てこない… 英語版を見て、挫折してしまった人も多いのではないでしょうか。 Bl

nekopunch222 2023/05/08

あとで読む

リンク

グーグル「Bard」ついに日本公開　「ChatGPT」対抗のAIチャット

グーグルが開発するAIチャット「Bard」。2月6日に発表され、3月21日より米国と英国のみで公開されていたが、4月18日午後（日本時間）あたりから、日本でもベータテストに参加できるようになった。さっそく使ってみる「Bard」は大規模言語モデル（LLM）「GPT-4」を使用したOpenAIの「ChatGPT」同様、Googleが開発するLLM「LaMDA（Language Model for Dialogue Applications）」の「軽量で最適化されたバージョン」を利用している。ベータテストに参加するには、サイトの右下に表示されている「Join Waitlist」ボタンをクリックし、ニュースメールの購読にチェックを入れるだけでよい。