芥川賞・九段理江さん 受賞作はチャットGPT駆使「5%くらい文章そのまま」「うまく利用しながら」
人気連載『生成AIウィークリー』で取り上げている注目論文を見ると、そこに中国IT企業の名前が頻繁に登場します。 EC大手のアリババ(Alibaba)、ゲーム大手のテンセント(Tencent)、TikTokの運営元であるBytedanceなどが常に顔を出しており、画像・音声・アニメーションと、生成AIのあらゆる分野で中国に勢いがあることがわかります。 そんな中、テンセントがなかなか衝撃的な技術を発表しました。「PhotoMaker」という画像生成AIです。これでなければできない、というものではないのですが、「ファインチューニングの事前作成不要」「元画像が少なくても良い」のに、人物のアイデンティティを維持した画像を生成できるというメリットがあります。 これまでは既存の画像AIモデルに多数の写真を読み込ませて本人性を学習させたものから新たなAIモデルやその簡易版であるLoRAモデルを作ってきまし
新年、明けましておめでとうございます。今年もよろしくお願いします。 2023年は、生成AIという新たな技術との出会いによって、いままでにないくらいに創作が面白くなった年でした。 年初にMidjouney /を触り始めたにも関わらず、国内外の美術館で3つの展示がきまったり、雑誌の表紙を飾ったり、世界三大オークションのひとつである、クリスティーズにグッチとのコラボで作品出展をするなど、まるで夢のような凄まじい一年でした。 こんな私に機会をくださった方々には心から感謝しています。 備忘録とそして、アーティストの皆さんに向けて、学びをnoteで記録したいと思います。 2021年は息子の自由研究であるZombie Zooが注目され、 2022年は新星ギャルバースのローンチがありましたが、今年もNFTで、人生が大きく変わりました。 昨年の記事はこちら↓ *この記事は多くの情報が詰まってるので、有料で、
ESETは11月22日(現地時間)、「Your voice is my password – the risks of AI-driven voice cloning」において、生成AIにより合成した音声を悪用したソーシャルエンジニアリング攻撃の実験に成功したと伝えた。この実験では、従業員が自社の最高経営責任者(CEO: Chief Executive Officer)になりすまして、財務責任者から自分宛てに送金させることに成功しており、生成AIの危険性について注意喚起している。 Your voice is my password – the risks of AI-driven voice cloning これは事前にCEOの許可を得て行っ実験であり、ここで解説する手法をまねることは犯罪となる可能性があることに注意。この実験と同様の攻撃が今後増加する可能性があると懸念されており、企業や組
尿失禁は、尿の自発的な排出や膀胱の制御喪失を示す現象であり、これにより社会的、心理的、衛生的な問題が引き起こされ、生活の質が低下する。全世界で2億人以上が、更年期や肥満、膣分娩、過去の子宮摘出手術、アルツハイマー病、認知症、パーキンソン病、脳性まひ、脊髄損傷などのさまざまな原因により、尿失禁を経験している。 この研究では、新しい電子テキスタイルベースのリアルタイム膀胱モニタリング技術「Privee」の開発と試験が行われた。この下着には、8つの刺しゅうされた電極とテキスタイル伝送路を取り入れている。電極とハードウェアの間の信号伝送ラインは、銀でコーティングされた導電性の糸を生地に直接刺しゅうすることで実現している。排尿や排便の際に着脱が不要となるよう、股間部分は開放している。 腹部周辺にあるセンシングネットワークはセンサーとして機能し、膀胱が尿で満たされる際の電流のインピーダンス、すなわち抵
半年ほど前までであればGoogle Colabと言うクラウドGPU環境が使え、無料でサクッと動かせたのだが、それが災いし、多くの人が生成AI画像目的で利用したため、リソースが足らなくなり、後述するAUTOMATIC1111は無料枠で使用禁止になってしまった。 AUTOMATIC1111をインストールして使ってみる画像生成AIは各社が提供しており、扱うためのサービスやアプリもいろいろあるが、デファクトスタンダードはStable Diffusionを利用するためのフロントエンドにあたる AUTOMATIC1111だろう。現在は、次世代Stable Diffusion (SDXL)に対応したv1.6.0が公開されている。 ここではOSがWindows 11で、先に提示したNVIDIAのGPUが装着済の前提で解説する。少し前まではPythonやGitを入れたり、いろいろ面倒だったが、現在はbatフ
月見ねぎとろ@3Dモデラー/動画・シナリオ屋さん @tukimi_negitoro もひゃー!漫画/シナリオ/映像作家/3Dモデラー。 モデリング依頼受付しています。動物キャラとか学習漫画やメカ物がすき。 #月見山ラボ pixiv.net/member.php?id=… 月見ねぎとろ@3Dモデラー/動画・シナリオ屋さん @tukimi_negitoro 最近、絵柄の批判でたまに見かける「マスピ顔」って言葉は何?って思って調べたら、画像生成AIのプロンプトに「masterpiece(=傑作)」と入力すると出力されがちな顔の事らしく、つまり人々が傑作だと賛美した絵の平均的な顔が濫用されて陳腐化、賛美の言葉が逆転する現象が起きてるらしい…おもしろ。 2023-09-24 11:56:47 月見ねぎとろ@3Dモデラー/動画・シナリオ屋さん @tukimi_negitoro 今となっては典型的AI絵
松本の娘がコメント「父親のことを、私は今も昔も父親とは思えません」 1: それでも動く名無し 2024/01/13(土) 09:35:18.86 ID:pG9EHOYzd 父親である麻原について 「父親のことを、私は今も昔も父親とは思えません。私が生まれた時、父は既に教祖であり、『グル』 […] 2024-01-13 【生活保護】東京で中国人高齢者の生活保護受給者、5年で2倍に急増 1: ちょる ★ 2024/01/25(木) 09:51:37.46 ID:??? TID:choru 東京都内の中国人高齢者における生活保護受給者数が過去5年間で2倍に増加したことが、の調査で判明しました。令和四年度の […] 2024-01-25 【痴漢行為】山手線の電車内で寝ている女性の胸を揉む男 1: ■忍【LV33,マドハンド,MT】第13艦隊◆IpxlQ2BXrcdb 24/01/08(月) 13:
Checkpointとはあとひと月ほどすると、前回ご紹介した次世代Stable Diffusion、SDXLの波が来そう(来るかも?)と言うこともあり、今回は一番の基本となるCheckpointと、筆者の興味の対象となっているリアル系モデルの遷移にふれておきたい。 まずStable Diffusionのバージョンは1.4、1.5、2.0、2.1などがあり、現在最もポピュラーなのは1.5 (SDXLは0.9、1.0)。基本、対応したバージョンでないとモデルは作動しない。 一言でモデルと言っても、Stable Diffusionが必要、もしくはオプションとして扱えるモデルは、Checkpoint、LoRA、LyCORIS、Embedding、 Hypernetwork…など、さまざまな種類がある。絵を作る上において最も重要(=絵の元になる)のがCheckpointで、他は無くても最低限これだけ
現役グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、画像生成AIを使ったリアルなAIグラビア作成技術を解説する連載の第三回。 今回はポーズ / 構図をテーマに、プロカメラマンとしての撮影スタイルとAI生成の共通点、現時点のAIでは難しい手指の表現を改善する技術についても説明します。(編集部) 実際の撮影と「呪文」の関係は似ている?グラビアでもポートレートでも、撮影する時は「立って」「座って」「前向き」「後ろ向き」……といったようにカメラマン側から指示を出す。 この大雑把な指示はどのカメラマンでもすることだが、顔の向きだったり腕の形だったり足の位置といった細かいことは、「指示する」カメラマンと「指示しない」カメラマンとで分かれる。これは撮影スタイルの話なので、どちらが良い悪いではない。 筆者の場合は割と大雑把で、細かい指示はせず、後の事はそのモデルに任せる=個性だと思って
画像生成AI「Midjourney」を使ったAIイラスト制作TIPSをお届けしています本連載、今回は、Midjourneyを使って、同一キャラのコスプレ、要するに衣装替えを実現する方法をご紹介したいと思います。 Midjourneyは現在V5.2が公開されていますが、このバージョンから新たに追加された機能に「ズームアウト」と「パン」があります。 ズームアウトは、ひとつの画面からその外側にある風景を追加描写する、画像生成AI界隈では、いわゆる「アウトペイント」と呼ばれる機能。もう一方のパンは、アウトペイントを上下左右の指定方向にだけ行い、カメラを振った(パンした)かのように描写する機能です。 Midjourneyのアウトペイントは少し特徴的です。他の画像生成AIのアウトペイントが描画領域を追加してそこを描画していくのに対し、Midjourneyのそれは、元の絵を極力改変せずに縮小させて周囲に
[速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023 マイクロソフトは、日本時間7月19日未明から開催中のパートナー向け年次イベント「Microsoft Inspire 2023」において、AIチャットサービス「Bing Chat」に、画像を基に質問ができる「ビジュアルサーチ」機能(Visual Search in Bing Chat)を追加したことを明らかにしました。 ビジュアルサーチの機能はOpenAIのGPT-4モデルを活用したものだと説明されています。 下記はBing Chatのビジュアルサーチのデモ動画として、手書きのWebフォームの画像からHTML/CSSを生成させる様子を紹介したものです。 手書きのWebフォーム画像からHTML/CSSを生成 Bing Ch
使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
人型ロボットがネコを描く動画がYouTubeで公開されています。 Ameca Drawing A Cat(YouTube) https://youtu.be/L32BRcvnWRU 動画を公開したのは人型ロボット「アメカ(Ameca)」を開発したイギリスのEngineered Artsという企業です。 Stable Diffusion(ステイブル・ディフュージョン)を活用して絵を描いていくと説明するアメカ。 「ネコを描いてもらえるかな」というリクエストを受け、絵を描き始めるアメカ。 ネコの絵が完成しました。 「大雑把だね」という感想を聞くと、眉間にしわを寄せて「私のアートが気に入らないということは、おそらくアートというものを理解していないということです」と返すアメカ。 動画の視聴者からは様々な声が寄せられています。 ・私もアートを理解していないようです ・絵を描く動きがすごくスムーズ ・人
骨しゃぶり @honeshabri 読書系ブロガー | 本と何かを結びつけた記事を書くのが得意 | 週プレで「文化史ぜんぶ読む」連載中 | 実況アカ @honeshaberi | マシュマロ marshmallow-qa.com/honeshabri | 記事執筆を依頼は→ bit.ly/2JcnxuQ | Amazonアソシエイト参加者 honeshabri.hatenablog.com 骨しゃぶり @honeshabri これでAIグラビアアイドルも4体作ったことになるのでまとめ。次はどうするかな。データが豊富そうで、四肢を持つ、毛が生えていない生物が望ましいのだが。 #StableDiffusion pic.twitter.com/gOdnj2zYH6 2023-06-18 20:45:42
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く