タグ

画像に関するshunkeenのブックマーク (261)

  • [速報]マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite 2023

    マイクロソフトは開催中の年次イベント「Microsoft Ignite 2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。 例えば、何もカスタマイズされていないCopilotは、ある企業の出張経費の上限などについて正しく答えることはできません。 そこで、Copilot Studioを利用して出張経費の……

    [速報]マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite 2023
    shunkeen
    shunkeen 2023/11/16
    “Copilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」”/Microsoft版GPTs。強そう。
  • 簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics

    こんにちは、安部です。 11月なのに暑かったり寒かったしますが、皆様いかがお過ごしでしょうか。 さて、先日のOpenAI DevDay、大変な盛り上がりでしたね。 様々な新機能が公開され、GPT関連がさらなるパワーアップを遂げました。 DevDayは基的に開発者向けのイベントですが、一般ユーザ向けの新機能も公開されました。 それがGPTsです。 今回は、GPTsが使えるようになったので試してみたいと思います。 GPTsとは GPTsとは、GPT Builderを使ってノーコードで簡単にChatGPTをカスタマイズできるサービスで、今のところ有料ユーザのみが使用できます。 ChatGPTは特定タスク向けのサービスではありませんが、精度の良い回答をもらおうと思ったらプロンプトを工夫したり事前情報をたくさん与えないといけなかったりしますよね? GPTsは、あらかじめ特定の目的を持たせたChat

    簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics
    shunkeen
    shunkeen 2023/11/13
    “日本語で回答できますが、質問はすべて英語でされます”/初手、日本語で質問してくださいってお願いしたら、日本語で聞かれたけど、たまたまだったのかな。しっかし、ドット絵の完成度すごすぎ。
  • 爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに(アスキー) - Yahoo!ニュース

    画像生成AI界隈で「Latent Consistency Models(LCM)」が話題だ。処理が軽快かつ爆速になり、リアルタイム生成まで可能になる。 【もっと写真を見る】 このところ画像生成AI界隈で話題になっているのが、「Latent Consistency Models(レイテント・コンシステンシー・モデル」(以下「LCM」)。10月6日に中国精華大学のシミアン・ルオさんが中心となって発表された論文で、日語にすると「拡散的一貫性モデル」。新しいタイプの効率性の高い生成モデルを使い、Stable Diffusion=安定拡散モデルより高速に画像を生成。結果としてビデオメモリーの少ないローレベルのPCでも画像生成AIを動かせるようにしようというものです。 0.5秒で4枚出力。Stable Diffusionの5倍 Stable Diffusionの拡散モデルは、ランダムなノイズ情報から

    爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに(アスキー) - Yahoo!ニュース
    shunkeen
    shunkeen 2023/11/13
    少ステップ数の画像で取捨選択して、後からステップ数を多くした画像が生成できるようなUIが用意できたら、Midjourneyみたいな使い勝手になったりするのかな?
  • 【ChatGPT「GPTs(GPT Builder)」のおすすめ活用事例一覧】猛者達が開発した最強GPTsの使い方60選 | WEEL

    ChatGPT「GPTs(GPT Builder)」のおすすめ活用事例一覧】猛者達が開発した最強GPTsの使い方60選 2024 2/24 2023年11月、ChatGPTの新機能「GPTs」が公開されました。 GPTsを活用すれば、ChatGPT上で手軽にGPT搭載ツールを作れます。 しかもプログラミングなどの特別な知識も必要なく、自然言語だけで誰でも簡単に作成できるんです! こんな画期的な機能、使わないなんて大損ですよ! というわけで記事では、SNS上で話題になったGPTsの活用事例60選を紹介します。 また記事の後半では、プログラミング知識ゼロの筆者が、実際にGPTsでツールを作成した様子もお見せします。 ぜひ最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる 【現在最強】GPT

    shunkeen
    shunkeen 2023/11/13
    ネットに漂流しているプロンプトをコピーするより、GPTsのリンクからボタン一発で導入の方が断然楽だけど、GPTsのまとめサイトを読むのは地味に労力がかかるから、GPT Storeがイイ感じに公開されたら嬉しいなぁ。
  • ChatGPT授乳ハックという失われつつある技術について - 本しゃぶり

    ChatGPTのDALL·E 3による画像生成は非常に強力だ。 だがプロンプトエンジニアリングを駆使すれば、さらに限界を超えた表現が可能となる。 ブックマーク保存をおすすめします。 インフルエンサーたちが隠した技術 11月7日にOpenAI DevDayが開催されてからというもの、生成AI系インフルエンサーたちが大騒ぎしている。発表された機能やAPIの数々を見れば、そうなるのも無理はない。俺のような一般ユーザーでさえ、できることが一気に増えたのだから。 例えば自分だけのChatGPTを簡単に作成・共有できるGPTsだ。俺もさっそく触り、しゃぶりの知識を全部突っ込んだAishabriを作ってみた*1。 https://chat.openai.com/g/g-x7GtBiqrn-aishabrichat.openai.com だが、インフルエンサーは新たに登場した機能ばかり口にし、その影で失

    ChatGPT授乳ハックという失われつつある技術について - 本しゃぶり
    shunkeen
    shunkeen 2023/11/13
    “ブックマーク保存をおすすめします。”/すでに対策がとられつつある技法を保存しても、今すぐ役に立つかはわからないが、文化を保全する意味では重要かもしれない()
  • GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること

    GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:009,334 Maxwell Zeff・Gizmodo US [原文] ( mayumine ) これは嬉しい進化です。 OpenAIの開発者向けカンファレンス「DevDay」で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました(こちらの記事もどうぞ)。 いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。 さらにGPT-4 Turboでは、JSONモードが実装され、JS

    GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
    shunkeen
    shunkeen 2023/11/09
    “Retrieval機能が搭載され、Google Driveといった外部のデータソースから知識を取り込むことができるようになります”/今のAssistants APIのKnowledge Retrievalはファイルをアップロードする必要があるはずだけど。予定の話か?
  • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

    以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

    OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
    shunkeen
    shunkeen 2023/11/07
    Assistants API群(Assistants,Threads,Messages,Runs)の複雑さに面食らっている。Code Interpreter、Retrieval、ファイル、スレッド回りの面倒を見てもらえるから楽になったんだけど、代わりに仕様を勉強しないといけないやつ。
  • イラレの生成AIはパンドラの箱を開けたか? Live - 2023/10/16|CreativeEdge Vlog

    Adobe Illustrator 28.0に実装された「テキストからベクター生成 (Beta)」を探求するプロジェクトを開始。 先週末の「イラレの生成AIを探求する」ライブでは(非公式な)ベクターイラスト生成AIチャレンジに参加しましたが、世界には強者がたくさんいる。イラレの達人クラスの人達しかいなかったので、いきなりハイレベルの戦いになりました… けっきょく、生成AIを使いこなすイラレの達人が最強ということを痛感。 Adobe Fireflyの体はテキストプロンプトに依存しないUIを実装したユーザーフレンドリーなクリエイティブツールに進化していますが、イラレの生成AIはまだベータ機能で原始的なプロンプト入力なので、ガチャをまわし続けることしかできません。 あと、アイコンやロゴ、UIパーツなどは今のベータ機能だと生成が雑なので、あまり使えない。 とはいえ、下図のようなベクターグラフィッ

    イラレの生成AIはパンドラの箱を開けたか? Live - 2023/10/16|CreativeEdge Vlog
    shunkeen
    shunkeen 2023/10/18
    要素ごとの生成と構成可能性、ベジェ曲線の制御、再配色、再配置。生成AIによる初期構築の高速化と、イラレがもともと持っていた変更容易性が組み合わさったときの威力たるや。
  • ChatGPT can now see, hear, and speak

    We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w

    ChatGPT can now see, hear, and speak
    shunkeen
    shunkeen 2023/09/26
    音声会話ができて、画像を解析できるようになるんか。BingのチャットAIは先行して画像解析できてたけど、ChatGPT PlusとEnterpriseユーザーにも2週間くらいで展開されるのかー。
  • 伊藤園、「おーいお茶」のパッケージに画像生成AIを活用

    伊藤園は8月28日、9月に発売する「お~いお茶 カテキン緑茶」のパッケージデザインに画像生成AIを活用したと発表した。同様の取り組みは同社初。「中身だけでなく、外観も時代に合った魅力を伝えられる製品開発に努める」(同社)という。 画像生成AIサービスは、商品パッケージのリサーチやデザインを手掛けるプラグ(東京都千代田区)のものを活用。商品デザインに特化したAIサービスの先行試用版で生成した画像を参考に、デザイナーが一から作り直したという。 AI活用のデザインは500ミリリットル、1リットル、2リットルのペットボトルに加え、パウダータイプの「お~いお茶 カテキン緑茶 スティック」で採用。「茶葉の生命力を現したもので、従来のデザインとは一線を画す鮮やかな色彩と抜群の視認性を最大限に引き出したデザインをあしらった」(伊藤園)としている。 関連記事 AIが生成した絵画が、アニメ「BEASTARS

    伊藤園、「おーいお茶」のパッケージに画像生成AIを活用
    shunkeen
    shunkeen 2023/08/29
    画像生成AIを使う場合、一点もの以外にも、大量生産に使ってみてほしい気もする。文字以外の背景の抽象的な緑を、すべて違うシード値で自動生成して、個性のある一つ一つ微妙に異なる見た目のパッケージにするなど。
  • Multimodal generative AI search | Google Cloud Blog

    What is Multimodal Search: "LLMs with vision" change businesses What if large language models (LLMs) had "vision", the ability to understand the meaning of images? Just like we have seen the innovation with LLMs with chatbots and text data, the ability would make another huge impact on businesses by letting LLMs look at and organize millions of images in enterprise IT systems. In this post, we wil

    Multimodal generative AI search | Google Cloud Blog
    shunkeen
    shunkeen 2023/08/22
    “vision language model (VLM)”/視覚言語モデル(VLM)。
  • 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan

    Stability AIは日語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP AlphaJapanese InstructBLIP Alpha」は、先日公開された日語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日語データセットで高性能なモデルを構築するために、モデルの一部を大規模な

    日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
    shunkeen
    shunkeen 2023/08/17
    「大きいのはどっちですか?」「左」/何と何の大きさを比較してほしいのか書いてない非常にあいまいな質問に、画像から文脈を読み取って的確に答えてくるのすごいなぁ。。。
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge

    使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk

    生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge
    shunkeen
    shunkeen 2023/07/19
    圧倒的な美しさの圧の強い写真だけだと使いづらいから、普段使い用にファインチューニングしたモデルとか出てくるのかな。ファッションみたく。いや、カメラやレンズにこだわる感じか。
  • [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023

    [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023 マイクロソフトは、日時間7月19日未明から開催中のパートナー向け年次イベント「Microsoft Inspire 2023」において、AIチャットサービス「Bing Chat」に、画像を基に質問ができる「ビジュアルサーチ」機能(Visual Search in Bing Chat)を追加したことを明らかにしました。 ビジュアルサーチの機能はOpenAIのGPT-4モデルを活用したものだと説明されています。 下記はBing Chatのビジュアルサーチのデモ動画として、手書きのWebフォームの画像からHTML/CSSを生成させる様子を紹介したものです。 手書きのWebフォーム画像からHTML/CSSを生成 Bing Ch

    [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023
    shunkeen
    shunkeen 2023/07/19
    “手書きのWebフォームの画像からHTML/CSSを生成させる”/これにCode InterpreterでFlaskの簡単なコードを生成させたらどうなるんじゃろうか。
  • AIイラスト販売サービス「petapi」、スタートからわずか1カ月半でサービス終了を発表【やじうまWatch】

    AIイラスト販売サービス「petapi」、スタートからわずか1カ月半でサービス終了を発表【やじうまWatch】
    shunkeen
    shunkeen 2023/07/14
    ユパ様「またAI村が一つ死んだ。行こう、ここもじき腐海に沈む」
  • 設立40周年のワコム、AIで「創作の軌跡」を可視化。デジタル著作権保護も展開

    設立40周年のワコム、AIで「創作の軌跡」を可視化。デジタル著作権保護も展開
    shunkeen
    shunkeen 2023/07/12
    “KISEKI ARTは、作家の一筆(ストローク)の特徴量をAIにより抽出し、可視化するプロジェクト。作家や作品特有の筆遣いの特徴を、指紋ならぬ「絵紋」として3D上に可視化できる”/筆跡鑑定みたいな?
  • pixivFANBOX個別規約改定と「AI生成コンテンツ」設定のお知らせ|pixivFANBOX公式|pixivFANBOX

    いつもpixivFANBOXをご利用いただきありがとうございます。 pixivFANBOX個別利用規約の改定内容についてお知らせします。 このたびの改定は、2023年7月25日(火)より適用されます。 ◼︎変更の概要 2023年5月10日「AI生成作品に対する、FANBOXにおける今後の対応」にてお伝えいたしました通り、FANBOXでは「AI生成コンテ...

    pixivFANBOX個別規約改定と「AI生成コンテンツ」設定のお知らせ|pixivFANBOX公式|pixivFANBOX
    shunkeen
    shunkeen 2023/07/12
    “利用規約に違反するコンテンツの公開を目的とした外部サイトへの誘導行為や、pixivFANBOX上での活動内容が極端に不明瞭なまま支援金を集める行為等、不審な手法でサービスを利用する”/うたがわしきは垢BAN。
  • Stable Diffusion から特定の概念を忘れさせる学習を行ってみる

    TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよ VRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよ マイナス適用によって、概念を削除するだけでなく強調することもできたよ 一度でも画像生成 AI に触ったことがあると、より楽しんで読めると思います。 論文とかどうでもいいから学習方法知りたい! という方は 実際に学習してみる へどうぞ! 今回作成したもの コード: モデルなど: 前提 Stable Diffusion とは、Stability AI らが公開したオープンソースの画像生成 AI であり、テキストによる指示で様々な画像を生成することができる。 来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の

    Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
    shunkeen
    shunkeen 2023/06/30
    学習棄却(アンラーニング)だ。ヤバめな画像をうっかり学習しちゃった時に、その画像をのぞいた画像集で新たなモデルを作るのはコストがかかる。けど、その画像を学習棄却できるなら、現実的なコストになりそう。
  • フォトショの生成AI機能でキャンペーン アドビ、Twitterで画像の投稿募る

    アドビは6月29日、Photoshopの画像生成AI機能「生成塗りつぶし」を活用した写真の投稿キャンペーンを始めた。制作に生成塗りつぶしを使った画像を、ハッシュタグ「#Photoshop生成AIチャレンジ」を付けてTwitterに投稿。アドビが選出したインフルエンサーに引用リツイートされると、景品として2000円分のAmazonギフト券を受け取れる。 キャンペーンは8月9日まで開催。アドビが選出したインフルエンサーとして、Webデザイナーのタマケンさん、フォトグラファーの高木慎平さん、バーチャルYouTuberなどとして活動するいまいち萌えない子さんなどが審査する。 生成塗りつぶしは米Adobeが5月に発表した機能。同社の画像生成AI「Adobe Firefly」を活用したもので、プロンプト(文章)を入力するだけで写真を拡張したり、モノを追加・削除したりできる。現在はβ版として英語入力のみ

    フォトショの生成AI機能でキャンペーン アドビ、Twitterで画像の投稿募る
    shunkeen
    shunkeen 2023/06/30
    “Webデザイナーのタマケンさん、フォトグラファーの高木慎平さん、バーチャルYouTuberなどとして活動するいまいち萌えない子さんなどが審査する”/高品質の作品が大量投稿されたら審査側も大変そう。
  • 「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される

    AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。 GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023) https://github.com/XingangPan/DragGAN Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold https://vcai.mpi-inf.mpg.

    「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される
    shunkeen
    shunkeen 2023/06/27
    指示に従いつつ、画像がなめらかに変形するように、GANの潜在空間内の潜在変数を動かす仕組みだとすると、対応する変数のない画像は生成されないのかな。