並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 11 件 / 11件

新着順 人気順

imageの検索結果1 - 11 件 / 11件

  • Hello GPT-4o

    GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversation. It

      Hello GPT-4o
    • AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介

      私事ですが、骨折して2か月ほど半寝たきり&半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きます で……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。 裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。 残りの99.8%は ・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される ・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会

        AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介
      • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

        画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

          画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
        • みんな知らない、知ると得するAirPodsの隠し機能

          みんな知らない、知ると得するAirPodsの隠し機能2024.04.19 21:00154,623 Dua Rashid - Gizmodo US [原文] ( 岩田リョウコ ) AirPodsをカスタマイズしてみよう! AirPodsが発売されて、最初は「うどん?」などと揶揄されていましたが、結局かなり浸透してオーディオ界を席巻する存在となりました。でもAirPodsがどんな機能を持っているのか詳しく調べたことって意外とないかも?ということで、地球上で一番人気のあるイヤホンのひとつ、AirPodsの知られざる隠れ機能を見ていきましょう。 別室での会話を聞くImage: 岩田リョウコAirPodsには、別の部屋で行なわれている会話を聞くことができる「ライブリスニング」機能というものがあります。これはAirPodsのどのモデルにもある機能です。 まず、iPhoneの「設定」を開き、コントロー

            みんな知らない、知ると得するAirPodsの隠し機能
          • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

            2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

              Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
            • Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた

              Adobeが画像生成AIモデル「Adobe Firefly Image 3 Foundation モデル(ベータ版)」を2024年4月23日に発表しました。既にウェブ版Adobe Fireflyで同モデルを用いた画像生成が可能になっていたので、実際に使ってどんな画像を生成できるのか確認してみました。 アドビ、Adobe Firefly Image 3 Foundation モデルを発表 https://www.adobe.com/jp/news-room/news/202404/20240423_adobe-firefly-image-3-foundation-model.html Adobe Firefly Image 3 Foundation モデル(ベータ版)は、従来のFirefly Imageと比べて高品質な画像を生成できるAIモデルです。同モデルはすでにベータ版のPhotosho

                Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
              • Sakana AI

                日本語プロンプト対応の高速画像生成モデルEvoSDXL-JPで生成した画像の例。プロンプトは「可愛いゾウの編みぐるみ」、「ラーメン、浮世絵、葛飾北斎」、「折り紙弁当」、「(下町ロケット、東京サラリーマン)、浮世絵」など 概要 Sakana AIは先日、進化的アルゴリズムを用いた基盤モデル構築の手法「進化的モデルマージ」を提案しました。また、進化的モデルマージにより構築された日本語の大規模言語モデルEvoLLM-JPと画像言語モデルEvoVLM-JPを公開しました。これらのモデルは、言語生成を目的とした自己回帰型Transformerモデルでした。今回私たちは、進化的モデルマージの可能性をさらに示すために、画像生成タスクで広く用いられる拡散モデルへの適用を行いました。 このリリースの要点は以下の通りです。 画像生成で昨今用いられている拡散モデルに進化的モデルマージを適用しました。言語生成モデ

                  Sakana AI
                • LOOSE AI

                  制作を依頼いただく際に、事前にLoose AIを利用いただき、その生成された素材をイラスト制作の参考として活用いただける場合には、制作料金から 最大20%割引 させていただきます。

                  • iPhone対Android、セキュリティはどっちが上? 明白な差が判明 | GetNavi web ゲットナビ

                    iPhoneとAndroidでは、どちらのほうがセキュリティがより強固で、プライバシーが保護されているのか? 長年にわたるこの問題についてサイバーセキュリティ技術を扱うメディアのCybernewsが実際に検証し、結果を報告しました。 ↑セキュリティ能力がより高いのは… 今回の検証では、ドイツのApp StoreとGoogle Playストアからトップ100のアプリを、それぞれ工場出荷状態にリセットしたiPhone SEとAndroidスマートフォンにインストール。その後、両方のスマホをアイドル状態にしておき、外部サーバーにアクセスする頻度と、そのサーバーがどこにあるかをチェックしています。 その結果、iPhoneは1日あたり平均3308クエリ(問い合わせ)を外部サーバーに送信したのに対し、Androidは2323クエリを送信。つまり、前者が後者より42%多く情報を外部とやり取りしていたこと

                      iPhone対Android、セキュリティはどっちが上? 明白な差が判明 | GetNavi web ゲットナビ
                    • Emi 2 - a Hugging Face Space by aipicasso

                      Future-oriented Anime model

                        Emi 2 - a Hugging Face Space by aipicasso
                      • Stable Diffusionからの概念消去⑤:DiffQuickFix (論文)

                        Localizing and Editing Knowledge In Text-to-Image Generative Models (ICLR2024) 今回はtext-to-imageの概念消去に戻ってDiffQuickFixという手法をみます. 論文は60ページ以上あり, 非常に多くの結果が提供されていますが主にmain paperの部分を見ていきます. 図や表はことわりのない限り論文からの引用です. 書籍情報 Samyadeep Basu and Nanxuan Zhao and Vlad I Morariu and Soheil Feizi and Varun Manjunatha. Localizing and Editing Knowledge In Text-to-Image Generative Models. The Twelfth International Con

                          Stable Diffusionからの概念消去⑤:DiffQuickFix (論文)
                        1