並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 3367件

新着順 人気順

画像処理の検索結果161 - 200 件 / 3367件

  • 【決定版】GPTs開発の教科書|ChatGPT研究所

    この記事は、一度使われて終わるような、ChatGPT にちょっとした機能を追加しただけの GPTではなく、本当に使われる素晴らしく便利な GPTs を作成、開発するための教科書として、書きました。 今までの GPTs 開発関連の情報を全てまとめた内容になっています。 この note 一冊を読めば、GPTs 制作の基礎から応用まで全部わかります。 記事の内容は必要に応じて適宜アップデートしていきます。 目次は以下です: 第1章 GPTsの概要とその可能性そもそも GPTs とはなんでしょうか? 一言で言うと、ChatGPTを自分独自に大幅にカスタマイズできる機能とそのカスタマイズされたAIのことです。 ただし、GPTsを単なるChatGPT のいち機能の一つとして考えるのは非常にもったいないです。 OpenAI は、GPT Store という、他の人が作ったGPTsを使えるようになるストアの

      【決定版】GPTs開発の教科書|ChatGPT研究所
    • Danbooru(イラスト転載サイト)で学習したWaifu Diffusion

      高杉 光一🦋 @14:59 @kuronagirai Cry… 基本箱推し 画像生成AIで作った画像の供養先@AI_Rushia 生成した画像は商用利用と人が嫌がるようなこと以外の用途であれば好きに使って構いません syosetu.org/?mode=user&uid… 高杉 光一🦋 @kuronagirai 私が把握してる今のところの各画像生成AIの相関図 Stable Diffusionのオープンソース化は間違いなくターニングポイントの一つだけどWaifu Diffusionがどこまで影響を与えるかはこれ次第 Midjourneyも十分影響あったんだけど芸術や背景特化感否めない ERNIE-ViLGはどうなるんだろう…? mimicはうん… pic.twitter.com/ykyDSkltPE 2022-09-09 04:17:01 高杉 光一🦋 @kuronagirai 素人目

        Danbooru(イラスト転載サイト)で学習したWaifu Diffusion
      • 「AIで2次元キャラの服を簡単に脱がせるサイト」が登場したので実際に使ってみた

        当たり前ですが、2次元のキャラクターは差分の画像がなければ、服を脱ぐことはできません。しかし、hobosoreさんの開発した「剥ぐやつ」を使えば、AIによる画像処理で2次元の服を脱がせることができます。どんな感じで脱がすことができるのか、実際に使って試してみました。 剥ぐやつ https://domainboy.site/ サイトにアクセスするとこんな感じ。右下のフォルダアイコンをクリックして、脱がしたい画像をアップロードします。 アップロードするとこんな感じ。今回はサイトで用意されているイラストを利用してみました。 左下のブラシアイコンを選択し、画像の上から脱がせたい服の部分を上から塗りつぶします。マスクをかけおわったら、右下にある保存アイコンをクリックします。 ポップアップが表示されるので「OK」をクリック。 「OK」をクリック。 30秒ほど待つと、画像が保存できます。 出力された画像

          「AIで2次元キャラの服を簡単に脱がせるサイト」が登場したので実際に使ってみた
        • 「AIが生成したイラストの投稿禁止」をイラスト投稿サイトが次々に決定し始めている

          by Lexica 近年は「Stable Diffusion」をはじめとする高精度な画像生成AIが次々に登場しており、「AIが人間のアーティストに取って代わるのではないか」と考えている人もいます。そんな中、さまざまなイラスト投稿サイトでは「AIが生成したイラストの投稿禁止」をガイドラインで定める動きが進んでいると、テクノロジー系ブログのWaxy.orgを運営するAndy Baio氏は指摘しています。 Online Art Communities Begin Banning AI-Generated Images - Waxy.org https://waxy.org/2022/09/online-art-communities-begin-banning-ai-generated-images/ AIが非常に精度の高いイラストを生成できるほど進化を遂げる中で、AIを活用する人々とAIに否定

            「AIが生成したイラストの投稿禁止」をイラスト投稿サイトが次々に決定し始めている
          • JAXA | 変形型月面ロボットによる小型月着陸実証機(SLIM)の撮影およびデータ送信に成功

            国立研究開発法人宇宙航空研究開発機構(理事長:山川宏)と株式会社タカラトミー(代表取締役社長 COO:小島 一洋)、ソニーグループ株式会社(代表執行役 会長 CEO:吉田 憲一郎)、同志社大学(学長 植木 朝子)の4者で共同開発※1した変形型月面ロボット(Lunar Excursion Vehicle 2(LEV-2)、愛称「SORA-Q」、以下「LEV-2」)は、小型月着陸実証機(SLIM、以下「SLIM」)※2の撮影に成功しました。これにより、LEV-2は超小型月面探査ローバ(Lunar Excursion Vehicle 1(LEV-1)、以下「LEV-1」)※3と共に、日本初※4の月面探査ロボットになり、世界初※4の完全自律ロボットによる月面探査、世界初※4の複数ロボットによる同時月面探査を達成しました。さらに、LEV-2は世界最小・最軽量※4の月面探査ロボットとなりました。 LE

              JAXA | 変形型月面ロボットによる小型月着陸実証機(SLIM)の撮影およびデータ送信に成功
            • Stable Diffusion の仕組みを理解する - ABEJA Tech Blog

              この記事は、ABEJAアドベントカレンダー2022 の 19 日目の記事です。 こんにちは!株式会社 ABEJA で ABEJA Platform 開発を行っている坂井です。 世間では Diffusion Model 使った AI による画像生成が流行っているみたいですね。 自分は元々 Computer Vision 系の機械学習エンジニアだったんですが、この1年くらいは AI モデル開発ではなくもっぱらバックエンド開発メインでやっていて完全に乗り遅れた感あるので、この機会に有名な Diffusion Model の1つである Stable Diffusion v1 について調べてみました!*1 では早速本題に入りたいと思います! Stable Diffusion v1 とは? Denoising Diffusion Probabilistic Model(DDPM) 学習時の動作 for

                Stable Diffusion の仕組みを理解する - ABEJA Tech Blog
              • 画像編集ソフトの覆い焼きやソフトライトといった「レイヤー合成モード」は一体何をしているのか?

                Photoshopなどのデジタル画像編集ソフトウェアでは、「覆い焼き」や「ソフトライト」といったさまざまなブレンドモード(レイヤー合成モード)を用いて画像を編集することが可能です。このレイヤー合成モードは一体何をしているのかを、プロダクトデザイナーのダン・ホリック氏が解説しています。 Blending Modes | Dan Hollick https://typefully.com/DanHollick/blending-modes-KrBa0JP レイヤー合成モードは、2つの入力カラーに基づき新しいカラーを作成するというものです。以下の画像の「Foreground(前景)」と「Background(後景)」が異なるレイヤーであり、「Result」部分がレイヤー合成モードにより出力された新しいカラーを指しています。 レイヤー合成モードの中で最も単純なのが、「Darken(比較(暗))」と

                  画像編集ソフトの覆い焼きやソフトライトといった「レイヤー合成モード」は一体何をしているのか?
                • TechCrunch | Startup and Technology News

                  TikTok is starting to automatically label AI-generated content that was made on other platforms, the company announced on Thursday. With this change, if a creator posts content on TikTok that…

                    TechCrunch | Startup and Technology News
                  • 君は使い分けられるか?CSS/SVG/Canvasのビジュアル表現でできること・できないこと - ICS MEDIA

                    ブラウザーで新たにインタラクションやアニメーションを作る時、皆さんはどのようにして使う技術を選んでいますか? 使い慣れたライブラリに機能がないかドキュメントを調べてみたり、流行りのキーワードであればGoogle等で検索してみることも多いでしょう。一方、独自のビジュアル表現やアニメーションの場合、そもそも検索するキーワードがわからないことも多いのではないでしょうか? この記事では、webのビジュアル表現・アニメーションを実現するベースの技術であるCSS・SVG・Canvas(WebGL)の3つについて、それぞれのできること・できないこと(得意・不得意)を作例とともに紹介します。 クイズ:どうやって実現する? webでできるさまざまな表現 下の図はこの記事で紹介する9つのサンプルを並べてみたものです。すべてのサンプルはCSS・SVG・Canvas(WebGL)のいずれかを中心に実装されています

                      君は使い分けられるか?CSS/SVG/Canvasのビジュアル表現でできること・できないこと - ICS MEDIA
                    • 日本語版「Stable Diffusion」公開 追加学習でオノマトペも理解 「キラキラ瞳」も反映

                      AI事業を手掛けるrinna社(東京都渋谷区)は9月9日、画像生成AI「Stable Diffusion」を改造した日本語版「Japanese Stable Diffusion」を9日に無料で一般公開すると発表した。日本語で生成したい画像の内容などを指示すると、AIが内容に沿った画像を出力する。 日本語版はStable Diffusionに、日本語キャプション付きの画像を約1億枚追加で学習させたもの。日本語圏の固有名詞や和製英語、オノマトベ(擬音、擬態語など)など、独特の文化を反映した画像を生成できるとしている。 配布場所はGitHubとAI関連コミュニティサイト「Hugging Face」。ソフトウェアへの組み込みも許可する。開発者向けサイト「rinna Developpers」ではAPIも公開する。 8日には、対話AIキャラクターを育成して交流させる同社製SNSアプリ「キャラる」や、同

                        日本語版「Stable Diffusion」公開 追加学習でオノマトペも理解 「キラキラ瞳」も反映
                      • 東京新聞:マルチ商法勧誘に首相夫妻との桜写真 業務停止命令の会社 「効果絶大」と会員に拡散:社会(TOKYO Web)

                        悪質なマルチ商法だとして二〇一七年に消費者庁から業務停止命令を受けた暗号資産(仮想通貨)販売会社「48(よつば)ホールディングス」(札幌市中央区)の役員が、「桜を見る会」に出席した際の写真が、組織的に会員勧誘に使われていたことが、関係者の話で分かった。前日に安倍晋三首相の後援会が東京都内で開いた「前夜祭」で、安倍首相夫妻と写った写真も会員間に出回っており、会員は「写真を見せると『すごいね』となり、信用してくれた」と話している。(石井紀代美) 48社は、一五年十二月、新しい仮想通貨だとする「クローバーコイン」の販売を開始。購入した会員が新規会員を勧誘すると報酬が出るマルチ商法だった。「購入すれば一カ月半後には十倍に値上がりする」などとして会員数を伸ばし、一七年七月時点で会員は約三万五千人だった。 本紙の取材に応じた東海地方の女性会員によると、一六年に上位会員が開いたセミナーで、48社役員(当

                          東京新聞:マルチ商法勧誘に首相夫妻との桜写真 業務停止命令の会社 「効果絶大」と会員に拡散:社会(TOKYO Web)
                        • ANAホテル領収書 桜夕食会の宛名は「上様」 首相答弁と一致

                          平成26年の桜を見る会前日に安倍晋三首相の後援会がANAインターコンチネンタルホテル東京で開催した夕食会の領収書(一部画像処理しています) 「桜を見る会」前日に安倍晋三首相の後援会が主催した夕食会に関し、会場となったANAインターコンチネンタルホテル東京(旧全日空ホテル)が発行したとする領収書を参加者が実際に受け取っていたことが21日、分かった。宛名は「上様」と記され、首相の国会答弁と一致している。 産経新聞は、参加者が保管していた領収書を確認した。ANAホテルが会場となったのは平成25、26、28年の夕食会。確認したのは26(2014)年の領収書で、桜を見る会前日の「’14・4・11」との日付が記されている。宛名欄には「上様」、金額は「5000円」で、「夕食懇談会として」となっている。 係名や「通し番号」が書かれ、支払い済みを示す赤色のスタンプも押されている。参加者は取材に「会場で会費を

                            ANAホテル領収書 桜夕食会の宛名は「上様」 首相答弁と一致
                          • Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python

                            ビジネス文書をデータ化し構造や内容を理解するアプリケーションはドキュメント・インテリジェンスと呼ばれ、画像処理や自然言語処理といった複数の要素技術を組み合わせて開発する必要があります。何が必要でどう実現すれば良いのかといった第一歩を、Pythonでの具体的な構築事例とともに紹介します。 https://2021.pycon.jp/time-table/?id=273795

                              Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
                            • Vtuberが「AIで書いたファンアートは『ファンアート』や『自作』といった発言をしないで欲しい」とお願いしていたがその理由がかなり切実だった

                              夏色まつり@NatsuiroMatsuri @natsuiromatsuri ファンアート頼むから自分でかいてくれ;; 最近のAIクオリティ高すぎて気づけなかったので・・・ AIイラストはファンアートとか自作発言はしないようにお願いします。 2022-10-11 11:02:27 夏色まつり@NatsuiroMatsuri @natsuiromatsuri これに関して個人で楽しんだりやってみた!ってので夏色まつりイメージで制作するぶんには何の問題もなくて AIということを明記しない、ファンアートタグをつける、自作発言をするっていうのが問題なんだと個人的に思ってます 難しい問題ではあるかもですがまつりすの中ではそういう認識でお願いします twitter.com/natsuiromatsur… 2022-10-11 14:35:39 リンク YouTube Matsuri Channel 夏

                                Vtuberが「AIで書いたファンアートは『ファンアート』や『自作』といった発言をしないで欲しい」とお願いしていたがその理由がかなり切実だった
                              • 2020年以降のプログラミング技術のトレンド予想 - Qiita

                                こちらの記事は、2019年7月に公開された Indrek Lasn 氏による『 2020 and Beyond Programming Trend Predictions 』の和訳になります。 本記事は著者の許可を得て掲載しています。 Thank you for letting us share your knowledge! 著者に何かメッセージがある方は Twitter までご連絡ください。 また本記事は転載であり、本記事はこちらになります。 はじめに 2020年は、もうすぐそこです。 2020年はSFの世界のように聞こえますが、そろそろ新しい世界のドアをノックする時期になっています。 すぐそこまで来ている未来のプログラミングの世界に興味をお持ちの方は、この文章をこのまま読み続けて下さい。 これから述べることは、間違っているかもしれませんが、私が将来起こると考えていることです。 未来を

                                  2020年以降のプログラミング技術のトレンド予想 - Qiita
                                • 世界最速レベルの性能を持つリレーショナルデータベース管理システム「劔(Tsurugi)」を開発

                                  世界最速レベルの性能を持つリレーショナルデータベース管理システム「劔(Tsurugi)」を開発― 処理性能456万TPSと応答遅延219ナノ秒を実現 ― 日本電気(株)と(株)ノーチラス・テクノロジーズはNEDOの「高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発」(以下、委託事業)において、世界最速レベルの性能を持つリレーショナルデータベース管理システム「劔(Tsurugi)」(以下、劔)を開発しました。 劔は、次世代のデータベースに用いられるハードウエア環境(メニーコア・大容量メモリーなど)に適合したシステムであり、ハードウエアの性能が向上するほどシステムの性能も高まる特性を有しています。32以上のコア数を有するハードウエアにおいては、世界最速レベルの処理性能456万TPSと219ナノ秒の応答遅延を実現しました。 劔の導入によって、複雑なバッチ処理とオンライン

                                    世界最速レベルの性能を持つリレーショナルデータベース管理システム「劔(Tsurugi)」を開発
                                  • Kaggle Expertになるまで勉強したことを全て書く - Qiita

                                    はじめに こんにちは。Yuki | Kagglerです! 先日、Shopeeコンペの順位が確定して銀メダルをいただき、晴れてCompetition Expertになることができました。区切りがいいのでここまで取り組んできたことをまとめてみました。 ※ 6/28追記:Amazonのリンクが切れていたので貼り直しました! プログラミング&機械学習を始めて一年、ようやく Kaggle Expertになることができました!! 行列も正規分布も知らず、ターミナルなんて触ったこともない状態からのスタートでしたが、ようやくここまで来ました。 ここまで来れたのは偏にこれまで関わってきた皆様のお陰です。これからも頑張ります!! pic.twitter.com/kMkaFhqhU9 — ユウキ | Kaggler (@Yuki_Kaggler) May 12, 2021 この記事の対象者 Kaggleをやって

                                      Kaggle Expertになるまで勉強したことを全て書く - Qiita
                                    • 脅威のカメラ性能! Google Pixel 3で撮ったネパール&エベレスト街道 - I AM A DOG

                                      最近、そのカメラ性能の高さで話題に上ることが多いGoogleのスマートフォン「Pixel 3」。私の妻も今年の3〜4月に行って来たネパール旅行直前から使うようになり、旅行中の写真はずっとPixel 3で撮っていたのですが、その写真を見せて貰ったところ本当にどれも綺麗で驚いてしまいました。 Pixel 3に搭載されているアウトカメラはF1.8の単焦点レンズ(シングル)に1,220万画素センサー、画角は35mm換算で27mm相当になります。AIやソフトウェアでの画像処理により、これまで小さなセンサーやレンズでは不利とされていた写真表現を実現することを目指した機種になっているそう。 日中の低感度で綺麗に撮れるのは今時のコンデジやスマートフォンならば当たり前ですが、まず驚いたのはその解像感。あの小さなレンズからよくこれだけの絵を生み出しているなと。 次の写真の手前に歩いてきたヤクの毛並みに奥に見え

                                        脅威のカメラ性能! Google Pixel 3で撮ったネパール&エベレスト街道 - I AM A DOG
                                      • 加工なし CSS のみで画像にグリッチと RGB ずらし効果をかける

                                        はじめに 以下のツイートが500いいねを超えましたので解説記事を書きます。 デモ&ソースコード CodePen に完成品のデモとソースコードを置いてあります。 グリッチとは 元々は「一過性の障害」という意味ですが、映像の世界ではしばしば「映像の乱れ」という意味で用いられます。ホラーやサイバーなどでよく見られる演出の一つ。 https://www.google.com/search?q=glitch&tbm=isch RGB ずらしとは 色収差、RGB シフト、RGB split (RGB 分割) など、さまざまな言い方がありますが、要するに本来光の三原色である Red、Green、Blue がズレることなく重なって映像を映し出すところ、それがズレた状態で表示されることです。 グリッチエフェクトと一緒に用いたり、場合によっては色ズレも含めてグリッチと言ったりしますので、今回も合わせて実装する

                                          加工なし CSS のみで画像にグリッチと RGB ずらし効果をかける
                                        • 天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ

                                          出典:Flickr / Tatsuo Yamashita (CC BY 2.0 DEED)ホンダのADAS「Honda SENSING(ホンダセンシング)」による「天一騒動」が再燃しているようだ。ホンダセンシングが、ラーメンチェーン「天下一品」の企業ロゴを「車両進入禁止」の道路標識に誤認識してしまう案件だが、ローソンが「天下一品こってりフェア」を開催したことで「遭遇率」が高まり、再び話題となっているようだ。 この誤認識による本質的なトラブル事例は出ておらず、あくまで「ネタ」としてトピック化されているわけだが、こうした事案が自動運転レベル3以降で発生すると厄介だ。 ■天下一品のロゴが車両進入禁止標識に酷似している件標識認識機能が「ネタ」に……天下一品の企業ロゴは、赤い丸枠に筆で描いたような「一」の字が白抜きで刻まれたものだ。このロゴが、赤い丸枠に白抜きで横線を入れた「車両進入禁止」の標識と酷

                                            天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ
                                          • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

                                            2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

                                            • 「自動ムービー編集」「ゲーム開発」「文章校正」「論文要約」などGPT-4がわずか3週間で生み出した14の画期的ツール

                                              OpenAIが2023年3月14日に正式発表した「GPT-4」は、ChatGPTなどに用いられたGPT-3.5の性能をさらに超え、「初代iPhone登場時と同等の衝撃を与える存在」と評されています。すさまじい性能を有するGPT-4がどのような影響を生み出しているのか、AIに関するマーケティングの専門家であるサム・ウッズ氏が「生後わずか3週間のGPT-4が作成した14の素晴らしいもの」としてまとめています。 GPT-4 is barely 3 weeks old. It has already made significant contributions to various fields. Here are the 14 incredible things created with GPT-4.— Sam Woods (@samuelwoods_) GPT-4では、テキストだけでなく画像を

                                                「自動ムービー編集」「ゲーム開発」「文章校正」「論文要約」などGPT-4がわずか3週間で生み出した14の画期的ツール
                                              • Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく

                                                Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく ChatGPT Code Interpreterをとにかく触ってみる 「Code Interpreterが凄い!」と、みんなが騒いでいるのでとりあえずネットで目についた活用方法を片っ端から試していきたいと思います。 試したら追記していきます。 Code Interpreterのセットアップ 以下3ステップです。簡単ですね。よく分からなかったら別のサイトみてください。 ChatGPT Plusに課金 Setting Beta featuresでCode interpreterのトグルをオン ChatGPTのGPT4でCode Interpreterを選択 以下参考のスクリーンショットです。 Code Interpreterの活用例 ここから活用例を載せていきます

                                                  Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく
                                                • ミュージシャンと絵師のAIに対する反応の違いが面白い

                                                  自分は両方やってるんですが(たまにお金貰えるけど専業は無理なレベル)2つの村でAIが話題になるたび結構反応が違うのが面白いです。 簡単に言うと、絵師の人達はAIに対して厳しめで、ミュージシャンの人達はゆるめ。 絵師の中では、反対派はもちろんたとえAI肯定派の人達も「補助ツールとしてなら」「AIオンリーやちょっと手を加えた程度の場合は明記するべき」「学習される側の権利は守るべき」くらいの立場の人が多い印象です(もちろん全部完璧に正論です) ミュージシャンの場合、上のような「条件」も「まあそんな気にしなくて良くね?」と思ってる人がそこそこ多い。 なんでそうなるかって言うと、音楽の場合そこら辺の意識(美意識?)がガバガバな作り方が良くも悪くももう既に市民権を得ちゃってるからだと思います。 AIによる作曲はまだそこまで強くない(簡単なBGM程度や補助ならいけるけどかっこいい曲がパッと出てくるのはま

                                                    ミュージシャンと絵師のAIに対する反応の違いが面白い
                                                  • https://twitter.com/rei_software/status/1583499209252012035

                                                      https://twitter.com/rei_software/status/1583499209252012035
                                                    • AI生成作品の取り扱いに関するサービスの方針について

                                                      pixiv事務局です。 現在、制作過程のすべて、もしくはほとんどをAIによって生成された作品(以下「AI生成作品」といいます)に関するお問い合わせを多数いただいております。 pixivでは2022年10月下旬から、従来の投稿作品とAI生成作品のすみわけが可能となるよう、下記のようなサービス変更を開始する予定です。 ■機能改修 ・投稿編集時にAI生成作品と設定できる機能の提供 ・AI生成作品を検索時などにフィルタリングする機能の提供 ・従来の作品とは分けた、AI生成作品のみのランキングの提供 詳細は、機能リリース時にお知らせいたします。 上記の機能変更は必ずしも恒常的なものではなく、必要に応じて見直しや変更を行います。今後の対応については、利用規約やガイドラインの変更、pixivの各種機能変更等も含めてさらに検討してまいります。 pixivではこの先、創作過程におけるAI技術の利用がより普及

                                                        AI生成作品の取り扱いに関するサービスの方針について
                                                      • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                                                          Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                                                        • 【2023年版】機械学習の日本語無料学習教材まとめ - Qiita

                                                          言語&開発基礎編 PythonやSQLなどの言語と開発環境に関連することをまとめました。 機械学習に関する教材はこの次のセクションにまとめてあります。 学習環境 インストール及び使い方チュートリアルのサイトと、ある程度使い慣れた後に役立つtips集を各エディタでまとめました。 Google Colaboratory Python初学者にとって最もわかりやすいPython実行環境です。プログラミングは初めて!という方はまずこのGoogle Colaboratory(通称: Colab)から始めてみて、使い方がある程度わかったら、そのまま次のセクションのPython編に移りましょう。 Pythonプログラミング入門 難易度: ★☆☆ 東京大学の公開しているPython講座ですが、冒頭でColabの使い方を解説しています。使ったことのない方はこちらから! Google Colabの知っておくべき

                                                            【2023年版】機械学習の日本語無料学習教材まとめ - Qiita
                                                          • Stable Diffusionでkawaiiを出力しようと奮闘したまとめ

                                                            852話さんには遠く及ばない... Gallery a samurai girl with japanese school uniform, japanese anime style A girl with wolf ear on silver hair, combat toon graphic, arknights, dolls frontline, pixiv girl's frontlineのつもりがdollsになってた...。その影響か人形っぽい雰囲気になっている。 concept idea of a kawaii girl with animal ear on her head, fantasy idle costume, equlip magic wand, beautiful face, thick coating painting, flower blooming, bir

                                                              Stable Diffusionでkawaiiを出力しようと奮闘したまとめ
                                                            • Kuwahara filterとかいう明らかに日本人の名前な画像フィルターに出会い、試してみたらすごかったので紹介する。 - Qiita

                                                              Kuwahara filterとかいう明らかに日本人の名前な画像フィルターに出会い、試してみたらすごかったので紹介する。Python画像処理画像加工フィルター 6/15追記 あとがきの提案について書きました 写真表現としての桑原フィルターの提案 #はじめに Kuwahara filter(桑原フィルター)とは 桑原フィルターは桑原道義さんという大学教授(Wikipedia曰く)が考案した平滑化フィルターの一種で、内容のシンプルさに反して上手いことかけるとまるで油絵のようになる、なんだかすごいフィルターであーる(先に結果が見たい方は記事の一番下を覗いてみよう) Kuwahara filter -Wikipedia SPECT用データ処理 (元論文?) #桑原フィルターの内容 https://upload.wikimedia.org/wikipedia/commons/4/49/Kuwahar

                                                                Kuwahara filterとかいう明らかに日本人の名前な画像フィルターに出会い、試してみたらすごかったので紹介する。 - Qiita
                                                              • 1ms 以下のリアルタイムオブジェクト検出/画像処理を目指して Goの配信サーバサイドで通知ぼかしを実装してみたこと - Mirrativ Tech Blog

                                                                こんにちは ハタ です。 今回は以前iOSのクライアントサイドで実装していた通知ぼかし機能をサーバサイド(配信サーバ)上に再実装した事を書きたいなと思います 今回はかなり内容を絞りに絞ったのですが、長くなってしまいました、、 目次機能があったのでつけてみました、読み飛ばして読みやすくなった(?)かもしれません 目次 目次 通知ぼかし機能とは サーバサイド通知ぼかし プロトタイプの実装 苦労の始まり その1 画像処理速度 苦労の始まり その2 データ量 さらなる計算量の削減を求めて さらなる最適化へ Halide の世界へ 簡単な halide の紹介 苦労の始まり その3 いざ リリース リリースその後 We are hiring! 通知ぼかし機能とは 通知ぼかし機能は、ミラティブ上での配信中に写り込んでしまったiOSの通知ダイアログをダイアログの中身を見えないようにぼかし処理をしてあげる

                                                                  1ms 以下のリアルタイムオブジェクト検出/画像処理を目指して Goの配信サーバサイドで通知ぼかしを実装してみたこと - Mirrativ Tech Blog
                                                                • ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」

                                                                  自宅からリモートワークを行う際、ZoomやSkypeといったオンラインビデオ会議ツールを使用するケースがよくあります。オンラインビデオ会議ツールではウェブカメラを使って自分の顔を映しますが、アルゴリズムで別人になりきってオンラインビデオ会議に参加できるオープンソースのディープフェイクツール「Avatarify」が公開されています。 GitHub - alievk/avatarify: Avatars for Zoom and Skype https://github.com/alievk/avatarify This Open-Source Program Deepfakes You During Zoom Meetings, in Real Time - VICE https://www.vice.com/en_us/article/g5xagy/this-open-source-pro

                                                                    ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」
                                                                  • やねうらお特別インタビューin BM9820AT<書き起こし永久保存版>|BM9820A-BM98 20th Anniversary- in Tokyo

                                                                    こちらは、フリーゲーム「BMS」の20周年を記念して開催された「BM9820A-BM98 20th Anniversary- in Tokyo」内でのイベント「やねうらお特別インタビュー」の様子を、日本語にて文字起こししたものです。 実際のインタビューの様子は以下youtubeにアップロードしております。 (無料でどなたでもご覧いただけます。) こちらの記事はインタビュー動画の会話を文字起こしし、海外の方々が翻訳して読むことを前提として作成されました。そのため、youtubeの日本語字幕及び実際の発言内容とは、方便などの表現を変えてある部分もございます。 できる限り内容・発言意図が変わらないよう細心の注意を払って、校正しておりますが、おかしいと思った部分や誤字脱字等がございましたら、下記 までお気軽にご連絡くださいませ。 ご連絡先:BM9820A公式twitter ■■■■■■■■■■■■

                                                                      やねうらお特別インタビューin BM9820AT<書き起こし永久保存版>|BM9820A-BM98 20th Anniversary- in Tokyo
                                                                    • 写真を「アニメの背景」に変換するAI 30秒で“水彩風”など4種類の背景を生成

                                                                      AIベンチャーのラディウス・ファイブ(東京都新宿区)は7月29日、AIを使って写真からアニメ用の美術背景を生成するサービス「Anime Art Painter」を始めた。写真をアップロードするだけでアニメ風の背景に変換できる。1枚の画像から4種類の背景を30秒程度で生成する。背景の生成は無料だが、画像のダウンロードは有料で料金は480円から。 大まかには、ディープラーニングを使い、写真のテクスチャ(質感)を簡略化。アニメやイラストに使われるような画風に変換する仕組みという。建物や夜景、山などの自然物、近距離で撮影した物体、屋内の背景など、物体に応じてテクスチャの変換や色合いを調整するという。生成される4種類の画像は、アニメでよく使われるような水彩風の絵を2種類と、べた塗りに近いアニメ風の絵が2種類。 同社は現在のアニメ業界について「制作が2年待ちといわれるほど行き詰まっている」と指摘する。

                                                                        写真を「アニメの背景」に変換するAI 30秒で“水彩風”など4種類の背景を生成
                                                                      • 「H.265/HEVC」と同じ画質でファイルサイズを50%削減できる次世代動画圧縮規格「H.266/VVC」が登場

                                                                        Fraunhofer Heinrich Hertz Instituteが、Windows/macOS/Android/iOSといった各種OSでデフォルトでサポートされている動画圧縮規格「H.265/HEVC」の次世代規格となる「H.266/VVC」を発表しました。「H.266/VVC」はデータの圧縮効率を改善し、約50%ビットレートを削減することが可能となります。 Fraunhofer Heinrich Hertz Institute HHI https://newsletter.fraunhofer.de/-viewonline2/17386/465/11/14SHcBTt/V44RELLZBp/1 記事作成時点で、インターネットトラフィックの80%を占めているのが圧縮されたムービーデータです。Fraunhofer Heinrich Hertz Instituteが発表した新しい動画圧縮

                                                                          「H.265/HEVC」と同じ画質でファイルサイズを50%削減できる次世代動画圧縮規格「H.266/VVC」が登場
                                                                        • https://twitter.com/Yamkaz/status/1626486302962245633

                                                                            https://twitter.com/Yamkaz/status/1626486302962245633
                                                                          • Photoshopで加工した顔写真を見分けるAIツール、Adobeが開発

                                                                            米Adobe Systemsは、Photoshopで加工した顔写真を見分けられるAIを開発しました。加工した部分を特定して、もとに戻すことも可能です。 加工された顔 開発はカリフォルニア大学バークレー校の研究者と共同で行いました。同社は過去の研究ではツギハギや複製などによる画像加工を対象にしていましたが、今回は顔のパーツを調整するPhotoshopの「Face Aware Liquify」機能を使って加工した写真を特定できるツールにフォーカス。この機能が人気があるためとしています。 検知された加工部分 研究ではConvolutional Neural Network(CNN:畳み込みニューラルネットワーク)に、多数の加工写真と元の写真をディープラーニングで学習させました。その結果、開発されたツールは99%の精度で加工された写真を特定できたといいます。一方人間では53%の精度でした。 またこ

                                                                              Photoshopで加工した顔写真を見分けるAIツール、Adobeが開発
                                                                            • より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion]|abubu nounanka

                                                                              より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion] こんにちは。今回はStableDiffusionのimg2imgと昔ながらのフォトバッシュを複合することで、より思い通りに、より完璧に近い画像を仕上げる手法について紹介します。SDやimg2imgについては過去記事を参照して下さい。まずこちらをご覧下さい。 ■『昼飯を食べるバットマンとジョーカー』を作る。『昼飯を食べるバットマンとジョーカー』A film still of Batman and Joker eating lunch in the diner, worm lighting, cinematic tone. The Dark Knight(2008)なんでしょうかこの凶悪な白塗りバットマンは。『昼飯を食べるバットマンとジョーカー』を生成させると高確率でこのような画

                                                                                より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion]|abubu nounanka
                                                                              • Blenderで不穏な「無人の風景」を生み出す、CG作家「たいらかける」が語る画づくりのコンセプト。

                                                                                2023/02/14 PR Blenderで不穏な「無人の風景」を生み出す、CG作家「たいらかける」が語る画づくりのコンセプト。 マウスコンピューター Blenderテクスチャモデリングライティング ごく普通の日常風景を題材にしながら、どこか「不気味さ」を感じさせるCGを生み出す、たいらかける氏。これまでの作品から、制作の秘訣や本人のバックグラウンドなどを探るとともに、現在制作で用いているマウスコンピューターのクリエイター向けノートPC「DAIV 5N」のパフォーマンスや使い勝手を伺った。 重視しているのは、腑に落ちない感覚 CGWORLD(以下、CGW):3DCGを始めて1年ちょっととのことですが、アートに関する経歴はどのような感じでしょうか。 たいらかける氏(以下、たいら):2020年に、まずは点描画やイラストなどの創作活動からスタートしました。その後、2021年の12月頃からはBle

                                                                                  Blenderで不穏な「無人の風景」を生み出す、CG作家「たいらかける」が語る画づくりのコンセプト。
                                                                                • 例えばAIに90年代までのエロゲの絵柄を全て学習させても、

                                                                                  例えばAIに90年代までのエロゲの絵柄を全て学習させても、2000年代以降の新しい画風は生み出せないわけだろ? だから新しいタッチを生み出してくれる人間絵師の権利はちゃんと保護しなきゃマズいと思う さもなきゃ、いつまで経っても同じ絵柄のハンコ絵しか見れなくなるぞ ---------------------------------------------- 追記: 権利って具体的に何?ってブコメがあったけど、例えば神絵師が苦労して新しい画風を生み出したとしても、やんちゃな海外AIにすぐ模倣されて、誰でも自由に生成できるようにされたら商売上がったりだよね。 そうならないように、やはり学習や使用を勝手にされない権利を強く主張していかないとマズそう、という話。 追記2: 「既存の画風を混ぜることで既にAIは新しい画風を生み出せるよ」って意見もあった。それは確かにと思った一方で、90年代までのイラス

                                                                                    例えばAIに90年代までのエロゲの絵柄を全て学習させても、