並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 347件

新着順 人気順

画像処理の検索結果121 - 160 件 / 347件

  • Vtuberが「AIで書いたファンアートは『ファンアート』や『自作』といった発言をしないで欲しい」とお願いしていたがその理由がかなり切実だった

    夏色まつり@NatsuiroMatsuri @natsuiromatsuri ファンアート頼むから自分でかいてくれ;; 最近のAIクオリティ高すぎて気づけなかったので・・・ AIイラストはファンアートとか自作発言はしないようにお願いします。 2022-10-11 11:02:27 夏色まつり@NatsuiroMatsuri @natsuiromatsuri これに関して個人で楽しんだりやってみた!ってので夏色まつりイメージで制作するぶんには何の問題もなくて AIということを明記しない、ファンアートタグをつける、自作発言をするっていうのが問題なんだと個人的に思ってます 難しい問題ではあるかもですがまつりすの中ではそういう認識でお願いします twitter.com/natsuiromatsur… 2022-10-11 14:35:39 リンク YouTube Matsuri Channel 夏

      Vtuberが「AIで書いたファンアートは『ファンアート』や『自作』といった発言をしないで欲しい」とお願いしていたがその理由がかなり切実だった
    • 加工なし CSS のみで画像にグリッチと RGB ずらし効果をかける

      はじめに 以下のツイートが500いいねを超えましたので解説記事を書きます。 デモ&ソースコード CodePen に完成品のデモとソースコードを置いてあります。 グリッチとは 元々は「一過性の障害」という意味ですが、映像の世界ではしばしば「映像の乱れ」という意味で用いられます。ホラーやサイバーなどでよく見られる演出の一つ。 https://www.google.com/search?q=glitch&tbm=isch RGB ずらしとは 色収差、RGB シフト、RGB split (RGB 分割) など、さまざまな言い方がありますが、要するに本来光の三原色である Red、Green、Blue がズレることなく重なって映像を映し出すところ、それがズレた状態で表示されることです。 グリッチエフェクトと一緒に用いたり、場合によっては色ズレも含めてグリッチと言ったりしますので、今回も合わせて実装する

        加工なし CSS のみで画像にグリッチと RGB ずらし効果をかける
      • 天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ

        出典:Flickr / Tatsuo Yamashita (CC BY 2.0 DEED)ホンダのADAS「Honda SENSING(ホンダセンシング)」による「天一騒動」が再燃しているようだ。ホンダセンシングが、ラーメンチェーン「天下一品」の企業ロゴを「車両進入禁止」の道路標識に誤認識してしまう案件だが、ローソンが「天下一品こってりフェア」を開催したことで「遭遇率」が高まり、再び話題となっているようだ。 この誤認識による本質的なトラブル事例は出ておらず、あくまで「ネタ」としてトピック化されているわけだが、こうした事案が自動運転レベル3以降で発生すると厄介だ。 ■天下一品のロゴが車両進入禁止標識に酷似している件標識認識機能が「ネタ」に……天下一品の企業ロゴは、赤い丸枠に筆で描いたような「一」の字が白抜きで刻まれたものだ。このロゴが、赤い丸枠に白抜きで横線を入れた「車両進入禁止」の標識と酷

          天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ
        • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

          2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

          • ミュージシャンと絵師のAIに対する反応の違いが面白い

            自分は両方やってるんですが(たまにお金貰えるけど専業は無理なレベル)2つの村でAIが話題になるたび結構反応が違うのが面白いです。 簡単に言うと、絵師の人達はAIに対して厳しめで、ミュージシャンの人達はゆるめ。 絵師の中では、反対派はもちろんたとえAI肯定派の人達も「補助ツールとしてなら」「AIオンリーやちょっと手を加えた程度の場合は明記するべき」「学習される側の権利は守るべき」くらいの立場の人が多い印象です(もちろん全部完璧に正論です) ミュージシャンの場合、上のような「条件」も「まあそんな気にしなくて良くね?」と思ってる人がそこそこ多い。 なんでそうなるかって言うと、音楽の場合そこら辺の意識(美意識?)がガバガバな作り方が良くも悪くももう既に市民権を得ちゃってるからだと思います。 AIによる作曲はまだそこまで強くない(簡単なBGM程度や補助ならいけるけどかっこいい曲がパッと出てくるのはま

              ミュージシャンと絵師のAIに対する反応の違いが面白い
            • https://twitter.com/rei_software/status/1583499209252012035

                https://twitter.com/rei_software/status/1583499209252012035
              • AI生成作品の取り扱いに関するサービスの方針について

                pixiv事務局です。 現在、制作過程のすべて、もしくはほとんどをAIによって生成された作品(以下「AI生成作品」といいます)に関するお問い合わせを多数いただいております。 pixivでは2022年10月下旬から、従来の投稿作品とAI生成作品のすみわけが可能となるよう、下記のようなサービス変更を開始する予定です。 ■機能改修 ・投稿編集時にAI生成作品と設定できる機能の提供 ・AI生成作品を検索時などにフィルタリングする機能の提供 ・従来の作品とは分けた、AI生成作品のみのランキングの提供 詳細は、機能リリース時にお知らせいたします。 上記の機能変更は必ずしも恒常的なものではなく、必要に応じて見直しや変更を行います。今後の対応については、利用規約やガイドラインの変更、pixivの各種機能変更等も含めてさらに検討してまいります。 pixivではこの先、創作過程におけるAI技術の利用がより普及

                  AI生成作品の取り扱いに関するサービスの方針について
                • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                    Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                  • Stable Diffusionでkawaiiを出力しようと奮闘したまとめ

                    852話さんには遠く及ばない... Gallery a samurai girl with japanese school uniform, japanese anime style A girl with wolf ear on silver hair, combat toon graphic, arknights, dolls frontline, pixiv girl's frontlineのつもりがdollsになってた...。その影響か人形っぽい雰囲気になっている。 concept idea of a kawaii girl with animal ear on her head, fantasy idle costume, equlip magic wand, beautiful face, thick coating painting, flower blooming, bir

                      Stable Diffusionでkawaiiを出力しようと奮闘したまとめ
                    • Kuwahara filterとかいう明らかに日本人の名前な画像フィルターに出会い、試してみたらすごかったので紹介する。 - Qiita

                      Kuwahara filterとかいう明らかに日本人の名前な画像フィルターに出会い、試してみたらすごかったので紹介する。Python画像処理画像加工フィルター 6/15追記 あとがきの提案について書きました 写真表現としての桑原フィルターの提案 #はじめに Kuwahara filter(桑原フィルター)とは 桑原フィルターは桑原道義さんという大学教授(Wikipedia曰く)が考案した平滑化フィルターの一種で、内容のシンプルさに反して上手いことかけるとまるで油絵のようになる、なんだかすごいフィルターであーる(先に結果が見たい方は記事の一番下を覗いてみよう) Kuwahara filter -Wikipedia SPECT用データ処理 (元論文?) #桑原フィルターの内容 https://upload.wikimedia.org/wikipedia/commons/4/49/Kuwahar

                        Kuwahara filterとかいう明らかに日本人の名前な画像フィルターに出会い、試してみたらすごかったので紹介する。 - Qiita
                      • 1ms 以下のリアルタイムオブジェクト検出/画像処理を目指して Goの配信サーバサイドで通知ぼかしを実装してみたこと - Mirrativ Tech Blog

                        こんにちは ハタ です。 今回は以前iOSのクライアントサイドで実装していた通知ぼかし機能をサーバサイド(配信サーバ)上に再実装した事を書きたいなと思います 今回はかなり内容を絞りに絞ったのですが、長くなってしまいました、、 目次機能があったのでつけてみました、読み飛ばして読みやすくなった(?)かもしれません 目次 目次 通知ぼかし機能とは サーバサイド通知ぼかし プロトタイプの実装 苦労の始まり その1 画像処理速度 苦労の始まり その2 データ量 さらなる計算量の削減を求めて さらなる最適化へ Halide の世界へ 簡単な halide の紹介 苦労の始まり その3 いざ リリース リリースその後 We are hiring! 通知ぼかし機能とは 通知ぼかし機能は、ミラティブ上での配信中に写り込んでしまったiOSの通知ダイアログをダイアログの中身を見えないようにぼかし処理をしてあげる

                          1ms 以下のリアルタイムオブジェクト検出/画像処理を目指して Goの配信サーバサイドで通知ぼかしを実装してみたこと - Mirrativ Tech Blog
                        • ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」

                          自宅からリモートワークを行う際、ZoomやSkypeといったオンラインビデオ会議ツールを使用するケースがよくあります。オンラインビデオ会議ツールではウェブカメラを使って自分の顔を映しますが、アルゴリズムで別人になりきってオンラインビデオ会議に参加できるオープンソースのディープフェイクツール「Avatarify」が公開されています。 GitHub - alievk/avatarify: Avatars for Zoom and Skype https://github.com/alievk/avatarify This Open-Source Program Deepfakes You During Zoom Meetings, in Real Time - VICE https://www.vice.com/en_us/article/g5xagy/this-open-source-pro

                            ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」
                          • 写真を「アニメの背景」に変換するAI 30秒で“水彩風”など4種類の背景を生成

                            AIベンチャーのラディウス・ファイブ(東京都新宿区)は7月29日、AIを使って写真からアニメ用の美術背景を生成するサービス「Anime Art Painter」を始めた。写真をアップロードするだけでアニメ風の背景に変換できる。1枚の画像から4種類の背景を30秒程度で生成する。背景の生成は無料だが、画像のダウンロードは有料で料金は480円から。 大まかには、ディープラーニングを使い、写真のテクスチャ(質感)を簡略化。アニメやイラストに使われるような画風に変換する仕組みという。建物や夜景、山などの自然物、近距離で撮影した物体、屋内の背景など、物体に応じてテクスチャの変換や色合いを調整するという。生成される4種類の画像は、アニメでよく使われるような水彩風の絵を2種類と、べた塗りに近いアニメ風の絵が2種類。 同社は現在のアニメ業界について「制作が2年待ちといわれるほど行き詰まっている」と指摘する。

                              写真を「アニメの背景」に変換するAI 30秒で“水彩風”など4種類の背景を生成
                            • 「H.265/HEVC」と同じ画質でファイルサイズを50%削減できる次世代動画圧縮規格「H.266/VVC」が登場

                              Fraunhofer Heinrich Hertz Instituteが、Windows/macOS/Android/iOSといった各種OSでデフォルトでサポートされている動画圧縮規格「H.265/HEVC」の次世代規格となる「H.266/VVC」を発表しました。「H.266/VVC」はデータの圧縮効率を改善し、約50%ビットレートを削減することが可能となります。 Fraunhofer Heinrich Hertz Institute HHI https://newsletter.fraunhofer.de/-viewonline2/17386/465/11/14SHcBTt/V44RELLZBp/1 記事作成時点で、インターネットトラフィックの80%を占めているのが圧縮されたムービーデータです。Fraunhofer Heinrich Hertz Instituteが発表した新しい動画圧縮

                                「H.265/HEVC」と同じ画質でファイルサイズを50%削減できる次世代動画圧縮規格「H.266/VVC」が登場
                              • https://twitter.com/Yamkaz/status/1626486302962245633

                                  https://twitter.com/Yamkaz/status/1626486302962245633
                                • Photoshopで加工した顔写真を見分けるAIツール、Adobeが開発

                                  米Adobe Systemsは、Photoshopで加工した顔写真を見分けられるAIを開発しました。加工した部分を特定して、もとに戻すことも可能です。 加工された顔 開発はカリフォルニア大学バークレー校の研究者と共同で行いました。同社は過去の研究ではツギハギや複製などによる画像加工を対象にしていましたが、今回は顔のパーツを調整するPhotoshopの「Face Aware Liquify」機能を使って加工した写真を特定できるツールにフォーカス。この機能が人気があるためとしています。 検知された加工部分 研究ではConvolutional Neural Network(CNN:畳み込みニューラルネットワーク)に、多数の加工写真と元の写真をディープラーニングで学習させました。その結果、開発されたツールは99%の精度で加工された写真を特定できたといいます。一方人間では53%の精度でした。 またこ

                                    Photoshopで加工した顔写真を見分けるAIツール、Adobeが開発
                                  • より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion]|abubu nounanka

                                    より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion] こんにちは。今回はStableDiffusionのimg2imgと昔ながらのフォトバッシュを複合することで、より思い通りに、より完璧に近い画像を仕上げる手法について紹介します。SDやimg2imgについては過去記事を参照して下さい。まずこちらをご覧下さい。 ■『昼飯を食べるバットマンとジョーカー』を作る。『昼飯を食べるバットマンとジョーカー』A film still of Batman and Joker eating lunch in the diner, worm lighting, cinematic tone. The Dark Knight(2008)なんでしょうかこの凶悪な白塗りバットマンは。『昼飯を食べるバットマンとジョーカー』を生成させると高確率でこのような画

                                      より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion]|abubu nounanka
                                    • Blenderで不穏な「無人の風景」を生み出す、CG作家「たいらかける」が語る画づくりのコンセプト。

                                      2023/02/14 PR Blenderで不穏な「無人の風景」を生み出す、CG作家「たいらかける」が語る画づくりのコンセプト。 マウスコンピューター Blenderテクスチャモデリングライティング ごく普通の日常風景を題材にしながら、どこか「不気味さ」を感じさせるCGを生み出す、たいらかける氏。これまでの作品から、制作の秘訣や本人のバックグラウンドなどを探るとともに、現在制作で用いているマウスコンピューターのクリエイター向けノートPC「DAIV 5N」のパフォーマンスや使い勝手を伺った。 重視しているのは、腑に落ちない感覚 CGWORLD(以下、CGW):3DCGを始めて1年ちょっととのことですが、アートに関する経歴はどのような感じでしょうか。 たいらかける氏(以下、たいら):2020年に、まずは点描画やイラストなどの創作活動からスタートしました。その後、2021年の12月頃からはBle

                                        Blenderで不穏な「無人の風景」を生み出す、CG作家「たいらかける」が語る画づくりのコンセプト。
                                      • 例えばAIに90年代までのエロゲの絵柄を全て学習させても、

                                        例えばAIに90年代までのエロゲの絵柄を全て学習させても、2000年代以降の新しい画風は生み出せないわけだろ? だから新しいタッチを生み出してくれる人間絵師の権利はちゃんと保護しなきゃマズいと思う さもなきゃ、いつまで経っても同じ絵柄のハンコ絵しか見れなくなるぞ ---------------------------------------------- 追記: 権利って具体的に何?ってブコメがあったけど、例えば神絵師が苦労して新しい画風を生み出したとしても、やんちゃな海外AIにすぐ模倣されて、誰でも自由に生成できるようにされたら商売上がったりだよね。 そうならないように、やはり学習や使用を勝手にされない権利を強く主張していかないとマズそう、という話。 追記2: 「既存の画風を混ぜることで既にAIは新しい画風を生み出せるよ」って意見もあった。それは確かにと思った一方で、90年代までのイラス

                                          例えばAIに90年代までのエロゲの絵柄を全て学習させても、
                                        • 中国産の画像AI「ERNIE-ViLG」が“二次元キャラ”に強いと話題 新しいデモページ公開

                                          中国Baiduは8月30日(現地時間)、画像AI「ERNIE-ViLG」を試せるデモページをオープンソースコミュニティー「Hugging Face」上で公開した。日本のTwitterユーザー間では「二次元キャラの生成に強い」などと話題を集めている。一方、先日国産の類似サービス「mimic」がβ版の機能停止を発表していたことから、中国にビジネス的なアドバンテージを取られるのではと懸念する声も見られる。 デモページでは、画像のイメージを言葉で入力し、画風を指定することで、イラストを1回につき6通り生成できる。画風は「水彩」「油彩」「アニメ風」など7種類。Baiduは中国語での利用を推奨しているが、英語も入力できる。 ERNIE-ViLGは、Baiduが手掛ける大規模データ「Wenxin」を基に、同社が開発しているAI群の一つ。中国語のテキストと画像の組み合わせを約1億4500万件学習していると

                                            中国産の画像AI「ERNIE-ViLG」が“二次元キャラ”に強いと話題 新しいデモページ公開
                                          • 絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ

                                              絵心いらずで基本無料。AIがやってくれる「Microsoft Designer」アプリ
                                            • AIにえっちな絵を描いて欲しい→謎のお兄さんの画像に差し替えられてしまう→Twitter民がソースを確認し解明

                                              「Stable Diffusion」で遊んでいたところ、定期的に謎の画像に差し変えられてしまう皆さん

                                                AIにえっちな絵を描いて欲しい→謎のお兄さんの画像に差し替えられてしまう→Twitter民がソースを確認し解明
                                              • 海中写真から青緑色を除去し、本当の色を再現するアルゴリズムを海洋学者が開発 : カラパイア

                                                海の中で自然光で水中写真を撮影すると、まるでフィルターを通したかのように青緑色を帯びてしまうことが多い。 海の浅いところであっても、そこに差し込む光は吸収・散乱してしまい、赤や黄色といったサンゴならではの色合いはほとんど消えてしまう。 青みを帯びた水中写真は、フォトショップなどの画像処理ツールで修正することは可能だが、それだと人工的な色合いになってしまい、実際の色とは違ったものとなってしまう。 そこで海洋学者は、、海底を彩る本当の色を再現できるアルゴリズムを開発した。

                                                  海中写真から青緑色を除去し、本当の色を再現するアルゴリズムを海洋学者が開発 : カラパイア
                                                • 「硫酸男」スピード逮捕のウラで…実はJRが「顔認証カメラ」を導入していた(週刊現代) @moneygendai

                                                  悪用されても気付けない 「駅名は明かせませんが、約110の駅のコンコースなどに設置したおよそ5800台の監視カメラの一部に、顔認証機能を搭載しました。マスクをつけていても、不審者の顔を判別できる能力があります」(JR東日本広報) JR東日本が、ひっそりと「顔認証監視カメラ」を導入したことをご存じだろうか。駅利用者の顔と、登録されている犯罪容疑者や不審者の顔をリアルタイムで照合し、検知しているというのだ。 五輪開幕に合わせて、7月から導入していた。顔データの出元や最終的な情報提供先は「答えられない」と言うものの、警察とみて間違いない。 先月24日夜、東京・港区で男性に硫酸をかけた男は、JR品川駅から新幹線に乗って逃走した。男は28日にスピード逮捕されたが、この捜査にも顔認証監視カメラが活用されたとみられる。 捜査に役立つなら、問題ないと思うかもしれない。しかし、顔の画像を無差別に収集されるの

                                                    「硫酸男」スピード逮捕のウラで…実はJRが「顔認証カメラ」を導入していた(週刊現代) @moneygendai
                                                  • 3cmから1.7kmまですべてにピントが合った写真を撮れるレンズを開発。三葉虫の眼から着想【Gadget Gate】 - PHILE WEB

                                                    一般的な三葉虫は、単一の眼が無数に集まってできた複眼と呼ばれる構造により、いわゆるレンズ部分と視覚細胞が1対1でつながっていたと考えられている。これは、現在の昆虫にも見られるしくみだ。 しかし、Dalmanitina socialisと呼ばれる種の三葉虫は、視覚系全体に二重レンズ構造を持ち、表面側のレンズは中央部の膨らみにより第二の焦点を得られていたことがわかった。つまり、この種は近くにいる獲物を見ると同時に、遠くで動く天敵もはっきりと視界にとらえることができたようなのだ。 NISTの研究チームは、この構造を「ライトフィールドカメラ」と呼ばれる特殊なカメラに応用できないかと考えた。ライトフィールドカメラは通常のデジタルカメラとは異なり、複眼のように多数のマイクロレンズを使用して、1度の撮影で色と輝度だけでなく、センサーに入る光の方向もまとめて記録し、ソフトウェアによって後から遠近のフォーカ

                                                      3cmから1.7kmまですべてにピントが合った写真を撮れるレンズを開発。三葉虫の眼から着想【Gadget Gate】 - PHILE WEB
                                                    • CSSで画像の上に表示するテキストをより読みやすく、より美しくするテクニック・実装方法のまとめ

                                                      画像の上にテキストを配置する際に、より読みやすく、より美しくするCSSのテクニックを紹介します。 CSSで画像上にテキストを表示する際に起こる問題に対するさまざまなアプローチと解決するための実装方法を解説。また、最近見かけた素晴らしいテクニック、便利なツールなども紹介します。 Handling Text Over Images in CSS by Ahmad Shadeed 下記は各ポイントを意訳したものです。 ※当ブログでの翻訳記事は、元サイト様にライセンスを得て翻訳しています。 はじめに テキストを読みやすくするためのさまざまなテクニック グラデーションのオーバーレイを使ったテクニック イージングのグラデーションを使ったテクニック 水平方向のグラデーションを使ったテクニック ソリッドカラーとグラデーションの混合 グラデーションのオーバーレイとtext-shadow グラデーションのオー

                                                        CSSで画像の上に表示するテキストをより読みやすく、より美しくするテクニック・実装方法のまとめ
                                                      • モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用

                                                        画像のノイズ除去やボケ除去、超解像といった従来の画像修復問題は、特定の劣化状態、既知の単純な劣化にのみ効果的であった。 これに対して、実際の環境下での多様な劣化を考慮した「Blind Image Restoration」(BIR)という手法が注目されている。BIRは、一般的な画像と、それが持つさまざまな劣化に対して、リアルな画像再構築を目指している。特に、BIRの研究は以下の3つのカテゴリーに分けられる。 (1)Blind Image Super-Resolution(BSR):低解像度で劣化が不明瞭な画像の超解像問題に取り組む技術、(2)Zero-Shot Image Restoration(ZIR):これは新しい研究の方向性で、劣化の前提条件を明確に定義した上で、クラシックな画像修復タスクで印象的なゼロショット復元を達成する方法、(3)Blind Face Restoration(BF

                                                          モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用
                                                        • https://twitter.com/illustmimic/status/1564558522766860288

                                                            https://twitter.com/illustmimic/status/1564558522766860288
                                                          • 今後、iphoneユーザーは社会的に信用してもらえなくなるかもしれないヤバい情報、iphoneカメラの画像劣化が酷すぎてスマホの証拠能力が消える可能性

                                                            たま、👻hantutama @hantutama この画像は去年の10月1日に買ったばかりのiPhone15で試し撮りしてびっくりした画像。 遠景の不鮮明な文字が勝手な解釈で異世界文字に化けてる。 今時のスマホカメラって物凄いAI補正🙄❗️ こんな画像なんて、所謂「絵じゃん」 写真の模写だけは巧みな魂の無い画家が模写した絵。 AI汚染。 厳密な意味で「真実の映像の記録」たり得るのだろうか。 現代から近未来のネット上に溢れる画像の大半は、無数の人類がスマホで写した画像になる。情報汚染された画像情報に… 2024-02-23 09:33:17 ウチューじん・ささき @uchujin17 その中で「惑星探査機が地球に送信してきた惑星の写真は何年もかけて解析しなければならない情報が詰まっているが、それが絵であればどんなに細密で綺麗であっても、科学番組の背景くらいにしか使えない」という文言があっ

                                                              今後、iphoneユーザーは社会的に信用してもらえなくなるかもしれないヤバい情報、iphoneカメラの画像劣化が酷すぎてスマホの証拠能力が消える可能性
                                                            • DiffusionによるText2Imageの系譜と生成画像が動き出すまで

                                                              2022年を境に爆発的な流行を見せはじめた AI 画像生成。コアとなる拡散モデルの基礎解説、研究領域で育てられた技術が一般層にまで羽撃いた変遷、その過程で生じた解決されるべき問題点、および日進月歩で増え続ける発展的な手法群について、網羅的に流れを追いかけるメタサーベイを作成しました。 明日にでも世界が一変しうる流動的な分野において、情報のまとめとは必然的に古くなっていくものです。そんな奔流の中にあっても、本資料が、これまでの歴史を俯瞰し、これからの成長を見据えるための礎として、幾許かでも皆様のお役に立てればと心より願い、ここに筆を置きます。

                                                                DiffusionによるText2Imageの系譜と生成画像が動き出すまで
                                                              • 画像生成AI「Stable Diffusion」でプロンプト・呪文やパラメーターを変えるとどういう差が出るか一目でわかる「Prompt matrix」と「X/Y plot」を「Stable Diffusion web UI(AUTOMATIC1111版)」で使う方法まとめ

                                                                画像生成AI・Stable Diffusionを導入するにはNVIDIA製GPUを搭載したPCのほかにPythonやAnacondaなどの知識が必要で、ローカル環境に導入するには少し敷居が高いところがありました。しかし、2022年8月に一般公開されて以降、多くの開発者によって誰でも簡単にStable Diffusionをローカル環境に導入可能でかつGUIで操作できるツールが次々と開発されています。「Stable Diffusion web UI(AUTOMATIC1111版)」はその中でも他のUIには搭載されていない機能も盛り込まれた決定版とも言えるツールで、その中でも特に画像生成にお役立ちな機能である「Prompt matrix」と「X/Y plot」を実際に使ってみました。 GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Di

                                                                  画像生成AI「Stable Diffusion」でプロンプト・呪文やパラメーターを変えるとどういう差が出るか一目でわかる「Prompt matrix」と「X/Y plot」を「Stable Diffusion web UI(AUTOMATIC1111版)」で使う方法まとめ
                                                                • https://twitter.com/Yamkaz/status/1575560980523720704

                                                                    https://twitter.com/Yamkaz/status/1575560980523720704
                                                                  • GitHub - bloc97/Anime4K: A High-Quality Real Time Upscaler for Anime Video

                                                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                      GitHub - bloc97/Anime4K: A High-Quality Real Time Upscaler for Anime Video
                                                                    • 画像の機械学習が劣化する理由 - Qiita

                                                                      前書き 注意:ここに書いていることは2020年代としては、古すぎる見解になっている。 近年の自己教師あり学習の大幅な進展で、ここで述べているようなアプローチは大幅に古めかしいものになっている。 ・自己教師あり学習の進展は、画像認識タスクに対する共通のbackbone を作り出しており、後段で個々の画像認識タスクに対するfine-tuningをするアプローチに変わってきている。 ・そのため、ラベル付きの限られたデータで特徴量の抽出をしていたのが、自己教師あり学習に基づく特徴量の抽出になっている。 ・各人、自己教師あり学習について調べることをお勧めする。 主旨 単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。 はじめに 画像認識の機械学習を改善するためにはデータを追加すればよい。 そう思っている人が大半だろう。 ただ、

                                                                        画像の機械学習が劣化する理由 - Qiita
                                                                      • ジョジョのキャラクター風に顔写真を変換する「JoJoGAN」 1枚の画像からAIが学習

                                                                        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米イリノイ大学アーバナ・シャンペーン校の研究チームが開発した「JoJoGAN: One Shot Face Stylization」は、入力した1枚の顔画像を漫画「ジョジョの奇妙な冒険」のキャラクター風に変換する機械学習フレームワークだ。「空条承太郎」など、作中のキャラクタースタイルに似せた顔に変換する。このフレームワークは、大量のペア画像データセットを使わず、1枚の顔画像から学習できる特性を持つ。 画像をスタイル変換するモデルは、大量のペア画像データセットを必要とするが、そのデータを準備するにはコストがかかる。数枚の画像からスタイル変換する研究も報告されているが、詳細なスタイルや多様性を

                                                                          ジョジョのキャラクター風に顔写真を変換する「JoJoGAN」 1枚の画像からAIが学習
                                                                        • iPhoneのカメラは13で『写実』を捨て『映え』を選択したのか「写真はサムネとして七色に輝く小さな宝石として楽しまれる」

                                                                          Away with Words @tomo_kosuga iPhoneのカメラは13で写実を捨てて「映え」を選択した。多くの写真撮りを落胆させた理由はここにあるが、一方でこれが写真の現在と言える。それは色味やトーンだけでなく細部描写にも言えることだ。写真を拡大して眺める時代は終わったのだ。写真はサムネとして、七色に輝く小さな宝石として楽しまれる 2022-09-11 18:14:51 Away with Words @tomo_kosuga iPhone13で撮った写真を拡大すればよく分かる。解像度の追求ではなくサムネで見た時の見栄えを優先した結果、その細部はもはやイメージ解像度では語れない次元に突入している。言ってみれば絵画だ。絵に近い描写・タッチに置き換わっている。100余年を超えて復興するニューピクトリアリズム時代の到来 2022-09-11 18:21:04

                                                                            iPhoneのカメラは13で『写実』を捨て『映え』を選択したのか「写真はサムネとして七色に輝く小さな宝石として楽しまれる」
                                                                          • 画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」

                                                                            Linuxのコマンドラインで文字列を検索する際に必要不可欠なコマンドといえば「grep」です。しかし、grepは動画ファイルやPDFファイルの文字列を検索できないのが弱点。そんなgrepの弱点を克服し、動画ファイルのメタデータやデータベースのレコード、画像ファイル内の文字列まで検索可能なコマンドが「ripgrep-all(rga)」です。 GitHub - phiresky/ripgrep-all: rga: ripgrep, but also search in PDFs, E-Books, Office documents, zip, tar.gz, etc. https://github.com/phiresky/ripgrep-all rgaはLinuxに限らずWindowsやmacOSでも利用することが可能。今回はUbuntu 20.04でrgaを利用してみます。以下のコマンドを

                                                                              画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」
                                                                            • 画像生成AI「Stable Diffusion」で自動生成された画像からどのようなプロンプト・呪文だったのかを分解して表示できる「CLIP interrogator」の使い方

                                                                              2022年8月に一般公開された画像生成AI「Stable Diffusion」を簡単にWindowsローカル環境に導入でき、コマンドラインではなくブラウザ上に表示されるユーザーインターフェース(UI)から操作可能にするツールがAUTOMATIC1111版Stable Diffusion web UIです。AUTOMATIC1111版Stable Diffusion web UIはただ画像を生成するだけではなく、画像生成時に入力する文字列(プロンプト)について複数の組み合わせを一気にチェックしたり、画像生成の条件を複数設定して一度に画像を生成したりするなど、Stable DiffusionのUIとしては決定版といってもいいほど機能が充実しています。そんなAUTOMATIC1111版Stable Diffusion web UIでは、AIで生成した画像を解析してプロンプトを表示する「CLIP

                                                                                画像生成AI「Stable Diffusion」で自動生成された画像からどのようなプロンプト・呪文だったのかを分解して表示できる「CLIP interrogator」の使い方
                                                                              • 合成背景に人が溶け込むよう照明を調節する技術 Googleが開発

                                                                                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchが開発した「Total Relighting」は、人物画像を切り抜いて別の背景に置き換えた際、被写体の照明変更を行う深層学習を用いた技術だ。静止画像だけでなく、映像内で動く人物も新しい背景に応じた照明で合成し、違和感のない動画コンテンツに仕上げる。

                                                                                  合成背景に人が溶け込むよう照明を調節する技術 Googleが開発
                                                                                • Stable Diffusionでmorphing - すぎゃーんメモ

                                                                                  #stablediffusion 完全に理解した pic.twitter.com/IR5yjnL07Y— すぎゃーん💯 (@sugyan) August 31, 2022 ということで少し触って遊んでみたのでメモ。 Stable Diffusion をザックリ理解 先月公開された Stable Diffusion。 stability.ai 高精度で美しい画像を出力できる高性能なモデルながら、Google Colab などでも手軽に動かせるし、 Apple silicon でもそれなりに動かせる、というのが魅力だ。 中身については 以下の記事の "How does Stable Diffusion work?" 以降のところが分かりやすい。 huggingface.co 図をそのまま引用させていただくと という仕組みになっていて、受け取る入力は "User Prompt" と "Late

                                                                                    Stable Diffusionでmorphing - すぎゃーんメモ