タグ

画像処理に関するl-_-llのブックマーク (9)

  • AIはどこまで無断で学習できるのか。~文化庁の生成AI論点整理(ガイドラインの素案)を読んで - フジイユウジ::ドットネット

    今日、文化庁は生成AIと著作権保護についてのガイドラインとなる素案を提示しました。(2023/12/20時点。その後の状況については追記をお読みください。) 生成AIでなにが合法でどんなとき違法になるべきか、クリエイターや開発者、ビジネス系のひとなどが議論していますが、多くの生成AI周辺にいる人たち全員に関係あるガイドラインがいままさに検討されているわけです。 朝日新聞ではこう報じています。 文化庁は20日、文化審議会著作権分科会の法制度小委員会に、生成AI人工知能)によるコンテンツの無断学習は、著作権法で著作権者の許諾が不要とされる「非享受目的」にあたらない場合があるとする「AIと著作権に関する考え方」の素案を示した。生成AIが記事や画像データなどを無断で利用する「ただ乗り」(フリーライド)に懸念の声が上がる中、現行法を厳格に解釈し、歯止めをかけたい考えだ。 朝日新聞デジタルより引用

    AIはどこまで無断で学習できるのか。~文化庁の生成AI論点整理(ガイドラインの素案)を読んで - フジイユウジ::ドットネット
  • 2022年11月末、今からAI画像生成を触りたい未経験者向け記事|852話

    こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi

    2022年11月末、今からAI画像生成を触りたい未経験者向け記事|852話
  • 画像編集ソフトの覆い焼きやソフトライトといった「レイヤー合成モード」は一体何をしているのか?

    Photoshopなどのデジタル画像編集ソフトウェアでは、「覆い焼き」や「ソフトライト」といったさまざまなブレンドモード(レイヤー合成モード)を用いて画像を編集することが可能です。このレイヤー合成モードは一体何をしているのかを、プロダクトデザイナーのダン・ホリック氏が解説しています。 Blending Modes | Dan Hollick https://typefully.com/DanHollick/blending-modes-KrBa0JP レイヤー合成モードは、2つの入力カラーに基づき新しいカラーを作成するというものです。以下の画像の「Foreground(前景)」と「Background(後景)」が異なるレイヤーであり、「Result」部分がレイヤー合成モードにより出力された新しいカラーを指しています。 レイヤー合成モードの中で最も単純なのが、「Darken(比較(暗))」と

    画像編集ソフトの覆い焼きやソフトライトといった「レイヤー合成モード」は一体何をしているのか?
  • Imagicを理解する

    17 oct 2022に出たImagicという技術について、ペーパーとソースを見比べながら説明します。

    Imagicを理解する
  • Stable Diffusion のプロンプトで意味の足し算・引き算をする

    TL;DR Stable Diffusion でプロンプトに重みをつけたり、意味の世界で足したり引いたりするよ 例: ピラミッド - エジプト + 日 = ? 画風をシームレスに変換できるよ seed 変更だと大きく変わってしまうけど、小さい重みで補正かければ構図を維持したまま絵に微調整を加えられるよ 意味の足し算・引き算 Stable Diffusion では、内部的に以下の 2 ステップの処理を行うことでテキストを画像に変換している テキストをベクトル(数の組)に変換する ベクトルを画像に変換する ところで、以下の動画を見てほしい テキストをベクトルにすることで、意味の世界で足し算や引き算が実現できている。 これを Stable Diffusion に応用したらどうなるだろうか[1]。 以下では、プロンプトの計算ができるように機能追加したStable Diffusionを用いる。 機

    Stable Diffusion のプロンプトで意味の足し算・引き算をする
  • Stable Diffusionのimg2imgで好みの絵を作成するまでの過程

    イラストの生成方法なので技術情報サイトで公開すべきか迷いましたが、ローカル環境では生成手順にコマンドプロンプトの操作を必要とするためこちらにも投稿します。 はじめに Stable Diffusionにはテキストから画像を生成するtxt2imgと画像から画像を生成するimg2imgという機能が実装されています。今回はimg2imgを使用してある程度好みの絵柄になるまで試行錯誤を行った過程を記録したいと思います。 環境構築 私が使用しているグラフィックボードはVRAMが6GBしかないため、最低でも10GBのVRAMを必要とする下記リンク先のStableDiffusionは使用できません 代わりにフォークされた以下のStableDiffusionを使用します。 こちらのリポジトリをGit経由でClone or 直接ダウンロードして、家に記載されている手順に従って環境構築を行ってください。(

    Stable Diffusionのimg2imgで好みの絵を作成するまでの過程
    l-_-ll
    l-_-ll 2022/08/29
    "a portrait of a cute girl,Girl with dark hair and wearing a school uniform, detailed face with gorgeous eyes, by mucha, by Range Murata, by Akihiko Yoshida, C95, C96, trending on pixiv, trending on Artstation"
  • 画像生成AI「Stable Diffusion」をGoogle Colabで動かしたメモ - ただいま村

    AIが画像を自動生成してくれる「Stable Diffusion」がすごい。これを使ったサービス「DreamStudio」は1枚6秒ほどで画像を生成してくれて早いが、無料枠を超えて使うには課金が必要になる。 Google Colabという、Pythonの実行環境を提供してくれるサービス上でStable Diffusionを動かせるそうだ。お金はかからない。1枚の画像生成にかかるのは30秒ほど。その方法は以下で解説されている。 Google Colab で はじめる Stable Diffusion v1.4|npaka|note 自分でもやってみて、今は無事にStable Diffusionを使えるようになっている。しかしGoogle Colabを使うのも初めてだったので上の記事だけだと詰まるところもあった。ここではそれを解説したいと思う。 ライセンスの確認 Hugging Faceのトー

    画像生成AI「Stable Diffusion」をGoogle Colabで動かしたメモ - ただいま村
  • 全部信じて任せてください! 画像ファイル容量を3~10分の1以下にする「SmartJPEG」知ってますか? | インタビュー

    こちらの画像、左側(286KB)と右側(44KB)とで、ファイル容量が5倍以上異なります。でも見た目に大きな違いはありませんよね? 画像のファイルサイズが小さければ、ユーザー側はギガ消費を抑えられるし、読み込み速度も速くなります。サイト管理側も、ストレージ容量を削減できます。このように、サイトに掲載する画像を自動で最適化してくれるのが、ウェブテクノロジの画像軽量化ソリューション「SmartJPEG」。 「SmartJPEG」は、見た目そのままに画像容量を抑えてくれるサービス。バージョン2.0を7月10日にリリースし、アニメーションGIFの生成、WebPの出力に対応したほか、画像内容に応じてJPEG・PNGのどちらが適しているかを自動判断できるようになりました。さらに、ブログシステム「WordPress」から「SmartJPEG」を呼び出して、画像の軽量化を自動で行うプラグインも同時にリリー

    全部信じて任せてください! 画像ファイル容量を3~10分の1以下にする「SmartJPEG」知ってますか? | インタビュー
  • 画像処理の数式を見て石になった時のための、金の針 - Qiita

    画像処理は難しい。 Instagramのキレイなフィルタ、GoogleのPhoto Sphere、そうしたサービスを見て画像は面白そうだ!と心躍らせて開いた画像処理の。そこに山と羅列される数式を前に石化せざるを得なかった俺たちが、耳にささやかれる「難しいことはOpenCVがやってくれるわ。そうでしょ?」という声に身をゆだねる以外に何ができただろう。 稿は石化せざるを得なかったあの頃を克服し、OpenCVを使いながらも基礎的な理論を理解したいと願う方へ、その道筋(アイテム的には金の針)を示すものになればと思います。 扱う範囲としては、あらゆる処理の基礎となる「画像の特徴点検出」を対象とします(実践 コンピュータビジョンの2章に相当)。なお、記事自体、初心者である私が理解しながら書いているため、上級画像処理冒険者の方は誤りなどあれば指摘していただければ幸いです。 画像の特徴点とは 人間が

    画像処理の数式を見て石になった時のための、金の針 - Qiita
  • 1