並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 776件

新着順 人気順

画像処理の検索結果1 - 40 件 / 776件

  • 中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!

    インターネット上である投稿が話題だ。それは特定の中国メーカーのスマートフォンでかつ、特定の場面で「消しゴムマジック」に準ずる機能を利用しようとすると「利用できない」というものだ。 その場面とは、北京にある天安門広場だ。北京の有名な観光地であるとともに、中国の歴史的な行事などで幾度も舞台になった場所だ。過去に天安門事件が起こった場所でもあることから、反政府的なデモを防ぐ目的で多くの警備兵が配置されていることでも知られる。 前述の反政府的なデモ防ぐ目的から、インターネット上でも、検閲が厳しい場所としても知られている。中国のネットユーザが天安門広場に飾られる毛沢東氏の肖像画を消した画像でも投稿してしまえば、そのアカウントはあっという間に凍結されてしまう。 今回フォロワーのなしみるく様よりこの2枚の写真を提供いただきました。 @Hayaponlog お疲れ様です🙏 Huawei機で天安門の写真で

      中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!
    • OpenAIのGPT-4oを日本語OCRとして使ってみる

      昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

        OpenAIのGPT-4oを日本語OCRとして使ってみる
      • 100均のセリアのロゴ、日産車が「100キロ制限」と誤認識 | 自動運転ラボ

        ■Xに投稿された誤認識の事例具体的なXの投稿は以下の通りだ。「コイツ100均の看板を道路標識と勘違いしてるwww」といった投稿だ。確かにセリアの看板にある100の数字を最高制限速度100キロの標識と誤認識しているようだ。 コイツ100均の看板を道路標識と勘違いしてるwww pic.twitter.com/Lh8gLsLfyD — CUE (@CueHhon) July 17, 2023

          100均のセリアのロゴ、日産車が「100キロ制限」と誤認識 | 自動運転ラボ
        • 天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ

          出典:Flickr / Tatsuo Yamashita (CC BY 2.0 DEED)ホンダのADAS「Honda SENSING(ホンダセンシング)」による「天一騒動」が再燃しているようだ。ホンダセンシングが、ラーメンチェーン「天下一品」の企業ロゴを「車両進入禁止」の道路標識に誤認識してしまう案件だが、ローソンが「天下一品こってりフェア」を開催したことで「遭遇率」が高まり、再び話題となっているようだ。 この誤認識による本質的なトラブル事例は出ておらず、あくまで「ネタ」としてトピック化されているわけだが、こうした事案が自動運転レベル3以降で発生すると厄介だ。 ■天下一品のロゴが車両進入禁止標識に酷似している件標識認識機能が「ネタ」に……天下一品の企業ロゴは、赤い丸枠に筆で描いたような「一」の字が白抜きで刻まれたものだ。このロゴが、赤い丸枠に白抜きで横線を入れた「車両進入禁止」の標識と酷

            天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ
          • 怒っている顔画像をAIであまり怒っていない表情に変形させる(笑って怒ってハイチーズ!に使われている技術_前編)

            はじめに こんにちは! Whatever Co. でエンジニアをしている登山です。 お台場にある 日本科学未来館では、2023 年 11 月に常設展示の大規模リニューアルが行われました。その中の一つである「老いパーク」では、「老い」をテーマに、老化による目・耳・運動器・脳の変化を疑似体験できるコンテンツが展示されています。 日本科学未来館 web ページより引用 Whatever Co. は、「老いパーク」の企画・設計・制作を担当しました。(クレジットは こちら からご確認ください) 本記事では、自分がテクニカルディレクションおよび実装を担当した、脳の変化を疑似体験できるコンテンツ「笑って怒ってハイチーズ!」の開発で使用した技術について解説します。(2 本立ての前編です。後編はこちら) どんなコンテンツ? 「笑って怒ってハイチーズ!」(通称わらおこ)は、 「年をとると、相手の怒りや悲しみな

              怒っている顔画像をAIであまり怒っていない表情に変形させる(笑って怒ってハイチーズ!に使われている技術_前編)
            • Google、新しいJPEGライブラリ「Jpegli」発表 - 圧縮率が35%向上

              Googleは4月3日(現地時間)、Google Open Source Blog「Introducing Jpegli: A New JPEG Coding Library」において、「Jpegli」と名付けられた新しいJPEGコーディングライブラリを発表した。Jpegliは従来のJPEGフォーマットと高い下位互換性を維持しながら、高速かつ高品質なコーディングを実現しており、高品質設定で圧縮した場合の圧縮率が35%以上向上したという。 Jpegliの特徴 JpegliはGoogleが開発を進めている次世代のJPEG形式である「JPEG XL」のためのコーディングライブラリとして開発されており、JPEG XLのリファレンス実装で培われた新しい技術を使用しているという。GoogleはJpegliの特徴として、以下を挙げている。 オリジナルのJPEG標準規格と従来の8ビット形式に準拠し、lib

                Google、新しいJPEGライブラリ「Jpegli」発表 - 圧縮率が35%向上
              • Rustの画像処理でSIMDを使ってみる

                JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜 / School lunch for anywhere

                  Rustの画像処理でSIMDを使ってみる
                • 生成AI版キンタマウィルス『モリス2』、画像や文字列に埋め込まれたプロンプトから、データ流出、スパム送信、マルウェア拡散、研究者がgoogleなどに警告

                  banshee(おおかみ) @higan_wafu winnyの時もなかなか規制進まなかったのでAntinnyというウイルスがばら撒かれた ワームってどっちも書いてるし似た構造じゃないかな 日本だと2007年に警視庁の個人情報データ流出。被害届の内容とか捜査リストとかいう一般人に知られたらダメなのが出回った 警視庁がwinny使うなよって思うが、生成AIも同じ道辿るのかな 詐欺師を食うクロサギってのがあるが、誰かを食い物にする悪人は誰かに食われる危険性もあるって覚悟すべきなんだろうな 気軽な気持ちで人の道を外れちゃいけないと思う 2024-03-12 15:32:43

                    生成AI版キンタマウィルス『モリス2』、画像や文字列に埋め込まれたプロンプトから、データ流出、スパム送信、マルウェア拡散、研究者がgoogleなどに警告
                  • GitHub - Mayuresh1611/Paper-Piano: Piano like no other, Piano on Paper

                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                      GitHub - Mayuresh1611/Paper-Piano: Piano like no other, Piano on Paper
                    • Linuxに商用レベルの画像編集フリーソフト、動画編集ソフトも豊富

                      Linuxには多くのフリーソフトがある。無料であっても、Windows向け有料ソフトに劣らない機能を持つものもある。厳選したLinuxフリーソフトを100本紹介する。 1 GIMP 商用レベルの多機能な画像編集ソフト 画像の作成や編集、フォトレタッチなどに役立つ、多彩な機能を持つ画像編集アプリです(図1)。レイヤー機能やブラシエディタ、ヒストグラム、ベジェ曲線を使った描画ができるパスツール、さまざまな加工ができるフィルター群など、商用ソフトレベルの充実した機能を持つのが特徴です。

                        Linuxに商用レベルの画像編集フリーソフト、動画編集ソフトも豊富
                      • イーロン・マスク、グーグルのAIを「非常識で人種差別的」と非難 検索も攻撃 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                        米企業家イーロン・マスクは22日、グーグルの対話型人工知能(AI)「Gemini(ジェミニ)」について、偏向した「人種差別主義者」だと非難した。翌23日にはグーグル検索にも攻撃の矛先を向け、同社が2024年米大統領選挙を不正に操作しようとしているとの陰謀論をあおる投稿を行った。 グーグルに対しては、GeminiのAI画像生成機能をめぐり、多様性を意識しすぎているとして激しい反発が起きている。歴史上の人物として生成された画像が、歴史的に不正確な人種や性別で描かれることが発覚し、誤解を招くと批判が殺到。同社は人物画像の生成機能を一時停止すると発表した。 マスクはこうした動きを受け、「問題はGeminiだけでなく、グーグル検索にもある」とX(旧ツイッター)に投稿。グーグルはAI画像生成に関して「勇み足を踏んだ」との見方を示した。 グーグルは不正確な画像生成について、偏向問題に取り組み、表現を改善

                          イーロン・マスク、グーグルのAIを「非常識で人種差別的」と非難 検索も攻撃 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                        • 今後、iphoneユーザーは社会的に信用してもらえなくなるかもしれないヤバい情報、iphoneカメラの画像劣化が酷すぎてスマホの証拠能力が消える可能性

                          たま、👻hantutama @hantutama この画像は去年の10月1日に買ったばかりのiPhone15で試し撮りしてびっくりした画像。 遠景の不鮮明な文字が勝手な解釈で異世界文字に化けてる。 今時のスマホカメラって物凄いAI補正🙄❗️ こんな画像なんて、所謂「絵じゃん」 写真の模写だけは巧みな魂の無い画家が模写した絵。 AI汚染。 厳密な意味で「真実の映像の記録」たり得るのだろうか。 現代から近未来のネット上に溢れる画像の大半は、無数の人類がスマホで写した画像になる。情報汚染された画像情報に… 2024-02-23 09:33:17 ウチューじん・ささき @uchujin17 その中で「惑星探査機が地球に送信してきた惑星の写真は何年もかけて解析しなければならない情報が詰まっているが、それが絵であればどんなに細密で綺麗であっても、科学番組の背景くらいにしか使えない」という文言があっ

                            今後、iphoneユーザーは社会的に信用してもらえなくなるかもしれないヤバい情報、iphoneカメラの画像劣化が酷すぎてスマホの証拠能力が消える可能性
                          • 「Evoto」は課金方法がユニークなポートレート向けAIレタッチソフトだった

                            最近、WebやSNSの広告でときどき見かける「Evoto」というフォトレタッチソフトがある。「AIを駆使したレタッチツール」という触れ込みだが、すでに写真を処理するワークフローが自分なりにできており、なかなか新しいソフトに手を出すにはハードルが高い昨今、気にはなりつつ時間だけが過ぎていた。 スマホのアプリならちょっと手を出して、イマイチだったら削除してって普通にしてるのにね。

                              「Evoto」は課金方法がユニークなポートレート向けAIレタッチソフトだった
                            • 【Unity / URP10.8.1】よく使うシェーダーのテクニックについてメモ (座標まわり)

                              概要 シェーダーの実装を行う上で、個人的に使うことが多いシェーダーのテクニックについてまとめてみようと思います。 環境 Unity 2020.3.32f1 Universal RP 10.8.1 紹介する手法 Transform の position を求める Transform の forward, right, up を求める カメラの前方向ベクトルを求める ビューベクトルを求める 頂点座標から深度値を求める スクリーン座標を求める 頂点を画面奥へずらす 一定の太さのアウトラインを作る 深度値からワールド座標を復元する 手法1. Transform.positionを求める 以下のようなコードで、transform.position (オブジェクトの位置) を取得できます。 float3 worldPosition; worldPosition.x = UNITY_MATRIX_M[0

                                【Unity / URP10.8.1】よく使うシェーダーのテクニックについてメモ (座標まわり)
                              • AIはどこまで無断で学習できるのか。~文化庁の生成AI論点整理(ガイドラインの素案)を読んで - フジイユウジ::ドットネット

                                今日、文化庁は生成AIと著作権保護についてのガイドラインとなる素案を提示しました。(2023/12/20時点。その後の状況については追記をお読みください。) 生成AIでなにが合法でどんなとき違法になるべきか、クリエイターや開発者、ビジネス系のひとなどが議論していますが、多くの生成AI周辺にいる人たち全員に関係あるガイドラインがいままさに検討されているわけです。 朝日新聞ではこう報じています。 文化庁は20日、文化審議会著作権分科会の法制度小委員会に、生成AI(人工知能)によるコンテンツの無断学習は、著作権法で著作権者の許諾が不要とされる「非享受目的」にあたらない場合があるとする「AIと著作権に関する考え方」の素案を示した。生成AIが記事や画像データなどを無断で利用する「ただ乗り」(フリーライド)に懸念の声が上がる中、現行法を厳格に解釈し、歯止めをかけたい考えだ。 朝日新聞デジタルより引用

                                  AIはどこまで無断で学習できるのか。~文化庁の生成AI論点整理(ガイドラインの素案)を読んで - フジイユウジ::ドットネット
                                • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

                                  Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

                                    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
                                  • CUDAによる局所特徴量計算の高速化とソースコード公開 - Fixstars Tech Blog /proc/cpuinfo

                                    このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。 はじめに こんにちは、エンジニアの高木です。 私は現在、adaskitという社内の自動運転関連のオープンソースプロジェクトに携わっており、プロジェクトの成果としてこれまでlibSGMやcuda-bundle-adjustmentなどを公開しています。 今回はVisual SLAMやSfM(Structure from Motion)で行われる局所特徴量計算について、CUDAによる高速化に取り組んだ話を紹介します。また、そのソースコードをcuda-efficient-featuresという名前でGitHubに公開しました。 fixstars/cuda-efficient-features 背景 局所特徴量計算 Visual SLAMやSfMでは、2つの視点間の相対的なカメラ姿勢を推定する

                                      CUDAによる局所特徴量計算の高速化とソースコード公開 - Fixstars Tech Blog /proc/cpuinfo
                                    • コンピュータグラフィクスの空

                                      2020年にEpic GamesのSébastien Hillaire氏が発表した論文「A Scalable and Production Ready Sky and Atmosphere Rendering Technique」を実装してみます これは2023年12月2日に行われた Kernel/VM探検隊@北陸 Part 6 での発表資料です 発表動画: https://youtu.be/YrQ4ACuvM68 ソースコード: https://github.com/Fadis/gct/tree/kernelvm_20231202

                                        コンピュータグラフィクスの空
                                      • 脳内イメージ、生成AIで再現 脳信号読み取り画像化 - 日本経済新聞

                                        量子科学技術研究開発機構(QST)は頭に思い浮かべた風景をコンピューターでディスプレーに復元する技術を開発した。脳の信号を機能的磁気共鳴画像装置 (fMRI)で読み取り、生成AI(人工知能)などを活用して画像に直す。病気で意思疎通が困難な人の意思伝達に使える可能性がある。従来は風景を見ているときの脳の信号を読み取って画像化することはできた。新技術は実際に見ていなくても、頭の中に思い浮かべた風景

                                          脳内イメージ、生成AIで再現 脳信号読み取り画像化 - 日本経済新聞
                                        • Windows 11の「フォト」に背景の除去・置換機能が実装へ ~そのほかにも多くの改善/写真の閲覧を妨げていた「フィルムストリップ」も見直し

                                            Windows 11の「フォト」に背景の除去・置換機能が実装へ ~そのほかにも多くの改善/写真の閲覧を妨げていた「フィルムストリップ」も見直し
                                          • フリーの画像編集ソフト「GIMP 2.10.36」、Adobe製品との互換性向上、脆弱性の修正も/「Windows on Arm」でネイティブ実行できるバージョンも試験提供中

                                              フリーの画像編集ソフト「GIMP 2.10.36」、Adobe製品との互換性向上、脆弱性の修正も/「Windows on Arm」でネイティブ実行できるバージョンも試験提供中
                                            • Meshy | 3D AI Generator

                                              We are going live on Product Hunt soon! Support us by subscribing to our teaser page. 🎉

                                                Meshy | 3D AI Generator
                                              • ChatGPT AIとペアプログラミング

                                                OpenCVを使用して画像から複数のオブジェクトを認識し、切り出すための一般的な手順は以下のようになります: 前処理: 画像を読み込みます。必要に応じて画像をリサイズします。グレースケールに変換するか、あるいは必要に応じて色空間を変更します。オブジェクトの検出: エッジ検出、閾値処理、または色に基づくフィルタリングなどを使用してオブジェクトを検出します。輪郭検出を行い、オブジェクトの境界を見つけます。輪郭の処理: 検出された輪郭をフィルタリングして、ノイズや小さなオブジェクトを除去します。必要に応じて輪郭を近似します。オブジェクトの切り出し: 各オブジェクトの境界ボックスを使用して画像からオブジェクトを切り出します。オブジェクトごとに個別の画像として保存するか、表示します。後処理 (オプション): 切り出されたオブジェクトをさらに処理するためのステップを行います。例えば、オブジェクトのサイ

                                                  ChatGPT AIとペアプログラミング
                                                • 決め手は「QRコード」 都営地下鉄、ホームドア設置もうすぐ100%に 車両改修費20億円→270万円:東京新聞 TOKYO Web

                                                  東京都営地下鉄の駅のホームドア設置率が来年2月までに100%になる。4路線のうち、多くの私鉄が乗り入れる浅草線が最後の難関だったが、スマートフォンでおなじみの技術を生かし、数十億円と見積もられた車両改修費を抑え、低コストで全駅設置にこぎ着けた。その技術とは―。(三宅千智)

                                                    決め手は「QRコード」 都営地下鉄、ホームドア設置もうすぐ100%に 車両改修費20億円→270万円:東京新聞 TOKYO Web
                                                  • 画像処理の入門 - Qiita

                                                    最近、弊社で画像処理の案件が増えているらしく、学生時代に研究でかじっていた私にドンピシャな案件がやってきています。 そこで、画像処理を少しでも知ってもらうように、今回は画像処理の基本であるOpenCVのライブラリを使って簡単な画像処理を実施していきたいと思います。 準備 今回はPythonを使用して、画像処理を行います。Pythonが使用できる環境を用意してください。 ライブラリはOpenCVを使用します。Pythonがインストール出来たら下記のコマンドでライブラリをインストールしてください。

                                                      画像処理の入門 - Qiita
                                                    • 東京大学 3Dスキャン勉強会「フォトグラメトリ」 | ドクセル

                                                      スライド概要 フォトグラメトリの基礎、基本的な撮影方法や事例。 RealityCaptureを用いたフォトグラメトリ処理やコンテンツ作成方法を解説。 撮影効率を優先した360度カメラの動画を用いたノウハウも紹介。 ・フォトグラメトリとは? ・事例紹介 ・ワークフロー紹介 ・フォトグラメトリ足運び紹介 ・360度カメラの活用 ・フォトグラメトリ処理デモ ・フォトグラメトリ以外の空間再現技術への活用 / 機材紹介 / 制作環境紹介 講義の録画はこちら:https://t.co/194x5BXyFW

                                                        東京大学 3Dスキャン勉強会「フォトグラメトリ」 | ドクセル
                                                      • イラレの生成AIが凄いので Live - 2023/10/11 Adobe MAX 2023|CreativeEdge Vlog

                                                        Adobe Illustraor 28.0に搭載された生成AI(ベクターグラフィックの生成)が衝撃的だったので、このページにまとめていきます。 イラレの生成AIの探求は以下の新しいページに掲載しています 新しいイラレ生成AI関連ページイラレの生成AIでハロウィンのイラストを描こう! イラレの生成AIでイラストを描くLive - 2023/10/14-15 Adobe Illustrator「イラレの生成AIを探求する」ライブ配信 イラレで生成したベクターグラフィック本日からロスアンゼルスでAdobe MAX 2023がスタートしましたが、遂にAdobe Illustrator(バージョン28.0)に「テキストからベクター生成 (Beta)」が実装されました。Adobe Fireflyのベータ版が登場した時から待機リストに掲載されていたので、いつ搭載されるのか注目していました。 参考:Ill

                                                          イラレの生成AIが凄いので Live - 2023/10/11 Adobe MAX 2023|CreativeEdge Vlog
                                                        • AI Emoji Generator

                                                          Turn your ideas into emojis in seconds. Generate your favorite Slack emojis with just one click.

                                                            AI Emoji Generator
                                                          • 失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確

                                                            写真を撮影していると「写真Aは人物の顔が見切れて、写真Bは顔が写ったけど逆光で暗すぎる」といったようにベストショットを撮影できないことがよくあります。Googleとコーネル大学の研究チームが開発したAI「RealFill」を使えば、複数の失敗写真をもとにベストショットを後から作り出せるとのことです。 RealFill https://realfill.github.io/ RealFillによる処理例はこんな感じ。以下の画像の左側が処理に用いる参考画像で、右側が参考画像をもとに生成されたベストショットです。参考画像には全身画像や背景が写る写真が含まれており、それぞれの要素をもとにベストショットが生成されています。 以下の例では、参考画像に「逆光ではないものの狭い写真」や「広範囲を写したものの逆光になった写真」が含まれており、参考画像をもとに広範囲かつ逆光ではない写真が生成されています。 以

                                                              失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確
                                                            • モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用

                                                              画像のノイズ除去やボケ除去、超解像といった従来の画像修復問題は、特定の劣化状態、既知の単純な劣化にのみ効果的であった。 これに対して、実際の環境下での多様な劣化を考慮した「Blind Image Restoration」(BIR)という手法が注目されている。BIRは、一般的な画像と、それが持つさまざまな劣化に対して、リアルな画像再構築を目指している。特に、BIRの研究は以下の3つのカテゴリーに分けられる。 (1)Blind Image Super-Resolution(BSR):低解像度で劣化が不明瞭な画像の超解像問題に取り組む技術、(2)Zero-Shot Image Restoration(ZIR):これは新しい研究の方向性で、劣化の前提条件を明確に定義した上で、クラシックな画像修復タスクで印象的なゼロショット復元を達成する方法、(3)Blind Face Restoration(BF

                                                                モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用
                                                              • GitHub - sczhou/ProPainter: [ICCV 2023] ProPainter: Improving Propagation and Transformer for Video Inpainting

                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                  GitHub - sczhou/ProPainter: [ICCV 2023] ProPainter: Improving Propagation and Transformer for Video Inpainting
                                                                • ラスター画像をベクター変換するAIツール「Vectorizer.AI」が便利すぎた

                                                                  デジタルプロダクション「factory4」でアプリやさまざまなIoTプロジェクトのUIUXデザインを手がける新谷友樹さんが、UIやUXにまつわるトピックについて解説する本連載。今回は「Vectorizer.AI」についてです。 こんにちは!株式会社Cosmowayが組織するデジタルプロダクション「factory4」のUIUXデザイナー新谷です。 今回は以前、AIを活用したロゴ作成に関する記事で少し触れた「Vectorizer.AI」について深掘りしていきたいと思います。 この一年でプロンプトを打ち込むチャット型AIツール「ChatGTP」や、画像生成系のAIツール「Midjourney」「Stable Diffusion」などさまざまなAIサービスが登場しています。そのなかでも「Vectorizer.AI」は、ほかとは少し違う角度のAIサービスではないでしょうか。簡単に言ってしまえば、JP

                                                                    ラスター画像をベクター変換するAIツール「Vectorizer.AI」が便利すぎた
                                                                  • グーグルがAI生成画像に電子透かし、大手テック企業で初

                                                                    生成AIが爆発的に広がる中、AI生成画像による被害が広がっている。AI生成画像に「電子透かし」を入れるツールを、グーグルが大手テック企業としては初めてサービスに組み込んだ。 by Melissa Heikkilä2023.09.05 11 14 グーグル・ディープマインドは、画像が人工知能(AI)によって生成されたものかどうかを示す、新しい電子透かし(ウォーターマーク)ツールをリリースした。 シンスID(SynthID)と呼ばれるこのツールは、当初はグーグル・クラウドの機械学習プラットフォームであるバーテックス(Vertex)でホストされているAI画像生成ツール、イメージェン(Imagen)のユーザーのみ利用できる。ユーザーはイメージェンを使って画像を生成し、透かしを入れるかどうかを選択できる。この透かしにより、AI生成コンテンツが本物と偽装されている場合に識別したり、著作権を保護するのに

                                                                      グーグルがAI生成画像に電子透かし、大手テック企業で初
                                                                    • AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた

                                                                      画像生成AIにイラストや写真を学習させることを防ぐため、「Mist」などを使って画像に敵対的サンプルと呼ばれるノイズを入れる方法があります。この敵対的サンプルによるノイズを画像から除去するためのツール「AdverseCleaner」が登場しています。 GitHub - lllyasviel/AdverseCleaner: Remove adversarial noise from images https://github.com/lllyasviel/AdverseCleaner AdverseCleanerはHugging Faceで公開されており、実際に試してみることができます。 AdverseCleaner - a Hugging Face Space by p1atdev https://huggingface.co/spaces/p1atdev/AdverseCleaner 今

                                                                        AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
                                                                      • 無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」

                                                                        動画や音声を記録・変換・再生するためのフリーソフト「FFmepg」はシェルでコマンドを入力することでさまざまな処理を実行できます。FFmpegにはさまざまなフィルタリングライブラリが存在しますが、GUIを持たないツールであるため、フィルターをかけるとどんな出力結果になるのかをプレビューすることはできません。「FFmpeg Explorer」はブラウザ上でフィルターをブラウザ上で試してどんな結果になるのかをチェックし、さらに手元で実行するためのコマンドも出力してくれるウェブツールです。 FFmpeg Explorer! https://ffmpeg.lav.io/ FFmpeg Explorerにアクセスするとこんな感じ。中央下段にあるのは入力動画と出力動画で、指定したフィルターがどのように重なっていくのかが図で示される仕組み。サンプルとなる入力動画は、ネオナチ指導者のリチャード・B・スペン

                                                                          無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」
                                                                        • 「ひかり拓本」アプリ完成、風化した石碑の文字・模様がくっきり浮かび上がる…奈文研など開発

                                                                          【読売新聞】 風化した石碑に光を照射するなどして文字や文様を浮かび上がらせる技術「ひかり拓本」のアプリが完成した。奈良市の奈良文化財研究所などが開発し、アプリ化の資金を募ったクラウドファンディング(CF)で目標額を達成。専門の技術を

                                                                            「ひかり拓本」アプリ完成、風化した石碑の文字・模様がくっきり浮かび上がる…奈文研など開発
                                                                          • Ideogram

                                                                            Ideogram v0.1 is open to everyone for free — August 29, 2023 Today, we're opening Ideogram to everyone on the planet! Ideogram enables you to turn your creative ideas into delightful images, in a matter of seconds. It's free and has no limits, and it can render text! Sign up at https://ideogram.ai and start creating images from text, and get inspired by the creativity of others. Ideogram (pronounc

                                                                              Ideogram
                                                                            • 画像生成AI、3Dホログラムにも革命起こす? - 週刊アスキー

                                                                              Looking Glass PortraitにMidjouneyで作成した画像を表示したところ。静止画では伝わらないが、実物では階段の奥行きの立体感がしっかりと出ている(筆者作成) 2021年に個人的に入手したガジェット類でとても気に入っており、いまだに使い続けているハードがあります。米Looking Glassの「Looking Glass Portrait」です。それはStable Diffusionとの組み合わせによって、その潜在能力が大きく広がったためです。 Stable DiffusionがLooking Glassの可能性を広げた Looking Glass Portraitは、「ライトフィールド」と呼ばれる裸眼立体視を実現する同社の第2世代ディスプレー。第1世代に比べて、軽量化されたとともに表示領域が広がっています。3Dモデルを45~100通りの角度から見た画像に表示して、屈

                                                                                画像生成AI、3Dホログラムにも革命起こす? - 週刊アスキー
                                                                              • 【全体公開】AIイラストが理解る!StableDiffusion超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX

                                                                                こちらの記事は2023年版のものです。特に理由がなければ、SDXLやForgeにも対応した2024年版の「AIイラストが理解る」をお読みくださいませ。 こんにちは!2022年10月からAIイラストの技術解説記事を連載してます、サークル「スタジオ真榊」の賢木イオです。この記事は、これまで投稿してきた100本(約40万文字)を超える...

                                                                                  【全体公開】AIイラストが理解る!StableDiffusion超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX
                                                                                • Dynamic 3D Gaussians:Tracking by Persistent Dynamic View Synthesis

                                                                                  1Carnegie Mellon University, USA 2RWTH Aachen University, Germany 3Inria & Universite Cote d’Azur, France Abstract We present a method that simultaneously addresses the tasks of dynamic scene novel-view synthesis and six degree-of-freedom (6-DOF) tracking of all dense scene elements. We follow an analysis-by-synthesis framework, inspired by recent work that models scenes as a collection of 3D Gaus