並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 59件

新着順 人気順

画像処理の検索結果1 - 40 件 / 59件

  • ChatGPT AIとペアプログラミング

    OpenCVを使用して画像から複数のオブジェクトを認識し、切り出すための一般的な手順は以下のようになります: 前処理: 画像を読み込みます。必要に応じて画像をリサイズします。グレースケールに変換するか、あるいは必要に応じて色空間を変更します。オブジェクトの検出: エッジ検出、閾値処理、または色に基づくフィルタリングなどを使用してオブジェクトを検出します。輪郭検出を行い、オブジェクトの境界を見つけます。輪郭の処理: 検出された輪郭をフィルタリングして、ノイズや小さなオブジェクトを除去します。必要に応じて輪郭を近似します。オブジェクトの切り出し: 各オブジェクトの境界ボックスを使用して画像からオブジェクトを切り出します。オブジェクトごとに個別の画像として保存するか、表示します。後処理 (オプション): 切り出されたオブジェクトをさらに処理するためのステップを行います。例えば、オブジェクトのサイ

      ChatGPT AIとペアプログラミング
    • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

      Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

        画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
      • 雑コラをAIでリアルにする!|Katsushiro Koizumi

        先日公開したアニメ絵の実写版を作る記事はおかげさまで好評でした! アニメ絵生成の第二弾に行く前に、アニメ絵実写版生成でも威力を発揮する「雑コラ」をAIでリアルにする手法について今回は説明します。 実はAIアートグランプリの時も「雑コラ」と言われたりしていたのでしたw 渚の妖精ぎばさちゃん対キモノアゲハ/koizoom1/漫画@gibasachan 雑コラに見えるけど すごい技術 登場人物より多いモデル これはゆるキャラの未来きたな…#AIArtGp pic.twitter.com/5A4wMUJsND — Dr.(Shirai)Hakase #AI神絵師本 #技術書典14 (@o_ob) March 12, 2023 AIといえばラーメン(?)ですが、こんな画像も作れちゃいます!ラーメンの中にいる秘書さん! ラーメンの中にいる秘書さん絵面としては結構インパクトがありますが、実は作るのは全然

          雑コラをAIでリアルにする!|Katsushiro Koizumi
        • 【全体公開】AIイラストが理解る!StableDiffusion超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX

          こちらの記事は2023年版のものです。特に理由がなければ、SDXLやForgeにも対応した2024年版の「AIイラストが理解る」をお読みくださいませ。 こんにちは!2022年10月からAIイラストの技術解説記事を連載してます、サークル「スタジオ真榊」の賢木イオです。この記事は、これまで投稿してきた100本(約40万文字)を超える...

            【全体公開】AIイラストが理解る!StableDiffusion超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX
          • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

            画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

              画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
            • 「これはヤバい」「写真を何百枚も撮る必要がなくなる」 ドラッグするだけで自由自在に画像編集できるAIツール「DragGAN」|ガジェット通信 GetNews

              https://twitter.com/AiBreakfast/status/1659601613739409409 「DragGAN」のデモ動画を視聴した人たちからは驚きの声が多くあがっているようです。 ・AIって結局進化したPhotoshopってことでいいんだよね ・写真を何百枚も撮る必要がなくなる ・すごいツールが出てきたもんだ ・これはヤバい ・アドビがこの技術を買い取るだろうな ・真実を捻じ曲げる新たな技術 ・完成まで1年もかからないだろう ・すべて人工的で表面的 ・このツールがPhotoshopもデートアプリも破壊する ・これってマジネタ? ・いろんな意味ですごい可能性を感じるツールだ ※画像:Twitterより引用 https://twitter.com/_akhaliq/status/1659424744490377217 ※ソース: https://arxiv.org/p

                「これはヤバい」「写真を何百枚も撮る必要がなくなる」 ドラッグするだけで自由自在に画像編集できるAIツール「DragGAN」|ガジェット通信 GetNews
              • すごい時代がきた 「おっさんの映像をリアルタイムで美女に変換する」AI技術が予想のはるか上行くクオリティー

                リアルタイムでおっさんから美女の映像を作り出すAI実験が、「す、すごすぎる!」「ライブでしたらだまされるレベル」と話題になっています。 す、すげーーー! 実験をしているのは、3DアーティストのHirokazu Yokoharaさん(@Yokohara_h)。Twitterに変換前後の映像を並べた動画を投稿しました。 その結果は驚くべきもの。動きが少々カクカクしているものの、Web会議を通じてであれば本物と信じてしまいそうなレベルです。 動作はもちろん、表情も追従。さらに顔だけでなく体形まで女性らしくなっています。髪形は、黒いTシャツをかぶることでロングヘアに変換させました。Tシャツの柄などがときどき変わってしまうので、よく見ていればおかしいと思えますが、ボーッと見ていたらわからないでしょう。ましてや、中身がおっさんなんて絶対に思えない! 黒いTシャツをかぶり、ロングヘアーを再現させました

                  すごい時代がきた 「おっさんの映像をリアルタイムで美女に変換する」AI技術が予想のはるか上行くクオリティー
                • 漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版|Anno Takahiro

                  画像生成AIの躍進が目覚ましい。エンジニア兼SF作家の筆者としては、AIが絵を描けるようになるのなら、絵が描けない自分でも漫画制作ができるようになるのではという期待があった。実際に2022年の末頃にはstable diffusionを使った漫画制作UIのプロトタイプを作ってみたこともある。 Google ColabでAI漫画制作用のUIを試作してみた。コマごとにプロンプトが割り当ててあって、AIが裏でたくさん選択肢を作りまくってくれる。人間が大量の絵からベストなものを選んだり、構図やセリフの調整に集中できるようなワークフローがいいのではないかという仮説 #stablediffusion pic.twitter.com/zI64zm3cNI — 安野貴博 (@takahiroanno) November 10, 2022 それから半年以上の月日が経ち、世の中でもMulti ControlNe

                    漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版|Anno Takahiro
                  • 中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!

                    インターネット上である投稿が話題だ。それは特定の中国メーカーのスマートフォンでかつ、特定の場面で「消しゴムマジック」に準ずる機能を利用しようとすると「利用できない」というものだ。 その場面とは、北京にある天安門広場だ。北京の有名な観光地であるとともに、中国の歴史的な行事などで幾度も舞台になった場所だ。過去に天安門事件が起こった場所でもあることから、反政府的なデモを防ぐ目的で多くの警備兵が配置されていることでも知られる。 前述の反政府的なデモ防ぐ目的から、インターネット上でも、検閲が厳しい場所としても知られている。中国のネットユーザが天安門広場に飾られる毛沢東氏の肖像画を消した画像でも投稿してしまえば、そのアカウントはあっという間に凍結されてしまう。 今回フォロワーのなしみるく様よりこの2枚の写真を提供いただきました。 @Hayaponlog お疲れ様です🙏 Huawei機で天安門の写真で

                      中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!
                    • 決め手は「QRコード」 都営地下鉄、ホームドア設置もうすぐ100%に 車両改修費20億円→270万円:東京新聞 TOKYO Web

                      東京都営地下鉄の駅のホームドア設置率が来年2月までに100%になる。4路線のうち、多くの私鉄が乗り入れる浅草線が最後の難関だったが、スマートフォンでおなじみの技術を生かし、数十億円と見積もられた車両改修費を抑え、低コストで全駅設置にこぎ着けた。その技術とは―。(三宅千智)

                        決め手は「QRコード」 都営地下鉄、ホームドア設置もうすぐ100%に 車両改修費20億円→270万円:東京新聞 TOKYO Web
                      • AIはどこまで無断で学習できるのか。~文化庁の生成AI論点整理(ガイドラインの素案)を読んで - フジイユウジ::ドットネット

                        今日、文化庁は生成AIと著作権保護についてのガイドラインとなる素案を提示しました。(2023/12/20時点。その後の状況については追記をお読みください。) 生成AIでなにが合法でどんなとき違法になるべきか、クリエイターや開発者、ビジネス系のひとなどが議論していますが、多くの生成AI周辺にいる人たち全員に関係あるガイドラインがいままさに検討されているわけです。 朝日新聞ではこう報じています。 文化庁は20日、文化審議会著作権分科会の法制度小委員会に、生成AI(人工知能)によるコンテンツの無断学習は、著作権法で著作権者の許諾が不要とされる「非享受目的」にあたらない場合があるとする「AIと著作権に関する考え方」の素案を示した。生成AIが記事や画像データなどを無断で利用する「ただ乗り」(フリーライド)に懸念の声が上がる中、現行法を厳格に解釈し、歯止めをかけたい考えだ。 朝日新聞デジタルより引用

                          AIはどこまで無断で学習できるのか。~文化庁の生成AI論点整理(ガイドラインの素案)を読んで - フジイユウジ::ドットネット
                        • イラレの生成AIが凄いので Live - 2023/10/11 Adobe MAX 2023|CreativeEdge Vlog

                          Adobe Illustraor 28.0に搭載された生成AI(ベクターグラフィックの生成)が衝撃的だったので、このページにまとめていきます。 イラレの生成AIの探求は以下の新しいページに掲載しています 新しいイラレ生成AI関連ページイラレの生成AIでハロウィンのイラストを描こう! イラレの生成AIでイラストを描くLive - 2023/10/14-15 Adobe Illustrator「イラレの生成AIを探求する」ライブ配信 イラレで生成したベクターグラフィック本日からロスアンゼルスでAdobe MAX 2023がスタートしましたが、遂にAdobe Illustrator(バージョン28.0)に「テキストからベクター生成 (Beta)」が実装されました。Adobe Fireflyのベータ版が登場した時から待機リストに掲載されていたので、いつ搭載されるのか注目していました。 参考:Ill

                            イラレの生成AIが凄いので Live - 2023/10/11 Adobe MAX 2023|CreativeEdge Vlog
                          • 天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ

                            出典:Flickr / Tatsuo Yamashita (CC BY 2.0 DEED)ホンダのADAS「Honda SENSING(ホンダセンシング)」による「天一騒動」が再燃しているようだ。ホンダセンシングが、ラーメンチェーン「天下一品」の企業ロゴを「車両進入禁止」の道路標識に誤認識してしまう案件だが、ローソンが「天下一品こってりフェア」を開催したことで「遭遇率」が高まり、再び話題となっているようだ。 この誤認識による本質的なトラブル事例は出ておらず、あくまで「ネタ」としてトピック化されているわけだが、こうした事案が自動運転レベル3以降で発生すると厄介だ。 ■天下一品のロゴが車両進入禁止標識に酷似している件標識認識機能が「ネタ」に……天下一品の企業ロゴは、赤い丸枠に筆で描いたような「一」の字が白抜きで刻まれたものだ。このロゴが、赤い丸枠に白抜きで横線を入れた「車両進入禁止」の標識と酷

                              天下一品のロゴ、ホンダ車が「進入禁止」と再び誤認識 | 自動運転ラボ
                            • モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用

                              画像のノイズ除去やボケ除去、超解像といった従来の画像修復問題は、特定の劣化状態、既知の単純な劣化にのみ効果的であった。 これに対して、実際の環境下での多様な劣化を考慮した「Blind Image Restoration」(BIR)という手法が注目されている。BIRは、一般的な画像と、それが持つさまざまな劣化に対して、リアルな画像再構築を目指している。特に、BIRの研究は以下の3つのカテゴリーに分けられる。 (1)Blind Image Super-Resolution(BSR):低解像度で劣化が不明瞭な画像の超解像問題に取り組む技術、(2)Zero-Shot Image Restoration(ZIR):これは新しい研究の方向性で、劣化の前提条件を明確に定義した上で、クラシックな画像修復タスクで印象的なゼロショット復元を達成する方法、(3)Blind Face Restoration(BF

                                モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用
                              • 今後、iphoneユーザーは社会的に信用してもらえなくなるかもしれないヤバい情報、iphoneカメラの画像劣化が酷すぎてスマホの証拠能力が消える可能性

                                たま、👻hantutama @hantutama この画像は去年の10月1日に買ったばかりのiPhone15で試し撮りしてびっくりした画像。 遠景の不鮮明な文字が勝手な解釈で異世界文字に化けてる。 今時のスマホカメラって物凄いAI補正🙄❗️ こんな画像なんて、所謂「絵じゃん」 写真の模写だけは巧みな魂の無い画家が模写した絵。 AI汚染。 厳密な意味で「真実の映像の記録」たり得るのだろうか。 現代から近未来のネット上に溢れる画像の大半は、無数の人類がスマホで写した画像になる。情報汚染された画像情報に… 2024-02-23 09:33:17 ウチューじん・ささき @uchujin17 その中で「惑星探査機が地球に送信してきた惑星の写真は何年もかけて解析しなければならない情報が詰まっているが、それが絵であればどんなに細密で綺麗であっても、科学番組の背景くらいにしか使えない」という文言があっ

                                  今後、iphoneユーザーは社会的に信用してもらえなくなるかもしれないヤバい情報、iphoneカメラの画像劣化が酷すぎてスマホの証拠能力が消える可能性
                                • 3D生成AIサービスの現在地|nakashun

                                  GenerativeAIをゲーム開発に活用する方法Tipsのマガジンゲーム開発AI Lab. Witchpotに含まれる記事です ゲームづくりを前提に書かれています このnoteでは観測範囲で試すことのできるサービスを実際に使用した結果などを比較していきます 追記1「見た目以外のモデル詳細も知りたい」とのコメントを頂いたので、詳細をこちら↓にまとめました!興味がありましたら合わせてご覧ください! 追記2日本時間8/22にCSMが有料サブスクリプションプランが追加されました CSMでは使用可能な学習モデルが選択可能でこの記事でCSMの項目で紹介している3Dモデルは現在の有料プランに相当する学習モデルを使用して生成されています 要約純粋な3D生成ではCSMが最もクオリティが高そう ただしメッシュはぼこぼこになることが多く後処理が必用 「Swordのみ」など生成可能なオブジェクトタイプを限定した

                                    3D生成AIサービスの現在地|nakashun
                                  • 【速報】次世代の外観検査!?プロンプトを駆使した異常検知 - Qiita

                                    先日、革新的な画像の異常検知(SAA)が出てきました。 何やら革命的な臭いがする... SAMを使った異常検知手法https://t.co/wmwFcbULdq コードはこちらhttps://t.co/3npK3FhnEz pic.twitter.com/JDs30bEJyQ — shinmura0 (@shinmura0) May 22, 2023 本稿では、操作手順 & 触ってみた感想をご報告します。 特長 本題に入る前に、どこら辺が革新的なのかざっくり説明します。 ※ SAAの詳細は論文をご参照ください。 学習データは不要 通常、学習(正常)データを数百枚用意しますが、この手法では正常データを必要としません。 ドメイン知識を導入できる 予め、異常の傾向をプロンプトに入れることにより、異常の特徴をモデルに教えることができます。 二点目が特に大きく、今までの異常検知では、積極的に異常の傾

                                      【速報】次世代の外観検査!?プロンプトを駆使した異常検知 - Qiita
                                    • 「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される

                                      AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。 GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023) https://github.com/XingangPan/DragGAN Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold https://vcai.mpi-inf.mpg.

                                        「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される
                                      • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                        昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                          OpenAIのGPT-4oを日本語OCRとして使ってみる
                                        • Clipdrop - Uncrop

                                          Easily generate and extend the body or backgrounds in your cherished photos, allowing you to breathe new life into your portraits. Try with this example Whether you're a professional artist or a hobbyist, this tool will help you expand your artwork and bring your vision to life. Try with this example Whether you're working with wood, fabric, metal, or any other texture, our app allows you to resca

                                            Clipdrop - Uncrop
                                          • 生成AI版キンタマウィルス『モリス2』、画像や文字列に埋め込まれたプロンプトから、データ流出、スパム送信、マルウェア拡散、研究者がgoogleなどに警告

                                            banshee(おおかみ) @higan_wafu winnyの時もなかなか規制進まなかったのでAntinnyというウイルスがばら撒かれた ワームってどっちも書いてるし似た構造じゃないかな 日本だと2007年に警視庁の個人情報データ流出。被害届の内容とか捜査リストとかいう一般人に知られたらダメなのが出回った 警視庁がwinny使うなよって思うが、生成AIも同じ道辿るのかな 詐欺師を食うクロサギってのがあるが、誰かを食い物にする悪人は誰かに食われる危険性もあるって覚悟すべきなんだろうな 気軽な気持ちで人の道を外れちゃいけないと思う 2024-03-12 15:32:43

                                              生成AI版キンタマウィルス『モリス2』、画像や文字列に埋め込まれたプロンプトから、データ流出、スパム送信、マルウェア拡散、研究者がgoogleなどに警告
                                            • 失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確

                                              写真を撮影していると「写真Aは人物の顔が見切れて、写真Bは顔が写ったけど逆光で暗すぎる」といったようにベストショットを撮影できないことがよくあります。Googleとコーネル大学の研究チームが開発したAI「RealFill」を使えば、複数の失敗写真をもとにベストショットを後から作り出せるとのことです。 RealFill https://realfill.github.io/ RealFillによる処理例はこんな感じ。以下の画像の左側が処理に用いる参考画像で、右側が参考画像をもとに生成されたベストショットです。参考画像には全身画像や背景が写る写真が含まれており、それぞれの要素をもとにベストショットが生成されています。 以下の例では、参考画像に「逆光ではないものの狭い写真」や「広範囲を写したものの逆光になった写真」が含まれており、参考画像をもとに広範囲かつ逆光ではない写真が生成されています。 以

                                                失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確
                                              • AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた

                                                画像生成AIにイラストや写真を学習させることを防ぐため、「Mist」などを使って画像に敵対的サンプルと呼ばれるノイズを入れる方法があります。この敵対的サンプルによるノイズを画像から除去するためのツール「AdverseCleaner」が登場しています。 GitHub - lllyasviel/AdverseCleaner: Remove adversarial noise from images https://github.com/lllyasviel/AdverseCleaner AdverseCleanerはHugging Faceで公開されており、実際に試してみることができます。 AdverseCleaner - a Hugging Face Space by p1atdev https://huggingface.co/spaces/p1atdev/AdverseCleaner 今

                                                  AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
                                                • イーロン・マスク、グーグルのAIを「非常識で人種差別的」と非難 検索も攻撃 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                                                  米企業家イーロン・マスクは22日、グーグルの対話型人工知能(AI)「Gemini(ジェミニ)」について、偏向した「人種差別主義者」だと非難した。翌23日にはグーグル検索にも攻撃の矛先を向け、同社が2024年米大統領選挙を不正に操作しようとしているとの陰謀論をあおる投稿を行った。 グーグルに対しては、GeminiのAI画像生成機能をめぐり、多様性を意識しすぎているとして激しい反発が起きている。歴史上の人物として生成された画像が、歴史的に不正確な人種や性別で描かれることが発覚し、誤解を招くと批判が殺到。同社は人物画像の生成機能を一時停止すると発表した。 マスクはこうした動きを受け、「問題はGeminiだけでなく、グーグル検索にもある」とX(旧ツイッター)に投稿。グーグルはAI画像生成に関して「勇み足を踏んだ」との見方を示した。 グーグルは不正確な画像生成について、偏向問題に取り組み、表現を改善

                                                    イーロン・マスク、グーグルのAIを「非常識で人種差別的」と非難 検索も攻撃 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                                                  • Go/Cgoで映像・音声のリアルタイム処理をやるまでの道のり - Go Conference 2023

                                                    Go Conference 2023 Room A : A7-L https://gocon.jp/2023/sessions/A7-L/

                                                      Go/Cgoで映像・音声のリアルタイム処理をやるまでの道のり - Go Conference 2023
                                                    • AI Emoji Generator

                                                      Turn your ideas into emojis in seconds. Generate your favorite Slack emojis with just one click.

                                                        AI Emoji Generator
                                                      • Linuxに商用レベルの画像編集フリーソフト、動画編集ソフトも豊富

                                                        Linuxには多くのフリーソフトがある。無料であっても、Windows向け有料ソフトに劣らない機能を持つものもある。厳選したLinuxフリーソフトを100本紹介する。 1 GIMP 商用レベルの多機能な画像編集ソフト 画像の作成や編集、フォトレタッチなどに役立つ、多彩な機能を持つ画像編集アプリです(図1)。レイヤー機能やブラシエディタ、ヒストグラム、ベジェ曲線を使った描画ができるパスツール、さまざまな加工ができるフィルター群など、商用ソフトレベルの充実した機能を持つのが特徴です。

                                                          Linuxに商用レベルの画像編集フリーソフト、動画編集ソフトも豊富
                                                        • 100均のセリアのロゴ、日産車が「100キロ制限」と誤認識 | 自動運転ラボ

                                                          ■Xに投稿された誤認識の事例具体的なXの投稿は以下の通りだ。「コイツ100均の看板を道路標識と勘違いしてるwww」といった投稿だ。確かにセリアの看板にある100の数字を最高制限速度100キロの標識と誤認識しているようだ。 コイツ100均の看板を道路標識と勘違いしてるwww pic.twitter.com/Lh8gLsLfyD — CUE (@CueHhon) July 17, 2023

                                                            100均のセリアのロゴ、日産車が「100キロ制限」と誤認識 | 自動運転ラボ
                                                          • ラスター画像をベクター変換するAIツール「Vectorizer.AI」が便利すぎた

                                                            デジタルプロダクション「factory4」でアプリやさまざまなIoTプロジェクトのUIUXデザインを手がける新谷友樹さんが、UIやUXにまつわるトピックについて解説する本連載。今回は「Vectorizer.AI」についてです。 こんにちは!株式会社Cosmowayが組織するデジタルプロダクション「factory4」のUIUXデザイナー新谷です。 今回は以前、AIを活用したロゴ作成に関する記事で少し触れた「Vectorizer.AI」について深掘りしていきたいと思います。 この一年でプロンプトを打ち込むチャット型AIツール「ChatGTP」や、画像生成系のAIツール「Midjourney」「Stable Diffusion」などさまざまなAIサービスが登場しています。そのなかでも「Vectorizer.AI」は、ほかとは少し違う角度のAIサービスではないでしょうか。簡単に言ってしまえば、JP

                                                              ラスター画像をベクター変換するAIツール「Vectorizer.AI」が便利すぎた
                                                            • ゲームをリマスターする時の“小さい2D素材”はどうすればいいの?圧縮ソフトだったはずがリマスター手法として人気が出てきたImageStudioの現在地 - AUTOMATON

                                                              CRI・ミドルウェアから発売されている「OPTPiX ImageStudio ®8」。画像の軽量化などに使う画像最適化ツールとして、長きにわたり愛されてきた。その「OPTPiX ImageStudio 8」(以下、ImageStudio 8)はどうやら最近、最適化以外の分野で重宝されているという。現在重宝されているのは、素材のリマスターだ。 同ソフトでは現在、リマスター機能が搭載されている。機械学習のリマスター機能によって、高精細なHD化画像を自動で生成可能となっている。この超解像度と呼ばれる機能は、どのような仕組みなのか。あるいは、導入においてどのような使われ方をしているのか。CRI・ミドルウェアのスタッフに話をうかがった。実際の使用事例をまじえて、「ImageStudio 8」の現在地をお伝えする。 OPTPiX ImageStudio 8の詳細はこちら 問い合わせはこちらから 14日

                                                                ゲームをリマスターする時の“小さい2D素材”はどうすればいいの?圧縮ソフトだったはずがリマスター手法として人気が出てきたImageStudioの現在地 - AUTOMATON
                                                              • 無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」

                                                                動画や音声を記録・変換・再生するためのフリーソフト「FFmepg」はシェルでコマンドを入力することでさまざまな処理を実行できます。FFmpegにはさまざまなフィルタリングライブラリが存在しますが、GUIを持たないツールであるため、フィルターをかけるとどんな出力結果になるのかをプレビューすることはできません。「FFmpeg Explorer」はブラウザ上でフィルターをブラウザ上で試してどんな結果になるのかをチェックし、さらに手元で実行するためのコマンドも出力してくれるウェブツールです。 FFmpeg Explorer! https://ffmpeg.lav.io/ FFmpeg Explorerにアクセスするとこんな感じ。中央下段にあるのは入力動画と出力動画で、指定したフィルターがどのように重なっていくのかが図で示される仕組み。サンプルとなる入力動画は、ネオナチ指導者のリチャード・B・スペン

                                                                  無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」
                                                                • 東京大学 3Dスキャン勉強会「フォトグラメトリ」 | ドクセル

                                                                  スライド概要 フォトグラメトリの基礎、基本的な撮影方法や事例。 RealityCaptureを用いたフォトグラメトリ処理やコンテンツ作成方法を解説。 撮影効率を優先した360度カメラの動画を用いたノウハウも紹介。 ・フォトグラメトリとは? ・事例紹介 ・ワークフロー紹介 ・フォトグラメトリ足運び紹介 ・360度カメラの活用 ・フォトグラメトリ処理デモ ・フォトグラメトリ以外の空間再現技術への活用 / 機材紹介 / 制作環境紹介 講義の録画はこちら:https://t.co/194x5BXyFW

                                                                    東京大学 3Dスキャン勉強会「フォトグラメトリ」 | ドクセル
                                                                  • フリーの画像編集ソフト「GIMP 2.10.36」、Adobe製品との互換性向上、脆弱性の修正も/「Windows on Arm」でネイティブ実行できるバージョンも試験提供中

                                                                      フリーの画像編集ソフト「GIMP 2.10.36」、Adobe製品との互換性向上、脆弱性の修正も/「Windows on Arm」でネイティブ実行できるバージョンも試験提供中
                                                                    • 【Conference Projector】OpenAI API を使って CVPR 2023 全体を眺めるWebサイトを作成した - IrohaLog

                                                                      概要 CVPR 2023 会議全体を可視化したグラフを眺めながら論文検索できるWebサイトを作成したので紹介します。 会議に採択された論文全体を可視化したグラフから、 カテゴリやアプリケーションが近い論文を探せます。 テキスト検索ではない方法で、広い視野で論文を探せます。 会議全体で盛り上がっている分野や、逆にニッチな分野を把握することもにも役立ちます。 研究テーマを模索している方や、広い視野で業界動向を知りたい方におすすめです。 yuukicammy--conference-projector-wrapper.modal.run 概要 はじめに Conference Projector で何ができるか システム概要 実装詳細 (1) スクレイピング (2) カテゴリ、アプリケーションなどのテキスト生成 (3) Embedding (4) PDFからの画像抽出 (5) 次元圧縮 (6) K

                                                                        【Conference Projector】OpenAI API を使って CVPR 2023 全体を眺めるWebサイトを作成した - IrohaLog
                                                                      • CUDAによる局所特徴量計算の高速化とソースコード公開 - Fixstars Tech Blog /proc/cpuinfo

                                                                        このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。 はじめに こんにちは、エンジニアの高木です。 私は現在、adaskitという社内の自動運転関連のオープンソースプロジェクトに携わっており、プロジェクトの成果としてこれまでlibSGMやcuda-bundle-adjustmentなどを公開しています。 今回はVisual SLAMやSfM(Structure from Motion)で行われる局所特徴量計算について、CUDAによる高速化に取り組んだ話を紹介します。また、そのソースコードをcuda-efficient-featuresという名前でGitHubに公開しました。 fixstars/cuda-efficient-features 背景 局所特徴量計算 Visual SLAMやSfMでは、2つの視点間の相対的なカメラ姿勢を推定する

                                                                          CUDAによる局所特徴量計算の高速化とソースコード公開 - Fixstars Tech Blog /proc/cpuinfo
                                                                        • 「ひかり拓本」アプリ完成、風化した石碑の文字・模様がくっきり浮かび上がる…奈文研など開発

                                                                          【読売新聞】 風化した石碑に光を照射するなどして文字や文様を浮かび上がらせる技術「ひかり拓本」のアプリが完成した。奈良市の奈良文化財研究所などが開発し、アプリ化の資金を募ったクラウドファンディング(CF)で目標額を達成。専門の技術を

                                                                            「ひかり拓本」アプリ完成、風化した石碑の文字・模様がくっきり浮かび上がる…奈文研など開発
                                                                          • GitHub - imgly/background-removal-js: Remove backgrounds from images directly in the browser environment with ease and no additional costs or privacy concerns. Explore an interactive demo.

                                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                              GitHub - imgly/background-removal-js: Remove backgrounds from images directly in the browser environment with ease and no additional costs or privacy concerns. Explore an interactive demo.
                                                                            • GitHub - Mayuresh1611/Paper-Piano: Piano like no other, Piano on Paper

                                                                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                GitHub - Mayuresh1611/Paper-Piano: Piano like no other, Piano on Paper
                                                                              • Windows 11の「フォト」に背景の除去・置換機能が実装へ ~そのほかにも多くの改善/写真の閲覧を妨げていた「フィルムストリップ」も見直し

                                                                                  Windows 11の「フォト」に背景の除去・置換機能が実装へ ~そのほかにも多くの改善/写真の閲覧を妨げていた「フィルムストリップ」も見直し
                                                                                • Tracking Everything Everywhere All at Once

                                                                                  OmniMotion jointly tracks all points in a video across all frames, even through occlusions. We present a new test-time optimization method for estimating dense and long-range motion from a video sequence. Prior optical flow or particle video tracking algorithms typically operate within limited temporal windows, struggling to track through occlusions and maintain global consistency of estimated mot

                                                                                    Tracking Everything Everywhere All at Once