タグ

技術と画像に関するrichard_rawのブックマーク (34)

  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
    richard_raw
    richard_raw 2023/10/16
    ラーメン食べられるようになったんだね、良かった。/ChatGPTがツンデレ風お姉ちゃんになってるんですがこれは……?(すっとぼけ)
  • 生成AI技術が辿った濃い一ヶ月間

    Stable Diffusionがオープンソースで公開されてちょうど1ヶ月が立ちました。OpenAIがDall-E2をリリースしたのが4月。こういう異次元なリソースを使ってモデルを作れるのはごく限られたプレーヤーだけと思い込んでいたものが、若干十数人のチームがMidjourneyをリリースしたのが7月。一連の騒ぎがここ半年程度の出来事で、1ヶ月前に深津さんも予見していた「世界変革」が目の前で怒涛の勢いで進行しています。 このブログも書いた瞬間に古くなるだと思うけど、この文化的特異点とも言える1ヶ月に起こったことを振り返ってみたいと思います。それにしても手書き文字の生成に感動していた2015年から比べるとずいぶん遠いところまで来ましたね。DataRobotでも「AIの民主化」を掲げて様々な企業のAI活用を推進していたけれど、今起こっている変化を見ているとそのスピード感に愕然とします。 少し宣

    生成AI技術が辿った濃い一ヶ月間
    richard_raw
    richard_raw 2022/10/04
    正直、「絵を生成する」需要がこんなにあるとは思ってませんでした。
  • さらば造影剤、0.2ミリの微小血管まで見える光超音波技術が変える「常識」

    これまで見えにくかった微小な血管が造影剤なしで鮮明に見える――。ベンチャー企業のLuxonus(ルクソナス)は光超音波技術を用いて微小な血管などを3次元(3D)画像として撮影する製品を開発している。同社はキヤノンや日立製作所、京都大学、慶応義塾大学などが参画した国の研究プロジェクト技術を実用化するために発足した。 現在は細い血管をコンピューター断層撮影装置(CT)や磁気共鳴画像装置(MRI)で撮影する場合、造影剤を体内に注入することが多い。Luxonusの光超音波技術を利用すれば、血管は造影剤を使わなくても画像化できる。光超音波技術は、生体にパルス光を照射した際に発生する超音波をセンサーが受信し画像化する。血管の場合はパルス光で赤血球中のヘモグロビンが光を吸収し、赤血球が熱膨張して発生した超音波を受信する。 高い解像度にできた理由の1つはおわん型に配置したフィルム状のセンサーだ。国の研究

    さらば造影剤、0.2ミリの微小血管まで見える光超音波技術が変える「常識」
    richard_raw
    richard_raw 2020/01/31
    “生体にパルス光を照射した際に発生する超音波をセンサーが受信し画像化する。血管の場合はパルス光で赤血球中のヘモグロビンが光を吸収し、赤血球が熱膨張して発生した超音波を受信する。”
  • 【photoshop】風景写真をイラスト・アニメ風に加工する|ヱノプルギスの夜 / こころ動かす者

    (2019.02.23に書いたブリコルールのブログ記事の引越しです) 写真をイラストっぽく使いたいなどの局面はいろいろありまして、備忘録も兼ねて。 会社の近所で撮影した写真をこんな感じでイラスト風にして、弊社のキャラクターと合わせてみました。まあまあアニメのワンシーンのようにも見えなくもない?? 最近だと、アプリで簡単に写真をイラスト風に変換できるものもありますが、photoshopを使います。 ベースとなるレイヤーを作成・調整する もとの写真はこちらです。 なんの変哲もない、何年か前に撮ってフォルダの奥底で眠っていた写真ですが、空を抜きやすい写真を選ぶとよいです。 【イメージ】>【色調補正】>【HDRトーン…】を選択します。 他のサイトなどでもHDRトーンを使って紹介しているところは多いです。私もこれを使います。HDRトーンの正しい使い方は正直なところ自分はわかっていません…。調整がまと

    【photoshop】風景写真をイラスト・アニメ風に加工する|ヱノプルギスの夜 / こころ動かす者
    richard_raw
    richard_raw 2019/04/12
    なるほどこうやるのか。
  • JPEG XSコーデックメモ - Qiita

    低レイテンシ(low-latency)で計算コストの小さい(lightweight)、視覚的ロスレス(visually lossless)品質のデジタル静止画像圧縮技術(コーデック)。 特徴と応用先 JPEG XSコーデックの特徴は下記の通り: 最大解像度: 8K フレームレート: 24 ~ 120fps 色空間: RGB, YCbCr(YUV)系 品質劣化の小さい視覚的ロスレス 圧縮率 1/2 ~ 1/6 で7回の反復エンコード後 [IIS-INTRO] 軽量な画像処理のため低消費電力 低レイテンシなエンコード/デコード処理 処理レイテンシ=32ライン未満 [IIS-INTRO] 比較的簡易なアルゴリズムのため実装が容易 小さなASIC/FPGAハードウェア実装面積 SIMD命令やGPU利用による高速なソフトウェア実装 JPEG XSコーデックは、低計算量・低レイテンシが要求されるアプリ

    JPEG XSコーデックメモ - Qiita
    richard_raw
    richard_raw 2018/04/18
    ウェーブレット変換だけど遅延極小なんですね。
  • 指紋がネットで狙われている! 手の画像は悪用恐れ… 国立情報学研が新技術の実用化目指す(1/2ページ)

    スマートフォンなどの個人認証で利用が広がる指紋がインターネット上で狙われている。投稿された手の画像(写真)から指紋の模様を読み取り、個人情報として悪用することが可能だからだ。国立情報学研究所(東京)はこうした指紋の盗撮を防ぐ新技術を開発しており、犯罪防止に向け2年後の実用化を目指している。 指紋認証は人によって模様が違うことを利用した個人認証システム。IDやパスワードを使用せず、指一人と確認できる利点があり、スマホやパソコン、マンションのドアロック解除、金融サービスなどに利用が拡大している。 その一方、スマホの普及でネット上に大量の画像が投稿されるようになったことでリスクも増大している。過去にはドイツで記者会見の画像などを基に「国防相の指紋を盗み取った」とある人物がネット上で発表し、衝撃を与えた事例がある。第三者に指紋のデータを読み取られた場合、プライバシーの侵害や金銭的な被害を受け

    指紋がネットで狙われている! 手の画像は悪用恐れ… 国立情報学研が新技術の実用化目指す(1/2ページ)
    richard_raw
    richard_raw 2017/01/10
    指紋は変更できないから、パスワードじゃなくてIDなんですね。
  • ディープラーニングで「インド人を右に」を理解する: Generative Adversarial Network による画像モーフィング - 加藤大晴のウェブサイト

    ディープラーニングで「インド人を右に」を理解する: Generative Adversarial Network による画像モーフィング 「インド人を右に」問題 インターネットを長く使っている方は、伝説の誤植「インド人を右に」 [1] についてご存知なのではないでしょうか。 「くお〜!! ぶつかる〜!! ここでアクセル全開、インド人を右に!」 この唐突に過ぎる意味不明な「インド人」は「ハンドル」の誤植であり、それはライターの手書きの文字が汚かったために発生したとされています。 …手書きの文字が汚かったとして、どうすれば「ハンドル」が「インド人」になるのか? 従来より、この問題について様々な考察がなされてきました。 ここでは、近年の技術の発展の成果を取り入れ、コンピュータに文字を書かせることによって「ハンドル」から「インド人」への変容についてアプローチしてみたいと思います。 # これは De

  • スマホカメラで指静脈認証 日立が技術開発

    日立製作所は10月24日、スマートフォンに標準搭載されているカメラを利用して高精度な指静脈認証を実現する技術を開発したと発表した。スマホカメラで撮影した複数の指のカラー画像から、各指を検出して静脈パターンを抽出。複数の指の静脈パターンを認証に用いることで精度を高めた。 指静脈認証は体内のパターンで認証するため、指紋、顔、声紋など他の認証方式より偽造やなりすましが困難だが、読み取るためには赤外線を用いた専用センサーが必要だった。 新技術は、スマホカメラで撮影した指の画像から、指静脈に特有な色合いの部分を強調することで静脈パターンを抽出。指のしわと指静脈を区別でき、指静脈パターンを安定的に抽出できるという。指の色や形の実例画像をあらかじめ学習させておくことで、画像に映り込む背景に左右されずに各指の傾きや大きさを補正する技術も開発した。 スマホでのオンラインショッピングなどでの人認証手段に利用

    スマホカメラで指静脈認証 日立が技術開発
    richard_raw
    richard_raw 2016/10/25
    手袋して生活しなきゃ……!
  • 健康的な水着写真かそうでないかを判別できるフィルタリングシステムの開発に成功 

    健康的な水着写真かそうでないかを判別できるフィルタリングシステムの開発に成功 
    richard_raw
    richard_raw 2015/02/11
    Deep Learning万能説。
  • 3m先から撮った親指の写真から、指紋の複製に成功

    richard_raw
    richard_raw 2015/01/06
    Rebuild.fmで言ってたやつか。指紋パターンを認識したらモザイクをかける技術が出てきそう。
  • JPEG画像の約半分のファイルサイズで同品質のものを表示できる画像形式「BPG」が誕生、実際に使ってみるとこんな感じ

    同品質のJPEG画像と比較するとファイルサイズを約半分以下に縮小できる新しい画像形式が「BPG」で、FFmpegJavaScriptだけで動くLinux「JSLinux」などを開発したFabrice Bellard氏が開発した画像形式です。ただサイズが軽いというだけではなく、グレイスケール・YCbCr=4:2:0・4:2:2・4:4:4・RGB・YCgCo・CMYKなどの色空間をサポートし、アルファチャンネルや可逆圧縮にも対応しています。 BPG Image format http://bellard.org/bpg/ BPGが他の画像形式と比べてどれくらい優れているのかを比較できるのが以下のページ。2種類の画像形式で同程度のファイルサイズの画像を表示させており、「mozjpeg」とBPGとで同じ画像を比較すると、BPG画像の鮮明さが際立ちます。 BPG Image Comparison

    JPEG画像の約半分のファイルサイズで同品質のものを表示できる画像形式「BPG」が誕生、実際に使ってみるとこんな感じ
    richard_raw
    richard_raw 2014/12/16
    へー、JavaScriptでデコードしてるのか。場合によっては普及するかも。/なんでJPEGを再圧縮したし。っていうかLenaの絵はものすごくスムージングしてないか。
  • 女の子のふとももに「半脱ぎパンツ画像」を自動合成する変態技術がすごい おまわりさんこっちです

    今年も夏コミの季節がやってまいりました。コミックマーケットと言えばひそかに注目しているのが、あの人の研究所(3日目/西き16b)の「あの人の研究論文集」。毎回何の役に立つか分からない「才能の無駄遣い」的研究ばかりを集めた論文集で、昨年は画像補完で衣服をスケスケにしちゃう「画像補完技術による衣服の除去」などが話題になりました(紹介記事)。 さて、今年の注目は何と言っても、七海セカイさん(@Sekai_Nanami)による「半脱ぎパンツ画像の自動合成によるはいてない感の付与」。画像合成技術を使うことで、「はいてない画像」の新たな方向性と感動を模索した紳士的研究論文です。 論文では、女の子の画像から太もも部分を検出し、適切な位置に「半脱ぎパンツ画像を合成」することで、まるで女の子がパンツをずらした「半脱ぎ」、すなわち「はいてない」状態であるかのように見せる手法を提案。その有効性は、次の参考画像を

    女の子のふとももに「半脱ぎパンツ画像」を自動合成する変態技術がすごい おまわりさんこっちです
    richard_raw
    richard_raw 2014/07/30
    色んな意味で変態技術だわ……。
  • プログラマーがイラレで絵を描けるようになると、こうなる - ppworks.jp

    プログラマー、絵が描けないじゃないですか(偏見) こんなじゃないですか。 なので描けるようになりたいなとずっと思っていて、ベジェ曲線って滑らかでナンカヨサソウ、とチャレンジしました。 「ベジェ曲線」習熟ドリル 7,8年前に買ったのがこれ。そう、チャレンジは2回目なのです。前回は3ページぐらいで挫折してました。んで、最近急に暇になったのをキッカケに「よしやろう」という気になり始めたのです。 改訂二版〈Illustratorで学ぶ〉「ベジェ曲線」習熟ドリル 作者: 中村高之出版社/メーカー: ラピュータ発売日: 2005/04メディア: 単行購入: 2人 クリック: 8回この商品を含むブログ (4件) を見る (2014.1.10追記) なんと、長らく手に入りにくかったこちらの書籍が新装改訂版で再登場とのこと。 表紙が若干、損していた分、今回はスタイリッシュで内容と合っていてヨサソウです。

    プログラマーがイラレで絵を描けるようになると、こうなる - ppworks.jp
    richard_raw
    richard_raw 2014/07/18
    「プログラマーが」っていうからバットマンを方程式で、みたいな話かと思ったらガチでイラストレーター使ってたスゲー!
  • 映像で瞬時に人物特定も 阪大など開発 NHKニュース

    防犯カメラなどに写った顔の特徴を自動的に読み取り、1000万枚の画像の中から似た人物を瞬時に選び出すシステムを大阪大学などの研究グループが開発し、犯罪捜査などに有効だとして実用化を目指すことにしています。 開発したのは、大阪大学産業科学研究所の八木康史所長などのグループです。 このシステムは、人物が写った防犯カメラなどの映像を入力すると、人物の向きや大きさにかかわらず、目や鼻、口など顔の14か所の情報を読み取り、正面を向いた顔や横顔など、さまざまな角度からの顔の画像を自動的に作ります。 そして、この画像をおよそ1000万人分の顔や全身の姿が登録されたデータベースと照合すると、僅か1秒でよく似た上位10人を選び出します。 これまでの研究では、選び出した10人の中に正解が含まれる割合は98%に上るということです。 防犯カメラの人物がマスクやサングラスを付けていても、一部が隠れた程度ならば識別で

    richard_raw
    richard_raw 2014/05/21
    「およそ1000万人分の顔や全身の姿が登録されたデータベースと照合すると」そのデータベースはいったいどこから……
  • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

    このドメインは、お名前.comで取得されています。 お名前.comのトップページへ Copyright © 2020 GMO Internet, Inc. All Rights Reserved.

    dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
    richard_raw
    richard_raw 2013/12/06
    せんせー、画像パズルはOCRよりコンピューター向きだと思います。
  • 心奪われるフォルム…文明を支える巨大マシーンの写真26枚 : らばQ

    心奪われるフォルム…文明を支える巨大マシーンの写真26枚 巨大な装置や機械は、ただそこにあるだけで存在感や機能美を感じるものです。 科学技術の結晶とも言うべき、巨大マシーンの数々をご覧ください。 1. アポロ計画で月まで行った「サターンV」ロケットのF-1エンジンと、フォン・ブラウン博士。 2. 発電機。 3. ボーイング旅客機の翼のストレステスト。 4. ゴッタルドベーストンネル(スイスで現在建設中の鉄道トンネル)を切削中の4500馬力のボーリングマシン「Heidi」。 5. レクサスLFAの8速ランスミッション。 6. 米軍の大陸弾道ミサイル(ICBM)「ピースキーパー」の慣性誘導モジュール。 7. ブガッティ・ヴェイロンのW-16エンジン。 8. ダークマターを検出する液体キセノン検出器。 9. シアトルの地下の国道線を掘るための世界最大のトンネルボーリングマシンのヘッド。 10.

    心奪われるフォルム…文明を支える巨大マシーンの写真26枚 : らばQ
    richard_raw
    richard_raw 2013/09/30
    いいですなあこういうの。精緻の極み。/車のエンジンは「巨大」なのか。
  • 新着記事

    『フォトショップ・ブイアイピー』の新着記事です。フォトショップやデザインをたのしむウェブサイト。2009年3月創刊以来、3800を超えるコンテンツを更新しています。フリーフォントなどの無料デザイン素材/配色やWeb制作といった最新トレンドも公開中。

    新着記事
    richard_raw
    richard_raw 2013/02/11
    nginxでwordpressを高速化する手順。
  • 圧倒的。彫刻家が3Dプリンタを使いこなすと:DDN JAPAN

    DDN は 音楽 ・ 映像 に関する デジタル アート を中心に情報ミックスを配信中

    圧倒的。彫刻家が3Dプリンタを使いこなすと:DDN JAPAN
    richard_raw
    richard_raw 2013/01/08
    これが21世紀の芸術か……。
  • Engadget | Technology News & Reviews

    Hands-on with the new iPad Pro M4: Absurdly thin and light, but the screen steals the show

    Engadget | Technology News & Reviews
    richard_raw
    richard_raw 2012/11/28
    ご冥福をお祈りします。
  • イギリスの学生がキヤノンのカメラを使い、予算24000円でNASAの人工衛星並の写真を撮影 : 痛いニュース(ノ∀`)

    イギリスの学生がキヤノンのカメラを使い、予算24000円でNASAの人工衛星並の写真を撮影 1 名前: ぬこ(四国地方):2012/09/10(月) 18:00:36.44 ID:BXt9zKwI0 イギリスのウースターシャー州の19歳の大学生、アダム・カドワースさんが200ポンド(約24000円)でNASA並の宇宙写真を撮影したということで話題になっています。eBayでキヤノンのA570を30ポンド(約3700円)で購入し、GPS探知機、無線機及びマイコンなどを搭載したシンプルな装置をおよそ40時間かけて製作し、 先週の木曜日にバルーンに括り付けて宇宙へと放ちました。 彼の装置が撮影した画像は何億円もの予算がつぎ込まれて製作されるNASAの人口衛星に匹敵するとの声も上がっています。彼の装置はおよそ2時間半かけて 上空32キロメートル 以上まで上昇し、この驚くべき光景を撮影することに成功し

    イギリスの学生がキヤノンのカメラを使い、予算24000円でNASAの人工衛星並の写真を撮影 : 痛いニュース(ノ∀`)
    richard_raw
    richard_raw 2012/09/12
    そうか、ラジオゾンデから見た景色ってこうなんだ。