Tencent Security Xuanwu Labが、マスクをしたままFace IDロック解除を可能にする「もう一つの容姿」の追加の仕方を紹介している。 設定>Face IDとパスコード>もう一つの容姿をセットアップを選択する。 新品のマスクを手に取り、左右に折りたたみ、2本のイヤーフックロープを片方の耳に掛ける。 マスクのしわを避けるため、できるだけ顔に近づけ、マスクの上隅は、鼻の先端の半分を覆う必要がある。
2022年8月に一般公開された画像生成AI「Stable Diffusion」をユーザーインターフェース(UI)で操作できる「AUTOMATIC1111版Stable Diffusion web UI」は非常に多機能である上にものすごい勢いで更新されており、Stable DiffusionのUIツールとしては記事作成時点で決定版といえる存在です。そんなAUTOMATIC1111版Stable Diffusion web UIでは、画像から画像を生成できる「img2img」に便利なScriptが用意されているので、実際に使ってみました。 GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI https://github.com/AUTOMATIC1111/stable-diffusion-webui AU
デューク大学の研究チームは、ぼやけて被写体が特定できない顔写真から、これまでの方法よりも精細な、極めて本物に近い画像をコンピュータで生成できるAIツール「PULSE」(Photo Upsampling via Latent Space Exploration)を開発した。 研究チームは、2020年6月14~19日の会期でオンラインで開催中の2020 Conference on Computer Vision and Pattern Recognition(CVPR)で、PULSEのプレゼンテーションを行った。 これまでの方法では、顔写真の解像度は最大8倍にしか高めることができなかった。デューク大学のチームは少数のピクセルからなる顔写真画像の解像度を最大64倍に高める方法を考案した。 研究チームを率いたデューク大学のコンピュータ科学者シンシア・ルーディン氏は「このような低解像度の画像を用いて
【2023/05/13 追記】ご存知の方も多いと思うが、実はもうだいぶ以前に Snap Camera はサービスを終了してしまった。 アンインストールの方法などについてはこちらの公式サポートの記事を参照いただきたい。 【2021/04/28 追記】 日本時間 4/27 リリースの Zoom のバージョン『5.6.3』では、Immersive View(没入ビュー)が有効になりました。 Immersive View(没入ビュー)の様子。もちろん SnapCamera もそのまま有効参加者の配置を変更できるのはホストだけですが、これまでの一覧表示と違って全員が同じ配置の画面を見ることになります。これはこれで便利そう。 デフォルトの背景にはこんなのも。仕事が進まない…あと、背景画像は自由に設定でき、参加者も任意の場所に配置できるのでこんなこともできる。仕事が進まーん!!(笑 まあよくこういうこと
1.緒言 低い画質の画像を高画質に変える技術である”超解像”技術のライブラリである"Real-ESRGAN"ライブラリを紹介します。 公式より、Real-ESRGANの使用方法は下記3つがあり、とにかく簡単に試したいならOnline inferenceが便利であり「https://arc.tencent.com/en/ai-demos/imgRestore」からWebアプリベースで実施できます。 【Real-ESRGANの使用方法】 Online inference:Webアプリで簡単に実行できる Portable executable files (NCNN):ー Python script:今回の記事で作成した通りPythonで実行 2.環境構築 基本的な実装方法はGitHubの"Installation"を参照しました。 私のPC環境ではCUDAのメモリに乗らないためGoogle C
プログラミング言語(以下、言語)の1つであるPythonの人気が高まっている。もはやどんな技術者も無縁ではいられない。 言語には、その言語で利用できる「ライブラリー」が用意されている。ライブラリーは、呼び出すだけで様々な機能を実現できるモジュールのこと。ある言語で利用できるライブラリーには、「その言語で書かれているもの」と「別の言語で開発され、その言語向けのAPI(Application Programming Interface)が用意されているもの」がある。 ライブラリーが乏しい言語では、プログラマーが自分のやりたいことを実現するには多くの処理を自前で実装しなければならない。これに対しライブラリーが豊富な言語は、やりたいことをすぐに実現できる。
この記事では、人物写真をフォトショップで加工するレタッチ、合成向けチュートリアルをまとめています。 フォトショップの醍醐味でもある写真合成や、レタッチテクニック、ポートレイト写真加工、アクション作成、デジタルメイク、モノクロ写真のカラー化、髪の毛の切り抜き、SF風デザイン、写真のイラスト化などあらゆるスタイルを網羅した保存版。 これらのテクニックを習得することで、フォトショップでイメージ通りの世界観を表現できる魔法のレシピを集めました。 フォトショップで人物写真を魅力的にする加工、レタッチ向けチュートリアル どんなイメージ写真もピクセルアートに変えてしまう方法 Illustratorのビットマップ機能を利用したデザインテクニックで、リアルワールドをピクセルアートにしてしまいます。 風景写真をイラスト・アニメ風に加工する方法 まるで大ヒットした某映画のワンシーンをみているような、写真をイラス
YOLOv5がリリースされたとのことなので試してみました。 https://github.com/ultralytics/yolov5/ 目次 使用データと目的 実装例 データ準備 COCOデータのpretrainedモデルのダウンロード コードのダウンロード 環境準備 コード実行 コード説明 最後に 1. 使用データと目的 以下のサイトから物体検出用の画像を拾ってきました。 https://public.roboflow.ai/object-detection/ 色んなデータがありますが、コロナの時期なのでマスク有り無しのデータを選択してみました。 目的は図のようにマスクをしている人・していない人の物体検出を行うことです。 2. 実装例 2-1. データ準備 まずデータをダウンロードします。 以下のURLにアクセスします。 https://public.roboflow.ai/objec
ディープラーニングを使わない顔認識 Githubで公開されている「Face-Detection-OpenCV」を実行し、OpenCVでの顔認識の限界を探ってみました。 このコードには、OpenCV(オープンシーヴィ)による、「非ディープラーニングの顔認識のテスト用コード」がまとまっています。 赤ちゃんのグレイ表示/顔認識テスト3人の赤ちゃんの顔認識テスト顔認識精度をパラメータ調整で向上させた例LBP方式の顔認識テストHaar方式とLBP方式の比較最終的にHaar方式、LBP方式という2種類の顔認識を比較しています。 Haar方式については、認識速度が遅く、壁に貼ったポスターの顔まで「顔」と認識してしまいました。 しかし、LBP方式は、実際の人間の顔のみキレイに認識出来た上、認識にかかる時間が1/3以下。 ここだけ見ると、「ああ、Haar方式って良いところないんだな。使わないようにしよう…」
顔誤認は冤罪が怖い! IBMに続きAmazon、マイクロソフトも捜査利用停止宣言2020.06.12 23:0010,437 satomi こちらの写真、見分ける自信ありますか? これ、黒人の方が見ると全然別人に見えるのだけど、白人の方が見るとほぼ同一人物に見えることがあるそうなんですよ? 人間の苦手分野はAIも苦手というわけで、IBMが8日、「監視、人種識別、人権と自由の侵害に顔認識などのテクノロジーを使うのは断固反対!」と米議会宛ての書簡で宣言し、顔認識技術の研究、開発、広告、販売の終了を発表したのに続き、10日にはAmazon(アマゾン)も自社の顔認識システム「Recognition」の捜査利用を1年禁じることを表明。Microsoft(マイクロソフト)も法が整備されるまでは警察への販売を控えることを誓いました。 アメリカで沸き起こっている警察による人種差別抗議デモを受けた動きですが
『この顔認証システムの顔認証の精度は○○%』なんていう宣伝を顔認証ベンダーはよくするようになりました。とくに、ニュース記事やブログで顔認証が取り上げられたとき、詳細な説明をすっ飛ばして『精度は○○%』と掲載する傾向があります。それもそのはずで、懇切丁寧に書いていたら紙面が足りませんから…。 さて、前回に引き続き、顔認証の用語について解説していきます。今回は、顔認証の性能を見る指標である『FAR』『FRR』『EER』について説明します。本シリーズで解説する中でも最重要の概念ですので、例を挙げながら丁寧に進めます。 認証失敗の要因 顔認証での認証失敗はゼロにはなりません 他の個人認証(物理認証・知識認証)と異なり、生体認証は認証失敗する場合もあるのが特徴です。認証失敗のパターンは大きく3種類に分けられます。一つ目は、登録失敗です。これは、顔認証システムに顔を登録しようとしたけどできなかった、と
顔コレデータセット(KaoKore Dataset)は、日本の絵巻物や絵本に登場する様々な顔貌画像「顔コレ(顔貌コレクション)」を、機械学習に利用しやすい形式で提供するデータセットです。データセットをご利用の際には、引用、ライセンス、利用ガイドラインなどをご確認ください。 顔コレデータセットは、複数の組織がIIIF (International Image Interoperability Framework)形式で公開する絵巻物・絵本に登場する様々な顔貌画像の所在情報とメタデータをまとめたものです。 2022年5月現在、最新バージョン(v1.3)のデータセットは、9,683件の顔貌データを提供します。データセットの内容は以下の通りです。 顔貌画像(画素:256×256)の所在情報(URL)をまとめたテキストファイル 専門家が付与した属性情報(メタデータ)をまとめたテキストファイル 機械学
EU、初のAI規制案 公共空間の顔認証「原則禁止」 2021年04月21日22時05分 欧州連合(EU)欧州委員会のフォンデアライエン委員長(EPA時事) 【ブリュッセル時事】欧州連合(EU)欧州委員会は21日、人工知能(AI)の利用に関するEU初の規制案を発表した。「監視社会」への懸念を払拭(ふっしょく)し、AI活用を促進するため、市民の権利保護や不正阻止のルールを整備。特に顔認証をはじめとする生体認証技術は、公共空間における警察などによる法執行目的での利用を原則禁止する。 政府の個人情報管理はどこまでなら許せるか、今こそ考えよう【怒れるガバナンス】 規制に違反すれば最大で3000万ユーロ(約39億円)か、企業なら全世界売上高の最大6%のいずれか高い方が制裁金として科される。 国際 コメントをする
経済産業省(通商政策)、キヤノン(経営企画、M&A)、A.T. カーニー(戦略コンサルティング)、デロイトトーマツコンサルティング執行役員/パートナー(Social Impact、Regulatory Strategy)を経て、現職。 著書に『稼げるFTA大全』(日経BP社)、『最強のシナリオプランニング』(共著:東洋経済新報社)、『世界市場で勝つルールメイキング戦略』(共著:朝日新聞出版)があるほか、日経ビジネス電子版「羽生田慶介の丸わかり通商ゼミナール」「通商の課外授業」、JBpress「通商の未来予想図」などへの寄稿や講演・テレビなどの識者コメント多数。 経済産業省「Society5.0標準化推進委員会」、JETRO「SDGs時代の海外ビジネスとジェトロ事業」研究会ほか、政策検討委員多数。国際基督教大学(ICU)教養学部卒。 一般社団法人エシカル協会理事、多摩大学大学院ルール形成戦略
古くて新しい顔検出技術 顔認識技術は、顔の位置を検出する技術です。デジタルカメラやスマートフォンのカメラ機能などでおなじみの、顔に四角い枠が出てピントが合うやつです。有名ですよね。 より正確には顔の位置を示すのが「顔検出」で、誰の顔かを見分けるのは「顔識別」「顔判別」「顔認証」と区別されます。今回の記事では、便宜上一般的に馴染みのある「顔認識」=「顔検出」という定義で説明いたします(専門家の方、石投げるのはご勘弁を)。 顔認識技術は、興味ある人も多いようで、当ブログで過去に顔認識技術を扱った記事も、古いわりに今だに人気のある記事になります。 拙作の 「からあげ先生のとにかく楽しいAI自作教室」でも、顔認識技術は少し扱っているのですが、書籍の主題から外れるので、詳細は割愛しておりました。書籍の補足的な位置付けもこめて、今回は顔認識技術に関して、楽しみながらより深く理解できる記事として、顔認識
リモートワークやリモート授業が浸透するにつれ、労働者や生徒をデバイス越しに監視するソフトウェアの需要が増加しています。中にはリモートで通信する相手の表情から感情を読み取る「AIを使ったソフトウェア・サービス」も存在しますが、これらの技術は科学的な実証がされておらず、誤用が懸念されると、人工知能(AI)の社会的影響を研究するケイト・クロフォード氏が論じています。 Time to regulate AI that interprets human emotions https://www.nature.com/articles/d41586-021-00868-5 新型コロナウイルス感染症(COVID-19)の影響で都市封鎖が行われ、リモート勤務やリモート学習が推奨されるようになりました。クロフォード氏によると、「これまで対面で行われていたコミュニケーションが遠隔で行われることで、感情が伝わり
イープラスとバンダイナムコライブクリエイティブは、完全非接触による高精度な「顔認証+体表面温度測定」を1台の端末で行う入場システムの導入を開始すると、8月24日に発表した。 新型コロナウィルスによる感染拡大の防止と、持続可能で、より安全なライブエンターテインメントの再開に向けての取り組みとして導入されるもので、入場口での来場者ともぎりスタッフのチケット受渡し時の接触が課題とされていた。そこで、顔認証システムによるチケットレス化、体表面温度測定による検温の実施を1台の端末で行うことにより、少人数のスタッフでの運営を可能とすると共に、来場者との完全非接触での安全な入場方法を実現するという。 イープラスで販売するチケットの購入情報と、購入後に行う顔登録データ連携によって、当日の入場管理端末で来場者データの一元管理が可能。イベント当日の紙チケットが不要となるため、来場者は手ぶらで入場ゲートを通過す
3つの要点 ✔️ ユークリッド距離や角度距離など特徴量間の関係性を事前に定める必要がない新しいアルゴリズム「BioMetricNet」を提案 ✔️ 代わりに、マッチングと非マッチングが事前に定められたそれぞれの分布に従うよう学習 ✔️ 顔認識で高精度を達成している手法(CosFace、ArcFace、SphereFace)と比べて、一貫して高い精度を報告 The Effect of Wearing a Mask on Face Recognition Performance: an Exploratory Study written by Arslan Ali, Matteo Testa, Tiziano Bianchi, Enrico Magli (Submitted on 13 Aug 2020) Comments: Accepted at ECCV2020 Subjects: Com
電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusion(というよりdiffusers)でTPU(JAX / Flax)を使った並列実行バージョンがリリースされたので、早速試してみました。 オリジナルのNotebookはこちら。 僕が作ったNotebookはこちら。 今回は、TPUを使うので、Google Colabに特化しています。自分で1から試す方は、メニューのEdit -> Notebook settingsでTPUを使うように設定してください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す
米Googleが、7月29日(現地時間)に発表した次期フラグシップ「Pixel 4」の顔認証システムのために、従業員が町で一般人に声をかけ、顔データを有償で集めていることを認めた。米The Vergeが同日、Googleのコメントを添えてそう報じた。 この件については、米ZDNetが21日の記事で、通りで声を掛けられた友人の体験談を紹介していた。それによると、ニューヨークの町で休憩していると男が近づいてきて、「こんにちは、私はGoogleの従業員です。次世代顔認証ロック解除の改善のためにデータを収集しています」と言って改造したPixel端末らしきものを手渡し、約5分間、端末を持って顔や手を動かすよう依頼した。男は見返りとして、5ドル分のギフトカード(AmazonかStarbucksから選べた)をくれたという。 GoogleはThe Vergeに対し、米国の複数の地域で「現地調査」と呼ぶ調査
フジロックに出たミュージシャンは「海外でこんな光景はない」と…生みの親・日高正博氏が語る“喜び”とは? FUJI ROCK FESTIVALの生みの親、SMASHの日高正博氏がフェスへの想いなどを語った。 日高氏が登場したのは、J-WAVEで7月30日(日)に放送された『SAISON CARD TOKIO HOT 100』(ナビゲーター:クリス・ペプラー)だ。 猛暑のフジロック、参加者は完全武装で この日は『TOKIO HOT 100』特別バージョンとして、最終日となるFUJI ROCK FESTIVAL '23(以下、フジロック)の会場内特別ラジオブースから放送。日高氏は15時台に登場した。 日高:もうちょいだけど暑いので、本当に体に気を付けてすごしてください。家にたどりついて靴を脱いだらフジロックは終わりです。よろしくお願いします。 クリス:おうちに帰るまでフジロックは続いていますもん
電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、美少女を高確率で出す呪文です。 Stable Diffusionで人物を出力するときに、顔が崩れている、目が変、口がない、腕(手)が変などを経験した方は多いことでしょう。NSFW(職場や学校で閲覧注意)が連続で出て、心が折れそうになった方もいることでしょう。僕もそのうちの一人です。 今回は、クオリティの高い人物画を高確率で出力し、NSFWもほとんど起きない呪文を研究しました。 v2.1 美少女アニメ画もよろしければご覧ください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女
AI人材の教育やコンサルティングを手掛ける、東京大学発のベンチャー企業NABLASは6月21日、「ディープフェイクと生成ディープラーニング」と題した技術資料を無償公開した。動画中の人物の顔や音声を別人に置き換えてうその情報を発信する「ディープフェイク」を中心に、技術背景や実際に起きた事件などを解説している。 資料は同社のWebページ上か、もしくはPDFをダウンロードすることで読める。ディープフェイクに使われている顔画像処理や音声処理の概要や、「オートエンコーダー」「GAN」(敵対的生成ネットワーク)などの画像を生成するディープラーニングモデルの基礎を取り上げている。 併せて、ディープフェイクを悪用した事件の他、芸術やデザイン、工業製品検査などへの応用例も示すことで、技術背景、活用の課題と可能性を30ページに渡って論じている。 同社は資料のまとめの中で「表面的に理解して漠然と恐れたり期待する
連載目次 データセット解説 ARC浮世絵顔データセット(以下、浮世絵顔)は、浮世絵の「顔」画像データセットである(図1)。このデータセットには、浮世絵に関する作品名/役者/版元/絵師/上演年などの書誌情報といったメタデータと、目/口/鼻などの顔パーツと顔領域の座標データ(=機械学習で自動抽出した結果)といったアノテーションデータが含まれる。 図1 浮世絵顔データセットの例(引用) この画像はGitHubリポジトリの公式データセットに含まれるサンプル画像から引用したものである。 立命館大学アート・リサーチセンター (2020): ARC所蔵浮世絵データベース. 国立情報学研究所情報学研究データリポジトリ. (データセット). https://doi.org/10.32130/rdata.2.1 浮世絵研究に機械学習やデータサイエンスの方法論を適用し、日本文化に関する新しいデジタル研究基盤を構
近年は「地下鉄の運賃を顔認証で決済するシステム」や「学校の食堂での支払い処理を顔認証で行うシステム」など、さまざまな場面で顔認証システムの導入が進められている一方、プライバシーに関する問題も提起されています。そんな中、イスラエルとヨルダンの間に位置するヨルダン川西岸地区では、イスラエル軍がパレスチナ人を監視するために大規模な顔認証システムを展開していると、アメリカの日刊紙であるワシントン・ポストが報じています。 Israel escalates surveillance of Palestinians with facial recognition program in West Bank - The Washington Post https://www.washingtonpost.com/world/middle_east/israel-palestinians-surveillan
Eeyeは、解析データから特徴点データのみを取り出すことでデータを小容量化して高速処理し、解析速度は0.1秒以内に10人の解析が可能。顔認識率は99.9%を実現したとしている。 インターフェースはUSB2.0対応USB3.0、通信プロトコルはUVCをサポートする。レンズマウントはM12、ISPはsoc統合(最大サポート4K 60fps)。CNN計算能力は1.2T OPS、ビデオストリームは1080P@30fps、毎秒25フレーム。USBから、画像データや特徴点を出力することができる。 500MHz ARM Cortex-M7 CPUとDSPを搭載し、H.265、H.264、MJPEGに対応する。電源はDC5V、2A、USBまたはコネクタにて給電可能で、使用温度範囲は-15℃~70℃だ。 AIカメラモジュール、USBケーブル、USBメモリ、μSDメモリカード、LINUXサンプルソフトウェア、
電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、長い呪文は切り捨てられる編です。 からあげさんのStable Diffusionの内容を理解するための情報・書籍の記事の中に出てくる最初の75個分以降の文章は、バッサリ捨てられてしまう記事をみて、自分でも検証してみたのが今回の記事です。 これまで、意味のある区切りとして、カンマ(,)を使っていたのですが、カンマ(,)は75個のトークンの一つとして重複して数えられ、カンマ(,)を削っても出力結果はほとんど変わらないことを知って愕然としました。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く