並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 204件

新着順 人気順

画像認識の検索結果121 - 160 件 / 204件

  • ドイツ新政権が「公共の場での生体認証による監視の禁止」を発表、監視の規制が欧州全体に広がる可能性も

    2021年11月24日に連立政権の樹立が決定したドイツ社会民主党・緑の党・自由民主党は連名で、公共の場で顔認証などの生体認証技術を用いた監視や追跡を行うことを禁止する公約を打ち出しました。公約には、欧州全体に対する要請が含まれているため、EUの人権擁護団体であるEuropean Digital Rights(EDRi)らは新政権を歓迎する声明を発表し、差別につながるとの懸念がある監視技術撤廃の支持を表明しています。 SUCCESS! New German government calls for European ban on biometric mass surveillance - Reclaim Your Face https://reclaimyourface.eu/new-german-government-calls-for-european-ban-on-biometric-

      ドイツ新政権が「公共の場での生体認証による監視の禁止」を発表、監視の規制が欧州全体に広がる可能性も
    • Python+Tesseractによる画像処理でOCRを試してみた! – 株式会社ライトコード

      Tesseract とは? Tesseract は、オープンソースの OCR エンジンです。 「OCR」とは、画像ファイル中の文字を、テキストファイルとして読み込む技術のことです。 Tesseract は、コマンドラインのインターフェースを実装しているため、パソコンへインストールするだけで、OCR ができます。 Tesseract と Python で画像処理するメリットは?Tesseract を Python と組み合わせて利用すれば、画像を前処理してから Tesseract へ渡すことができます。 これにより、OCR の精度が向上し、Tesseract が読み取った文字列を任意の形に処理できます。 例えば、紙に印刷された文書も、Tesseract を利用すれば、テキストデータとして保管できるのです。 さて、今回は、Tesseractを使って、画像処理でOCRを試してみたいと思います!

        Python+Tesseractによる画像処理でOCRを試してみた! – 株式会社ライトコード
      • GitHub - facebookresearch/detectron2: Detectron2 is a platform for object detection, segmentation and other visual recognition tasks.

        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

          GitHub - facebookresearch/detectron2: Detectron2 is a platform for object detection, segmentation and other visual recognition tasks.
        • DeepstreamでストリームAI処理する方法について | テクのまど

          エッジでAIを動作させる仕組みが増えてきました。 AI動作が可能なエッジ機器としてはAI組込済のエッジ機器、RaspberryPi、FPGA、RISC-Vチップなど色々と選択肢があります。但し、現状では深層学習処理をしようとするとパフォーマンスの問題でGPUが前提となるケースがあります。 このケースに限ってはNVIDIA製のエッジ機器であるJetsonシリーズの使用が前提となります。 今回はNVIDIA製のエッジ機器である「Jetson Nano」上でDeepstreamを使ってストリーム処理で物体検出させる手順を記事にしたいと思います。 Jetsonとは何か? Jetsonとは、NVIDIA社が製造・販売するGPUを備えた画像認識、機械学習や自動運転等を想定した組込み用のARMベースのシングルボードコンピュータシリーズです。 特徴としてはCUDAを搭載しているため、CUDAに対応したAI

          • DeepStream SDKでリアルタイム動画認識からのLINE通知 - Qiita

            DeepStream SDKで高速動画認識からのLINE通知 この記事は,ドコモアドベントカレンダー2019 7日目の記事です。 NTTドコモ サービスイノベーション部の酒井と申します。業務ではDeep Learningを用いた画像認識エンジンの研究開発、サービス化に取り組んでいます。今回は、GPUを使った動画認識高速化ツール「DeepStream SDK」を用いて、動画からの車検出を高速で行うとともに、結果をLINEに通知してみました。AIカメラ的な物を作って、監視カメラで人を検知したり、カメラ映像から違法駐車の検出などを行うなどに使える感じです。 Web上であまり事例の見つけられなかったDeepStream SDKとAMQPを用いたメッセージングにもチャレンジしました。 動機 近年、画像認識技術でのDeep Learning利用が広がるに連れ、動画データの画像認識も徐々に盛り上がって来

              DeepStream SDKでリアルタイム動画認識からのLINE通知 - Qiita
            • 【業界別】画像認識AIカオスマップ2023を公開!

              人工知能を搭載した製品・サービスの比較・資料請求が無料でできるAIポータルメディア「AIsmiley」は、各業界のDX推進の支援の一環として画像認識関連サービスをまとめた「画像認識AIカオスマップ2023」を公開します。掲載数は合計で196サービス。 \AI市場のトレンドが一目でわかる!/ 無料でカオスマップを資料請求(30秒) ※2023年9月28日更新 こちらのカオスマップは画像認識AIを業界別で探せるように「製造」「建設」「エネルギー」「物流」「食品」「自動車」「医療機関」「公共機関」等のカテゴリーに分け、合計196サービスをマッピングしております。作成にあたり参考にしたサービスURL、画像認識AIベンダーを記載した一覧表(Excel)は、カオスマップ資料請求後に画像認識AIの導入を検討している企業ご担当者様に無償でご案内いたします。 画像認識AIとは? 画像認識AIとは、AI・人工

                【業界別】画像認識AIカオスマップ2023を公開!
              • OpenCVのカレンダー | Advent Calendar 2020 - Qiita

                2020年もOpenCVのライセンスがApache 2になったり、OpenCV AI Kitのファンディングが開始されたりと変化の多い年になりました。ということで今年も小ネタからディープなネタまで記事を募集します!また、記事本体はQiita以外に投稿してもらっても問題ありません。 過去のOpenCV Advent Calendar OpenCV Advent Calendar 2018 OpenCV Advent Calendar 2017 OpenCV Advent Calendar 2016 OpenCV Advent Calendar 2015

                  OpenCVのカレンダー | Advent Calendar 2020 - Qiita
                • 巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル

                  数年前、巨大テック企業のエンジニアたちは、カメラで捉えた相手の顔を認識し、名前を表示するツールを開発した。だが、かのシリコンバレーもそのときばかりは、素早く実用化して環境を変えることをしなかった。 それからしばらく経ったいま、大企業の支配を受けないスタートアップが、その技術を世に出そうとしている。この状況は、技術をどう活用するかという倫理的な議論や法規制が必要であることを浮き彫りにする。 すでに完成されていた技術 2017年初頭のある日の午後のことだ。カリフォルニア州メンロパークにあるフェイスブック本社の会議室で、エンジニアのトマー・レイヴァンドは、野球帽の端にスマートフォンをくっつけた状態で座っていた。そのスマートフォンは、ゴムバンドによってカメラを外に向けた状態でしっかり固定されていた。 このばかげた帽子フォンは、きわめて不格好だったが、未来の青写真であり、そこにはごく一部の社員しか知

                    巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル
                  • YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO

                    5 AI-OCR AI-OCRとしては、MicrosoftのComputer Visionで提供されている、Read APIを使用させて頂きました。 参考: Computer Vision 3.2 GA Read API を呼び出す 最初は、ナンバープレート画像を、そのままOCRにかけてみたのですが、下段左の平仮名1文字のところの認識が難しいようでした。これは、このように「ひらがな」1文字だけが配置されることに、モデルが対応しきれていないような気がしました。 対策として、画像を3つの部分に分割し、それぞれでOCRにかけるようにしてみました。また、認識精度が上がるように、業務用(緑バックの白文字、及び、黒バックの黄色文字)は、ネガポジ反転し、最終的にグレースケール変換することにしました。 AI-OCRで処理しているコードと、それを使っている、全体のコードです。 ocr.py import t

                      YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO
                    • NVIDIA、AIでWeb会議を快適にするプラットフォーム「Maxine」を開発者向けに提供開始

                      米NVIDIAは10月5日(現地時間)、開発者向けの新Web会議プラットフォーム「NVIDIA Maxine」を発表した。クラウド側の同社のGPUでAIを使って動画や音声を処理し、Web会議の品質を向上させる。 既にZoomなどでおなじみの仮想背景やMicrosoft Teamsの翻訳機能、Google Duoのオートフレーム機能、ノイズキャンセル機能に加え、斜め横から撮影している顔を正面に修正したり、互いの視線が合うように補正したり、表情をリアルタイムで反映できるアバターの利用などが可能になる。 すべてクラウド側で処理するので、Web会議参加者はスペックの低い端末でもこれらの機能を享受できる。 また、AIにより、動画全体のピクセルをストリーミングするのではなく、顔の動きにとって重要なポイントを分析し、顔をアニメーション化する。これにより、送受信するデータ量を大幅に減らし、動画による帯域幅

                        NVIDIA、AIでWeb会議を快適にするプラットフォーム「Maxine」を開発者向けに提供開始
                      • Fashion-MNIST: 簡単になり過ぎたMNISTに代わる初心者向け画像認識ベンチマーク - 渋谷駅前で働くデータサイエンティストのブログ

                        (MNIST database - Wikipedia) 僕は画像認識分野は門外漢なのですが、ここ最近初心者向けにCNNのトレーニングを行うことを企画していて、その目的に適した画像認識のオープンデータセットを探していたのでした。 というと誰しも思いつくのがMNISTではないかと思うのですが、Kaggleのベンチマークにも出ているように、実はMNISTはチューニングなしのデフォルトのランダムフォレストで回しても97%以上のACCが出てしまいます。そしてちょっとチューニングしたCNNなら99.7%を叩き出せてしまう上に、そういったノウハウがネットのあちこちにHello World並みのイージーハウツーコンテンツとして溢れ返っていて、初心者向け教材という意味では全く参考になりません。そこで、ちょっとサーベイして探してみることにしました。 MNIST以外のMNIST的なデータセットを探す 実は、以

                          Fashion-MNIST: 簡単になり過ぎたMNISTに代わる初心者向け画像認識ベンチマーク - 渋谷駅前で働くデータサイエンティストのブログ
                        • Android携帯、多数が顔認証の安全性に不備 持ち主の写真でロック解除可能 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                          顔認証によるロック解除機能を搭載したAndroid(アンドロイド)スマートフォンの多くが、写真を使ってロック解除ができてしまうことを示した調査結果が発表された。 英国の消費者団体「Which?」が48機種をテストしたところ、19機種で持ち主の写真、それも普通紙に印刷した低解像度の写真でロックを解除できた。 写真でロック解除できた機種は、モトローラの「Moto E13」などの低価格モデルが大半だが、モトローラの「Razr 2022」などの高級機種も含まれていた。メーカー別の内訳はシャオミが7機種、モトローラが4機種、ノキア、オッポ、サムスンが各2機種、オナーとビボが各1機種。 同団体はアップルのiPhoneもテストしたが、結果はすべて合格だった。iPhoneには、センサーを使ってユーザーの顔の3D深度マップを作成する「Face ID」機能が搭載されている。 同団体のテクノロジー担当エディター

                            Android携帯、多数が顔認証の安全性に不備 持ち主の写真でロック解除可能 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                          • リスクテイクしてこそ研究者だ。音響と画像認識で成果を出し続ける日立研究員のマインド - Qiita Zine

                            ここ数年で機運が高まり続けている企業のデジタルトランスフォーメーション。AIをはじめとする技術への社会的注目度は格段に上がってきており、日立製作所でも社会課題解決を支援する様々なコア技術の研究と、それらを社会実装したソリューションを、日々発表しています。 今回はその中でも、音響領域と画像認識領域における最新の取り組みについて。 同社では、最も古い映像認識コンペティションのひとつであるTRECVID(TREC Video Retrieval Evaluation)に2015年から参加しており、また音響領域の国際コンペティションであるDCASEに至っては2020年から主催側として活動しています。 その背景にあるマインドは「リスクテイク」。グローバルレベルで技術競争が激しくなっているからこそ、研究者はリスクを負ってでも積極的にチャレンジをするべきだ!本記事では、そんな強烈なマインドをもった2人の

                              リスクテイクしてこそ研究者だ。音響と画像認識で成果を出し続ける日立研究員のマインド - Qiita Zine
                            • RaspberryPi4にYOLOv3-Tinyを実装してリアルタイム画像認識をしながら物体を自動追尾するカメラを作ってみた - Qiita

                              RaspberryPi4にYOLOv3-Tinyを実装してリアルタイム画像認識をしながら物体を自動追尾するカメラを作ってみた画像処理RaspberryPiPython3画像認識YOLO 1. 背景 自宅前のゴミ捨て場がカラスに荒らされて嫌な思いをしたので、カラスを撃退するためのプロダクトを作ってGUGEN2019に応募しました。作品はコチラ:https://gugen.jp/entry2019/2019-080 この機能の一部であるRaspberryPiとYOLOを使った自動追尾カメラは、いろんなことに応用できると思うので、投稿してみました。 2. 準備するもの 今回作りたいのは物体を認識して画像を自動で追尾する自動追尾カメラになります。したがって、下記の構成が必要となります。 ・RaspberryPi:YOLOが実装されたもの ・カメラ:RaspberryPi用の純正カメラを使用 ・サー

                                RaspberryPi4にYOLOv3-Tinyを実装してリアルタイム画像認識をしながら物体を自動追尾するカメラを作ってみた - Qiita
                              • Brickit — Build new things from your good old bricks

                                Just scatter your bricks and take a photo. Brickit will show you hundreds of ideas for what to build with them, along with the exact location of each piece you’ll need. Just scatter your bricks and take a photo. Brickit will show you hundreds of ideas for what to build with them, along with the exact location of each piece you’ll need. Focus on creativity while Brickit guides you through the hard

                                  Brickit — Build new things from your good old bricks
                                • 【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた!

                                  3つの要点 ✔️ 画像分類タスクに必要不可欠なData Augmentationの体系をまとめた ✔️ 基本的なData Augmentationについて手法と利点/欠点をまとめた ✔️ 基本的なDAは実装が簡単な上に絶大な効果を発揮する A survey on Image Data Augmentation for Deep Learning written by Connor Shorten, Taghi M. Khoshgoftaar (Submitted on  06 July 2019) Comments: Published by Journal of Big Data Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Image and Video Proc

                                    【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた!
                                  • mediapipe/mediapipe/docs/hand_tracking_mobile_gpu.md at master · google-ai-edge/mediapipe

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      mediapipe/mediapipe/docs/hand_tracking_mobile_gpu.md at master · google-ai-edge/mediapipe
                                    • 2019年CEATECでPFNは何を出展していたのか お片づけロボットだけではない実力は - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                      2019年のCEATECが終了した。本誌でも既報のとおり、ANAホールディングスによるテレプレゼンスロボット活用「アバター」構想を目玉として、日立とソニーによるaiboとminimaru連携など、初お披露目を含む多数のロボットが出展されていた。 さて、昨年(2018年)のCEATECを覚えているだろうか。2018年のCEATECで最も話題を呼んだのは、注目のスタートアップ、株式会社Preferred Networks(プリファードネットワークス、以下 PFN)による「家庭用全自動お片づけロボット」だった。ハードウェアはトヨタ自動車の生活支援ロボットHSRを使い、PFN独自のソフトウェアで自動片付けを成功させ、CEATECではインダストリ/マーケット部門 準グランプリを受賞した。 ■動画 では今年、PFNは何を出展していたのか。2019年は、国内外のスタートアップ企業および海外諸機関のパビリ

                                        2019年CEATECでPFNは何を出展していたのか お片づけロボットだけではない実力は - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                      • Multimodal neurons in artificial neural networks

                                        We’ve discovered neurons in CLIP that respond to the same concept whether presented literally, symbolically, or conceptually. This may explain CLIP’s accuracy in classifying surprising visual renditions of concepts, and is also an important step toward understanding the associations and biases that CLIP and similar models learn. Fifteen years ago, Quiroga et al.[^reference-1] discovered that the h

                                          Multimodal neurons in artificial neural networks
                                        • Fawkes

                                          Shawn Shan†, PhD Student Emily Wenger†, PhD Student Jiayun Zhang, Visiting Student Huiying Li, PhD Student Haitao Zheng, Professor Ben Y. Zhao, Professor † Project co-leaders and co-first authors Email the Fawkes team Email us to join Fawkes mailing list for news on updates/changes. NEWS 5-12-22: v1.01 release for Macbook M1! 5-1-22: Fawkes hits 840,000 downloads! 4-23-21: v1.0 release for Windows

                                          • トップガン マーヴェリック」のキャラになりきれるカメラフィルター登場!

                                            パーフェクト社は、全世界累計10億ダウンロードを記録したアプリ「YouCam メイク」と写真編集アプリ「YouCam Perfect」で、「トップガン マーヴェリック」のキャラクタールックとエフェクトをリリースしました。 このAIニュースのポイント 写真アプリ「YouCam メイク」と「YouCam Perfect」に新たなARフィルターが追加 ARで映画「トップガン マーヴェリック」登場キャラになりきれる体験を実現 アプリ開発元のパーフェクト社はAI技術を活用した美容系アプリを提供する企業 パーフェクト株式会社は、全世界累計10億ダウンロードを記録したアプリ「YouCam メイク」と写真編集アプリ「YouCam Perfect」で、「トップガン マーヴェリック」のキャラクタールックと、エフェクトをリリースしました。 ユーザーは、「トップガン マーヴェリック」をテーマにした夜明けの飛行甲板

                                              トップガン マーヴェリック」のキャラになりきれるカメラフィルター登場!
                                            • Jetson nano セットアップとUSBカメラを使った画像認識 (YOLO) の動作 - Takahiro Suzuki

                                              Jetson nano セットアップとUSBカメラを使った画像認識 (YOLO) の動作 Jetson nanoはNVIDIAのGPUが載った、Raspberry Piサイズのボードです。 簡単な設定でUbuntuとNVIDIA Driver, CUDAが整った環境が揃えられるので、CPUでは重すぎて動かないディープラーニングなどを個人で少し試すのによいデバイスかと思います。 試しにUSBカメラを繋いでYoloを動かしました。 使用したハードウェア Jetson Nano Developer Kit 128 GB Micro SD カード 電源アダプタ 5V/4A USBカメラ USB WiFiモジュール ジャンパーピン J48にジャンパーピンを接続するとDCジャック電源供給に切り替わります。デフォルトのUSB電源供給だと処理負荷が増えた際に安定動作しません。 初期セットアップ Wifiで

                                              • 画像の半教師あり学習について整理した - 機械学習 Memo φ(・ω・ )

                                                概要 勉強会で画像の半教師あり学習について取り上げられるたびに、あれ、これ似たやつなかったっけ?と混乱するので、整理してみました。同じような内容のネット記事や資料はありますが、自分のために記載します。 概要 半教師あり学習とは MixMatch MixUp ReMixMatch Distribution Alignment Augmentation Anchoring CTAugment FixMatch Pseudo-Label Consistency Regularization その他 VAT UDA RandAugment 終わり 参考 半教師あり学習とは 半教師あり学習 (Semi-supervised learning: SSL) とはラベル付きデータとラベルなしデータで学習を行う方法。ラベルなしデータを活用してモデルのパフォーマンスをあげます。 MixMatch MixMat

                                                  画像の半教師あり学習について整理した - 機械学習 Memo φ(・ω・ )
                                                • TechCrunch | Startup and Technology News

                                                  The families of victims of the shooting at Robb Elementary School in Uvalde, Texas are suing Activision and Meta, as well as gun manufacturer Daniel Defense. The families bringing the…

                                                    TechCrunch | Startup and Technology News
                                                  • 画像認識で機械が眼を持つ!? ディープラーニングの可能性と画像認識の事例8選 | AI専門ニュースメディア AINOW

                                                    ディープラーニングと機械学習の学習の違い では、ディープラーニングと普通の機械学習の学習の違いは何なのでしょうか。 そもそも、ディープラーニング(深層学習)と機械学習は対比するものではなく、両者は包含関係にあり、上記でもあるように機械学習の1つの技術としてディープラーニングがあることを前提におきます。 最も分かりやすい両者の違いは、学習するデータを自動で選択することができるか、そうではないかです。ディープラーニングは先ほど紹介したように、コンピュータが自動でデータを集めて学習します。一方、機械学習では、人間がデータを選択してコンピュータに学習させる必要があります。 なぜディープラーニングを使うのか では次に、なぜ機械学習ではなくディープラーニングを使うことが増えてきているのかを紹介します。 理由は主に2つあります。 音声・動画のような非構造化データにも対応できる 1つ目の理由は、音声や動画

                                                      画像認識で機械が眼を持つ!? ディープラーニングの可能性と画像認識の事例8選 | AI専門ニュースメディア AINOW
                                                    • Clearview AI | Facial Recognition

                                                      Clearview AI’s investigative platform allows law enforcement to rapidly generate leads to help identify suspects, witnesses and victims to close cases faster and keep communities safe. Learn More >

                                                        Clearview AI | Facial Recognition
                                                      • OpenAI Microscope

                                                        A collection of machine learning interpretability techniques from the OpenAI Clarity team.

                                                          OpenAI Microscope
                                                        • Microsoftが「感情を読み取る」と物議を醸した顔認証ツールを廃止

                                                          Microsoftが、年齢や性別、表情などを読み取る顔認識サービスの一部機能を廃止することを発表しました。これらの「人々の感情を読み取る機能」は、Microsoftの社内外で正当性やプライバシーに関する物議を醸していました。 Microsoft's framework for building AI systems responsibly - Microsoft On the Issues https://blogs.microsoft.com/on-the-issues/2022/06/21/microsofts-framework-for-building-ai-systems-responsibly/ Responsible AI investments and safeguards for facial recognition | Azure Blog and Updates |

                                                            Microsoftが「感情を読み取る」と物議を醸した顔認証ツールを廃止
                                                          • 数式の画像を撮影するだけでLaTeX形式に変形してくれるMathpixのWeb版「Snip Notes」が、PDFファイルを丸ごとLaTeXやDOCX、Markdownへ変換する機能を追加。

                                                            数式の画像を撮影するだけでLaTeX形式に変形し挿入してくれるMathpixのWeb版「Snip Notes」がPDFファイルを丸ごとLaTeXやDOCX、Markdownへ変換してくれる機能を追加しています。詳細は以下から。 Mathpix Snipシリーズはスタンフォード大学でディープラーニングを専攻していたNico Jimenezさんが開発した数式に特化したOCRアプリで、写真やスクリーンショット内にある手書きや印刷された数式を抽出してLaTeX形式に変換してくれる機能がありますが、このMathpix SnipのWeb版となる「Snip Notes」が、PDFファイルの変換機能をサポートしたと発表しています。 We are very excited to announce the release of a new feature that we have been working o

                                                              数式の画像を撮影するだけでLaTeX形式に変形してくれるMathpixのWeb版「Snip Notes」が、PDFファイルを丸ごとLaTeXやDOCX、Markdownへ変換する機能を追加。
                                                            • Google AI will no longer use gender labels like 'woman' or 'man' on images of people to avoid bias

                                                              An icon in the shape of a person's head and shoulders. It often indicates a user profile.

                                                                Google AI will no longer use gender labels like 'woman' or 'man' on images of people to avoid bias
                                                              • Yahoo!ブラウザー、「カメラ検索」に新機能「スポット検索」の提供開始

                                                                ヤフーが提供するAndroidアプリ「Yahoo!ブラウザー」は、画像から似ている商品などを検索できる機能「カメラ検索」に独自のAIによる画像解析技術を用いて、施設や観光名所などの検索ができる「スポット検索」の提供を開始しました。 このAIニュースのポイント 「Yahoo!ブラウザー」の「カメラ検索」に施設や観光名所の検索ができる「スポット検索」が追加 AIによる画像解析技術で全国約2万ヶ所の建物、施設の画像検索が可能 検索結果には名称、関連画像、説明文、住所などその場所に関する深堀り情報が表示 ヤフー株式会社が提供する、累計約1,400万ダウンロードのAndroidアプリ「Yahoo!ブラウザー」は、画像から似ている商品などを検索できる機能「カメラ検索」に独自のAIによる画像解析技術を用いて、施設や観光名所などの検索ができる「スポット検索」の提供を開始しました。 「Yahoo!ブラウザー

                                                                  Yahoo!ブラウザー、「カメラ検索」に新機能「スポット検索」の提供開始
                                                                • CH552-MCUでSplatoon3の自動ドット打ちを実現する|ゲーム好きの和菓子|note

                                                                  ボードのインストール ① ファイル→環境設定を開き、「追加のボードマネージャのURL」に以下のURLを追加してください。 https://raw.githubusercontent.com/DeqingSun/ch55xduino/ch55xduino/package_ch55xduino_mcs51_index.json ② ツール→ボード→ボードマネージャを開き、検索窓で「ch55xduino」を検索し、インストールします。 ③ ツール→ボードから、CH552を選択します。 ④ ツール→USB Settingsから、「USER CODE w/ 148B USB ram」を選択します。 ライブラリのインストール Arduino IDEのライブラリマネージャーの検索窓で「CH55xSwitchControl」を検索し、インストールします。 画像の変換・コンパイル以下からch552spl3p

                                                                    CH552-MCUでSplatoon3の自動ドット打ちを実現する|ゲーム好きの和菓子|note
                                                                  • [OpenCV+dlib] 顔認識の実験 - Qiita

                                                                    1.はじめに OpenCVとdlibで顔認識を実験してみました。 2. Face Detector() まず、顔を検出します。 顔の検出というのは、「画像の中から、人の顔を認識し、その位置を特定する」ことを意味します。 dlibのget_frontal_face_detector()を利用します。 import dlib #dlibのget_frontal_face_detectorのインスタンスを立てる。 detector = dlib.get_frontal_face_detector() #imagesで顔を検出し、それをfacesに保存する。 faces = detector(images) 上記のコードのfacesに保存された情報を元に、検出された顔に四角い枠を表示します。 実行結果を示します。二人の女性を顔を検出し、白い枠で表示されていることが分かります。 3. Facial

                                                                      [OpenCV+dlib] 顔認識の実験 - Qiita
                                                                    • pythonとdlibでお手軽に顔のランドマークを検出してみた - Qiita

                                                                      pip install dlib pip install imutils pip install opencv pip install libopencv pip install py-opencv 学習済みモデルの入手 学習済みモデルはdlibの公式サイトの以下から入手できます。 dlib ~Index of /files~ http://dlib.net/files/ →「shape_predictor_68_face_landmarks.dat.bz2 」を選択 余談ですが上記の学習済みモデルは以下のサイトのデータを元に生成されています。 i・bug ~Facial point annotations~ https://ibug.doc.ic.ac.uk/resources/facial-point-annotations/ 顔画像の入手 顔画像は以下から「Girl.bmp」を入手し

                                                                        pythonとdlibでお手軽に顔のランドマークを検出してみた - Qiita
                                                                      • 東京メトロmy!アプリで日比谷線・半蔵門線の号車ごとのリアルタイム混雑状況を配信開始

                                                                        東京メトロは、東京メトロmy!アプリで号車ごとのリアルタイム混雑状況を配信する機能を提供しており、2022年6月29日(水)から新たに日比谷線・半蔵門線での配信を開始しました。 このAIニュースのポイント 東京メトロmy!アプリのリアルタイム混雑状況配信機能が日比谷線・半蔵門線にも実装 デプスカメラと画像認識AIを用いてリアルタイムの混雑状況を号車ごとに配信 リアルタイムだけでなく乗る電車のその先の区間における混雑状況の変化を予測し可視化 東京地下鉄株式会社は、2021年7月から東京メトロmy!アプリで号車ごとのリアルタイム混雑状況を配信していますが、2022年6月29日(水)から新たに日比谷線・半蔵門線での配信を開始しました。 東京メトロはデプスカメラと画像認識AIを用いた列車混雑計測システムを導入しており、東京メトロmy!アプリにて、リアルタイムの車内の混雑状況とその列車のその後の混雑

                                                                          東京メトロmy!アプリで日比谷線・半蔵門線の号車ごとのリアルタイム混雑状況を配信開始
                                                                        • ITエンジニアのためのスパースモデリング入門一覧

                                                                          CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

                                                                            ITエンジニアのためのスパースモデリング入門一覧
                                                                          • クレストが顧客へのサービス強化を目的にAWLと事業提携を開始

                                                                            このAIニュースのポイント クレストが小売業界向けにエッジAIカメラソリューションを提供するAWLと事業提携を開始 2社の技術を組み合わせることにより、既存店舗でもデータ取得の導入障壁を減らす 小売業界における「データを活用した施策づくり」に向けてデータ取得の幅の拡大を期待 クレストが小売業界向けにエッジAIカメラソリューションを提供するAWLと事業提携を開始しました。この事業提携により、クレストが提供するサービス、「リテールアナリティクスサービス」における価値提供の幅拡大が期待されます。 クレストは2016年より、サインやディスプレイの効果検証を可能とする「リテールテック事業」を開始しており、リアル店舗へ「顧客データ収集」 や 「データを活用した施策づくり」 を 導入支援から取得データの提供・分析までを提供しています。 一方、AWLは既設の防犯カメラをAI化し、少ない投資で最適なソリュー

                                                                              クレストが顧客へのサービス強化を目的にAWLと事業提携を開始
                                                                            • 書店で万引き疑われる人物、顔認識カメラで把握…導入後の被害が半減

                                                                              【読売新聞】 人の顔が識別できる顔認識カメラの防犯への利用を巡り、民間事業者らの対応が分かれている。公表して活用する事業者がある一方で、プライバシー侵害への懸念から技術提供を中止したメーカーも出ている。JR東日本が刑務所の出所者らを

                                                                                書店で万引き疑われる人物、顔認識カメラで把握…導入後の被害が半減
                                                                              • ResNet (Residual Network) の実装 | AIdrops

                                                                                ResNet (Residual Network) の実装 画像認識タスクにおいて、高い予測性能をもつ ResNet。ImageNetのSOTAランキングでも、EfficientNetと並び、応用モデルが上位にランクインしています。ライブラリ等を用いれば事前学習済のResNetは簡単に読み込めますが、モデルの構造をきちんと実装しようとすると、どうなるでしょうか?今回は、このResNetをPyTorchを用いて実装していきたいと思います。 様々な応用モデルが存在するResNetですが、もともとは2015年に Deep Residual Learning for Image Recognition という論文で提案された手法になります。大きな特長は、skip connection あるいは residual connection と呼ばれる、層を飛び越えた結合を持つことです。 下図がモデルの概

                                                                                  ResNet (Residual Network) の実装 | AIdrops
                                                                                • ウクライナ侵攻「AI顔認識」で死亡ロシア兵を特定、懸念される「酷い結果」の危険性とは?(平和博) - エキスパート - Yahoo!ニュース

                                                                                  ウクライナ侵攻をめぐり、プライバシー侵害で物議を醸す「AI顔認識」を、死亡ロシア兵の身元特定に使い始めた――そこで懸念される「酷い結果」の危険性とは? ウクライナ副首相のミハイロ・フェドロフ氏はロイター通信に対して、米ベンチャー「クリアビューAI」から「AI顔認識」サービスの無償提供を受け、使用を開始したことを明らかにした。 フェドロフ氏はその用途として、死亡したロシア兵の身元特定を挙げている。 「クリアビューAI」はソーシャルメディアなどから自動収集した100億枚以上の顔画像データベースを使用しており、プライバシー侵害だとして各国政府から相次いで巨額の制裁金やサービス停止を命じられている。 今回の利用についても、人権団体からは「監視会社による戦争の利用」と抗議の声が上がる。 戦場ですすむAI利用。その先には、深刻な問題が指摘されている。 ●ロシア版SNSの20億枚 兵士たちの母への礼節を

                                                                                    ウクライナ侵攻「AI顔認識」で死亡ロシア兵を特定、懸念される「酷い結果」の危険性とは?(平和博) - エキスパート - Yahoo!ニュース