並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 200件

新着順 人気順

画像認識の検索結果1 - 40 件 / 200件

  • 「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ

    Appleが6月のWWDCで正式発表する「iOS 18」について。 新たにSafariブラウジングアシスタント機能や暗号化されたビジュアル検索機能が搭載されるという情報が出ています。 iOS 18のイメージAppleのサーバー上のコードから発見したとして報告されており、当初、SafariのブラウジングアシスタントはiCloudプライベートリレーのインフラを使い、プライバシーを重視した形でAppleに関連データを送信するのではないかと推測されていましたが、その後、プライベートリレーとの関係はないかもしれないともしています。 MacRumorsは、SafariのブラウジングアシスタントはiOS 18でiPhoneに搭載されると噂されている新しい生成AI機能のうちのひとつかもしれないと推測しています。GPT-4を搭載したCopilotを備えたMicrosoft Edgeや、ウェブページを要約して

      「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ
    • GitHub - Filimoa/open-parse: Improved file parsing for LLM’s

      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

        GitHub - Filimoa/open-parse: Improved file parsing for LLM’s
      • 若い米国人エンジニア、500ドル未満でGPSに依存しない無人機を1日で開発

        3人の若い米国人エンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機を1日で作り上げてしまい、彼らは「ウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている」と明かした。 参考:How A Trio Of Engineers Developed A GPS-Denied Drone For Under $500 Theseusの無人機にはウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている米軍はロシアや中国の妨害してくるGPS信号への対応に苦慮しているが、3人の若いエンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機(500ドル未満)を1日で作り上げてしまい、Aviation Weekは「彼らは低コストでGPSを代替する手段があると考えている」「この無人機の開発速度は国防総省が

        • HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始

          HOUSEIは、AI顔認証システム「WelcomID」連携した予約管理システム「eRESERvest(エリザベスト)」の販売を開始します。 このAIニュースのポイント エリザベストは、予約業務を自動化し電話や窓口対応の時間を軽減。効率的な店舗運営が実現 AI顔認証端末「WelcomID」と連携し顔認証を利用することで、省人化した受付・入室ができ、またクラウドシステムとの連携も可能 ネット予約で24時間365日、自動で予約受付可能。接客対応中の電話や営業時間外の予約取りこぼしを防止し機会損失を減らす 2023年10月11日、HOUSEI株式会社は、従来の予約管理システムを刷新し、新たにAI顔認証連携を実現した予約管理システム「eRESERvest(エリザベスト)」を販売すると発表しました。 エリザベストの機能として顔認証端末「WelcomID」との連携により、顔認証を利用し省人化した受付・入

            HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始
          • 巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル

            数年前、巨大テック企業のエンジニアたちは、カメラで捉えた相手の顔を認識し、名前を表示するツールを開発した。だが、かのシリコンバレーもそのときばかりは、素早く実用化して環境を変えることをしなかった。 それからしばらく経ったいま、大企業の支配を受けないスタートアップが、その技術を世に出そうとしている。この状況は、技術をどう活用するかという倫理的な議論や法規制が必要であることを浮き彫りにする。 すでに完成されていた技術 2017年初頭のある日の午後のことだ。カリフォルニア州メンロパークにあるフェイスブック本社の会議室で、エンジニアのトマー・レイヴァンドは、野球帽の端にスマートフォンをくっつけた状態で座っていた。そのスマートフォンは、ゴムバンドによってカメラを外に向けた状態でしっかり固定されていた。 このばかげた帽子フォンは、きわめて不格好だったが、未来の青写真であり、そこにはごく一部の社員しか知

              巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル
            • YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO

              5 AI-OCR AI-OCRとしては、MicrosoftのComputer Visionで提供されている、Read APIを使用させて頂きました。 参考: Computer Vision 3.2 GA Read API を呼び出す 最初は、ナンバープレート画像を、そのままOCRにかけてみたのですが、下段左の平仮名1文字のところの認識が難しいようでした。これは、このように「ひらがな」1文字だけが配置されることに、モデルが対応しきれていないような気がしました。 対策として、画像を3つの部分に分割し、それぞれでOCRにかけるようにしてみました。また、認識精度が上がるように、業務用(緑バックの白文字、及び、黒バックの黄色文字)は、ネガポジ反転し、最終的にグレースケール変換することにしました。 AI-OCRで処理しているコードと、それを使っている、全体のコードです。 ocr.py import t

                YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO
              • 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan

                Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な

                  日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
                • iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania

                  ベータ版が開発者向けに公開されているiOS17ですが、写真アプリの「画像を調べる」がさらに強化されており、洗濯表示の読み取り、その意味を解説してくれるようになりました。MacStoriesの記者が報告しています。 ■3行で分かる、この記事のポイント 1. iOS17で、写真アプリの「画像を調べる」がさらに強化されている。 2. 洗濯表示の読み取り、その意味を解説してくれるようになった。 3. ペット認識や車に使われているマークを調べることもできる。 オンラインで洗濯指示情報を入手 iOS17では、写真の中の洗濯表示シンボルの意味を説明してくれるようになっていることがわかった、とフェデリコ・ヴィッティチ氏が画像をソーシャルメディアに投稿しています。Appleは、国際標準化機構(ISO)が運営するオンライン・ブラウジング・プラットフォームから洗濯指示の情報を入手しています。 MacRumors

                    iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania
                  • Pythonで手軽に顔認識をやってみる(face-recognition)

                    はじめまして!エンジニアのUemaです。 近年では、スマホのロックの解除や入館時の認証など様々なことに顔認識の技術が使われています。 顔認識を利用するには機械学習、画像処理や数学などの様々な知識が必要で学習コストがかかり、顔認識を使ってアプリケーションを作ってみたいと考えている人もなかなか手が出ないと思います。 そんな人に朗報です! 手軽に顔認識を行えるface-recognitionというPythonライブラリが存在します! 今回は顔認識の入り口として、face-recognitionを実際に使ってみたいと思います。 face-recognitionとは Pythonコードやコマンドラインで手軽に顔を検出・認識することができるライブラリです。face-recognitionの顔認識モデルは99%の正解率を記録しているそうです。 インストール(mac) Pythonとhomebrewがイン

                      Pythonで手軽に顔認識をやってみる(face-recognition)
                    • Android携帯、多数が顔認証の安全性に不備 持ち主の写真でロック解除可能 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                      顔認証によるロック解除機能を搭載したAndroid(アンドロイド)スマートフォンの多くが、写真を使ってロック解除ができてしまうことを示した調査結果が発表された。 英国の消費者団体「Which?」が48機種をテストしたところ、19機種で持ち主の写真、それも普通紙に印刷した低解像度の写真でロックを解除できた。 写真でロック解除できた機種は、モトローラの「Moto E13」などの低価格モデルが大半だが、モトローラの「Razr 2022」などの高級機種も含まれていた。メーカー別の内訳はシャオミが7機種、モトローラが4機種、ノキア、オッポ、サムスンが各2機種、オナーとビボが各1機種。 同団体はアップルのiPhoneもテストしたが、結果はすべて合格だった。iPhoneには、センサーを使ってユーザーの顔の3D深度マップを作成する「Face ID」機能が搭載されている。 同団体のテクノロジー担当エディター

                        Android携帯、多数が顔認証の安全性に不備 持ち主の写真でロック解除可能 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                      • “あの時”のプーチン氏はニセモノだった⁈影武者の真偽AIが分析 【報道1930】 | TBS NEWS DIG

                        広島サミットにゼレンスキー大統領が参加し結束を再確認し合う形となった西側。それに対抗するように中国にミシュスチン首相を送ったり、旧ソ連の首相を呼んだ会議をモスクワで開いたりとプーチン大統領の動きも激…

                          “あの時”のプーチン氏はニセモノだった⁈影武者の真偽AIが分析 【報道1930】 | TBS NEWS DIG
                        • 【速報】次世代の外観検査!?プロンプトを駆使した異常検知 - Qiita

                          先日、革新的な画像の異常検知(SAA)が出てきました。 何やら革命的な臭いがする... SAMを使った異常検知手法https://t.co/wmwFcbULdq コードはこちらhttps://t.co/3npK3FhnEz pic.twitter.com/JDs30bEJyQ — shinmura0 (@shinmura0) May 22, 2023 本稿では、操作手順 & 触ってみた感想をご報告します。 特長 本題に入る前に、どこら辺が革新的なのかざっくり説明します。 ※ SAAの詳細は論文をご参照ください。 学習データは不要 通常、学習(正常)データを数百枚用意しますが、この手法では正常データを必要としません。 ドメイン知識を導入できる 予め、異常の傾向をプロンプトに入れることにより、異常の特徴をモデルに教えることができます。 二点目が特に大きく、今までの異常検知では、積極的に異常の傾

                            【速報】次世代の外観検査!?プロンプトを駆使した異常検知 - Qiita
                          • GitHub - tfandkusu/ikut3: OBSをWeb Socketで操作して、やられたシーンのリプレイバッファを作るWebアプリ

                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                              GitHub - tfandkusu/ikut3: OBSをWeb Socketで操作して、やられたシーンのリプレイバッファを作るWebアプリ
                            • 「スプラトゥーン3」で敵に倒されたシーンだけを自動録画できるウェブアプリ「iKut 3」でグングン上達できる環境を作ってみたよレビュー

                              「スプラトゥーン3(Splatoon3)」などの対戦ゲームでは、プレイ中の画面を録画しておくことでゲーム終了後に改善すべき点を見つけることができます。無料で公開されているウェブアプリ「iKut 3」と録画配信ソフト「OBS Studio」を組み合わせれば、スプラトゥーン3の「敵に倒されたシーン」のみを録画可能とのこと。敵に倒されたシーンのみを繰り返し再生することで爆速で上達できそうだったので、実際にiKut 3を使ってスプラトゥーン3の画面を録画する手順を確認してみました。 iKut 3 https://s3.ikut.app/ スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する - Qiita https://qiita.com/tfandkusu/items/1131a9a549249b5d8cfe まずは、OBS Studioの設定を行います。画面上部の「ツー

                                「スプラトゥーン3」で敵に倒されたシーンだけを自動録画できるウェブアプリ「iKut 3」でグングン上達できる環境を作ってみたよレビュー
                              • COLMINA 画像認識アルゴリズム自動生成

                                FUJITSU Manufacturing Industry SolutionCOLMINA 画像認識アルゴリズム自動生成COLMINA Service AI-Pro富士通が長年培ってきた「AI技術」と「ものづくり現場での経験」を基に、画像認識アルゴリズムを簡単な操作で高精度に自動生成します。アルゴリズムを生成するエンジニアの負荷を下げ、変化変動に強い画像認識アルゴリズムで生産ラインの早期立ち上げ、安定稼働に貢献します。

                                  COLMINA 画像認識アルゴリズム自動生成
                                • スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する - Qiita

                                  この記事は スプラトゥーン3の試合中に、やられる直前15秒の動画を自動作成するシステムを開発したので紹介します。 ここに至るまでの15秒の動画を試合中に自動作成します。 スプラトゥーン2の時に開発した、やられたシーン自動抽出システムは、時間がかかる スプラトゥーン2に引き続きスプラトゥーン3もやりこんでいますが、対面力に課題ありです。そこで、やられたシーンを録画で振り返りつつXマッチに潜っています。 その振り返りの効率化のため、スプラトゥーン2の時にプレイ録画から、やられたシーンを自動抽出するシステムを作りました。その様子はこちらの記事で解説しています。 スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する Flutter Webで画像分類を行う(AutoML Vision, TensorFlow.js) しかしこのシステムには問題があります。試合が終わっ

                                    スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する - Qiita
                                  • Meta、写真内のあらゆるものをきれいに切り出せる技術

                                      Meta、写真内のあらゆるものをきれいに切り出せる技術
                                    • CH552-MCUでSplatoon3の自動ドット打ちを実現する|ゲーム好きの和菓子|note

                                      ボードのインストール ① ファイル→環境設定を開き、「追加のボードマネージャのURL」に以下のURLを追加してください。 https://raw.githubusercontent.com/DeqingSun/ch55xduino/ch55xduino/package_ch55xduino_mcs51_index.json ② ツール→ボード→ボードマネージャを開き、検索窓で「ch55xduino」を検索し、インストールします。 ③ ツール→ボードから、CH552を選択します。 ④ ツール→USB Settingsから、「USER CODE w/ 148B USB ram」を選択します。 ライブラリのインストール Arduino IDEのライブラリマネージャーの検索窓で「CH55xSwitchControl」を検索し、インストールします。 画像の変換・コンパイル以下からch552spl3p

                                        CH552-MCUでSplatoon3の自動ドット打ちを実現する|ゲーム好きの和菓子|note
                                      • 【検証】 プーチン氏の周りで撮影される人たち……顔認証ソフトの判定は - BBCニュース

                                        ロシアのウラジーミル・プーチン大統領が公の場で撮影されると、周りにはいつも同じ人たちがいる――と、ソーシャルメディアでうわさになりがちだ。最近では、昨年大みそかに公表された集合写真について、プーチン氏の背後にいるのは本物の軍人ではない、以前にもプーチン氏と一緒に撮影されていたなどのうわさがとびかった。果たして本当にそうなのか。顔認証ソフトウェアで検証する。

                                          【検証】 プーチン氏の周りで撮影される人たち……顔認証ソフトの判定は - BBCニュース
                                        • 【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践

                                          こんにちは。TURING株式会社でインターンをしている、東京大学学部3年の三輪と九州大学修士1年の岩政です。 TURINGは完全自動運転EVの開発・販売を目指すスタートアップです。私たちの所属する自動運転MLチームでは完全自動運転の実現のため、AIモデルの開発や走行データパイプラインの整備を行っています。 完全自動運転を目指すうえで避けて通れない課題の一つに信号機の認識があります。AIが信号機の表示を正しく理解することは、自動運転が手動運転よりも安全な運転を達成するために欠かせません。信号機を確実に認識したうえで、周囲の状況を総合的に判断して車体を制御し、安全かつ快適な走行を実現する必要があります。 TURINGでは信号機の認識に取り組むため、15,000枚規模のデータセットを準備し、高精度なモデルのための調査・研究を開始しました。この記事ではデータセットの内製とその背景にフォーカスしつつ

                                            【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践
                                          • 顔識別技術でガールスカウトの母親が「裁判中の弁護士事務所の弁護士」だと判明しイベント会場から追い出されてしまう

                                            by Kevin Poh ある母娘がガールスカウトの集まりでクリスマスイベントの舞台を観劇しようとしたところ、母親だけ警備に呼び止められて会場から追い出されてしまいました。その理由について会場の運営会社は、母親が自社の訴訟を担当している弁護士事務所に所属する弁護士だからだと説明しました。 MSG’s Facial Recognition at Radio City Gets Girl Scout Mom Kicked Out – NBC New York https://www.nbcnewyork.com/investigations/face-recognition-tech-gets-girl-scout-mom-booted-from-rockettes-show-due-to-her-employer/4004677/ Girl Scout mom banned from Rad

                                              顔識別技術でガールスカウトの母親が「裁判中の弁護士事務所の弁護士」だと判明しイベント会場から追い出されてしまう
                                            • コンピュータビジョン分野のトップカンファレンスであるECCV2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog

                                              目次 目次 はじめに ECCV2022概要 Workshop Instance-Level Recognition Workshop Keynote talk: Image Search and Matching Kaggle Google Universal Image Embedding Challenge Keynote talk: Few-Shot Learning for Object Aware Visual Recognition Language Assisted Product Search Granularity aware Adaptation for Image Retrieval over Multiple Tasks Where in the World is this Image? Transformer-based Geo-localization in t

                                                コンピュータビジョン分野のトップカンファレンスであるECCV2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog
                                              • 【Nintendo Switch 自動化】予算1500円で画像認識マクロ環境を実現する - チラ裏雑記帳

                                                この記事はPokémon RNG Advent Calendar 2020 13日目の記事です。 本当は色々細かく書きたかったのですが、リアルが色々忙しくなってしまったので簡潔に纏めます。 (ハック関連のアレソレ?知らんな) 概要 タイトルで釣ってしまいましたが、最近色々なデバイスが値上がりしている関係で1500円で環境構築するのは少し難しいかもしれません... また、無線機器を使用する都合上環境によっては遅延や入力漏れ等の問題が発生する可能性があります。 それらを気にする場合はマイコンを使用した有線接続を推奨致します。 また、有線接続の為にマイコンとシリアル通信モジュールを統合した基板を設計したので、興味のある方はこちらも参照してください。 使用しているマイコンのhex書き込みツールがGUIなので、従来のATmega系マイコンより簡単に環境構築ができると思います。 bzl.hatenab

                                                  【Nintendo Switch 自動化】予算1500円で画像認識マクロ環境を実現する - チラ裏雑記帳
                                                • 中国政府がスマホ追跡や顔認識などを駆使し抗議者を追跡し自宅を特定、大規模な監視が裕福な都市の中流階級の人々に向けられたのは初めて

                                                  厳格な新型コロナウイルス感染症対策(COVID-19)へ抗議活動を行った中国の国民が、過去10年をかけて中国政府が構築してきた強力な監視ツールにより正確に追跡されていることがニューヨーク・タイムズより伝えられました。政府がどのようなツールを使い、どのように人々を追跡しているのかについて、ニューヨーク・タイムズが解説しています。 How China’s Police Used Phones and Faces to Track Protesters - The New York Times https://www.nytimes.com/2022/12/02/business/china-protests-surveillance.html 中国の警察は街角やビルの入り口に何百万台ものカメラを設置し、強力な顔認識ソフトを導入して人々を追跡しています。政府が採用するソフトウェアの1つ「Face

                                                    中国政府がスマホ追跡や顔認識などを駆使し抗議者を追跡し自宅を特定、大規模な監視が裕福な都市の中流階級の人々に向けられたのは初めて
                                                  • TwitterのAIが流れ星の動画を「いかがわしい」と判定。天文家のアカウントが凍結される | Gadget Gate

                                                    英国の天文家メアリー・マッキンタイア氏は、流れ星の動画をTwitterに投稿したところ「被写体の同意なく共有されたいかがわしい内容」を含むと自動判定され、突然アカウントが凍結された。 Here is the #IonizationTrail from the #Perseid #Fireball at 01:37 BST / 00:37 UT 13/08/22 from #Oxfordshire. Visually it was epic! Canon 1100D 18-55mm lens 8sec ISO-800 f/3.5. Video is made from the fireball + 7 subsequent images #Perseids2022 #PerseidsMeteorShower pic.twitter.com/jSw3OTSw15 — Mary McIntyre

                                                      TwitterのAIが流れ星の動画を「いかがわしい」と判定。天文家のアカウントが凍結される | Gadget Gate
                                                    • 凸版印刷、今度は明治から昭和のくずし字文書が「読める、読めるぞ!」--2023年4月リリース

                                                      近代に作られた手書きの資料は大量に残っており、公文書や企業経営にかかわる文書、業務日誌、書簡など、貴重な資料が多いそうだ。ただし、くずし字で書かれたものが多く、書き手によるくずし方の差が大きいうえ、筆記用具の多様化、カタカナ語の混在、旧字や旧仮名遣い表記などの特性があり、江戸時代の資料より解読が困難な場合もあるという。 そこで、凸版印刷は古文書解読サービス「ふみのは」で提供中の江戸時代のくずし字に対応したOCRをベースとして、近代の多様な筆跡の手書き文字に対応するOCRを開発した。今後、実証実験を進め、2023年4月より正式サービスとして提供する予定。 提供形態は、くずし字解読システム「ふみのはゼミ」の追加サービスとするほか、古文書解読アプリ向けの追加サービスや、APIサービスを検討している。

                                                        凸版印刷、今度は明治から昭和のくずし字文書が「読める、読めるぞ!」--2023年4月リリース
                                                      • グーグルレンズの「パソコンにコピー」が地味に便利だという話 - 世界のねじを巻くブログ

                                                        Google Lensでテキストをスキャン いきなりですが、グーグルクローム関連の小ネタを3つ紹介。 Google Lensでテキストをスキャン 二窓検索機能 タブ検索 まず一つ目は、 現実世界にある文字・テキストを スマホのGoogle Lensのアプリで読み取り文字起こしして、 PCのGoogle Chromeに飛ばすというライフハック。 パソコンで作業してるときけっこう使えます。 まずはグーグルレンズで文字を読み込み、 場所・範囲を選択。 そして 上記画像の下部に「パソコンにコピー」ってあるのわかりますかね?? これをタップすれば、Google Chromeにコピーされ、 あとは PC上でCtrl+V コピペできるようになります。 例として上記画像の、サンタナのアルバム『キャラバンサライ』ライナーノーツから。 肉体は溶けて宇宙に変わる 宇宙は溶けて静寂の音に変わる 音は溶けてまばゆい

                                                          グーグルレンズの「パソコンにコピー」が地味に便利だという話 - 世界のねじを巻くブログ
                                                        • 凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発

                                                          2022/11/11 凸版印刷、明治期から昭和初期の手書き文字を解読する AI-OCRを日本で初めて開発

                                                            凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発
                                                          • 自動運転車の視界から“人だけ”を消す攻撃 偽情報をLiDARに注入 電通大などが発表

                                                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米ミシガン大学、米フロリダ大学、電気通信大学による研究チームが発表した論文「You Can’t See Me: Physical Removal Attacks on LiDAR-based Autonomous Vehicles Driving Frameworks」は、自動運転車の周囲を検知するセンサーにレーザー光を物理的に照射して、選択的に障害物を見えなくする攻撃を提案した研究報告だ。偽の情報を注入するスプーフィング攻撃で自動運転車の物体検出モデルに影響を与え安全を脅かす。 自動運転車の知覚システムは、LiDARやカメラ、レーダーなどのセンサーを活用して、障害物回避やナビゲーション制

                                                              自動運転車の視界から“人だけ”を消す攻撃 偽情報をLiDARに注入 電通大などが発表
                                                            • まるで透明マント。監視カメラでAIが認識しないアグリー・セーターが作られる

                                                              まるで透明マント。監視カメラでAIが認識しないアグリー・セーターが作られる2022.10.22 16:0090,468 岡本玄介 目立つ柄だけど社会的に消えます。 伝統的に冬になると欧米人が着る、ダッサい柄の「アグリー・セーター」。マイクロソフトも毎年新作をリリースし、音楽業界ではアイアン・メイデンやガンズ・アンド・ローゼズがオリジナルを作っていましたね。 さて、今年もそろそろアグリー・セーターの時期が到来しようという頃合いですが、ニューヨーク州にあるコーネル大学では、監視カメラでAIが認識しない「アグリー・セーター」が爆誕した模様。『ドラえもん』や『ハリーポッター』では物理的に消える「透明マント」がありましたが、こちらは社会的に透明人間になれる装備となっています。 検出オブジェクトの信頼度を下げる模様デカデカと印刷されている市場のカボチャみたいな模様は、機械学習システムが認証時に用いるス

                                                                まるで透明マント。監視カメラでAIが認識しないアグリー・セーターが作られる
                                                              • 共通コンポーネントのテスト実装方法にあえてVRTを選択した話 / why do we choose VRT for testing shared components

                                                                Vue Fes Japan 2022 の発表内容です https://vuefes.jp/2022/sessions/KushibikiMashu ■ 概要 社内のコンポーネントライブラリに対してStorybookとChromaticでビジュアルリグレッションテストを導入して、見た目のデグレを防止している話をします。 ■ 詳細 Chromaticとは、Storybookのメンテナーが作成しているStorybook用のツールです。 ストーリーごとのスクリーンショットを撮影し、差分を画像で比較してくれる機能を備えています。 以下の課題を解決することを目的にして Chromatic を導入しました。 既存のコンポーネントを改修した際に発生する DOM、CSS に起因する表示崩れを自動で検知できないこと 依存モジュールのバージョンアップに時間がかかること その結果、両方の課題を解決できた上に作業が

                                                                  共通コンポーネントのテスト実装方法にあえてVRTを選択した話 / why do we choose VRT for testing shared components
                                                                • ゴキブリを自動で見つけレーザーで殺す装置 数万円で自作も可能

                                                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 スコットランドのHeriot-Watt University、フランスのUniversity Paul Sabatier、英University of Sussexによる研究チームが発表した論文「Selective neutralisation and deterring of cockroaches with laser automated by machine vision」は、ゴキブリを自動的に射殺できるデバイスを提案した研究報告だ。カメラでゴキブリを捉え、その位置にレーザー光を照射して殺傷する。

                                                                    ゴキブリを自動で見つけレーザーで殺す装置 数万円で自作も可能
                                                                  • レーザーでゴキブリを自動ロックオンして焼き殺すAI搭載タレットが登場

                                                                    by Douglas Muth ゴキブリは多くの人にとって悩みの種なので、「もし自動でゴキブリを退治してくれるAIが登場したら是非使いたい」という人は多いはず。そんな人の夢を実現するAI搭載の自動レーザー砲台が開発されました。 なお、この記事にはゴキブリの映像や画像が掲載されるので、苦手な人は注意してください。 Full article: Selective neutralisation and deterring of cockroaches with laser automated by machine vision https://doi.org/10.1080/00305316.2022.2121777 Scientists Create AI-Powered Laser Turret That Kills Cockroaches https://www.vice.com/en/a

                                                                      レーザーでゴキブリを自動ロックオンして焼き殺すAI搭載タレットが登場
                                                                    • ウクライナ戦争で台頭する「顔認識」 米新興企業が手掛ける“ヤバすぎる”サービスとは

                                                                      2月24日にロシアによるウクライナ侵攻で始まったいわゆる「ロシア・ウクライナ戦争」。開戦からすでに半年余りが過ぎたが、いまだ終戦の兆しが見えてこない。 この間、実にさまざまな識者たちが分析や解説を行っている。その中で個人的に最も驚かされたのは、この戦争がいわば「古いタイプ」だったことだ。領土争いや虐殺が行われ、旧式の兵器(なんと百年前のもの!)が使用され、野戦砲が主力とされている。 一方で、この戦争は2022年という21世紀の近代国家同士によって行われているものであるため、実に現代的な部分も存在している。 すでに各メディアでも取り上げられているように、トルコ製ドローン(バイラクタル2)の活躍や、緒戦におけるサイバー空間での攻防、そして実業家イーロン・マスク氏のSpaceX社がウクライナ上空から現地の人々に無料で提供している衛星通信を使ったブロードバンドサービス「スターリンク」といったものは

                                                                        ウクライナ戦争で台頭する「顔認識」 米新興企業が手掛ける“ヤバすぎる”サービスとは
                                                                      • The Follower, 2023-2024

                                                                        Using open cameras and AI to find how an Instagram photo is taken. How does this work? Recorded a selection of open cameras for weeks. Scraped all Instagram photos tagged with the locations of the open cameras. Software compares the Instagram with the recorded footage. I launched the project on 12 September 2022. The YouTube video was just created with results of 10 days. I will publish new result

                                                                          The Follower, 2023-2024
                                                                        • 古文書を解読できるスマホアプリ 凸版印刷が開発 くずし字対応AI-OCRを活用

                                                                          凸版印刷ではこの課題を解決するため、2015年から国文学研究資料館と共同研究を開始。古文書対応のAI-OCRの開発に取り組んできた。その中で「手元の古文書を手軽に読みたい」という一般利用者向けのサービスに対する多数の要望があり、今回のアプリ開発に至ったとしている。 凸版印刷は今後、2025年度までにAPI提供や関連事業を含め、一般利用者や教育機関、博物館・資料館、地方自治体などのサービス提供を拡大し、約3億円の売り上げを目指す。 関連記事 ライトを当てると文字や絵が現れるホログラム 凸版が開発 スマホライトで真贋判定 強い光(点光源)を当てると、立体的な画像が現れる新たなホログラム「イルミグラム」を凸版が開発。スマートフォンのライトなどで誰でも簡単・正確に真贋判定できる。 メタバースでのなりすましを防ぐ 3Dアバターの本人証明ができるセキュリティ基盤 凸版印刷が開発 凸版印刷が、メタバース

                                                                            古文書を解読できるスマホアプリ 凸版印刷が開発 くずし字対応AI-OCRを活用
                                                                          • https://twitter.com/kajigayatakuya/status/1569428800987099138

                                                                              https://twitter.com/kajigayatakuya/status/1569428800987099138
                                                                            • SNSで「10万いいね」レクサスとテスラの衝突安全テストの結果が衝撃すぎた | MOBY [モビー]

                                                                              It’s 2022, and Teslas still aren’t stopping for children. pic.twitter.com/GGBh6sAYZS — Taylor Ogan (@TaylorOgan) August 9, 2022 今年実施されたテスラの走行テストの様子がTwitterに投稿され、10万いいねを超えるほどの話題になっています。 動画内ではテスラ Model3が走行中に、車両前方に配置された子どもに見立てた人形を検知して停止することができるかというテストの模様が撮影されています。 映像右側で同時にテスト走行しているレクサス RXがしっかり停止しているのに対し、Model3は人形を豪快に吹き飛ばしてしまいました。 「LiDAR」を搭載していないのが原因? 明るく見通しも良い状況にもかかわらず、Model3が人形の前で停止できなかったのは「子ども人形のクオ

                                                                                SNSで「10万いいね」レクサスとテスラの衝突安全テストの結果が衝撃すぎた | MOBY [モビー]
                                                                              • コンピュータビジョン分野における世界最高峰の国際会議CVPR2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog

                                                                                目次 目次 はじめに CVPR2022概要 Workshop on Image Matching: Local Features & Beyond SuperPoint and SuperGlue: Lessons Learned Large-scale 3D reconstruction Deployment - Successes, Challenges, Open Problems Unstructured Object Matching using Co-Salient Region Segmentation Nerfels: Renderable Neural Codes for Improved Camera Pose Estimation Feature Query Networks: Neural Surface Description for Camera Pose Re

                                                                                  コンピュータビジョン分野における世界最高峰の国際会議CVPR2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog
                                                                                • “顔認識されない”使い捨てマスク AIがオーダーメイドで柄を作成

                                                                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 イスラエルのBen-Gurion University of the NegevとイスラエルのTel Aviv Universityによる研究チームが開発した「Adversarial Mask: Real-World Universal Adversarial Attack on Face Recognition Models」は、カメラで捉えた顔を認識するシステムにおいて、検出されないようにする特殊なマスクだ。 紙製および布製のフェイスマスクに深層学習で計算し作成した敵対的なパターンを印刷することで実現する。実験において、このマスクを着用することで約96%以上の精度で誤認識させることがで

                                                                                    “顔認識されない”使い捨てマスク AIがオーダーメイドで柄を作成