並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

画像認識の検索結果1 - 12 件 / 12件

  • 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan

    Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な

      日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
    • 若い米国人エンジニア、500ドル未満でGPSに依存しない無人機を1日で開発

      3人の若い米国人エンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機を1日で作り上げてしまい、彼らは「ウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている」と明かした。 参考:How A Trio Of Engineers Developed A GPS-Denied Drone For Under $500 Theseusの無人機にはウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている米軍はロシアや中国の妨害してくるGPS信号への対応に苦慮しているが、3人の若いエンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機(500ドル未満)を1日で作り上げてしまい、Aviation Weekは「彼らは低コストでGPSを代替する手段があると考えている」「この無人機の開発速度は国防総省が

      • 【速報】次世代の外観検査!?プロンプトを駆使した異常検知 - Qiita

        先日、革新的な画像の異常検知(SAA)が出てきました。 何やら革命的な臭いがする... SAMを使った異常検知手法https://t.co/wmwFcbULdq コードはこちらhttps://t.co/3npK3FhnEz pic.twitter.com/JDs30bEJyQ — shinmura0 (@shinmura0) May 22, 2023 本稿では、操作手順 & 触ってみた感想をご報告します。 特長 本題に入る前に、どこら辺が革新的なのかざっくり説明します。 ※ SAAの詳細は論文をご参照ください。 学習データは不要 通常、学習(正常)データを数百枚用意しますが、この手法では正常データを必要としません。 ドメイン知識を導入できる 予め、異常の傾向をプロンプトに入れることにより、異常の特徴をモデルに教えることができます。 二点目が特に大きく、今までの異常検知では、積極的に異常の傾

          【速報】次世代の外観検査!?プロンプトを駆使した異常検知 - Qiita
        • “あの時”のプーチン氏はニセモノだった⁈影武者の真偽AIが分析 【報道1930】 | TBS NEWS DIG

          広島サミットにゼレンスキー大統領が参加し結束を再確認し合う形となった西側。それに対抗するように中国にミシュスチン首相を送ったり、旧ソ連の首相を呼んだ会議をモスクワで開いたりとプーチン大統領の動きも激…

            “あの時”のプーチン氏はニセモノだった⁈影武者の真偽AIが分析 【報道1930】 | TBS NEWS DIG
          • GitHub - Filimoa/open-parse: Improved file parsing for LLM’s

            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

              GitHub - Filimoa/open-parse: Improved file parsing for LLM’s
            • 巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル

              数年前、巨大テック企業のエンジニアたちは、カメラで捉えた相手の顔を認識し、名前を表示するツールを開発した。だが、かのシリコンバレーもそのときばかりは、素早く実用化して環境を変えることをしなかった。 それからしばらく経ったいま、大企業の支配を受けないスタートアップが、その技術を世に出そうとしている。この状況は、技術をどう活用するかという倫理的な議論や法規制が必要であることを浮き彫りにする。 すでに完成されていた技術 2017年初頭のある日の午後のことだ。カリフォルニア州メンロパークにあるフェイスブック本社の会議室で、エンジニアのトマー・レイヴァンドは、野球帽の端にスマートフォンをくっつけた状態で座っていた。そのスマートフォンは、ゴムバンドによってカメラを外に向けた状態でしっかり固定されていた。 このばかげた帽子フォンは、きわめて不格好だったが、未来の青写真であり、そこにはごく一部の社員しか知

                巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル
              • YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO

                5 AI-OCR AI-OCRとしては、MicrosoftのComputer Visionで提供されている、Read APIを使用させて頂きました。 参考: Computer Vision 3.2 GA Read API を呼び出す 最初は、ナンバープレート画像を、そのままOCRにかけてみたのですが、下段左の平仮名1文字のところの認識が難しいようでした。これは、このように「ひらがな」1文字だけが配置されることに、モデルが対応しきれていないような気がしました。 対策として、画像を3つの部分に分割し、それぞれでOCRにかけるようにしてみました。また、認識精度が上がるように、業務用(緑バックの白文字、及び、黒バックの黄色文字)は、ネガポジ反転し、最終的にグレースケール変換することにしました。 AI-OCRで処理しているコードと、それを使っている、全体のコードです。 ocr.py import t

                  YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO
                • Android携帯、多数が顔認証の安全性に不備 持ち主の写真でロック解除可能 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                  顔認証によるロック解除機能を搭載したAndroid(アンドロイド)スマートフォンの多くが、写真を使ってロック解除ができてしまうことを示した調査結果が発表された。 英国の消費者団体「Which?」が48機種をテストしたところ、19機種で持ち主の写真、それも普通紙に印刷した低解像度の写真でロックを解除できた。 写真でロック解除できた機種は、モトローラの「Moto E13」などの低価格モデルが大半だが、モトローラの「Razr 2022」などの高級機種も含まれていた。メーカー別の内訳はシャオミが7機種、モトローラが4機種、ノキア、オッポ、サムスンが各2機種、オナーとビボが各1機種。 同団体はアップルのiPhoneもテストしたが、結果はすべて合格だった。iPhoneには、センサーを使ってユーザーの顔の3D深度マップを作成する「Face ID」機能が搭載されている。 同団体のテクノロジー担当エディター

                    Android携帯、多数が顔認証の安全性に不備 持ち主の写真でロック解除可能 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                  • iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania

                    ベータ版が開発者向けに公開されているiOS17ですが、写真アプリの「画像を調べる」がさらに強化されており、洗濯表示の読み取り、その意味を解説してくれるようになりました。MacStoriesの記者が報告しています。 ■3行で分かる、この記事のポイント 1. iOS17で、写真アプリの「画像を調べる」がさらに強化されている。 2. 洗濯表示の読み取り、その意味を解説してくれるようになった。 3. ペット認識や車に使われているマークを調べることもできる。 オンラインで洗濯指示情報を入手 iOS17では、写真の中の洗濯表示シンボルの意味を説明してくれるようになっていることがわかった、とフェデリコ・ヴィッティチ氏が画像をソーシャルメディアに投稿しています。Appleは、国際標準化機構(ISO)が運営するオンライン・ブラウジング・プラットフォームから洗濯指示の情報を入手しています。 MacRumors

                      iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania
                    • Pythonで手軽に顔認識をやってみる(face-recognition)

                      はじめまして!エンジニアのUemaです。 近年では、スマホのロックの解除や入館時の認証など様々なことに顔認識の技術が使われています。 顔認識を利用するには機械学習、画像処理や数学などの様々な知識が必要で学習コストがかかり、顔認識を使ってアプリケーションを作ってみたいと考えている人もなかなか手が出ないと思います。 そんな人に朗報です! 手軽に顔認識を行えるface-recognitionというPythonライブラリが存在します! 今回は顔認識の入り口として、face-recognitionを実際に使ってみたいと思います。 face-recognitionとは Pythonコードやコマンドラインで手軽に顔を検出・認識することができるライブラリです。face-recognitionの顔認識モデルは99%の正解率を記録しているそうです。 インストール(mac) Pythonとhomebrewがイン

                        Pythonで手軽に顔認識をやってみる(face-recognition)
                      • HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始

                        HOUSEIは、AI顔認証システム「WelcomID」連携した予約管理システム「eRESERvest(エリザベスト)」の販売を開始します。 このAIニュースのポイント エリザベストは、予約業務を自動化し電話や窓口対応の時間を軽減。効率的な店舗運営が実現 AI顔認証端末「WelcomID」と連携し顔認証を利用することで、省人化した受付・入室ができ、またクラウドシステムとの連携も可能 ネット予約で24時間365日、自動で予約受付可能。接客対応中の電話や営業時間外の予約取りこぼしを防止し機会損失を減らす 2023年10月11日、HOUSEI株式会社は、従来の予約管理システムを刷新し、新たにAI顔認証連携を実現した予約管理システム「eRESERvest(エリザベスト)」を販売すると発表しました。 エリザベストの機能として顔認証端末「WelcomID」との連携により、顔認証を利用し省人化した受付・入

                          HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始
                        • 「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ

                          Appleが6月のWWDCで正式発表する「iOS 18」について。 新たにSafariブラウジングアシスタント機能や暗号化されたビジュアル検索機能が搭載されるという情報が出ています。 iOS 18のイメージAppleのサーバー上のコードから発見したとして報告されており、当初、SafariのブラウジングアシスタントはiCloudプライベートリレーのインフラを使い、プライバシーを重視した形でAppleに関連データを送信するのではないかと推測されていましたが、その後、プライベートリレーとの関係はないかもしれないともしています。 MacRumorsは、SafariのブラウジングアシスタントはiOS 18でiPhoneに搭載されると噂されている新しい生成AI機能のうちのひとつかもしれないと推測しています。GPT-4を搭載したCopilotを備えたMicrosoft Edgeや、ウェブページを要約して

                            「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ
                          1