並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 23 件 / 23件

新着順 人気順

画像認識の検索結果1 - 23 件 / 23件

  • 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan

    Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な

      日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
    • 若い米国人エンジニア、500ドル未満でGPSに依存しない無人機を1日で開発

      3人の若い米国人エンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機を1日で作り上げてしまい、彼らは「ウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている」と明かした。 参考:How A Trio Of Engineers Developed A GPS-Denied Drone For Under $500 Theseusの無人機にはウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている米軍はロシアや中国の妨害してくるGPS信号への対応に苦慮しているが、3人の若いエンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機(500ドル未満)を1日で作り上げてしまい、Aviation Weekは「彼らは低コストでGPSを代替する手段があると考えている」「この無人機の開発速度は国防総省が

      • GitHub - Filimoa/open-parse: Improved file parsing for LLM’s

        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

          GitHub - Filimoa/open-parse: Improved file parsing for LLM’s
        • 巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル

          数年前、巨大テック企業のエンジニアたちは、カメラで捉えた相手の顔を認識し、名前を表示するツールを開発した。だが、かのシリコンバレーもそのときばかりは、素早く実用化して環境を変えることをしなかった。 それからしばらく経ったいま、大企業の支配を受けないスタートアップが、その技術を世に出そうとしている。この状況は、技術をどう活用するかという倫理的な議論や法規制が必要であることを浮き彫りにする。 すでに完成されていた技術 2017年初頭のある日の午後のことだ。カリフォルニア州メンロパークにあるフェイスブック本社の会議室で、エンジニアのトマー・レイヴァンドは、野球帽の端にスマートフォンをくっつけた状態で座っていた。そのスマートフォンは、ゴムバンドによってカメラを外に向けた状態でしっかり固定されていた。 このばかげた帽子フォンは、きわめて不格好だったが、未来の青写真であり、そこにはごく一部の社員しか知

            巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル
          • YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO

            5 AI-OCR AI-OCRとしては、MicrosoftのComputer Visionで提供されている、Read APIを使用させて頂きました。 参考: Computer Vision 3.2 GA Read API を呼び出す 最初は、ナンバープレート画像を、そのままOCRにかけてみたのですが、下段左の平仮名1文字のところの認識が難しいようでした。これは、このように「ひらがな」1文字だけが配置されることに、モデルが対応しきれていないような気がしました。 対策として、画像を3つの部分に分割し、それぞれでOCRにかけるようにしてみました。また、認識精度が上がるように、業務用(緑バックの白文字、及び、黒バックの黄色文字)は、ネガポジ反転し、最終的にグレースケール変換することにしました。 AI-OCRで処理しているコードと、それを使っている、全体のコードです。 ocr.py import t

              YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。 〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像(30,000枚・192,000アノテーション)です〜 | DevelopersIO
            • iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania

              ベータ版が開発者向けに公開されているiOS17ですが、写真アプリの「画像を調べる」がさらに強化されており、洗濯表示の読み取り、その意味を解説してくれるようになりました。MacStoriesの記者が報告しています。 ■3行で分かる、この記事のポイント 1. iOS17で、写真アプリの「画像を調べる」がさらに強化されている。 2. 洗濯表示の読み取り、その意味を解説してくれるようになった。 3. ペット認識や車に使われているマークを調べることもできる。 オンラインで洗濯指示情報を入手 iOS17では、写真の中の洗濯表示シンボルの意味を説明してくれるようになっていることがわかった、とフェデリコ・ヴィッティチ氏が画像をソーシャルメディアに投稿しています。Appleは、国際標準化機構(ISO)が運営するオンライン・ブラウジング・プラットフォームから洗濯指示の情報を入手しています。 MacRumors

                iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania
              • Pythonで手軽に顔認識をやってみる(face-recognition)

                はじめまして!エンジニアのUemaです。 近年では、スマホのロックの解除や入館時の認証など様々なことに顔認識の技術が使われています。 顔認識を利用するには機械学習、画像処理や数学などの様々な知識が必要で学習コストがかかり、顔認識を使ってアプリケーションを作ってみたいと考えている人もなかなか手が出ないと思います。 そんな人に朗報です! 手軽に顔認識を行えるface-recognitionというPythonライブラリが存在します! 今回は顔認識の入り口として、face-recognitionを実際に使ってみたいと思います。 face-recognitionとは Pythonコードやコマンドラインで手軽に顔を検出・認識することができるライブラリです。face-recognitionの顔認識モデルは99%の正解率を記録しているそうです。 インストール(mac) Pythonとhomebrewがイン

                  Pythonで手軽に顔認識をやってみる(face-recognition)
                • HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始

                  HOUSEIは、AI顔認証システム「WelcomID」連携した予約管理システム「eRESERvest(エリザベスト)」の販売を開始します。 このAIニュースのポイント エリザベストは、予約業務を自動化し電話や窓口対応の時間を軽減。効率的な店舗運営が実現 AI顔認証端末「WelcomID」と連携し顔認証を利用することで、省人化した受付・入室ができ、またクラウドシステムとの連携も可能 ネット予約で24時間365日、自動で予約受付可能。接客対応中の電話や営業時間外の予約取りこぼしを防止し機会損失を減らす 2023年10月11日、HOUSEI株式会社は、従来の予約管理システムを刷新し、新たにAI顔認証連携を実現した予約管理システム「eRESERvest(エリザベスト)」を販売すると発表しました。 エリザベストの機能として顔認証端末「WelcomID」との連携により、顔認証を利用し省人化した受付・入

                    HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始
                  • 大阪・関西万博会場では現金は使用不可、キャッシュレス決済のみ 入場と決済にNEC顔認証システムを導入 - ロボスタ ロボスタ - ロボット情報WEBマガジン

                    来年、2025年4月13日(日)~10月13日(月)に開催予定の2025年日本国際博覧会(大阪・関西万博)では、会場内での買い物には、原則として現金が使用できないことがわかった。支払いは全面的にキャッシュレス、電子決済が前提となる。入場ゲートや支払いレジではNECの顔認証システムが導入され、利用者の利便性向上がはかられる。顔認証としては国内最大級となる見込み。万博の期間は184日間連続、想定来場者数は2820万人の巨大規模のイベントでの運用はこれまで前例がない。

                      大阪・関西万博会場では現金は使用不可、キャッシュレス決済のみ 入場と決済にNEC顔認証システムを導入 - ロボスタ ロボスタ - ロボット情報WEBマガジン
                    • 「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ

                      Appleが6月のWWDCで正式発表する「iOS 18」について。 新たにSafariブラウジングアシスタント機能や暗号化されたビジュアル検索機能が搭載されるという情報が出ています。 iOS 18のイメージAppleのサーバー上のコードから発見したとして報告されており、当初、SafariのブラウジングアシスタントはiCloudプライベートリレーのインフラを使い、プライバシーを重視した形でAppleに関連データを送信するのではないかと推測されていましたが、その後、プライベートリレーとの関係はないかもしれないともしています。 MacRumorsは、SafariのブラウジングアシスタントはiOS 18でiPhoneに搭載されると噂されている新しい生成AI機能のうちのひとつかもしれないと推測しています。GPT-4を搭載したCopilotを備えたMicrosoft Edgeや、ウェブページを要約して

                        「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ
                      • 日産車のセンサーがセリアの看板を「100キロ制限」と誤認識する事例があるらしい「天下一品に続いて…」「自動運転の実用化は遠い」

                        リンク 自動運転ラボ 100均のセリアのロゴ、日産車が「100キロ制限」と誤認識 | 自動運転ラボ 100円ショップのセリアの看板を車のセンサー機能が誤認識する事例が、Xなどで投稿されている。100の数字を「制限速度100キロ」の標識と誤って認識。マツダ車のセンシング機能がそのように認識してしまった事例も。 43 users 171

                          日産車のセンサーがセリアの看板を「100キロ制限」と誤認識する事例があるらしい「天下一品に続いて…」「自動運転の実用化は遠い」
                        • 富士フイルム「X-S20」機能編レビュー 小型軽量モデルの時代に合わせた進化点

                          富士フイルムXシリーズのミラーレスは、そのスタイルから大きく2つに分けられます。センターファインダースタイルともいうべき一眼レフスタイルのモデルと、オフセットファインダースタイルあるいはレンジファインダースタイルと例えられるモデルです。前者は「X-H2/X-H2S」「X-T5」、後者は「X-Pro3」「X-E4」などとなります。今回紹介する「X-S20」はセンターファインダースタイルのミラーレスで、小型軽量ながらボディ内手ブレ機構を採用し好評を博した「X-S10」の後継モデルとなります。 センターファインダースタイルとダイヤルを多用する富士フイルム「X-S20」。小型軽量なボディに強力な手ブレ補正機構の搭載をはじめ、不足を感じさせないスペックが魅力のミラーレスです。実売価格は、ボディ単体モデルが20万円前後、「XC15-45mm F3.5-5.6 OIS PZ」が付属するレンズキットが22

                            富士フイルム「X-S20」機能編レビュー 小型軽量モデルの時代に合わせた進化点
                          • 「牛の顔認証」で防疫対策強化や飼育管理省力化へ 宮崎大学などアプリ開発へ

                            宮崎大学は、宮崎県やJA宮崎経済連などと連携して、AIによる顔認証技術を活用してスマホをかざすだけで牛の病歴などの個体情報を確認できるシステムの研究開発に着手すると発表した。畜産現場で感染症リスクや農家の高齢化が課題となる中、迅速な防疫対策や労働の省力化につながることが期待される。 牛の顔領域を自動検出する様子(宮崎大学提供) 牛の個体識別は、2003年に導入された牛トレーサビリティ法で、10ケタの識別番号が記された耳標で行われているのが大半だが、体毛や汚れで番号が見づらかったり、耳標が脱落したりする課題があった。また、農家の高齢化や多頭飼育で生産現場の負担が重くなっているのに加え、海外の感染症の侵入リスクも高まっており、新たな対応が求められている。 こうした中、同大学では、椋木雅之教授(工学部工学科情報通信工学プログラム)が研究開発を進めている「牛個体識別AIアプリ」技術をベースに、宮崎

                              「牛の顔認証」で防疫対策強化や飼育管理省力化へ 宮崎大学などアプリ開発へ
                            • 顔認識AI技術を活用したレシピの紹介 - Qiita

                              はじめに Axrossを運営している藤原です。 Axross とは、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いのもと、ソフトバンクと社内起業制度にて立ち上げたサービスです。 現役エンジニアによる実践ノウハウを"レシピ"として教材化し、実際にプログラミングで実装を追体験しながら学ぶことができます。AI/機械学習をテーマにした、様々な業務領域やビジネスの課題解決に応用できる実践的な学習教材を140以上揃えています。(2021年6月時点) Axross:https://axross-recipe.com 公式Twitter:https://twitter.com/Axross_SBiv 今回は、AIによる顔認識の仕組みとその代表的な手法を紹介し、Axrossのサービスで無料で学べる、顔画像を活用した人気レシピをご紹介します。 顔認識AIの仕

                                顔認識AI技術を活用したレシピの紹介 - Qiita
                              • 顔認識市場(Facial Recognition Market)に関する調査は、2022 年のランドスケープを理解するために実施されました

                                顔認識市場(Facial Recognition Market)に関する調査は、2022 年のランドスケープを理解するために実施されました 調査期間: 2023年1月25日―2月1日 調査業者: RNPL 調査対象: 当社は、あらゆる規模の 545の市場プレーヤーに対して調査を実施しました。 有効な回答の数: 545 調査方法: 実地調査 226、 インターネット調査319 調査回答者: 調査は、収益に基づいて企業を対象に実施されました。 調査結果: 質問: 顔認識市場の規模はどのくらいですか? 世界の顔認識市場は、2023 ―2033 年までの予測期間中に 16% の CAGR で成長することにより、2033 年末までに 240 億米ドルの収益を獲得すると推定されています。さらに、市場は 2022 年に 50 億米ドルの収益を生み出しました。市場拡大の主な成長要因は、顔の小さな動きを捉え

                                  顔認識市場(Facial Recognition Market)に関する調査は、2022 年のランドスケープを理解するために実施されました
                                • Autosplit Helperの導入から実践利用までの設定方法|samege

                                  Autosplit Helperってなんですか?RTAで手動でタイマーを切っていると、プレイに集中して切り忘れてしまったり、手動で操作している故に細かいタイムがブレる…。 というわけで、自動で切ってくれると楽で良いですよね。 そんなあなたにお勧めなアプリです。 具体的には、プレイ中のゲーム表示ウィンドウを監視し、特定の画像が表示されたり、特定の音が鳴った時に、LiveSplitを操作してくれます。 ※この記事では画像認識の方法の説明をします。 どこにありますか?https://frailleaves.com/myownsoftware/autosplit-helper/ こちらのレモングラス様(@lemonglass)のサイトから、 「ダウンロード」→「ココ(Autosplit Helper ドキュメント内)」 で、別ウィンドウが開き、 「ダウンロード」の「Download via Dro

                                    Autosplit Helperの導入から実践利用までの設定方法|samege
                                  • 人権か、経済か。「顔認識」がAI法案で最大の争点となった舞台裏 – 株式会社Laboro.AI

                                    2024.1.8 監 修 株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇 概 要 2023年12月、世界初となる「包括的なAI 法案」がEUで合意に至りました。この法案によってさまざまなAI技術が4つのリスクに分類され、最も危険とされるものの利用は禁止されるようになります。 会合の場にはおよそ100人がいたとされ、各々の立場の思惑が交錯し、中でも顔認識技術について激しく意見が交わされました。議論の結果、用途によっては「許容できないリスク」として禁止されるような高リスクに位置付けられることとなった顔認識技術。違反した企業は最大で、3,500万ユーロ(約55億円)または世界における年間総売上高の7%のいずれか高い方を罰金として支払うことになります。 このAI法案が2024年に承認されるのを目前に控え、顔認証技術の具体的なリスクや、どうすると公平で安全な社会に役立てられるのか

                                      人権か、経済か。「顔認識」がAI法案で最大の争点となった舞台裏 – 株式会社Laboro.AI
                                    • 新しいBardはChatGPTを超えたか? - AI Trends by 相武AI

                                      7月にアップデートされたBardとChatGPT Plusの比較についての議論は、AIがどのように我々の日常生活とビジネスに影響を与えるか、どのように進化しているかを理解するための重要な視点を提供します。それぞれのAIが持つ能力と特性について考察することで、我々はこれらの強力なツールが提供する可能性を最大限に活用する方法を見つけることができます。ここでは、BardがChatGPT Plusを凌駕している領域に焦点を当てて考察します。 マルチモーダル性 まず、Bardの最も魅力的な特徴の一つは、マルチモーダル性です。つまり、テキストだけでなく、画像をもとにした情報処理が可能という点です。これにより、ユーザーはBardに画像を提示し、その画像を解析し説明を生成するように求めることができます。例えば、植物の写真を送信して病害虫の有無を確認したり、手の写真から年齢を推測させたりすることが可能です。

                                      • 楽天とタカラ・エムシー、AIカメラ付きデジタルサイネージを活用した実証実験を実施

                                        楽天グループ株式会社(以下「楽天」)と、株式会社タカラ・エムシー(以下「タカラ・エムシー」)は、AIカメラ付きデジタルサイネージを活用した実証実験を、2023年10月10日(火)から約6週間実施します。 「フードマーケット マム 若松店」外観 AIカメラ付きデジタルサイネージを設置した店内 本実証実験では、タカラ・エムシーが静岡県内で展開するスーパーマーケット「フードマーケット マム 若松店」の店内合計11カ所にAIカメラ付きのデジタルサイネージを設置し、店舗で取り扱う商品の広告を放映します。AIによる映像解析技術を活用し(注1)、通行者の広告視聴状況や年代・性別などの層ならびに購買傾向に基づいた販売促進、商品ニーズや表示される広告表現、「楽天ポイント」を使った視聴促進などの効果を検証していきます(注2)。 楽天とタカラ・エムシーが協働し、広告ソリューションに関する実証実験を行うのは、今回

                                          楽天とタカラ・エムシー、AIカメラ付きデジタルサイネージを活用した実証実験を実施
                                        • TIGEREYE社 顔認識技術を活用した新たな健康管理 ストレスチェッカーをリリース

                                          2024年5月24日 ========================================== PRESS RELEASE ========================================== TIGEREYE社 顔認識技術を活用した新たな健康管理 ストレスチェッカーをリリース ■概要 株式会社TIGEREYE(本社:中央区晴海、代表取締役:上村 学、以下「TIGEREYE社」)は、ブラウザで動く顔認証打刻の「顔パス勤怠」と連動して、感情を読み取りストレスを数値化する「顔パスストレスチェッカー」をリリースしました。このサービスは従業員の顔を認識するだけで、勤怠の打刻と感情を同時に読み取り、グラフ化やアラートを通知するものです。 このサービスにより、従業員のストレス状態をいち早く察知し、ウェルビーイングの向上を実現することをサポートしています。 「顔パス勤怠」は、

                                            TIGEREYE社 顔認識技術を活用した新たな健康管理 ストレスチェッカーをリリース
                                          • 顔認証での搭乗手続き「Face Express」、個人情報登録をアプリで 実証実験実施 - TRAICY(トライシー)

                                            全日本空輸(ANA)と日本航空(JAL)、成田国際空港、日本電気(NEC)は、顔認証技術を活用した搭乗手続き「Face Express」の個人情報の登録を、オンラインチェックイン時に利用者自身のスマートフォンで実施できるアプリの実証実験を3月25日から28日まで成田空港で実施した。 アプリはANAとJALのアプリと連携し、オンラインチェックインから個人情報の登録までをワンストップで可能とした。また、登録情報をアプリで本人が管理することで、次回以降の手続きが省略できる。実証実験では利便性と「Face Express」の利用率向上に寄与することを確認したとしている。 「Face Express」は、2021年から成田国際空港で導入。NECの顔認証技術を活用し、チェックインなど空港での最初の手続きの際にパスポート・搭乗券・顔写真情報を登録すると、従来必要であった搭乗券やパスポートを提示することな

                                              顔認証での搭乗手続き「Face Express」、個人情報登録をアプリで 実証実験実施 - TRAICY(トライシー)
                                            • インテルの GPU を使用して YOLOv8 で 1000fps 越えを達成するには | iSUS

                                              この記事は、Medium に公開されている「How to get YOLOv8 Over 1000 fps with Intel GPUs?」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。 この記事の PDF 版はこちらからご利用になれます。 著者: Raymond Lo インテル コーポレーション AI ソフトウェア・エバンジェリスト OpenVINO™ とインテル® Arc™ A770m グラフィックスがあれば YOLOv8 で 1000fps 越えを達成できます! GPU で AI 推論を実行することは新しいトピックではありません。最近では、AI のトレーニングと推論に GPU を使用するアプリケーションも多くなりました。では、新しいインテル® Arc™ グラフィックスを使用して同じことができるでしょうか? どうすれば良

                                                インテルの GPU を使用して YOLOv8 で 1000fps 越えを達成するには | iSUS
                                              • Vision Proは「ビジュアルサーチ」を搭載〜物理的な物体やテキストの検出が可能 - iPhone Mania

                                                Appleの複合現実(MR)ヘッドセットVision ProのvisionOSオペレーティングシステムには、iPhoneやiPadの「画像を調べる」に似た「ビジュアルサーチ(Visual Search)」と呼ばれる機能が搭載されていることがわかりました。 ■3行で分かる、この記事のポイント 1. AppleのMRヘッドセットVision ProのvisionOSに、「ビジュアルサーチ」機能が搭載されていることがわかった。 2. 現実世界と仮想世界の間で自由にテキストのやり取りが可能。 3. 連絡先情報、Webページ、単位変換などを含む現実世界のテキストが操作できる。 現実世界と仮想世界の間で自由にテキストのやり取りが可能 ビジュアルサーチを使えば、ユーザーはVision Proヘッドセットで、物理的な物体に関する情報を得たり、周囲のテキストを検出して対話したり、印刷されたテキストを現実世界

                                                  Vision Proは「ビジュアルサーチ」を搭載〜物理的な物体やテキストの検出が可能 - iPhone Mania
                                                1