画像認識の人気記事 23件 - はてなブックマーク

1 - 23 件 / 23件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

画像認識の検索結果1 - 23 件 / 23件

日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
- 234 users
- ja.stability.ai
- テクノロジー
- 2023/08/17
Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な
- AI
- LLM
- あとで読む
- 画像
- 機械学習
- 日本語
- 人工知能
- 生成AI
- 日本
- イラスト
若い米国人エンジニア、500ドル未満でGPSに依存しない無人機を1日で開発
- 217 users
- grandfleet.info
- テクノロジー
- 2024/03/10
3人の若い米国人エンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機を1日で作り上げてしまい、彼らは「ウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている」と明かした。参考：How A Trio Of Engineers Developed A GPS-Denied Drone For Under $500 Theseusの無人機にはウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている米軍はロシアや中国の妨害してくるGPS信号への対応に苦慮しているが、3人の若いエンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機（500ドル未満）を1日で作り上げてしまい、Aviation Weekは「彼らは低コストでGPSを代替する手段があると考えている」「この無人機の開発速度は国防総省が
- 技術
- あとで読む
- Drone
- 軍事
- アルゴリズム
- GPS
- military
- 戦争
GitHub - Filimoa/open-parse: Improved file parsing for LLM’s
- 17 users
- github.com/Filimoa
- テクノロジー
- 2024/04/08
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- OSS
- PDF
- あとで読む
巨大テック企業があえて「自粛」した技術が、世に放たれようとしている | 顔認証技術から考える倫理的ハードル
- 8 users
- courrier.jp
- テクノロジー
- 2023/10/04
数年前、巨大テック企業のエンジニアたちは、カメラで捉えた相手の顔を認識し、名前を表示するツールを開発した。だが、かのシリコンバレーもそのときばかりは、素早く実用化して環境を変えることをしなかった。それからしばらく経ったいま、大企業の支配を受けないスタートアップが、その技術を世に出そうとしている。この状況は、技術をどう活用するかという倫理的な議論や法規制が必要であることを浮き彫りにする。すでに完成されていた技術 2017年初頭のある日の午後のことだ。カリフォルニア州メンロパークにあるフェイスブック本社の会議室で、エンジニアのトマー・レイヴァンドは、野球帽の端にスマートフォンをくっつけた状態で座っていた。そのスマートフォンは、ゴムバンドによってカメラを外に向けた状態でしっかり固定されていた。このばかげた帽子フォンは、きわめて不格好だったが、未来の青写真であり、そこにはごく一部の社員しか知
- 監視社会
- テクノロジー
- AI
- 企業
- 社会
YOLOv8でナンバープレートを検出してAI-OCRで読み取ってみました。〜ファインチューニングに使用したデータは、撮影した写真ではなく、Pythonで生成した画像（30,000枚・192,000アノテーション）です〜 | DevelopersIO
- 8 users
- dev.classmethod.jp
- テクノロジー
- 2023/10/02
5 AI-OCR AI-OCRとしては、MicrosoftのComputer Visionで提供されている、Read APIを使用させて頂きました。参考: Computer Vision 3.2 GA Read API を呼び出す最初は、ナンバープレート画像を、そのままOCRにかけてみたのですが、下段左の平仮名１文字のところの認識が難しいようでした。これは、このように「ひらがな」１文字だけが配置されることに、モデルが対応しきれていないような気がしました。対策として、画像を3つの部分に分割し、それぞれでOCRにかけるようにしてみました。また、認識精度が上がるように、業務用（緑バックの白文字、及び、黒バックの黄色文字）は、ネガポジ反転し、最終的にグレースケール変換することにしました。 AI-OCRで処理しているコードと、それを使っている、全体のコードです。 ocr.py import t
- YOLO
- 自動車
iOS17では「画像を調べる」がアップグレード〜洗濯表示タグの意味を説明可能に - iPhone Mania
- 3 users
- iphone-mania.jp
- テクノロジー
- 2023/06/29
ベータ版が開発者向けに公開されているiOS17ですが、写真アプリの「画像を調べる」がさらに強化されており、洗濯表示の読み取り、その意味を解説してくれるようになりました。MacStoriesの記者が報告しています。 ■3行で分かる、この記事のポイント 1. iOS17で、写真アプリの「画像を調べる」がさらに強化されている。 2. 洗濯表示の読み取り、その意味を解説してくれるようになった。 3. ペット認識や車に使われているマークを調べることもできる。オンラインで洗濯指示情報を入手 iOS17では、写真の中の洗濯表示シンボルの意味を説明してくれるようになっていることがわかった、とフェデリコ・ヴィッティチ氏が画像をソーシャルメディアに投稿しています。Appleは、国際標準化機構（ISO）が運営するオンライン・ブラウジング・プラットフォームから洗濯指示の情報を入手しています。 MacRumors
- iOS
- Apple
Pythonで手軽に顔認識をやってみる(face-recognition)
- 3 users
- blog.grasys.io
- テクノロジー
- 2023/06/22
はじめまして！エンジニアのUemaです。近年では、スマホのロックの解除や入館時の認証など様々なことに顔認識の技術が使われています。顔認識を利用するには機械学習、画像処理や数学などの様々な知識が必要で学習コストがかかり、顔認識を使ってアプリケーションを作ってみたいと考えている人もなかなか手が出ないと思います。そんな人に朗報です！手軽に顔認識を行えるface-recognitionというPythonライブラリが存在します！今回は顔認識の入り口として、face-recognitionを実際に使ってみたいと思います。 face-recognitionとは Pythonコードやコマンドラインで手軽に顔を検出・認識することができるライブラリです。face-recognitionの顔認識モデルは99%の正解率を記録しているそうです。インストール(mac) Pythonとhomebrewがイン
- 機械学習
- 勉強
- AI
HOUSEI、AI顔認証システムと連携した予約管理システム「eRESERvest」販売開始
- 3 users
- aismiley.co.jp
- テクノロジー
- 2023/10/16
HOUSEIは、AI顔認証システム「WelcomID」連携した予約管理システム「eRESERvest(エリザベスト)」の販売を開始します。このAIニュースのポイントエリザベストは、予約業務を自動化し電話や窓口対応の時間を軽減。効率的な店舗運営が実現 AI顔認証端末「WelcomID」と連携し顔認証を利用することで、省人化した受付・入室ができ、またクラウドシステムとの連携も可能ネット予約で24時間365日、自動で予約受付可能。接客対応中の電話や営業時間外の予約取りこぼしを防止し機会損失を減らす 2023年10月11日、HOUSEI株式会社は、従来の予約管理システムを刷新し、新たにAI顔認証連携を実現した予約管理システム「eRESERvest(エリザベスト)」を販売すると発表しました。エリザベストの機能として顔認証端末「WelcomID」との連携により、顔認証を利用し省人化した受付・入
- ビジネス
大阪・関西万博会場では現金は使用不可、キャッシュレス決済のみ入場と決済にNEC顔認証システムを導入 - ロボスタロボスタ - ロボット情報WEBマガジン
- 3 users
- robotstart.info
- テクノロジー
- 2024/05/24
来年、2025年4月13日(日)～10月13日(月)に開催予定の2025年日本国際博覧会(大阪・関西万博)では、会場内での買い物には、原則として現金が使用できないことがわかった。支払いは全面的にキャッシュレス、電子決済が前提となる。入場ゲートや支払いレジではNECの顔認証システムが導入され、利用者の利便性向上がはかられる。顔認証としては国内最大級となる見込み。万博の期間は184日間連続、想定来場者数は2820万人の巨大規模のイベントでの運用はこれまで前例がない。
「iOS 18」にSafariブラウジングアシスタントや暗号化されたビジュアル検索機能が搭載か - こぼねみ
- 3 users
- www.kobonemi.com
- テクノロジー
- 2024/04/11
Appleが6月のWWDCで正式発表する「iOS 18」について。新たにSafariブラウジングアシスタント機能や暗号化されたビジュアル検索機能が搭載されるという情報が出ています。 iOS 18のイメージAppleのサーバー上のコードから発見したとして報告されており、当初、SafariのブラウジングアシスタントはiCloudプライベートリレーのインフラを使い、プライバシーを重視した形でAppleに関連データを送信するのではないかと推測されていましたが、その後、プライベートリレーとの関係はないかもしれないともしています。 MacRumorsは、SafariのブラウジングアシスタントはiOS 18でiPhoneに搭載されると噂されている新しい生成AI機能のうちのひとつかもしれないと推測しています。GPT-4を搭載したCopilotを備えたMicrosoft Edgeや、ウェブページを要約して
- 検索
- iOS
- Apple
日産車のセンサーがセリアの看板を「100キロ制限」と誤認識する事例があるらしい「天下一品に続いて…」「自動運転の実用化は遠い」
- 2 users
- togetter.com
- テクノロジー
- 2024/04/25
リンク自動運転ラボ 100均のセリアのロゴ、日産車が「100キロ制限」と誤認識 | 自動運転ラボ 100円ショップのセリアの看板を車のセンサー機能が誤認識する事例が、Xなどで投稿されている。100の数字を「制限速度100キロ」の標識と誤って認識。マツダ車のセンシング機能がそのように認識してしまった事例も。 43 users 171
- 人工知能
- 自動車
富士フイルム「X-S20」機能編レビュー　小型軽量モデルの時代に合わせた進化点
- 1 user
- news.mynavi.jp
- 暮らし
- 2023/08/21
富士フイルムXシリーズのミラーレスは、そのスタイルから大きく2つに分けられます。センターファインダースタイルともいうべき一眼レフスタイルのモデルと、オフセットファインダースタイルあるいはレンジファインダースタイルと例えられるモデルです。前者は「X-H2/X-H2S」「X-T5」、後者は「X-Pro3」「X-E4」などとなります。今回紹介する「X-S20」はセンターファインダースタイルのミラーレスで、小型軽量ながらボディ内手ブレ機構を採用し好評を博した「X-S10」の後継モデルとなります。センターファインダースタイルとダイヤルを多用する富士フイルム「X-S20」。小型軽量なボディに強力な手ブレ補正機構の搭載をはじめ、不足を感じさせないスペックが魅力のミラーレスです。実売価格は、ボディ単体モデルが20万円前後、「XC15-45mm F3.5-5.6 OIS PZ」が付属するレンズキットが22
- Camera
「牛の顔認証」で防疫対策強化や飼育管理省力化へ　宮崎大学などアプリ開発へ
- 1 user
- www.jacom.or.jp
- 政治と経済
- 2023/08/19
宮崎大学は、宮崎県やＪＡ宮崎経済連などと連携して、ＡＩによる顔認証技術を活用してスマホをかざすだけで牛の病歴などの個体情報を確認できるシステムの研究開発に着手すると発表した。畜産現場で感染症リスクや農家の高齢化が課題となる中、迅速な防疫対策や労働の省力化につながることが期待される。牛の顔領域を自動検出する様子（宮崎大学提供）牛の個体識別は、2003年に導入された牛トレーサビリティ法で、10ケタの識別番号が記された耳標で行われているのが大半だが、体毛や汚れで番号が見づらかったり、耳標が脱落したりする課題があった。また、農家の高齢化や多頭飼育で生産現場の負担が重くなっているのに加え、海外の感染症の侵入リスクも高まっており、新たな対応が求められている。こうした中、同大学では、椋木雅之教授（工学部工学科情報通信工学プログラム）が研究開発を進めている「牛個体識別ＡＩアプリ」技術をベースに、宮崎
- ビジネス
顔認識AI技術を活用したレシピの紹介 - Qiita
- 1 user
- qiita.com/AxrossRecipe_SB
- テクノロジー
- 2024/05/21
はじめに Axrossを運営している藤原です。 Axross とは、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いのもと、ソフトバンクと社内起業制度にて立ち上げたサービスです。現役エンジニアによる実践ノウハウを"レシピ"として教材化し、実際にプログラミングで実装を追体験しながら学ぶことができます。AI/機械学習をテーマにした、様々な業務領域やビジネスの課題解決に応用できる実践的な学習教材を140以上揃えています。（2021年6月時点） Axross：https://axross-recipe.com 公式Twitter：https://twitter.com/Axross_SBiv 今回は、AIによる顔認識の仕組みとその代表的な手法を紹介し、Axrossのサービスで無料で学べる、顔画像を活用した人気レシピをご紹介します。顔認識AIの仕
顔認識市場（Facial Recognition Market）に関する調査は、2022 年のランドスケープを理解するために実施されました
- 1 user
- prtimes.jp
- 暮らし
- 2023/06/19
顔認識市場（Facial Recognition Market）に関する調査は、2022 年のランドスケープを理解するために実施されました調査期間: 2023年1月25日―2月1日調査業者: RNPL 調査対象: 当社は、あらゆる規模の 545の市場プレーヤーに対して調査を実施しました。有効な回答の数: 545 調査方法: 実地調査 226、インターネット調査319 調査回答者: 調査は、収益に基づいて企業を対象に実施されました。調査結果: 質問: 顔認識市場の規模はどのくらいですか? 世界の顔認識市場は、2023 ―2033 年までの予測期間中に 16% の CAGR で成長することにより、2033 年末までに 240 億米ドルの収益を獲得すると推定されています。さらに、市場は 2022 年に 50 億米ドルの収益を生み出しました。市場拡大の主な成長要因は、顔の小さな動きを捉え
Autosplit Helperの導入から実践利用までの設定方法｜samege
- 1 user
- note.com/samege
- アニメとゲーム
- 2023/09/27
Autosplit Helperってなんですか？RTAで手動でタイマーを切っていると、プレイに集中して切り忘れてしまったり、手動で操作している故に細かいタイムがブレる…。というわけで、自動で切ってくれると楽で良いですよね。そんなあなたにお勧めなアプリです。具体的には、プレイ中のゲーム表示ウィンドウを監視し、特定の画像が表示されたり、特定の音が鳴った時に、LiveSplitを操作してくれます。 ※この記事では画像認識の方法の説明をします。どこにありますか？https://frailleaves.com/myownsoftware/autosplit-helper/ こちらのレモングラス様(@lemonglass)のサイトから、「ダウンロード」→「ココ(Autosplit Helper ドキュメント内)」で、別ウィンドウが開き、「ダウンロード」の「Download via Dro
- tool
- software
- game
人権か、経済か。「顔認識」がAI法案で最大の争点となった舞台裏 – 株式会社Laboro.AI
- 1 user
- laboro.ai
- テクノロジー
- 2024/01/10
2024.1.8 監　修株式会社Laboro.AI　執行役員マーケティング部長　和田崇概　要 2023年12月、世界初となる「包括的なAI 法案」がEUで合意に至りました。この法案によってさまざまなAI技術が4つのリスクに分類され、最も危険とされるものの利用は禁止されるようになります。会合の場にはおよそ100人がいたとされ、各々の立場の思惑が交錯し、中でも顔認識技術について激しく意見が交わされました。議論の結果、用途によっては「許容できないリスク」として禁止されるような高リスクに位置付けられることとなった顔認識技術。違反した企業は最大で、3,500万ユーロ（約55億円）または世界における年間総売上高の7％のいずれか高い方を罰金として支払うことになります。このAI法案が2024年に承認されるのを目前に控え、顔認証技術の具体的なリスクや、どうすると公平で安全な社会に役立てられるのか
- 法律
- 社会
新しいBardはChatGPTを超えたか？ - AI Trends by 相武AI
- 1 user
- aitrends.top
- テクノロジー
- 2023/07/25
7月にアップデートされたBardとChatGPT Plusの比較についての議論は、AIがどのように我々の日常生活とビジネスに影響を与えるか、どのように進化しているかを理解するための重要な視点を提供します。それぞれのAIが持つ能力と特性について考察することで、我々はこれらの強力なツールが提供する可能性を最大限に活用する方法を見つけることができます。ここでは、BardがChatGPT Plusを凌駕している領域に焦点を当てて考察します。マルチモーダル性まず、Bardの最も魅力的な特徴の一つは、マルチモーダル性です。つまり、テキストだけでなく、画像をもとにした情報処理が可能という点です。これにより、ユーザーはBardに画像を提示し、その画像を解析し説明を生成するように求めることができます。例えば、植物の写真を送信して病害虫の有無を確認したり、手の写真から年齢を推測させたりすることが可能です。
楽天とタカラ・エムシー、AIカメラ付きデジタルサイネージを活用した実証実験を実施
- 1 user
- prtimes.jp
- テクノロジー
- 2023/09/27
楽天グループ株式会社（以下「楽天」）と、株式会社タカラ・エムシー（以下「タカラ・エムシー」）は、AIカメラ付きデジタルサイネージを活用した実証実験を、2023年10月10日（火）から約6週間実施します。「フードマーケットマム若松店」外観 AIカメラ付きデジタルサイネージを設置した店内本実証実験では、タカラ・エムシーが静岡県内で展開するスーパーマーケット「フードマーケットマム若松店」の店内合計11カ所にAIカメラ付きのデジタルサイネージを設置し、店舗で取り扱う商品の広告を放映します。AIによる映像解析技術を活用し（注1）、通行者の広告視聴状況や年代・性別などの層ならびに購買傾向に基づいた販売促進、商品ニーズや表示される広告表現、「楽天ポイント」を使った視聴促進などの効果を検証していきます（注2）。楽天とタカラ・エムシーが協働し、広告ソリューションに関する実証実験を行うのは、今回
- ビジネス
TIGEREYE社　顔認識技術を活用した新たな健康管理　ストレスチェッカーをリリース
- 1 user
- prtimes.jp
- テクノロジー
- 2024/05/25
2024年5月24日＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝ PRESS RELEASE ＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝ TIGEREYE社　顔認識技術を活用した新たな健康管理　ストレスチェッカーをリリース ■概要株式会社TIGEREYE（本社：中央区晴海、代表取締役：上村学、以下「TIGEREYE社」）は、ブラウザで動く顔認証打刻の「顔パス勤怠」と連動して、感情を読み取りストレスを数値化する「顔パスストレスチェッカー」をリリースしました。このサービスは従業員の顔を認識するだけで、勤怠の打刻と感情を同時に読み取り、グラフ化やアラートを通知するものです。このサービスにより、従業員のストレス状態をいち早く察知し、ウェルビーイングの向上を実現することをサポートしています。「顔パス勤怠」は、
- ビジネス
顔認証での搭乗手続き「Face Express」、個人情報登録をアプリで　実証実験実施 - TRAICY（トライシー）
- 1 user
- www.traicy.com
- テクノロジー
- 2024/05/13
全日本空輸（ANA）と日本航空（JAL）、成田国際空港、日本電気（NEC）は、顔認証技術を活用した搭乗手続き「Face Express」の個人情報の登録を、オンラインチェックイン時に利用者自身のスマートフォンで実施できるアプリの実証実験を3月25日から28日まで成田空港で実施した。アプリはANAとJALのアプリと連携し、オンラインチェックインから個人情報の登録までをワンストップで可能とした。また、登録情報をアプリで本人が管理することで、次回以降の手続きが省略できる。実証実験では利便性と「Face Express」の利用率向上に寄与することを確認したとしている。「Face Express」は、2021年から成田国際空港で導入。NECの顔認証技術を活用し、チェックインなど空港での最初の手続きの際にパスポート・搭乗券・顔写真情報を登録すると、従来必要であった搭乗券やパスポートを提示することな
- セキュリティ
- ビジネス
インテルの GPU を使用して YOLOv8 で 1000fps 越えを達成するには | iSUS
- 1 user
- www.isus.jp
- テクノロジー
- 2023/07/23
この記事は、Medium に公開されている「How to get YOLOv8 Over 1000 fps with Intel GPUs?」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。この記事の PDF 版はこちらからご利用になれます。著者: Raymond Lo インテルコーポレーション AI ソフトウェア・エバンジェリスト OpenVINO™ とインテル® Arc™ A770m グラフィックスがあれば YOLOv8 で 1000fps 越えを達成できます! GPU で AI 推論を実行することは新しいトピックではありません。最近では、AI のトレーニングと推論に GPU を使用するアプリケーションも多くなりました。では、新しいインテル® Arc™ グラフィックスを使用して同じことができるでしょうか? どうすれば良
Vision Proは「ビジュアルサーチ」を搭載〜物理的な物体やテキストの検出が可能 - iPhone Mania
- 1 user
- iphone-mania.jp
- テクノロジー
- 2023/06/24
Appleの複合現実（MR）ヘッドセットVision ProのvisionOSオペレーティングシステムには、iPhoneやiPadの「画像を調べる」に似た「ビジュアルサーチ（Visual Search）」と呼ばれる機能が搭載されていることがわかりました。 ■3行で分かる、この記事のポイント 1. AppleのMRヘッドセットVision ProのvisionOSに、「ビジュアルサーチ」機能が搭載されていることがわかった。 2. 現実世界と仮想世界の間で自由にテキストのやり取りが可能。 3. 連絡先情報、Webページ、単位変換などを含む現実世界のテキストが操作できる。現実世界と仮想世界の間で自由にテキストのやり取りが可能ビジュアルサーチを使えば、ユーザーはVision Proヘッドセットで、物理的な物体に関する情報を得たり、周囲のテキストを検出して対話したり、印刷されたテキストを現実世界
- 検索
- Apple