タグ

*programとcvに関するsh19910711のブックマーク (23)

  • TensorFlow Object Detection APIを使ってFaster R-CNN、R-FCN、SSDを比較してみた - Qiita

    TensorFlow Object Detection APIを使ってFaster R-CNN、R-FCN、SSDを比較してみた機械学習MachineLearningTensorFlow物体検出ObjectDetection 5行まとめ TensorFlow Object Detection APIには各種モデルが準備されており、簡単に試すことができた。 SSDは推論がとても早いが学習に時間がかかる。 R-FCNは推論時間でSSDに劣るが、検出精度がSSDより高め。学習時間と精度のバランスも良い。 ラベル付けの補助としてR-FCNを使い、推論時間が重要な場面での最終的な検出器としてSSDを使うのが良さそう。 ラベル付け(アノテーション)は苦行。 概要 TensorFlow Object Detection APIを使い、独自のデータセットで物体検出(Object Detection)を行っ

    TensorFlow Object Detection APIを使ってFaster R-CNN、R-FCN、SSDを比較してみた - Qiita
    sh19910711
    sh19910711 2024/05/24
    "SSD: 推論がとても早いが学習に時間がかかる / R-FCN: 検出精度がSSDより高め / ラベル付けの補助としてR-FCNを使い、推論時間が重要な場面での最終的な検出器としてSSDを使うのが良さそう" 2019
  • 白黒画像のパーシステントホモロジー解析をGoogleColab上でやってみる - Qiita

    はじめに 私は現在大学4年生で、材料科学系の学科に所属しています。 材料科学系でも、機械学習はトレンドのようです。 機械学習の特徴量として、様々なパラメータが考えられますが、その中でも「形状を定量化するパーシステントホモロジーが有用なのではないか」というトピックがあります。 今回は、それをとりあえずやってみようという内容です。 記事のプログラムは、次のColabのリンクから確認できます! パーシステントホモロジー解析(PH解析)とは PH解析の例として、シリカの例がよく用いられます。 左の点の集まりは、液体シリカとアモルファスシリカの原子配置の3Dマップです。 この点の集まりを見ても、どのような構造上の違いがあるのかわかりません。 しかし、それぞれPH解析すると、右のパーシステント図が得られます。 これをみると、何やら違いがあるように見えます。 これがPH解析です。 パーシステント図とは

    白黒画像のパーシステントホモロジー解析をGoogleColab上でやってみる - Qiita
    sh19910711
    sh19910711 2024/05/21
    "PH解析: 形状を定量化 / 原子配置の3Dマップ > 点の集まりを見ても、どのような構造上の違いがあるのかわかりません / PH解析すると、右のパーシステント図が得られ ~ 何やら違いがあるように見えます" 2023
  • GPT-4o のマルチモーダル機能をさっそく試す - Qiita

    1. この記事の内容 OpanAI から 2024.5.15 に新しい大規模言語モデル「GPT-4o」が出たので、以前書いた「GPT-4V に入門してみる」記事と同様の検証をもう一回 GPT-4o でやってみて比較する記事となります 結論から言うと「GPT-4oが圧倒的に強い」です。(わかり切った話ですみません) 2. GPT-4o とは? すでに大量のニュース記事が出ていますので細かく紹介しませんが、以下の公式サイトを貼っておきます。 2-1. 料金 こちらのページを参照されたし 2-2. どのくらいの時点までの知識があるのか? 勿論上にある通りオフィシャルには2023年10月までなのですが、実際どのくらい最近のことまで答えられるのか聞いてみました。 最近の情報まで含めてめちゃくちゃ正確な回答です。いつの間にかWeb検索した情報を踏まえて回答するようになっていました。ハルシオン防止のため

    GPT-4o のマルチモーダル機能をさっそく試す - Qiita
    sh19910711
    sh19910711 2024/05/21
    "現場猫の画像: シニカルな状態を表現したもの + GPT-4Vはこの絵を見て「ヘルメット」や「猫」や「笑顔」などのディティールは認識できるものの、全体としてこの絵が表している主題はまったく理解できませんでした"
  • OpenMMLabの始め方@SUMMER 2023 - Qiita

    Rist Kaggle チームの藤(@fam_taro)です。 今回は Rist Kaggle合宿2023夏の時間を使って、最近の OpenMMLab の始め方をまとめてみました。記事内ではその中の mmdetection を使って説明していきますが、他の OpenMMLab の使い方もカバーする内容となってます。 また記事の後半では Kaggle のコードコンペなどに参加したいときの使い方も記載します。 1. OpenMMLabとは 下図と紹介文は 公式サイト より引用 OpenMMLab builds the most influential open-source computer vision algorithm system in the deep learning era. It aims to provide high-quality libraries to reduc

    OpenMMLabの始め方@SUMMER 2023 - Qiita
    sh19910711
    sh19910711 2024/05/02
    "OpenMMLab: タスクごとのライブラリをまとめた OSS + 大体 Config でなんとかなる + 高い再現性 + Deploy(e.g. ONNX への変換) まで対応 + 慣れるまで大変 / 長期間での業務となると自作パイプラインだと負債が大きくなってしまう" 2023
  • PyTorchで学習したモデルをOpenCVで使う (Custom Layer編) - takminの書きっぱなし備忘録 @はてなブログ

    この記事はOpenCV Advent Calendar 2020 18日目の記事です。 はじめに OpenCVにはDNNモジュールという畳み込みニューラルネットワークの機能が実装されています。この機能は推論専用のため、CaffeやTensorflowなどの深層学習ライブラリ上で学習したモデルを読み込んで使用します。DNNモジュールはPyTorchのモデルを直接はサポートしていませんが、ONNXをサポートしているため、PyTorchからONNX経由でモデルを読ませることができます。 参考: takmin.hatenablog.com さて、自分たちで開発をしていると、既存のネットワーク層ではなく、自分たちで独自に開発した層を使いたいという要求が出てくると思います。TensorflowやPyTorchなどほとんどの深層学習ライブラリにはこのようなカスタマイズしたネットワーク層を作成する機能がつ

    PyTorchで学習したモデルをOpenCVで使う (Custom Layer編) - takminの書きっぱなし備忘録 @はてなブログ
    sh19910711
    sh19910711 2024/04/27
    "既存のネットワーク層ではなく、自分たちで独自に開発した層を使いたい / OpenCV: PyTorchのモデルを直接はサポートしていませんが、ONNXをサポートしている / CaffeやTensorflowのモデルを取り込む例 + チュートリアルに解説" 2020
  • 7帖の室内で球速を測ってみる話 - すぎやまたいちのブログ

    こちらは ドワンゴ Advent Calendar 2021 4日目の記事です。 はじめに 新型コロナウイルス対策の一環としてテレワークが急速に普及し、今はご自宅でお仕事をされている方も多いのではないでしょうか。 私が働く会社でも、感染対策として昨年2月という比較的早い時期から原則在宅勤務が導入され、昨年7月にその制度が恒久化されました。 さて突然ですが、みなさんの仕事部屋に防球ネットは置いてありますか? 私はあります。(マウント) 仕事部屋です 防球ネットが仕事部屋にあると非常に便利です。仕事で溜まったストレスをいつでも軟式M号球に込めて防球ネットにぶつけて発散することが出来ます。 ただ、仕事部屋の広さは約7帖で、日の一般的な住宅の1室としては普通の広さかなと思いますが、軟式球を投げるにはあまりに狭過ぎます。 それでも防球ネットは安定して私の投げたボールを受け止めてくれるので素晴らしい

    7帖の室内で球速を測ってみる話 - すぎやまたいちのブログ
    sh19910711
    sh19910711 2022/06/15
    "防球ネットが仕事部屋にあると非常に便利です。仕事で溜まったストレスをいつでも軟式M号球に込めて防球ネットにぶつけて発散することが出来ます / 白色のボールを白色の壁の部屋で検出するのは難しい"
  • 着彩済イラストから綺麗に線画を抽出する方法 - 午睡二時四十分

    機械学習のテーマの一つとして自動着彩があります。この中で、特にイラストの自動着彩を考えると 未着彩と着彩済みのペアが学習用サンプルとして大量に必要となりますが、まとまった量を入手するのはなかなか難しいという問題があります。 すると、カラーイラストから線画を抽出することを考えたくなるのですが、 一般的な輪郭検出を用いると「輪郭線自体の輪郭」が抽出されてしまい、線がぼやけてしまうという問題があります。 例えば に対して輪郭検出を実施すると、 となります。 (拡大) 右頬の輪郭線に対して、肌側、背景側それぞれの境界が検出されてしまい、線が2引かれてしまっていることがわかります。 で、綺麗な輪郭抽出ができず困っていたのですが、ピーFN(一体何FNなんだ...)のtaizanさんが投稿されたこちらのエントリ qiita.com では非常に綺麗に線画抽出ができており、どのようにやっているか気になっ

    着彩済イラストから綺麗に線画を抽出する方法 - 午睡二時四十分
    sh19910711
    sh19910711 2021/09/12
    cv2.dilate + cv2.subtract / "自動着彩を考えると未着彩と着彩済みのペアが学習用サンプルとして大量に必要となりますが、まとまった量を入手するのはなかなか難しい > イラストから線画を抽出することを考えたくなる"
  • 最近のポケモンはデザインが複雑になったのか?【Python】【OpenCV】 - Qiita

    はじめに 先日、ポケモンたかさおじさんこと、生㌔Pのブログにて次のような記事が投稿された。 ポケモンらしさ-2_意見分析 マスコット感検証 https://pkmnheight.blogspot.com/2020/04/2.html ざっくり引用すると、以前バズってた以下の海外の分析画像を、転載したTweetがあった。 ポケモンのデザインはどんどん生物的じゃなくなって行ってて、色んな部位が丸みを帯びてただの可愛いマスコットキャラクターと化してるっていう海外の分析画像が凄い pic.twitter.com/qHHVaHzEue — Χ十 ◤カイジュー◢(⃔ *`꒳´ * )⃕↝♡ (@KaijuXO) June 13, 2019 このTweetに対して、ポケモンたかさおじさんが 猛撃 していたというものである。 ざっっっくり要約すると、各世代ごとに幼虫・昆虫ごとに部位をピックアップし、 そう

    最近のポケモンはデザインが複雑になったのか?【Python】【OpenCV】 - Qiita
    sh19910711
    sh19910711 2021/04/25
    "「フシギダネの情報量は0.4853」と書いても、この数字が多いのか少ないのか直感的に分かりにくいので"
  • vvvvでJPGのglitchを実装した - Qiita

    それぞれのセグメントについてグリッチしてうまくいくか試してみたところ、壊しても良さそうなセグメントがおおまかに特定できました。 また、セグメントによって得られるグリッチ効果がわかりやすく違ったので少し面白い結果になりました。 量子化テーブル定義セグメント(DQT) DQTセグメントは2つありますが、両方とも壊して良さそうです。ただし、先頭から5Byteはセグメントのヘッダ部分なので触れないほうが良さそう。 というわけでDQTについては、バイト位置で言うと25~88Byte目、94~157Byte目がグリッチ対象です。 実際にグリッチをかけると下記のような映像が得られます。壊すバイト数をかなり増やしてもあまり原型崩れない感じ。 ちなみにグリッチ前の映像は以前の記事で作成したものです。 ハフマン法テーブル定義セグメント(DHT) DHTセグメントは4つあります。ただし、データ長が33Byteの

    vvvvでJPGのglitchを実装した - Qiita
    sh19910711
    sh19910711 2020/10/17
    vvvvっていうビジュアルプログラミング言語があるらしい
  • Python + OpenCVで画像の類似度を求める - Qiita

    ※ https://qiita.com/best_not_best/items/669aaa9e1b8de647d29d にこの記事の修正版を投稿しました! 皆さんこんにちは。@best_not_bestです。 現在のお仕事は、求人サイトの案件レコメンド機能の実装や、Google AnalyticsやAdobe Analyticsを使って、そのサイトの分析をしています。(あとは動物画像を社内SlackにひたすらPostしています。) 前回のAdvent Calendarでは、Deep Learningを使った画像類似度判定を行いました。精度は良かったのですが、やはり学習データを収集することがネックとなります・・・。今回は、単純に2枚の画像を比較して画像の類似度を求めてみたいと思います。 やること 以下のおいぬ様の画像の類似度を比較します。画像はGoogle先生から拾ってきています。 精度を

    Python + OpenCVで画像の類似度を求める - Qiita
  • ピープルカウンタを考えてみる(1) - みらいテックラボ

    Code for Naraがらみで, 施設に出入りする人のカウント及びそのデータ分析などの実証実験を, とある場所(ヒ・ミ・ツ!!)の施設管理者に提案しようという話が持ち上がっている. 関連記事: ・ピーブルカウンタを考えてみる(1) ・ピープルカウンタを考えてみる(2) ・ピープルカウンタを考えてみる(3) ・ピープルカウンタを考えてみる(4) ・ピープルカウンタを考えてみる(5) ・ピープルカウンタを考えてみる(6) ・ピープルカウンタを考えてみる(7) ・ピープルカウンタを考えてみる(8) 1. はじめに 施設出入口で通行人をカウントする方法として, ・ カメラ映像の解析 ・ 赤外線センサ ・ マットセンサ などいろいろとあるが, 今回カウント方法の1つとしてDepthカメラの距離画像によるカウントを検討している. カメラで撮影した映像データを解析して人のカウントを行う場合, 個人情

    ピープルカウンタを考えてみる(1) - みらいテックラボ
  • OpenCVを使ったモーション テンプレート解析(リアルタイムに物体とその動く方向を認識する) - Qiita

    今回は、(a)(b)(c)全てを使ったプログラムを作成しますが、必要なもののみ取捨選択することも可能です。例えば、モーション画像のみ欲しければ(b)(c)は不要です。 今回のプログラムの主な機能は以下になります。 - モーションを検出しグレースケールで表示します。 - 新しいモーションを強調し、古いモーションは徐々に薄く表示します。 - 各座標のモーションの方向を緑色の線で表示します。 - 画面全体のモーションの方向を黄色い線で表示します。 プログラム 動作環境 python: 3.5.1 OpenCV(core + contrib): 3.1.0 動画データ プログラムではOpenCVに付属しているサンプル動画を利用します。 OpenCV\opencv\sources\samples\data\768x576.avi import time import math import cv2

    OpenCVを使ったモーション テンプレート解析(リアルタイムに物体とその動く方向を認識する) - Qiita
  • OpenPoseがどんどんバージョンアップして3d pose estimationも試せるようになっている - izm_11's blog

    概要 今年のゴールデンウイークに公開されたCMUのOpenPoseはその推定精度の高さと、(Ubuntuなら)気軽に試せる依存ライブラリの少なさ、結果の分かりやすさから多くのサイトで話題になりました。 github.com OpenPoseで踊ってみた動画からポーズ推定。 試しに動かしてみました。腕をクロスさせたときとかの遮蔽に対してかなり強いです。動画解像度とfpsが高いほど有効そうです。 Geforce GTX1060 Ubuntu16.04 pic.twitter.com/1GKfBmTXdo— izm (@izm) 2017年5月7日 このエントリは、このOpenPoseについての最近(-2017/7)の情報をまとめておく、という備忘録的な意図です。 手と顔の推定が正式追加 WindowsBuildが実用的に動く 骨格の3次元座標が(セッティングすれば)取れる 商用ライセンスが正式

    OpenPoseがどんどんバージョンアップして3d pose estimationも試せるようになっている - izm_11's blog
  • デュアルディスプレイなときに顔の向きでアプリ切り替えてみた | GREE Engineering

    SAO The Beginningのαテストに落選したふじもと (@masaki_fujimoto) です。当選されたかたは、無事ログアウトできるといいですね (負け惜しみ感)。 相変わらず長い前置き それはそれとして、最近ディスプレイが余った (別のフロアに1台おきっぱにしてたのを回収してきた) ので、久々にデュアルディスプレイにしてみました。で、画面がひろびろとするのはいいのですが、なんか思ったより快適じゃない感じがしまして、なんでかなぁと思ったら、隣のディスプレイを見たときにアクティブなウィンドウをスイッチするのがかったるいんですよね。一応図にしてみるとこういう感じで: それぞれ27inchで結構大きいので、基は左側のディスプレイを正面にみておしごとしてます。で、右側にはchatを表示させてて、通知きたらそっちみて、って感じでまぁありがちな感じですね。 で、それはいいんですが、問題

    デュアルディスプレイなときに顔の向きでアプリ切り替えてみた | GREE Engineering
  • Caffeで手軽に画像分類

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。システム統括部 データソリューション部の宮崎です。 最近ディープラーニングと呼ばれる技術の話題を耳にすることが増えてきました。 この記事ではディープラーニングの手法を実装し画像認識系の用途で便利に使えるCaffeというツールの使い方を紹介します。 Caffeの概要 Caffeは、C++で実装されGPUに対応した高速なディープラーニングのライブラリです。 大規模画像認識のコンテストILSVRCで2012年にトップとなった畳込みニューラルネットワークの画像分類モデル[1]がすぐに利用できるようになっています。 Caffeは、カリフォルニア大学バークレー校のコンピュータビジョンおよび機械学習に関する研究センターであるBV

    Caffeで手軽に画像分類
  • FF10の雷除けを自動化した話 - panchiga's blog

    これはAizu Advent Calender 2014の9日目の記事です! Aizu Advent Calender 2014 前の人: @MiZuKi_Sonoko mizukindevelop: Hackathonに参加しよう {Aizu Advent Calendar 2014 [8]日目} 次の人: @a_r_g_v はじめに FF10はみんな知ってるよね? FF10には七曜の武器っていう伝説の武器みたいなものがあって、入手方法がゲーム中のミニゲームをなんかすごいやるみたいな感じ。 例) サブイベントの「とれとれチョコボ」をタイム0:0:0でクリアする(ティーダ) サブイベントの「サボテンダーの里」をクリアする(リュック) 召喚獣バトルに全部勝利する(ユウナ) その中で巨乳おっぱいさんルールーの「雷平原のサブイベント・雷除けを200回連続で成功する」というものがある。 おっぱいさ

    FF10の雷除けを自動化した話 - panchiga's blog
  • GitHub - nariyu/jquery.mangafilter

    jquery.mangafilter 画像(IMG 要素)をマンガっぽくできる jQuery プラグインです。 Usage

    GitHub - nariyu/jquery.mangafilter
  • JavaScriptで画像のクラスタリングによるドット絵風加工 – Rest Term

    pixel clustering using k-means++ 前回のJavaScriptでPoisson Image Editingによる滑らかな画像合成に引き続き、HTML5 Canvasを使ったJavaScriptによる画像処理の一例を紹介します。 今回は画像の画素値に対するクラスタリング(分類)を画像加工用途に応用します。クラスタリングには各画素のRGB値を特徴ベクトル(次元数3)としてk-means法と呼ばれる手法を使って行います(実装上はk-means法の初期値選択アルゴリズムを改良したk-means++法を利用)。以下のサイトでOpenCVを利用した実装例が紹介されています。 k-meansクラスタリングによる画像分割,減色 – opencv.jp 上記サイト内でも言及されているように、k-means法による画像の領域分割や減色処理はあまり良い結果が得られないことが知られて

    JavaScriptで画像のクラスタリングによるドット絵風加工 – Rest Term
  • GitHub - mtschirs/js-objectdetect: computer vision in your browser - javascript real-time object detection

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - mtschirs/js-objectdetect: computer vision in your browser - javascript real-time object detection
  • OpenCV2でSIFT, SURFによる画像の対応付け - Kesinの知見置き場

    大学の講義で画像間の対応付けプログラムを作成するという課題が出されて、無事提出できたのでメモしておこうと思います。このような画像工学のプログラムは初めてで、特にMacOSX + Xcode4 + OpenCV2のサンプルが少なくて色々苦労しました。簡単ではありますがOpenCVのインストールから2画像の対応付け画像を生成するところまでを説明したいと思います。 執筆時のバージョン OSX 10.7.4 + Xcode4.1 + OpenCV2.4.1 準備 Xcodeはインストール済みであるとして、まずはOpenCVをインストールします。 私はMacPortsを使用しましたが各自で好きな方法でインストールしてください。MacPortsなら port install opencvで楽チンにインストールできます インストールが終わったらXcodeでプロジェクトを作成して、Command Line

    OpenCV2でSIFT, SURFによる画像の対応付け - Kesinの知見置き場