データ分析LT会第二回で発表した際の資料です。 youtube: https://www.youtube.com/watch?v=jDZwX3jxhK4 conppass url: https://kaggle-friends.connpass.com/event/214854/ github repository: https://github.com/fkubota/bunseki_compe_LT_02
Image Processing in WebAssembly Photon is a high-performance image processing library in WebAssembly that runs both natively and on the web. Features Photon outperforms even the fastest of libraries, and is powered with Rust, allowing for safe and secure image processing. Web-Assembly Friendly For web-based image processing, Photon is 4-10x faster than JS, leading to faster results, and less lag.
a language for fast, portable computation on images and tensors Halide is a programming language designed to make it easier to write high-performance image and array processing code on modern machines. Halide currently targets: CPU architectures: X86, ARM, MIPS, Hexagon, PowerPC, RISC-V Operating systems: Linux, Windows, macOS, Android, iOS, Qualcomm QuRT GPU Compute APIs: CUDA, OpenCL, OpenGL Com
ある日のこと、後輩たちがこんなことを言いました。 「ゆゆ式のコマをランダムに並びかえたら無限にゆゆ式が楽しめるのでは?」 真面目に計算してみると、10の15乗くらいの組み合わせができることがわかりました。 この記事ゆゆ式アドベントカレンダー20日目は、そんな無限にゆゆ式をたのしむためのシステムを真面目に作ってみた話をします。 コマの切り出し 漫画のコマを並び替えるためには、コマがバラバラな画像として存在していなければなりません。 なので、まずは自炊で電子化された書籍をコマの線にそって切り出していく処理を自動化することにしました。 上の図がふつうの4コマの1ページですね。これの枠線を識別して、1ページから8枚のコマを取り出してくる方法を考えます。 ハフ変換で直線検出 OpenCVという画像処理のライブラリに直線を検出するツールがあったので、まずこれを試してみました。 が、結果はこのとおり。
Or to be technical, I made a thing that makes things like that thing. (If your device doesn’t render it, it looks like this.) Backstory: a month and a half ago I left my job to make an indie game. One of the many things on my to-do list was “Learn shader programming”, and around that time I ran across this blog post by Roger Alsing about using genetic algorithms to create images. So I tried the sa
概要 画像補完技術とは画像の欠損部分をそれらしく埋め合わせる技術のことをいう。この技術は古くから職人技として知られ、傷んだ写真の修復や写真からのトロツキーの除去などに広く用いられてきた。 近年では画像補完を自動的に行う技術の発展が目覚ましい。Hays らは、風景画像の欠損部分に合う画像を風景画像データベースから検索することで、風景画像の一部をまったく違う(しかし見た目には自然な)風景画像へと置き換えることに成功している。このような外部画像データベースを用いる手法は一種の「脳内補完」として機能しているといえる。 ところで、一般に「脳内補完」の主要な適用先は着衣状態の無着衣化である。彼らの手法のうち、風景画像データベースを裸体画像データベースへと置き換えることで、着衣画像の裸体化が行えることが期待される。 本プロジェクトでは上記着想の実装を行い、その実験結果を示す。 なお、本プロジェクトページ
Note that all plenary presentations will be video-recorded and available on the Signal Processing Society SigView online training database in late 2015. Deep Learning Yoshua Bengio Professor, University of Montreal Department of Computer Science and Operations Research Canada Research Chair in Statistical Learning Algorithms TIME Monday September 28, 2015 Abstract & Biography + Abstract The abstra
こんにちは。河本です。 僕はサイゼリヤに行くとまずキッズメニューの間違い探しを解くんですが、 今回は難しすぎたので、大人の力(=画像処理)で解決することにしました。 2014年9月版。みんなもやってみよう! (以下、間違い探しの答えが出てきます。見たくない人は↑の画像で頑張ってから読もう。) やり方 いろいろ書いてますが、左面と右面の違う部分を色の差分から見つけてるだけです。 紙の歪みを吸収するために、少しややこしいことをしてます。 (1) 間違い探しページの写真を撮る ↑の写真です。普通にiPhoneで撮りました。 (2) ページ領域を抽出する 画像からページの部分を見つける必要があります。 今回は面倒なので、左側は手作業で指定しました。 角を手作業でタグ付けして・・・ こっちは手作業。 射影変換で台形補正します。OpenCVならWarpPerspectiveです。 台形補正しても、紙が
類似画像検索手法について簡単にまとめました。 はじめに 画像検索には主に2種類の手法がある。 TBIR (Text Based Image Retrieval) 画像にテキストデータが紐付けられていて、テキストを元に検索する CBIR (Content Based Image Retrieval) 画像の特徴量を基盤として検索する ライブラリ Feature Extraction Library - FELib http://appsrv.cse.cuhk.edu.hk/~jkzhu/felib.html 下記の5つの特徴を持つ画像から特徴量を抽出できるライブラリである。 Color histogram, color moments. カラーヒストグラム・色統計) Edge histogram. 輪郭のヒストグラム Gabor wavelets transform. Wavelet tra
概要 近年、自称作曲家・佐村河内守氏と外見の酷似した人物が増加し、彼らと佐村河内氏とを自動的に見分けるシステムの開発が望まれている。一方で、佐村河内氏は作曲時と謝罪会見時で大きく外見的に変化することが知られており、佐村河内氏を見分けるシステムはそのような変化に頑健である必要があるため、実現は容易ではない。本プロジェクトでは、高度なコンピュータ技術を活用し、佐村河内氏を適切に見分けるシステムを開発する。 背景 自称作曲家・佐村河内守氏が世間を賑わせている。佐村河内守氏が引き起こした様々な問題のうちもっとも厄介なものは、「佐村河内守氏にそっくりな人物が多すぎる」ということである。たとえば、ミュージシャンの Revo 氏は知らない人に「あなたのCDはもう二度と買いません」などと言われるなどの風評被害を訴えており、漫画家のみうらじゅん氏についてもタクシー運転手から「佐村河内さんでしょ?」と執拗に問
防犯カメラに映った不審な車。でも画像が粗くてナンバープレートが読めない――。そんな捜査員の悩みを解決するソフトが開発され、全国の警察で導入が進んでいる。作ったのは一人の警察職員。画像を鮮明にするのではなく、照合する側の数字をぼかす逆転の発想が生かされた。 英語名を略して「PRESLLI(プレスリー)」と名付けられた低解像度ナンバー推定プログラムは2011年、大分県警が開発、導入した。同県警が12~13年にプレスリーで解析した52の事件では、27件で正しい容疑車両のナンバーを「可能性が高い」とリストアップし、容疑者検挙に結びついた。 仕組みはこうだ。防犯カメラ画像の暗さや粗さ、角度に応じて、ナンバープレートに使われている1~9の書体をぼかす加工(疑似劣化)を施す。ぼかした「・・・1」から「9999」までのすべてのパターンと画像を自動照合し、似ている順に上位30パターンをはじき出す。完全な特定
これはレイトレ合宿2!!アドベントカレンダーの4週目の記事です。 梅雨真っ盛りでぱっとしない天気が続きますがレイの追跡の具合はいかがでしょうか。 7月に入ったとはいえアドベントカレンダーはまだまだ序盤。 後のほうにガチな人がいらっしゃるのでレイトレと関係あるのか微妙なネタでもまだ許されると信じていきます。 さて、レンダリングしているとテクスチャが欲しくなって、とりあえずチェッカーをつくってみたりします。 それに飽きてきたらノイズです。ノイズですよねッ!? もうノイズがあるだけでそれはそれはCGらしくなります。 しかも模様だけにとどまらず、バンプやディスプレイス、プロシージャルなオブジェクトと使い道もたくさんある素敵なやつです。 そんなわけでちょっとノイズでも作ってみようかと思います。 とりあえず2Dの画像をつくることにして、深いことを考えずに乱数で埋め尽くすとこんな感じになります。 flo
MOONGIFTはオープンソース・ソフトウェアを紹介するブログです。2021年07月16日で更新停止しました Googleの類似画像検索を使うと、例えばどこかのサイトで見た画像のネタ元(さらに言えば加工前)の画像を探すことが出来ます。それによって改変を見破ったり、一次ソースにあたることが出来ます。それだけでなく、類似画像検索は色々な場面で役立つでしょう。 大量にある写真の中から類似した写真を見つけ出せば、それだけで魅力あるコンテンツになります。そんな技術を提供するのがLIREです。 LIREの使い方 オンラインデモが公開されていますので見てみましょう。 適当な写真の適当なリンクを選んでみましょう。 それぞれのアルゴリズムによって出てくる結果ががらっと変わるのが面白いです。それぞれ必要に応じて選択すれば良いでしょう。出てくる写真を順番にクリックしていくだけでも面白い、そんなライブラリです。
なんとなく使えそうなので書きました。画像を受け取るとサーバに送信し、サーバは顔認識して結果を返します。以下みたいな感じです。以上はここで実際に見ることができます。クライアント側はふつうに Javascript で書かれています。ファイルを受け取ってアップロードするために Dropzone.js というライブラリを使ってみました。サーバ側は Python/Django で書かれています。なぜ Python かといいますと、まあ、使い慣れているからです。Django は最近はあまり流行らないそうですが、しかしちょっと調べてみた感じでは Python の Web フレームワークの中では一番将来性がありそうな印象でした。今回は本当に小さいプログラムですから、明らかに役不足(正しい意味で)ですね。画像ファイルをアップロードしてバックエンドで処理できるといろいろ楽しいですよね。一応コンピュータビジョン
序論 近年、全聾の作曲家とされた佐村河内守氏がゴーストライターを用いていたことを告白し、同時に障害者手帳の不正受給も疑われ、大きな問題となっている。その報道の中で、佐村河内氏の容姿が多くの著名人と酷似していること、2月の会見と3月の会見で外見が大きく変化したことが話題となった。 具体的には、2月の会見の時点で話題になったものが 笑 佐村河内を探せ!(勝手に改訂版) pic.twitter.com/3TLFm14PvZ” — FACT (@factjapan) February 7, 2014 であり、3月の会見を踏まえて修正されたものが 佐村河内を探せの最新版クソワロタ pic.twitter.com/ptNhxecCW4 — 天才指揮者bot (@Siegfried_Idyll) March 7, 2014 である。 ここで興味深いのは、佐村河内氏の顔をコンピュータに学習させ、これらの顔
フルHDの4倍の解像度をもつ4K解像度がいよいよ本格的に普及しそうな勢いですが、あまりにも解像度が高すぎることで、アプリケーションによっては文字が小さすぎて読めなくなるなどの弊害も現れ始めています。このような高解像度ゆえに生じる問題として、キャラクターデザインの「ドット感」があり、なつかしのキャラクターを高解像度ディスプレイに拡大表示させると輪郭がガクガクでとても見ていられないという状態になってしまいます。そんなドット感満載のガクガクした輪郭を滑らかに修正させるアルゴリズムを使ってキャラクターを簡単に加工・比較できるのが「Depixelizing Pixel Art」です。 Depixelizing Pixel Art http://research.microsoft.com/en-us/um/people/kopf/pixelart/supplementary/multi_compar
330個の1000次方程式によるまどかマギカ pic.twitter.com/QnuOhXQfiT— りんご (@aomoriringo) November 27, 2013 上記のような、任意の画像の輪郭を数式に変換するプログラムを紹介します。 発端 Wolfram|Alphaには「Person Curve」と呼ばれる類の検索結果が存在し、「Barack Obama Curve」「Hatsune Miku like curve」とか検索すると、その人物・キャラを表したパラメトリック方程式とそのプロット結果が表示されます。 これについては以下に示すようにたくさんの記事があり、存在自体は早くから知っていました。 数式が解明されてしまった初音ミク。その他キャラクターを色々試してみました | 猫と杓子 http://nlab.itmedia.co.jp/nl/articles/1305/02/
撮る、ではなくて作るというところがポイントです。 方法としては撮るのはiPhone5、作るのはPCなのですがまあ小難しいことは後に回しまして、原寸大写真の一部切り取ったものを見てもらいましょう。 まずこちらが普通に撮った写真。ねんどろいど両儀式さんの左目アップです。低照度な室内らしくノイズたっぷりでいかにも携帯で撮った画質という感じです。 そしてこちらがアフター。 一目瞭然ですよね。「ノイズが一切見られない」写真になったかと思います。 種明かしをしますと… お分かり頂けたでしょうか。つまり、これらの写真の輝度平均を取ったのが先ほどの絵になるわけです。ノイズというのは基本的にランダムに発生するものですから、ならたくさん撮って平均値出せばノイズなんてぶっ飛ぶよね!ということです。 この方法を可能にするにはまずこの連続写真を撮る連写アプリが必要になるわけですが、今回使ったのはSnappyCamと
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く