【読売新聞】 風化した石碑に光を照射するなどして文字や文様を浮かび上がらせる技術「ひかり拓本」のアプリが完成した。奈良市の奈良文化財研究所などが開発し、アプリ化の資金を募ったクラウドファンディング(CF)で目標額を達成。専門の技術を
はじめに 趣味でノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」を作りました。 その紹介の記事です。中身にOpenCVガッツリ使っているからアドカレOKですよね。。。👀? ガッツリ使っているという意味では、GUI部分の DearPyGui のほうがガッツリ使っているかもしれませんが🤔 「Image-Processing-Node-Editor」とは 以下のように、ノードを接続していくことで、処理結果を可視化しながら画像処理が行えるツールです。 以下のような特徴があります。 主要な処理は全てPython ※ライブラリ部分除く 各処理を可視化しながら画像処理が試せる 自作ノードの追加が容易 (だと信じている) 記事書くために見直していましたが、イマイチ複雑ですわ、、、😇 OSS (Apache 2.0ライセンス) デフォルトでいくつかのAI機
Photoshopなどのデジタル画像編集ソフトウェアでは、「覆い焼き」や「ソフトライト」といったさまざまなブレンドモード(レイヤー合成モード)を用いて画像を編集することが可能です。このレイヤー合成モードは一体何をしているのかを、プロダクトデザイナーのダン・ホリック氏が解説しています。 Blending Modes | Dan Hollick https://typefully.com/DanHollick/blending-modes-KrBa0JP レイヤー合成モードは、2つの入力カラーに基づき新しいカラーを作成するというものです。以下の画像の「Foreground(前景)」と「Background(後景)」が異なるレイヤーであり、「Result」部分がレイヤー合成モードにより出力された新しいカラーを指しています。 レイヤー合成モードの中で最も単純なのが、「Darken(比較(暗))」と
一般的な三葉虫は、単一の眼が無数に集まってできた複眼と呼ばれる構造により、いわゆるレンズ部分と視覚細胞が1対1でつながっていたと考えられている。これは、現在の昆虫にも見られるしくみだ。 しかし、Dalmanitina socialisと呼ばれる種の三葉虫は、視覚系全体に二重レンズ構造を持ち、表面側のレンズは中央部の膨らみにより第二の焦点を得られていたことがわかった。つまり、この種は近くにいる獲物を見ると同時に、遠くで動く天敵もはっきりと視界にとらえることができたようなのだ。 NISTの研究チームは、この構造を「ライトフィールドカメラ」と呼ばれる特殊なカメラに応用できないかと考えた。ライトフィールドカメラは通常のデジタルカメラとは異なり、複眼のように多数のマイクロレンズを使用して、1度の撮影で色と輝度だけでなく、センサーに入る光の方向もまとめて記録し、ソフトウェアによって後から遠近のフォーカ
Overview 画像/音声処理をリアルタイムで行う、Webブラウザから利用できるアプリをStreamlitで作る方法を解説します。 StreamlitのおかげでPythonだけでwebアプリが作れます。さらに、一番簡単な例なら10行程度のPythonコードで、webカメラを入力にしてブラウザから利用できるリアルタイム画像処理アプリケーションになります。 Webベースなのでクラウドにデプロイでき、ユーザに簡単に共有して使ってもらえ、UIもイマドキで綺麗です。 人物・物体検知、スタイル変換、画像フィルタ、文字起こし、ビデオチャット、その他様々な画像・音声処理の実装アイディアをデモ・プロトタイピングするのになかなかハマる技術スタックではないでしょうか。 Webブラウザから利用できる物体検知デモの例。実行中に閾値をスライダーで変えられる。オンラインデモ🎈 同様にスタイル変換デモの例。実行中にモ
ゲームエンジンや3Dソフトウェアを利用して高度な表現ができるこの時代でも、プリミティブな描画や動き、アルゴリズムから学べることは多い。それらをJavaScriptで書くクリエイティブコーディングという形で学べる手引書が本書となる。
こんにちは、デイリーポータルZ編集部 石川です。 デイリーポータルZは今年19周年を迎えたよみものサイトで、多すぎてもはや忘れましたが1万本だか2万本だかの過去記事アーカイブを保有しています。 例えばこれなんかは2005年のヒット記事。 納豆を一万回混ぜるより サイドバー等のガワはちょっとずつ変えつつも、本文部分はHTMLごと当時のものがいまだ使用されています。 時事ネタを載せているニュースサイトと違って、いま読んでも楽しんでいただける記事が多いと自負しています。納豆は2005年も2021年も変わらず納豆ですからね。 書き手としても、自分で書いた記事でも15年くらいたつとすっかり忘れてるので、フレッシュな気持ちで読み返せます。 しかしいま読むにはいかんせん、画像が小さい!ネット回線も細かったし、なんたってモニタの解像度が1080ピクセルとかだったころのページです。現代のモニタで見ると、ほと
NHKで再放送された(デジタルリマスター版)プロジェクトX「男たちの復活戦 デジタルカメラに賭ける」を見た。カシオの技術者たちが、アナログスチルカメラの大失敗を乗り越えて QV-10 を開発・発売するまでの話。パソコンにデータを取り込めるようにすることで魅力がより増して大売れ、みたいな話に感心しつつ、ふと、「そういえば自分もそのころは、当然のようにデータを計算機に取り込んで画像処理してた」みたいなことも思ったので、当時の画像処理がどんな感じだったのか、誰も読まないだろう昔話などをしてみる。 簡単に自分のプロフィールを書いておく。小学校時代にパソコン(日立ベーシックマスターとか)に触れ、中学時代にはポケコンの BASIC 等でプログラミング。しかしこのころはむしろアマチュア無線や電子工作が中心だった。高校時代に K&R でC言語を習得し、レイトレーシングで生成したカラー画像をディザリングで1
1983年徳島県生まれ。大阪在住。散歩が趣味の組込エンジニア。エアコンの配管や室外機のある風景など、普段着の街を見るのが好き。日常的すぎて誰も気にしないようなモノに気付いていきたい。(動画インタビュー) 前の記事:ポケベル打ちでTwitterしたい > 個人サイト NEKOPLA Tumblr 日焼けポスターから感じる夏の日差し 街を歩いていると、青っぽいポスターをよく見かける。 肌が青くなった人。ありえない色なのに、見慣れているせいか特に変には思わない 長きにわたり太陽光にさらされた結果、赤のインクが退色して全体的に青くなっているのだ。これを見て、「皮膚が青い人の写真だ!」って思う人はいないだろう。脳が勝手に、「これは日に焼けたポスターだ」(なので青くて当然)と認識している。それだけ日常的に見慣れた光景とも言える。 似たようなものに、セピア色の写真がある。モノクロ印画紙が経年劣化すると、
マルチコアCPU/GPU/FPGAを用いた高速化技術のグローバルリーダーである株式会社フィックスターズ(東証1部: 3687、代表取締役社長 CEO: 三木 聡)は、同社が開発した視差計算のオープンソースソフトウェア(OSS)「libSGM」が、コンピュータビジョン向けOSSライブラリ「OpenCV」に正式実装されたことをお知らせします。ステレオカメラの画像から視差計算をするlibSGMは、複雑化・高度化する自動運転システムの前方注視能力の向上など様々な用途に活用が期待されています。推定1800万ダウンロードを超えるOpenCVに採用されたことで、コミュニティを通じて世界中のデベロッパーにlibSGMを活用いただきやすくなりました。 OpenCV(https://opencv.org/)にフィックスターズのlibSGMが実装された libSGMとOpenCV libSGMは、Semi-Gl
DeNAのAIシステム部、音声チームの豆谷と申します。前回の記事では音声変換を解説しました。本記事では、ManimというPythonのモジュールを使って美しい動画を作る方法を紹介します。 本記事のターゲット 教育系の動画制作でかなりの実績(YouTubeでの評価など)あるアニメーションエンジンを紹介します。日本語に対応する方法を解説することで、より多くの日本語話者(特にエンジニア)が自らの知識や経験を簡単に動画にできると知ってもらえると嬉しいです。今まであまり世に伝えられなかった学識や表現が、世界中の人々にシェアされるキッカケになると最高です(具体例を挙げてみました1)。 Python好きに向けて美しい動画の作り方を説明します。Pythonの楽しさ2と動画制作3というクリエイティブな組み合わせにより多くの人が関心を持ってもらえると嬉しいです。 Manim 3Blue1Brown(以下、3b
どうも、 株式会社Progate で SoftwareEngineer チームのマネージャーをしています @satetsu888 です。本記事は Progate AdventCalendar 2020 10日目です。 普段仕事ではエンジニア組織のことやプロダクトの技術戦略的なことを考えたり、ミーティングしたり採用活動したりタスクをお願いして回ったりなどを担当していますが、今日はそういうのとはなんの関係もないただの日常の話を書こうと思います。 ことの始まり 我が家では子どもの朝ごはんとして週に2,3回くらいの頻度でポケモンパンを買っています。 先日(2020/09/18 ~ 11/24) ポケモンパンについてるポイントを5点集めるとポケモンシールホルダーの抽選に1回応募できるキャンペーンがありました。(キャンペーン自体はすでに終了しています) いつも通りのペースでパンを買ってると何回か挑戦で
Photoshopであらゆる被写体、画像全体を数クリックで金ピカのゴールドにする無料アクションを紹介します。 数クリックとしたのは被写体の選択操作で、金ピカにするのはわずか1クリック。 簡単に、目映いばかりの黄金エフェクトを楽しめます。 Free Photoshop Action to Turn Anything into Gold in Photoshop ダウンロードボタンをクリックすると、オーバーレイが表示され、それを閉じて、再度ダウンロードボタンをクリックすると、ダウンロードできます。 インストール方法は、Photoshopのアクションパネルで「アクションを読み込み」から、ダウンロードした「Spoon Graphics Gold Effect.atn」を指定するだけです。
生物の実験でシャーレに生えた大腸菌のコロニーの数を数えるという作業をしたのですが、こんなものは人間の仕事ではないので自動化したいと思いました。 OpenCVのインストール OpenCV 3.0で入った関数を使いたいので記事を書いた時点で最新版のOpenCV 3.1をビルドしてインストールします。 環境はUbuntu 15.10で、基本的にInstallation in Linux — OpenCV 2.4.13.0 documentationに従います。 sudo apt-get install build-essential sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev wge
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
今回、CV勉強会に何度か参加&発表していただいたJin Yamanakaさんにお誘いいただき、JTPA (Japan Technology Professional Association)というところで、「コンピュータビジョン今昔物語 -深層学習がCVの世界をどう変えたか-」という大上段なタイトルで講演させていただきました。 www.meetup.com このJTPAのTech Talkでは、機械学習/深層学習の勉強会を開催してきたそうなのですが、私自身「これ」という深層学習の専門があるわけではないので、コンピュータビジョン全体の基礎的な技術の変遷を、深層学習と絡めて広く浅く網羅した話をさせていただきました。 ちなみにここで紹介した深層学習の技術は、「既存の技術を置き換えるために、深層学習は何をクリアしなくてはならないか?」という視点で、紹介するのが適当と思ったものを選んだつもりです。
1983年徳島県生まれ。大阪在住。散歩が趣味の組込エンジニア。エアコンの配管や室外機のある風景など、普段着の街を見るのが好き。日常的すぎて誰も気にしないようなモノに気付いていきたい。(動画インタビュー) 前の記事:高速道路上にあるバス停が異世界 > 個人サイト NEKOPLA Tumblr 電子ペーパーを飾るということ 「電子ペーパー」は、どちらかといえば地味な存在だ。その多くがモノクロだし、応答速度(画面切り替え)も遅い。液晶と比べると華やかさに欠けるイメージがある。 しかし一方、目が疲れにくかったり、電源がなくても画面表示を保持する特性があったりで、電子書籍端末などに重宝されている。秀才の影に隠れて目立たない無口キャラだけど、「あいつ、実はすごいやつだよな」とクラスで噂されるような存在である。 そんな飾り気のない、質実剛健な電子ペーパーに強く惹かれている。 これは愛用している電子ペーパ
Pythonでよく使う画像処理ライブラリの関数まとめ備忘録。 随時更新予定。 以下のライブラリをimportしていることが前提 Library Version opencv @3.2.0_1+contrib+python27 scikit-image @0.12.3_2 scipy @0.19.0_0+gfortran import numpy as np import copy import cv2 as cv import skimage import skimage.io as sk import skimage.filters as fil import skimage.filters.rank as rank import skimage.morphology as mor import skimage.transform as tr import scipy.misc as s
くずし字の解読は、文学や歴史学など「文系」の専門家の領域ですが、AIの開発は、日頃プログラミングやシステムの開発に携わる「理系」の研究者が得意とするところです。 そのうちの1人、国際コンペに参加した福岡県の土井賢治さんを訪ねました。土井さんはIT企業のエンジニアで、ネットオークションに出品された商品が本物か偽物かを、投稿された画像から判断するシステムの構築に携わっています。 くずし字は「存在を知っている程度」だったということで、みずから読むことはできません。そんな土井さんが今回のコンペに参加した理由を聞いてみると、意外なきっかけがあったことが分かりました。 「ラーメンの画像から店を当てるシステム」を応用できると考えたというのです。 土井さんは、SNSに投稿されたラーメンの画像がどこの店舗で出されたのかを、数万枚の画像データをもとにAIが予測するシステムを運営していて、ファンの間で人気となっ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く