画像認識は現在、仕事・趣味と幅広い場面で欠かせないものとなってきています。その手段として機械学習を用いることももはや常識的になっていると言っても過言ではなく、そのためのチュートリアルも数多くあります。 ただ一方で、機械学習のもとになる「学習データの作り方」についてはあまり情報がありません。 本編では、この「データの取り方、処理方法(下ごしらえ)」にフォーカスした解説を進めていきます。
得居です。3月下旬とは思えない寒さに凍えています。 Facebook が CVPR2014 に投稿しアクセプトされていた顔認証に関する論文 [1] が MIT Technology Review にて紹介されたことで注目を集めています。DeepFace と名付けられた手法で、同社が集めた4030人の顔写真440万枚を用いた大規模学習によってほぼ人間並の人物識別性能を達成しているということで、なかなかキャッチーな話題です。一方、Face++ という顔認証・分類のプラットフォームを展開する Megvii社 がつい先日公開したプレプリント [2] でも DeepFace と同程度の性能を達成しています。今日はこの2つの論文を解説します。 DeepFace の論文では、検出された顔矩形に対して以下の3つの処理を施しています。 矩形の2次元アラインメント 3次元モデルを用いた out-of-plan
From Florida Memory Register to join If you work at a cultural institution with a photography collection, please consider becoming a member of Flickr Commons! Register with The Commons The Flickr Commons Program This program is looked after by the Flickr Foundation with four main objectives: Increase access to publicly held photography collections Propagate updates from and to member catalogs and
人間は写真を見てそれがどういった場面なのかを説明することができますが、これはコンピューターにとっては非常に難しいことです。しかし、Googleの研究者は機械学習システムを用いて一度写真を見れば自動でその状況を説明するようなキャプションを生成できる、というまるで人間のような能力を持ったシステムの開発に成功しています。 Research Blog: A picture is worth a thousand (coherent) words: building a natural description of images http://googleresearch.blogspot.jp/2014/11/a-picture-is-worth-thousand-coherent.html 近年の研究では、物体の検出や分類、ラベル付けなどの技術が大幅に向上しています。しかし、人間のように複雑な状
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く