サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
おしっこセンサーできました ウチの小学生の息子が家のトイレでたびたびおしっこをこぼしてしまう。俺がくどくど注意してもあんまり効果ない。そこで、代わりにAIに怒ってもらうことにした。こんな感じである。 おしっこセンサーのデモ(動画)。水を数滴床にたらすとブザーが鳴り、床を拭くと止まる。 ディープラーニングの画像認識を使い、床の上に落ちた水滴をカメラで検出してブザーが鳴る仕組みだ。夏休みの自由工作に過ぎないので精度は期待していなかったけど、意外にきちんと動いてくれて、カメラに映る範囲に水滴を数滴たらすとピッピと鳴り、床を拭くとブザーも止まる。「お父さんだってAIくらい作れるぞ」と息子に自慢したいがための工作なのだ。 でも、これ作るのはそんなに難しくなくて、休み中の3日くらいで完成した。かかったお金は、RasPiやカメラ、周辺デバイスが2万円弱、画像認識のモデル作成に使ったクラウドの料金が数10
Deep Learning Advent Calendar 2016の20日目の記事です。 ConvNetの歴史とResNet亜種、ベストプラクティスに関連スライドがあります(追記) 背景 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまったようです。 M2の学生が趣味でやっていたCIFAR10とCIFAR100の認識タスクで,現時点での世界最高性能の結果を出したそうだ…趣味でっていうのが…https://t.co/HKFLXTMbzx — ニーシェス (@lachesis1120) 2016年12月7日 府大のプレスリリース 一般物体認識分野で、府大生が世界一の認識精度を持つニューラルネットワークを開発 黄瀬先生の研究室の学生さんだそうです。凄いですね! ちょうどResNet系に興味があったので、読んでみます。この論文を理解するには、ResNet, (Wide
ディープラーニングで「インド人を右に」を理解する: Generative Adversarial Network による画像モーフィング 「インド人を右に」問題 インターネットを長く使っている方は、伝説の誤植「インド人を右に」 [1] についてご存知なのではないでしょうか。 「くお〜!! ぶつかる〜!! ここでアクセル全開、インド人を右に!」 この唐突に過ぎる意味不明な「インド人」は「ハンドル」の誤植であり、それはライターの手書きの文字が汚かったために発生したとされています。 …手書きの文字が汚かったとして、どうすれば「ハンドル」が「インド人」になるのか? 従来より、この問題について様々な考察がなされてきました。 ここでは、近年の技術の発展の成果を取り入れ、コンピュータに文字を書かせることによって「ハンドル」から「インド人」への変容についてアプローチしてみたいと思います。 # これは De
講演や講義に字幕を付与することは、聴覚障害者への情報保障のみならず、理解を深める効果があると考えています。私たちの音声認識技術により、教育コンテンツに字幕付与が普及することを期待しています。 概要 2016年度から施行されている障害者差別解消法では、障害者の社会的障壁の除去について「必要かつ合理的な配慮」を行うことが義務づけられており、聴覚障害者に対しては手話や字幕付与などの情報保障を行うことがこれに該当します。近年、さまざまな講義コンテンツがインターネット配信されていますが、字幕が付与されているものはほとんどありません。 放送大学は、日本で最大のメディアを利用した高等教育機関であり、約300の科目の講義がテレビやラジオで配信されています。その大半がインターネットでも配信され、スマートフォンやタブレットなどでも視聴できます。現在、字幕が付与されているのはテレビ講義番組の半数程度ですが、近い
人工知能でモノクロ画像をカラー化できるWebサービス「siggraph2016_colorization」が凄すぎる! SIGGRAPH 2016で提案される予定の、飯塚 里志氏らの白黒写真の自動色付けの研究成果が公開されています。 ⇒ [参考] satoshiiizuka/siggraph2016_colorization 人工知能、ディープラーニングの技術を応用したもので、素晴らしい性能を発揮します。写真にもよりますが、かなりそれらしい色付けをしてくれます。 画像出典: https://github.com/satoshiiizuka/siggraph2016_colorization ただし、これはすぐには実行ができないソースコードの形での公開であるため、開発環境を用意して各自でビルドしなくてはならず、だれにでも使えるものではありませんでした。 ⇒ [参考] 早稲田大学が開発した人工
The Menpo Project is a set of BSD licensed Python frameworks and associated tooling that provide end-to-end solutions for 2D and 3D deformable modeling. The project includes training and fitting code for various state-of-the-art methods such as: Active Appearance Model (AAM) Supervised Descent Method (SDM) Ensemble of Regression Trees (ERT) (powered by dlib) Constrained Local Model (CLM) Active Sh
このところDeep Learningが相当流行っているようで、ほとんど至るところで話題になっているのを見ます。 Deep Learningは深層学習とも呼ばれ、ニューラルネットワークの層をこれまでより深くして機械学習を行う技法です(だそうです)。 画像認識コンテストで他の方法と比べて非常に高い精度を示しており、以前は人の手で行っていた特徴の抽出まで行えます。 以前であれば車を認識するには車はどのような特徴を持っているかを人がモデル化して入力していたわけですが、この特徴を入力画像と与えられたラベルからニューラルネットワークが捉えてくれます。詳しいことはDeep Learningで検索して出てくる記事やスライドを参照のこと。 Deep Learning自体は容易に実装可能なものではなさそうですが、多くの研究グループがDeep Learningを行うためのソフトウェアをオープンソースにしているた
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く