[B! 機械学習][認識] richard_rawのブックマーク

richard_raw id:richard_raw

機械学習と認識に関するrichard_rawのブックマーク (16)

源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社タイ出身女性が語る「前人未到の人生」 | Ledge.ai
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
richard_raw 2021/10/08
「好き」は最強だなあ。

機械学習

認識

日本

clip

国際
リンク
Self-Attentionを全面的に使った新時代の画像認識モデルを解説！ - Qiita
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします！(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransf ormerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
richard_raw 2020/09/11
さっぱりわからないがブックマーク。

認識

機械学習

画像処理

clip
リンク
グーグルの天才AI研究者、ニューラルネットワークを超える「カプセルネットワーク」を発表
richard_raw 2017/11/28
これか→ https://mosko.tokyo/post/on-capusels/ 両方読んでも理解できてる気がしません(/_;)

人工知能

認識

技術

clip

機械学習
リンク
RasPiとディープラーニングで我が家のトイレ問題を解決する - Qiita
おしっこセンサーできましたウチの小学生の息子が家のトイレでたびたびおしっこをこぼしてしまう。俺がくどくど注意してもあんまり効果ない。そこで、代わりにAIに怒ってもらうことにした。こんな感じである。おしっこセンサーのデモ（動画）。水を数滴床にたらすとブザーが鳴り、床を拭くと止まる。ディープラーニングの画像認識を使い、床の上に落ちた水滴をカメラで検出してブザーが鳴る仕組みだ。夏休みの自由工作に過ぎないので精度は期待していなかったけど、意外にきちんと動いてくれて、カメラに映る範囲に水滴を数滴たらすとピッピと鳴り、床を拭くとブザーも止まる。「お父さんだってAIくらい作れるぞ」と息子に自慢したいがための工作なのだ。でも、これ作るのはそんなに難しくなくて、休み中の3日くらいで完成した。かかったお金は、RasPiやカメラ、周辺デバイスが2万円弱、画像認識のモデル作成に使ったクラウドの料金が数10
richard_raw 2017/09/01
これが3日で作れるのか……。/「1500枚の学習画像を集めるのたいへんそう！というコメントを結構いただいたけど、実際に集めるのにかかった時間は2時間くらい。」

認識

機械学習

clip

Raspberry Pi
リンク
Google、機械学習を応用した無償のオンラインお絵描きツール“AutoDraw”を発表～手書きの絵を認識し、アーティストの描いた高品質なイラストへ変換
richard_raw 2017/04/12
「本職のイラストレーターが描いたイラストを提案してくれる」著作権が気になります。

認識

機械学習

Google

webサービス

画像

clip
リンク
Amazon、Google、IBM、Microsoftが公開する、AIを使うための「API」「ライブラリ」「実行環境」一覧
AIには、複合的で意思を持つ「強いAI」と、何かを認識することに特化した「弱いAI」があります。ドラえもんのような「強いAI」はまだ生まれておらず、現在利用可能なものは「弱いAI」。その「弱いAI」のAPIを公開している代表企業として挙げられるのが、Amazon.com、Google、IBM、Microsoftといった企業です。
richard_raw 2017/03/09
ASK気になってる。日本リリースまだー？

Microsoft

amazon

Google

clip

機械学習

認識
リンク
府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまった論文を読んだ - Qiita
Deep Learning Advent Calendar 2016の20日目の記事です。 ConvNetの歴史とResNet亜種、ベストプラクティスに関連スライドがあります（追記）背景府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまったようです。 M2の学生が趣味でやっていたCIFAR10とCIFAR100の認識タスクで，現時点での世界最高性能の結果を出したそうだ…趣味でっていうのが…https://t.co/HKFLXTMbzx — ニーシェス (@lachesis1120) 2016年12月7日府大のプレスリリース一般物体認識分野で、府大生が世界一の認識精度を持つニューラルネットワークを開発黄瀬先生の研究室の学生さんだそうです。凄いですね！ちょうどResNet系に興味があったので、読んでみます。この論文を理解するには、ResNet, (Wide
richard_raw 2016/12/21
やばいピラミッドのところで振り切られた。

機械学習

認識

clip
リンク
ディープラーニングで「インド人を右に」を理解する: Generative Adversarial Network による画像モーフィング - 加藤大晴のウェブサイト
ディープラーニングで「インド人を右に」を理解する: Generative Adversarial Network による画像モーフィング「インド人を右に」問題インターネットを長く使っている方は、伝説の誤植「インド人を右に」 [1] についてご存知なのではないでしょうか。「くお〜!! ぶつかる〜!! ここでアクセル全開、インド人を右に!」この唐突に過ぎる意味不明な「インド人」は「ハンドル」の誤植であり、それはライターの手書きの文字が汚かったために発生したとされています。 …手書きの文字が汚かったとして、どうすれば「ハンドル」が「インド人」になるのか？　従来より、この問題について様々な考察がなされてきました。ここでは、近年の技術の発展の成果を取り入れ、コンピュータに文字を書かせることによって「ハンドル」から「インド人」への変容についてアプローチしてみたいと思います。 # これは De
richard_raw 2016/12/07
タイトルの勝利。

画像

ネタ

技術

機械学習

認識

ゲーム

clip
リンク
講演・講義の音声から字幕を付けるシステムを開発－放送大学の講義で90％以上の認識率－
講演や講義に字幕を付与することは、聴覚障害者への情報保障のみならず、理解を深める効果があると考えています。私たちの音声認識技術により、教育コンテンツに字幕付与が普及することを期待しています。概要 2016年度から施行されている障害者差別解消法では、障害者の社会的障壁の除去について「必要かつ合理的な配慮」を行うことが義務づけられており、聴覚障害者に対しては手話や字幕付与などの情報保障を行うことがこれに該当します。近年、さまざまな講義コンテンツがインターネット配信されていますが、字幕が付与されているものはほとんどありません。放送大学は、日本で最大のメディアを利用した高等教育機関であり、約300の科目の講義がテレビやラジオで配信されています。その大半がインターネットでも配信され、スマートフォンやタブレットなどでも視聴できます。現在、字幕が付与されているのはテレビ講義番組の半数程度ですが、近い
richard_raw 2016/12/07
これも深層学習か。

認識

機械学習

clip

教育
リンク
機械の読唇術精度が人間を遙かに上回る93.4%を達成～オックスフォード大やGoogleが共同開発。難聴の人向けサービスにも応用可能
richard_raw 2016/11/11
「世界で初めて単語レベルではなく文章レベルの読唇を実現した。LipNetは、話者に依存せず93.4%の精度で読唇を行なえるという。」人間のプロでも52％程度！……盗聴が捗りますな（ぇ

機械学習

技術

認識

clip
リンク
グーグルの人工知能、今度はコミックをスマホで読みやすくする
richard_raw 2016/08/02
これはいいソリューション。Koboのアプリでもやってるっぽい？

機械学習

認識

画像

漫画

Google

clip
リンク
人工知能でモノクロ画像をカラー化できるWebサービス「siggraph2016_colorization」が凄すぎる！
人工知能でモノクロ画像をカラー化できるWebサービス「siggraph2016_colorization」が凄すぎる！ SIGGRAPH 2016で提案される予定の、飯塚里志氏らの白黒写真の自動色付けの研究成果が公開されています。 ⇒ [参考] satoshiiizuka/siggraph2016_colorization 人工知能、ディープラーニングの技術を応用したもので、素晴らしい性能を発揮します。写真にもよりますが、かなりそれらしい色付けをしてくれます。画像出典: https://github.com/satoshiiizuka/siggraph2016_colorization ただし、これはすぐには実行ができないソースコードの形での公開であるため、開発環境を用意して各自でビルドしなくてはならず、だれにでも使えるものではありませんでした。 ⇒ [参考] 早稲田大学が開発した人工
richard_raw 2016/06/07
いろいろ試したい。/そういえばモノクロの漫画をカラー化するアプリあったな……。

画像

機械学習

認識

webサービス

clip
リンク
紙に書いた方程式を瞬時に解くiPhoneアプリ『Mathpix』。三角法、微積分対応、グラフや解答手順も表示 - Engadget 日本版
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
richard_raw 2016/05/23
手書きの数式を認識できるのか！こりゃ凄い。

認識

iphone

clip

機械学習
リンク
The Menpo Project · The Menpo Project
The Menpo Project is a set of BSD licensed Python frameworks and associated tooling that provide end-to-end solutions for 2D and 3D deformable modeling. The project includes training and fitting code for various state-of-the-art methods such as: Active Appearance Model (AAM) Supervised Descent Method (SDM) Ensem ble of Regression Trees (ERT) (powered by dlib) Constrained Local Model (CLM) Active Sh
richard_raw 2016/04/07
えーっと、顔検出して隈取りっぽく加工するだけの画像処理ライブラリ……じゃないよね？（ぉ

Python

画像処理

認識

機械学習

clip
リンク
圧勝「囲碁AI」が露呈した人工知能の弱点 - 日本経済新聞
米グーグルの研究部門であるGoogle DeepMindが開発した囲碁AI（人工知能）「Alpha Go（アルファ碁）」と、韓国のプロ棋士イ・セドル氏が2016年3月9日～15日に韓国で相まみえた五番勝負は、イ・セドル氏が第四局で一矢を報いたものの、4勝1敗でAlpha Goの圧勝に終わった。この五番勝負は、"第三次AIブーム"を牽引するディープラーニング（深層学習:多層のニューラルネットによる機械学習）のデモンストレーションという枠を超え、その強みと弱点、ビジネス応用の方向性を浮き彫りにした。
richard_raw 2016/03/18
「弱点」というかブラックボックス化してて人間には理解しがたいというSFにありそうな問題。

機械学習

ゲーム

認識

Google

技術

clip
リンク
Deep Learningでラブライブ！キャラを識別する - christinaの備忘録
このところDeep Learningが相当流行っているようで、ほとんど至るところで話題になっているのを見ます。 Deep Learningは深層学習とも呼ばれ、ニューラルネットワークの層をこれまでより深くして機械学習を行う技法です（だそうです）。画像認識コンテストで他の方法と比べて非常に高い精度を示しており、以前は人の手で行っていた特徴の抽出まで行えます。以前であれば車を認識するには車はどのような特徴を持っているかを人がモデル化して入力していたわけですが、この特徴を入力画像と与えられたラベルからニューラルネットワークが捉えてくれます。詳しいことはDeep Learningで検索して出てくる記事やスライドを参照のこと。 Deep Learning自体は容易に実装可能なものではなさそうですが、多くの研究グループがDeep Learningを行うためのソフトウェアをオープンソースにしているた
richard_raw 2015/02/11
OpenCV+AnimeFaceで顔認識。CaffeでDeep Learning。髪型と瞳の色がキーになってたりするのか……。

画像

認識

機械学習

clip
リンク
1