Research AlphaGo Zero: Starting from scratch Published 18 October 2017 Authors David Silver, Demis Hassabis Artificial intelligence research has made rapid progress in a wide variety of domains from speech recognition and image classification to genomics and drug discovery. In many cases, these are specialist systems that leverage enormous amounts of human expertise and data. However, for some pro
VGG16のFine-tuningによる犬猫認識 (1) (2017/1/8)のつづき。 前回、予告したように下の3つのニューラルネットワークを動かして犬・猫の2クラス分類の精度を比較したい。 小さな畳み込みニューラルネットをスクラッチから学習する VGG16が抽出した特徴を使って多層パーセプトロンを学習する VGG16をFine-tuningする リポジトリ:dogs_vs_cats 1. 小さな畳み込みニューラルネットをスクラッチから学習する ベースラインとしてVGG16は使わずに小規模な畳み込みニューラルネットワークをスクラッチから学習する。学習データは、犬クラス1000枚、猫クラス1000枚と小規模なデータを使うのであまり大規模なネットワークは学習できない。そこで、畳込みが3層のLeNet相当の小さなモデルを構成した。 横の矢印はそのレイヤでの出力の4Dテンソルのサイズ (samp
自然言語からSQLクエリを機械学習で生成、業務データベースが言葉で検索できるように。セールスフォース・ドットコムがAIの研究成果を公開 セールスフォース・ドットコムの人工知能研究部門であるSalesforce Researchは、自然言語による質問とデータベーススキーマの情報を基に、質問に対応するSQLクエリを機械学習で生成する研究成果を公開しました。 これによってビジネスパーソンがSQL言語を学ぶことなく、業務データベースから必要な情報を自然言語で検索できることが期待できます。 自然言語を解析してSQLクエリを生成 下記の図は、公開された研究成果の概要を示したものです。 図の左上「How many engine types did Val Musetti use?」が自然言語の問いとなり、「Entrant / Constructor / Chassis / Engine / No / D
英語版はこちら。 TensorFlowの登場以降、OSSベースの機械学習の盛り上がりは加速しています。Kerasの作者のFrançois Cholletさんの言葉が、この状況を非常に端的に表しています。これだけでも十分だとは思いますが、この記事では、なぜオープンソースの機械学習が強いのか、最近のどういった流れがあるのかを整理したいと思います。 tl;dr機械学習やDeep Learningのフレームワークが充実してきた論文が査読前に公開され、他社も簡単にアルゴリズムの検証ができるようになった多くのプレーヤーの参戦により、アカデミアでの機械学習の研究がレッドオーシャン化した他社にないアルゴリズムで一発勝負、実装は秘密、というアプローチが厳しい牧歌的な時代5年前10年前の世界では、先端の機械学習に取り組んでいるのは大学などの研究室、大企業の研究所や一部の先進的な企業がほとんどでした。特に、ラベ
Google「DeepMind」、コンピュータが人型ベースでB地点にたどり着く最善の方法(柔軟な動き)を独学で生成する強化学習を用いたアプローチを提案した論文を発表 2017-07-11 GoogleのAIを研究する子会社「DeepMind」は、強化学習で人型含めシミュレートされた環境の中で複雑で柔軟な動きを生成するアプローチを提案した論文を公開しました。 Emergence of Locomotion Behaviours in Rich Environments(PDF) これら動きは、コンピュータが独学で最善の方法として考案した行動です。 研究者は、エージェントに動きのセットと前進するインセンティブを与え、AからB地点にたどり着く最善の方法を生み出すための強化学習を仕込みます。 コンピュータは、今ある動作を使って試行錯誤を繰り返し、さまざまな動き方を思いつく中で次々と最善へ近づけてい
本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 こんにちは、AI開発部の伊藤です。 今回のブログは、「深層学習はいったい画像のどこを見て判断しているのか」という素朴な疑問に答えてくれる技術として、昨年提唱された「Grad-CAM」という技術を紹介します。 目次 目次 1. はじめに 2. Grad-CAMの紹介 Grad-CAMの仕組み: 3. 適用例 3-1. 画像キャプション生成(Image Captioning) 3-2. VQA(Visual Question Answering) 3-3. 学習用データのバイアス 4. 実施例(お好み焼きとピザを分類) 4-1. 画像データについて: 4-2. CNNの構築: 4-3. Grad-CAMの実装: 4-4. 実施結果の評価 お好み焼き画像でCNNの判定が当たっているケース: ピザ
Generative Adversarial Networks (GANs) excel at creating realistic images with complex models for which maximum likelihood is infeasible. However, the convergence of GAN training has still not been proved. We propose a two time-scale update rule (TTUR) for training GANs with stochastic gradient descent on arbitrary GAN loss functions. TTUR has an individual learning rate for both the discriminator
Google、単一の画像内で複数のオブジェクトを検出するTensorFlow向け機械学習フレームワーク「TensorFlow Object Detection API」をGitHubにて公開 2017-06-16 Googleは、単一の画像内で複数のオブジェクトを検出するTensorFlow上に構築されたオープンソースの機械学習フレームワーク「TensorFlow Object Detection API」をGitHubにて公開しました。 本システムは、コンピュータビジョンでの活用を想定しており、画像内のオブジェクトを検出、トレーニングおよびデプロイを容易にします。 GitHubページはこちら。 関連 Google、機械学習をスマートフォンだけで処理する低遅延、低電力の画像認識技術におけるコンピュータビジョンモデル「MobileNets」をGitHubにて公開 | Seamless
こんにちは。ぼへみあです。 機械学習がすっかりブームになって、仕事や趣味でディープラーニングを使ったことがある人が増えていると思います。 特に画像分野でディープラーニングは成果を上げているので、特定のものを判別・識別するといった事例が多いかと思います。 そうした画像系のディープラーニング経験者なら経験する現象があります。 それは、 「その分野について、作ったAIよりも自分が詳しくなる」 という現象です。 おそ松さん見分けの第一人者になってしまった 以前取り組んだおそ松さんの6つ子をディープラーニングで見分けるネタでは、学習用データセットの作成のために、自力で5000枚以上のおそ松さんたちを見分ける作業を行いました。その結果、アニメを見ても、これは何松だ、と判断できるようになってしまいました。当時はおそ松さんを見分ける能力は誰にも負けない自信がありました。 なぜか学会でおそ松さんの話をする機
James Kirkpatrick, Razvan Pascanu, Neil Rabinowitz, Joel Veness, Guillaume Desjardins, Andrei A. Rusu, Kieran Milan, John Quan, Tiago Ramalho, Agnieszka Grabska-Barwinska, Demis Hassabis, Claudia Clopath, Dharshan Kumaran, and Raia Hadsell aDeepMind, London EC4 5TW, United Kingdom;bBioengineering Department, Imperial College London, London SW7 2AZ, United Kingdom
マルチラベル (multi-label)† マルチラベル分類問題は,多クラス分類と同様に,クラスのとりうる値の数(定義域の大きさ)が3以上.しかし,通常の多クラス分類では,各事例はどれか一つのクラスに分類される.一方,マルチラベル分類では,一つの事例が複数のクラスに同時に分類されうる. 例えば,Webページを分類を考えたとき,機械学習について書かれたページを「機械学習」と「統計」の両方のクラスに同時に分類する. クラスの定義域を \(\mathcal{C}\) とすると,多クラスの訓練事例は \((c_i\in\mathcal{C},\mathbf{x_i})\) の形式だが,マルチラベルでは定義域の部分集合を使った \((C\subseteq\mathcal{C},\mathbf{x}_i)\) の形式. ↑ 解法† 文献1で照会された問題を変換する方法を紹介 binary releva
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く