タグ

ブックマーク / ctrl-x-s.blog (2)

  • 学習データ自作のすすめ

    「深層学習で勝負するなら」で、深層学習でよい結果を出すには良質のデータを作るのが一番よいと述べました。とはいえ実際問題として、深層学習で必要とされるぐらいのデータ量を確保するにはそれなりのコストがかかるため、データ作りはなかなか手を出しにくいのも事実です。そこで記事では、自分でデータを作ることにはよい学習結果を得る以上のご利益があることを説明したいと思います。 データを作るためには、(当然ですが)どういうデータが必要なのか明確にしないといけません。ある程度の量のデータを作るためには(クラウドソーシングなどを使って)多数の作業者に作成を委託することが普通ですが、そのためにはどういうデータをどう作って欲しいのか他人もわかるように説明できないといけません。仮にそれができないとすると、そもそも深層学習を使って何をしたいのかが怪しくなってきます。データを作る第一歩として何を作るのか説明することで、

    学習データ自作のすすめ
  • 深層学習で勝負するなら

    深層学習を使って良い結果を出すためにはいくつか重要な要素があります。 タスクにあった学習アルゴリズム(ここでは、ネットワークの構造、初期化法、最適化手法などざっくり含んで学習アルゴリズムと呼ぶことにします。) 学習・評価を手っ取り早く行うための計算機資源 データ 深層学習を使って開発するぞ!となったとき、1と2にまず目が行くことが多い気がします。特に研究色が強い場合はほぼ1が興味の対象で、2と3は後回しになりがちです。しかし、少し先のことを考えてみると、1と2はお金でどうにかなる(ということは長期的には価格が低下してコモディティ化する可能性が高い)ところだという気がしています。 もちろん、学習アルゴリズムと計算資源の分野でも最先端の研究は続いていくと思います。また、安全性や高速性などの要求水準が高い分野では、そう簡単に価格は下がらないかもしれません。しかし、一般的な利用に十分なレベルな精度

    深層学習で勝負するなら
    takuya-a
    takuya-a 2018/01/08
  • 1