タグ

ブックマーク / qiita.com/cvusk (1)

  • ディープラーニングで音声分類 - Qiita

    勉強がてらディープラーニングで環境音・自然音の分類をやってみました。 データセットはESC-50を使用します。 コード全文。 やったこと 環境音・自然音をConvolutional neural networkで分類します。 対象は動物の鳴き声や雨の音、人間の咳、時計のアラーム、エンジン音のような声(言葉)のない音です。 これらの音を使って、以下の手順で分類器をつくりました。 音声データの前処理 データの入手 Augmentation メルスペクトログラム データの用意 CNNで分類 CNNの定義 最適化関数にAmsgradを採用 学習データにmixupを採用 音声データの前処理 ESC-50は環境音を50クラス、2,000ファイル集めたデータセットです。 クラスには以下があります。 50クラスで各クラスのデータが40ファイルずつ用意されており、合計2,000ファイルです。 1ファイルの長

    ディープラーニングで音声分類 - Qiita
  • 1