サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
WWDC24
kouohhashi.qrunch.io
音声のノイズリダクション、その2です。 今回はRNNoiseを試してみました。RNNoiseはJean-Marc ValinさんがMozillaにいた時に公開したオープンソースソストウェアで、ディープラーニングと昔ながらのDSP(デジタルシグナルプロセッシング)の手法を組み合わせているのが特徴です。 折角なので翻訳(意訳)してみることにします。 原文はこちら RNNoiseとは このデモはRNNoiseプロジェクトがどのようにディープラーニングを使って音声のノイズ除去を行っているのかを説明します。核となるアイデアは、従来からあるシグナルプロセッシングとディープラーニングを組み合わせることで、軽量かつ高速で、リアルタイムで使えるノイズ除去アルゴリズムを作ることです。GPUは必要ありません。Raspberry Piでも簡単に動作し、簡単でかつ従来のノイズ除去システムより良い結果を出します。 ノ
ディープラーニングを使って音声データのノイズリダクションに挑戦してみることにしました。 ソツーで音声認識をやる上で、入力値となる音声データのノイズを事前に減らしておけると良いのではと思ったのと、単純に面白そうで勉強にもなるかなと思ったのが動機です。上手いこと動いてくれれば、上記以外でも使い道がありそうっていうのも魅力的です。 折角なので、Tensorflowを使ってend-to-endのモデルがトレーニング出来たら良いなと思っています。 1週間もあれば、成果を出せるかなと思ったのですが、舐めてました。end-to-endの音声のノイズ除去は調べてみると中々大変。また、取り組んでいる開発者が少ないせいか、説明してくれているウェブサイトもGithubのソースコードも少ないかったです。 というわけで、一気にやり切ることは断念し、3回か4回にわけてプロジェクトを進めることにしました。 作戦 調査
このページを最初にブックマークしてみませんか?
『kouohhashi.qrunch.io』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く