声から声に直接変換しようとすると、変換元の声も学習する必要があるのがネック。そこで、変換元の声から音素と音高を抽出し、深層学習モデルを使って変換先の声に音声合成するという所がポイントらしい。

NATNAT のブックマーク 2020/09/15 23:37

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう