発話者が同じなら、声質には癖がある。だから最初の方の特性を学習するだけで、あとの音質は予測できる。文字テキストだけからも音声を生成できるはず。それを原理とすれば、大幅に情報量を削減できる。

blueboyblueboy のブックマーク 2021/03/03 18:33

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

3kbpsという低いビットレートでも高音質を実現するコーデック「Lyra」をGoogleが開発

    2021年2月25日、Googleが3kbpsという低いビットレートでも、元音声と遜色ないほどの音質を維持できるコーデック「Lyra」を開発したと発表しました。 Google AI Blog: Lyra: A New Very Low-Bitrate Codec for Spe...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう