タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

音と@Googleに関するyamadarのブックマーク (1)

  • SoundStorm

    SoundStorm:Efficient Parallel Audio Generation [paper] Zalán Borsos, Matt Sharifi, Damien Vincent, Eugene Kharitonov, Neil Zeghidour, Marco Tagliasacchi Google Research Abstract. We present SoundStorm, a model for efficient, non-autoregressive audio generation. SoundStorm receives as input the semantic tokens of AudioLM, and relies on bidirectional attention and confidence-based parallel decoding

    yamadar
    yamadar 2023/06/12
    "SoundStorm"は、AudioLMのセマンティックトークンを用いて、高品質で一貫性のある音声を非自己回帰で高速生成するモデル。高速で生成可能で、注意して聞いても人間と判別がつかないレベルの品質。
  • 1