タグ

ブックマーク / zenn.dev/litagin (2)

  • (Style-)Bert-VITS2 JP-Extra (日本語特化版)について

    宣伝 Style-Bert-VITS2のチュートリアル解説動画を作りました discordサーバー「AI声づくり研究会」によく出没しています 概要 2024-02-01、音声合成(TTS)の中国発オープンソースのBert-VITS2の日語特化版のBert-VITS2 JP-Extra がリリースされ、私が作っているそれの改造版 Style-Bert-VITS2 でもJP-Extra版を2/3に使えるようになりました(しました)。 実際にどんな感じかは オンラインのデモ 上で試せるのでぜひお試しください。 これにより日語の発音やアクセントやイントネーション等の自然性が上がり、クリアさや学習を回していったときのガタツキが大きく減る傾向があります。英語中国語で音声合成したいという需要がなく日語しか使わない場合はJP-Extra版を使うことを強くおすすめします。 稿では、以前の の記事で

    (Style-)Bert-VITS2 JP-Extra (日本語特化版)について
    stealthinu
    stealthinu 2024/02/10
    LitaginさんがStyle-Bert-VITS2のためにg2pを改善したところの解説がある。openjtalkでは句読点や!?など音にならない部分は削除されるため根本修正にはそこから修正しないといけない。
  • (Style-)Bert-VITS2の仕組み・構造と、バージョンによる違いについて

    宣伝 Style-Bert-VITS2のチュートリアル解説動画を作りました discordサーバー「AI声づくり研究会」によく出没しています 注意 (2024-02-05) この記事は、Bert-VITS2の日語特化版が出る以前のものについて解説しています。最新の日語特化版については をご参照ください。 概要 テキストから感情豊かで自然な抑揚の音声を生成できるBert-VITS2には、新しいバージョンでも 2.1 2.2 2.3(最終バージョン) の3バージョンがあります。 また、バージョン2.1をベースにし、感情スタイル指定をちゃんと動くようにしようとして私がリリースしたStyle-Bert-VITS2もあります: それぞれのバージョンによってモデル構造が異なっており、どちらが良いとは一概には言えません。つまり2.3が2.1より必ずしも優れているとは言えない(逆もまた然り)です。 こ

    (Style-)Bert-VITS2の仕組み・構造と、バージョンによる違いについて
    stealthinu
    stealthinu 2024/01/31
    Bert-VITS2のバージョン2.1~2.3の違いについてlitaginさんが説明してくれてるもの。
  • 1