エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
OpenAI、わずか15秒のサンプルから”そっくり音声”作れるAIモデル
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
OpenAI、わずか15秒のサンプルから”そっくり音声”作れるAIモデル
OpenAIは3月29日(現地時間)、少ない音声サンプルから合成音声を生成できるAIモデル「Voice Engine」に... OpenAIは3月29日(現地時間)、少ない音声サンプルから合成音声を生成できるAIモデル「Voice Engine」について技術的な詳細を発表した。 Voice Engineは入力されたテキストから自然な発話音声を生成できるAIモデル。サンプルとして与えられた人間の声を自然な発音でまねることができ、学習に必要な音声サンプルの長さも15秒程度で済む。 サンプルデータに含まれていない言語の音声も生成可能だが、元の言語のアクセントの癖はそのまま保持される。例えば、フランス語話者の音声サンプルを基に英語の音声を生成すると、フランス語のアクセントをもった英語音声が出力されるといった具合だ。 Voice Engineは2022年後半に開発された技術で、すでに「ext-to-Speech API」や「ChatGPT Voice」といった同社のサービスに活用されているほか、2023年末からは信頼できる一