タグ

音声に関するprozorecのブックマーク (3)

  • 動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Dolby LaboratoriesとスペインのUniversitat Pompeu Fabraの研究チームが開発した「Universal Speech Enhancement With Score-based Diffusion」は、収録した映像のバックグラウンドノイズ(背景雑音)を強力に除去する技術だ。動画撮影した雑音を消し去り、話す声だけをくっきり残すことができる。強力すぎるため、映像がアフレコを挿入したみたいな仕上がりになってしまう。 実世界で録音した音声には必然的に背景の雑音や残響が含まれ、不快感や明瞭度の妨げになるためノイズ除去が行われる。最近では深層学習の登場によりノイズ除

    動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に
    prozorec
    prozorec 2022/06/15
    音声がくっきりしている。特に料理番組は、バックグラウンドのミュージックや料理をしている音もなくなって、声だけが強調されている
  • 音程を変えずに速度変更可能な音楽・語学練習用プレイヤー「BestPractice」 | OSDN Magazine

    語学学習や楽器演奏の習得には、教材となる音声ファイルやCDをゆっくり聴きながらの反復練習が欠かせない。しかし一般的な音楽プレイヤーソフトはスロー再生や反復再生に対応しておらず使い勝手が悪い。そこで利用したいのが音楽・語学練習用プレイヤー「BestPractice」である。 通常、音楽プレイヤーソフトは再生速度の変更ができないことが多い。また、変更できる場合でも速度の変更と同時に音程が高くなったり低くなったりして、非常に聞き苦しくなることがある。だが、BestPracticeなら音程を保ったまま20%(0.2倍速)から200%(2倍速)まで0.1パーセント刻みで自由に速さを変更できる。変更はリアルタイムで反映されるので、再生しながら細かく調整可能だ。 またBestPracticeには指定した2点間のリピート再生を行えるループ機能がある。開始点と終了点はクリック1つで手軽に設定でき、重点的に学

    音程を変えずに速度変更可能な音楽・語学練習用プレイヤー「BestPractice」 | OSDN Magazine
  • Web上で利用できる歌声合成システム「Sinsy」公開 | クリエイティブ | マイコミジャーナル

    調整なしで人間のように歌うことが可能な新歌声合成システム、HMM-based Singing Voice Synthesis System「Sinsy」(しぃんしぃ)が、sinsy.jpにて、公開された。 システムでは、MusicXMLをアップロードすることで自動的に歌声を合成してくれる Sinsyは、アップロードされた楽譜(MusicXML)に基づき、自然な歌声を生成するHMM歌声合成システム。Webサイト上にて、「ボーカル」、「声質」、「ピッチシフト 」などのパラメータを設定し、別途、ユーザーが「finale」などの対応アプリケーションで作成したMusicXMLファイルを送信することで、合成した歌声(.wav)を取得することができる。現在、ボーカルとして「f001 (女性 合成可能音程: Gb3-Gb5 得意なテンポ: BPM100)」が提供されている。また、Webサイトにてサンプル

  • 1