タグ

音楽とあとで読むと映像に関するaceraceaeのブックマーク (1)

  • 混ざった楽器の音を演奏者の動きで分離 米MITなど研究

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米マサチューセッツ工科大学(MIT)とMIT-IBM Watson AI Labの研究チームが開発した「Music Gesture for Visual Sound Separation」は、楽器を演奏する複数人の動きを深層学習で分析し、個々の楽器の音を分離する手法だ。ピアノ、フルート、トランペットなどの楽器を複数人で同時演奏した場合に、その映像から演奏者それぞれのメロディーを抜き出す。 映像解析ネットワークと視覚音声分離ネットワークの2つからなる「自己教師あり学習」を採用。映像解析ネットワークでは、人体のキーポイント18点、手のキーポイント21点を抽出。次に身体の動きと前後関係を統合し、

    混ざった楽器の音を演奏者の動きで分離 米MITなど研究
    aceraceae
    aceraceae 2020/11/17
    音源分離にその発想はなかった。演奏者がちゃんと映ってることが前提だな。
  • 1