名古屋工業大学 国際音声言語技術研究所と音声合成を柱とするベンチャー企業テクノスピーチは12月12日、これまでの歌声合成とは一線を画す、元の歌い手の声質、癖、歌い方といった特徴を捉えた歌い方をディープラーニング技術などの適用で実現した。約2時間分の音声データで学習し、日本語、英語、中国語に対応する。 名古屋工業大学の徳田恵一教授を中心とするチームはこれまで、隠れマルコフモデルを使った統計的手法により、音声合成のOpen JTalk、歌声合成のSinsyを開発し、提供してきた。テクノスピーチはこれらを発展させた商用製品CeVIO Creative Studioの開発にも携わっている。今回の新技術はこれらを新たな次元に推し進めるものと言える。 名古屋工業大学とその出身者によるテクノスピーチの共同研究は、2019年3月に開催される日本音響学会2019年春季研究発表で公開される。 Sinsyと同じ
既存の曲からボーカルや特定の楽器だけをきれいに抽出できる新しい技術を、「End-to-End学習」によるニューラルネットワークを用いて開発したという論文が発表されています。 [1810.12187] End-to-end music source separation: is it possible in the waveform domain? https://arxiv.org/abs/1810.12187 楽曲からボーカルやギター、ドラムなど、特定のパートを分離して抽出できるニューラルネットワークとして、「DeepConvSep」と呼ばれる畳み込みニューラルネットワークが存在していました。これは、楽曲の周波数に応じてどの音がどれぐらい強くなっているかを示す「マグニチュードスペクトログラム」を分析してから抜き出すという手法もの。しかし、DeepConvSepでは、抜き出したパートの精度
遅れてきた本命! ヤマハ新型イヤホン&ヘッドホン発表 イヤホン端子を省略したことで話題となったiPhone 7の登場をきっかけに、Bluetooth搭載のヘッドホンやイヤホンが大きな人気となっている。ここ最近の新製品でもワイヤレスタイプの占める割合は増える一方だ。そんななかでも沈黙を守っていたヤマハだったが、今秋満を持して新モデルを発表した。ワイヤレスタイプのBluetoothヘッドホン/一体型イヤホン、そして有線タイプはハイレゾに対応したイヤホンだ。 いずれも音質と装着感にこだわった作りで、機能をあえて絞って王道を行くところがヤマハらしい。「イヤホンやヘッドホンには何よりも音質を求めたい!」という人にとっては、まさに遅れてきた本命と言えるだろう。 そこでアスキー編集部では、開発者の皆さんにインタビューを敢行。久しぶりの新製品についてたっぷりと語っていただいた。同時に、鳥居一豊による実機レ
ローランドの創業者であり、元社長、元会長。現在、ATV株式会社の代表取締役会長で、公益財団法人かけはし芸術文化振興財団名誉顧問である梯郁太郎(かけはしいくたろう)さんが4月1日、お亡くなりになりました。ご遺族の意向もあるようで、ATVやローランドからも正式な発表は現時点ではありませんが、ご冥福をお祈りいたします。昨年末のATVの新製品、aFrameの発表会のときにお見掛けした際にはとってもお元気でいらっしゃったので、楽器業界のために100歳くらいまでは……と思っていたのですが、87歳だったとのことです。 ご存じのとおり梯さんはMIDIの考案者・開発者であり、そのMIDIの功績からグラミー賞を受賞されている方でもあります。その梯さんに、2011年にインタビューさせていただいたことがありました。ちょうどスティーブ・ジョブズが亡くなった直後で、朝日新聞社のAERAのスティーブ・ジョブズ追悼号での
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く