【読売新聞】 生成AI(人工知能)を使い、声優らの偽音声を作り出して無断利用した動画がSNSに投稿される事態が相次ぎ、当事者らに不安が広がっている。勝手に曲を歌わせたり、文章を朗読させたりしていて、専門家らは、権利の保護や悪用防止の
声優の井上喜久子さんがCVを務めるキャラクタ、桜乃そら(読み方:ハルノソラ)。これまで喋るソフトとしてはVOICEROID2、歌うソフトとしてはVOCALOID5で製品が販売されていました。その桜乃そら誕生5周年というタイミングに合わせ、この度新たなバージョンが誕生することが7月25日に発表されるとともに、その翌日、7月26日に、井上喜久子さんご本人も登場する「AHS公式生放送」という形での発表会が開催されました。 その新バージョン、入力文字読み上げソフトとしてはVOICEPEAKを、歌声合成ソフトとしてはSynthesizer Vを使う形で製品化され、「VOICEPEAK 桜乃そら」、「Synthesizer V AI 桜乃そら」という2製品が8月24日にパッケージ版、ダウンロード版で発売されます。いずれのソフトもWindows、Mac、Linuxの環境で動作するため、使えるユーザーが大
すでに使っている方も多いと思いますが、2023年6月21日にSynthesizer Vの最新バージョン1.9.0が正式にリリースされています。これまでのSynthesizer V Studio Proのユーザーであれば、誰でも無料でバージョンアップできるようになっているのがスゴイところですが、この1.9.0ではついにラップに対応するという、音声合成・歌声合成の世界の中で初の試みが実現されています。これまでラップを音声合成ソフトや歌声合成ソフトで、無理やり実現させようと打ち込みを頑張ってみた経験のある方も少なくないと思います。でも、なかなか思うようにいかなかったのが現実ではないでしょうか? そのラップを今回のSynthesizer V 1.9.0ではついに現実のものにしたのです。現時点においては英語のラップと中国語のラップへの対応で、日本語にはまだ対応できていないようですが、現在準備中なので
それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff
さとうささらとすずきつづみの初主演ライブ「ささら&つづみ Winter ~1st duet~」に行ってきました。 1時間ほどのライブでしたが、ずっと楽しかったという記憶しかなかった。 会場は横浜YTJホール。開場時間から入場を待つ行列ができていた。 入場から開演まで 入場すると、クラウドファンディングでSasara席を申し込んだので、特典にペンライトとTシャツをもらう。ささらちゃんのイラストがプリントされたピンク色のTシャツで、自分はあまり着ないような色だけど、特別な日なのでそのTシャツに着替える。 私の横の座席に座る人達は、Sasara席やSuzuki席を申し込んだ熱心なファン。手作りのささらちゃんぬいぐるみを抱えた方もいた。初音ミクのトートバッグを抱え、ペンライト持参の、ボカロのライブに慣れた人もいた。 まあ、初音ミクグッズは持って行かなかったけど、私もそんなボカロのライブに慣れた人の
NEUTRINOずんだもん完成おめでとうございます ※当作品は東北ずん子ガイドラインに準拠します(ず・ω・きょ) ※案件動画ではございません。経緯はこちら https://twitter.com/t_zunko/status/1553749891696164865 【オフボーカル】 https://drive.google.com/drive/folders/1ybaMJkW51ZZ5vPbM0IBz3PMgZmzHwDI8?usp=sharing 【クレジット】 作詞作曲:mustie=DC 動画:マスティ https://twitter.com/DoughnutsCinema イラスト:RAO様 https://twitter.com/RIORAO 【NEUTRINOずんだもん】 https://studio-neutrino.com/ 【歌詞】 (ずんだ もんだ わん
についても、発表があり、「これは何なんだろう?」と気になっていました。この時は具体的な内容まではわからず、その翌日にHigh Dynamics Voice Modelに関する紹介ビデオも公表されたのですが、ここでもいま一つ、ピンときませんでした。が、それが実装されたβ版を使わせてもらうとともに、Kanruさんに話を聞いて、ようやくこれが歌声合成における革命であることが分かりました。 以下が、そのAIリテイクの様子を捉えたビデオです。 だいたいの雰囲気が、理解いただけたでしょうか? そう、このAIリテイク機能は、High Dynamics Voice Modelという技術をSynthesizer Vの機能として実装させたものであり、歌声を新たに作り直すというものなのです。 「歌声合成は、ここ数年で大きく進化してきましたが、やはり人間の歌声の魅力にはかなわない面があります。その大きな理由の一つ
5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ
Macが生まれた年からの贈り物は、逆回転で「タイム・アフター・タイム」と囁く:立ちどまるよふりむくよ(1/3 ページ) 古いメディアを再生しようとするとさまざまな困難にぶち当たるのは当然だ。例えばパーソナル向けコンピュータストレージはカセットテープから8インチ、5インチ、3.5インチのフロッピーディスク、ハードディスク、SSDへと移ってきたが、今はフロッピーのデータすら読むのは難しい。 この連載の前回は、Apple最後のデジカメで撮った写真をフラッシュストレージから取り出す話だったが、けっこう壮大なストーリーになってしまった。 Apple最後のデジカメを再起動したらMac Studioの祖先まで巻き込んだタイムトラベル的結末に デジカメのメモリカード今昔物語 スマートメディアからSD、xD、CFexpressまで PC用のストレージ規格ですらこのように変遷しているのだから、まあ仕方ない。
昨年8月、彗星のように登場し、音声合成業界に大きな衝撃を与えたオープンソースのAI音声合成ソフトウェア、VOICEVOX。リリース当初はWindows専用で「ずんだもん」と「四国めたん」という2つのキャラクタの声でテキストを読み上げるソフトでしたが、その後、Mac版、Linux版が登場するとともに、GPUを使って高速に処理できるモードも搭載。そして、「春日部つむぎ」、「雨晴はう」、「波音リツ」……などなど多くのキャラクタが追加されてきました。すごいのは、商用・非商用を問わず無料で使えるということで(キャラクタによって利用規約は異なります)、多くの人たちに利用されてきました。 そして今回、VOICEVOXとして10番目となる新キャラクタ、「九州そら」が誕生。ノーマル、まあまあ、ツンツン、セクシーという4つのスタイルに加え、はじめて「ささやき」というものが搭載されたのです。これまで音声合成の世
日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば
驚異的に進化したSynthesizer V AI まずは、バックグラウンドや機能、性能といったものを紹介する前に、私がSynthesizer V Pro Studioの1.5.0を使って打ち込んだ、弦巻マキの歌声をちょっと聴いてみてください。 いかがですか?従来の歌声合成の概念を覆すレベルに来ていると思いませんか?これは、2年前のコミケでDTMステーションCreativeからリリースしたoyasumiという曲の冒頭部分。そのときは声優の小岩井ことりさんにボーカルをお願いし、囁くように優しく歌ってもらったので、弦巻マキにも、それっぽく歌わせて仕上げてみたのです。本来、弦巻マキは「アニメキャラっぽい雰囲気の元気な女の子」というイメージの歌声ですが、そことはだいぶ違ったニュアンスの歌声になっているのも感じられたと思います。 「自動処理」メニューにある「自動ピッチ調整(カスタマイズ)」を選択する
ここ1、2年、音声合成や歌声合成が急速に進化し、さまざまなサービスが登場してきていますが、またちょっと違う方向から、スゴいサービスが登場してきました。自分の声をマイクで入力すると、数秒後に女性キャラクターの声になって返ってくる音声変換システム、VOICE AVATAR 七声ニーナ(ボイスアバター・ななこえニーナ)です。5月12日に、突如としてWeb上に誕生し、無料でいくらでも利用できることから、世間を大きく騒がせています。男性でも女性でも、誰がどのようにしゃべっても、声優の高田憂希(@sunflower930316)さんCVの七声ニーナのキャラクタボイスに変換されるというものなのです。 パソコンでもスマホでも、サイトにアクセスしてRECボタンを押してしゃべりかければ、すぐに使えます。そして、その結果を聴けば誰もが驚かされるはず。このシステムはAIを用いて作られているとのことで、それを開発し
AIを活用した技術の進歩。革新。 幅広いサービスの利用が、当たり前になった昨今、 これからの私たちが、提供できる価値とはいったい何か。 それは、DeNA × AIだからできる 「人」と「テクノロジー」が、組み合わさった未来です。 DeNA × AIが持つ 「意図や思いを汲み取った、質の高い発想力」、 「多岐にわたる経験を元にした、AI、データサイエンスの実践力」、 「複雑なシステムの開発、安定した稼働ができる技術力」など。 それぞれの強みを組み合わせることで、 まだどこにもない「モノづくり」や「コトがら」を、生み出していきます。 ともに、技術の向上を。 ともに、革新の追求を。 ともに、今よりも豊かな未来を。 さあ、DeNA × AIと 新しいモノづくりを一緒に。
東北地方を応援する萌えキャラの運営会社が、キャラの声を生かしたAI研究向け学習データを無料で公開している。直接的な収益にもならず、研究者に使ってもらえるとも限らないのに、なぜそのような取り組みを行っているのか。データを公開した萌えキャラ運営会社SSS(仙台市)の小田恭央CEOに話を聞いた。 萌えキャラ「東北ずん子」の運営会社 SSSは東北応援キャラ「東北ずん子」を運営する企業で、グッズの製作や地域振興イベントなど、ライセンスビジネスを展開している。ヤマハの歌声合成ソフト「VOCALOID」用音源の販売などは行っているが、AIの技術開発を行っているテクノロジー企業というわけではない。「AI向けの学習データを無料公開」といわれると少し唐突にも聞こえる。 同社は2019年11月、研究者向けに「東北きりたん歌唱データベース(DB)」を無料公開した。東北ずん子の関連キャラ「東北きりたん」の歌声を約1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く