[B! 音声合成] aceraceaeのブックマーク

男性が喋っても女性の声になるリアルタイムAIボイスチェンジャー「MMVC」でずんだもんなどがサポート

aceraceae 2022/04/29

リンク

音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能｜DTMステーション

日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI 音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人＋男性3人＋女の子1人＝7人の声を切り替えることが可能なAI 音声合成ソフトで、テキストを入力すれば

aceraceae 2022/02/17

最近の音声合成の品質はすごく高いけど日本語は高低アクセントの位置が同じ単語でも場合で変わるんで普通に学習させても不自然になりがちだった。開き直ってあとからでもアクセントを変えられるのはいいと思う。

音声合成

リンク

Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話

稲田エイジ｜BtoBのWebサイト制作／Web活用支援／コンテンツ支援／HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」ぼく「はい」 Google「そちらの営業時間を教えてください」ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と日曜日の営業時間も教えてください」 ↓ 2022-01-25 10:26:41 稲田エイジ｜BtoBのWebサイト制作／Web活用支援／コンテンツ支援／HubSpot @inada_h ぼく「土曜と日曜は普通にお休みです」 Google「確認させてください。そちらの営業時間は月曜から金曜の9時〜18時でよろしいでしょうか」ぼく「はい」 Google「ありがとうございました（電話を切りそうな気配）」ぼく「待って。参

aceraceae 2022/01/26

自動音声の詐欺電話と自動音声がやり合う未来がすぐにくるかな。

リンク

もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力｜DTMステーション

驚異的に進化したSynthesizer V AI まずは、バックグラウンドや機能、性能といったものを紹介する前に、私がSynthesizer V Pro Studioの1.5.0を使って打ち込んだ、弦巻マキの歌声をちょっと聴いてみてください。いかがですか？従来の歌声合成の概念を覆すレベルに来ていると思いませんか？これは、2年前のコミケでDTMステーションCreativeからリリースしたoyasumiという曲の冒頭部分。そのときは声優の小岩井ことりさんにボーカルをお願いし、囁くように優しく歌ってもらったので、弦巻マキにも、それっぽく歌わせて仕上げてみたのです。本来、弦巻マキは「アニメキャラっぽい雰囲気の元気な女の子」というイメージの歌声ですが、そことはだいぶ違ったニュアンスの歌声になっているのも感じられたと思います。「自動処理」メニューにある「自動ピッチ調整（カスタマイズ）」を選択する

aceraceae 2021/12/24

AI による音声合成も日本語のピッチアクセント問題以外はかなりいい線いってるけど音楽は楽譜としてピッチ指定できるのが強い。自然さに対する考え方は Finale の human playback 的なものかな？

リンク

VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

オープンソースVOICEVOX は OSS（オープンソース・ソフトウェア）版 VOICEVOX をもとに構築されています。製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成をご参照ください。ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

aceraceae 2021/08/01

普通に使うならじゅうぶんなレベル。

リンク

新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入

LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog はじめにこんにちは、2020年4月に新卒としてLINE株式会社に入社した二又航介です。テキスト音声合成システムの研究開発を担当するAI開発室 Voiceチームに所属し、音声合成システムにおけるテキスト処理部の研究開発やチームの機械学習基盤構築に取り組んでいます。学生時代は機械翻訳や同時通訳に関連する研究に取り組んでいました。研究以外の活動としては、アルバイト・インターンでの対話システムや機械翻訳システムの研究開発、個人活動としてwebアプリケーション開発などを行っていました。このような活動を通じて、数多くのユーザーに利用される自然言語処理技術を活かしたサービスに携わりたいという思いからLINEを志望しました。学生時代は専

aceraceae 2021/05/27

日本語の場合ピッチアクセント言語でしかも前後の関係性でアクセント位置が移動するからそれが効率よく学習できないといつまで経っても不自然なままになってしまう。

リンク

無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

CoeFont (コエフォント) @coefont Web音声合成サービス『CoeFont STUDIO』 coefont.studio をリリースしました。全サービス無料公開。すべてのクリエイターに声を届けます。#CoeFontSTUDIO #CoeFont pic.twitter.com/Wu5AFJpZ9d 2021-04-23 12:44:30

aceraceae 2021/04/26

音声合成

リンク

AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース｜DTMステーション

今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO（ニュートリノ）です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT（いずれも学術的に公開されている歌声データベースを利用して開発している）の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです（9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です）。先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ

aceraceae 2020/09/19

musicxml 入力だったり汎用性が高いし vocoder が切り換えられるのでもっと音質がいいものが出てきたらもっとよくなりそうだし。

リンク

JSUT (Japanese speech corpus of Saruwatari Lab, University of Tokyo) - Shinnosuke Takamichi

JSUT (Japanese speech corpus of Saruwatari-lab., University of Tokyo) The JSUT Collection is Japanese speech corpora connecting speech, song, and audio events. The JSUT corpus is a part of the JSUT Collection. JSUT コレクションは，声・歌・音声模倣をつなげるための音声コーパスです．このJSUT コーパスは，JSUT コレクションの一部です． This corpus consists of Japanese text (transcription) and reading-style audio. The audio data is sampled at 48kHz and rec

aceraceae 2020/09/08

リンク

GitHub - espnet/espnet: End-to-End Speech Processing Toolkit

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

aceraceae 2020/09/08

充実してる。

リンク

Tacotron2で始める日本語音声合成 - Qiita

はじめに最も気になるのはやはりどの程度のものができるのかだと思うので、まずはこちらをお聞きください。このモデルは pre-trained model を使用した転移学習約一時間の前処理済みのデータ WaveGlow (published model) で学習、推論しています。これから始める方の参考になるように私のやり方を紹介します。 Tacotron2についてはこちらが参考になります。 Tacotron2を用いた日本語TTS(Text-to-Speech)の研究・開発【まとめ】 ※デモを既に動かしていることを前提としています。用意するもの音声ファイル 22050Hz 16bit モノラル wav 音声区間毎に分割ノイズが多いもの、笑い声等のテキストにしづらいものは除外します。長過ぎるものは学習時にメモリエラーが出ることがあります。私は10秒以内のもののみにしています。テキ

aceraceae 2020/08/03

リンク

はてなブックマーク

タグ

関連タグで絞り込む (11)

音声合成に関するaceraceaeのブックマーク (11)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス