並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 296件

新着順 人気順

音声合成の検索結果161 - 200 件 / 296件

  • 読唇術を実現するためのデータベース作成!? 口の動きだけで言葉を認識し、違う声にする究極のバ美肉技術のための研究資金をクラウドファンディング中|DTMステーション

    ここ数年で、声を変換する技術が急速に進んでいます。いわゆるボイスチャンジャーの技術が進化していますし、DTMステーションでも何度も取り上げているクリムゾンテクノロジーのVoidol/リアチェンvoiceなども、画期的技術だと思います。ただ、従来の声の変換だと、どうしても元の声、イントネーションなどに引っ張られるため、なかなか思い通りの声にならないという問題点がありました。 そうした中、いまにわかに脚光を浴びる形になったのが、コンピュータによる読唇術(どくしんじゅつ:機械読唇ともいわれています)です。声を発せずに、口の動きだけで何を言っているかを認識した上で、それに音声合成を組み合わせれば、究極のボイスチャンジを実現できるのでは……、という発想なのですが、その技術研究のためのクラウドファンディングがスタートしたのです。これは先日「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベ

      読唇術を実現するためのデータベース作成!? 口の動きだけで言葉を認識し、違う声にする究極のバ美肉技術のための研究資金をクラウドファンディング中|DTMステーション
    • まったく新しい合成音声をユーザーが独自設計できる生成モデル「Design Voice」

      画像・文章生成AIが活気づくなか、人工知能と機械学習を使って吹き替えツールを製作するソフトウェア企業・Eleven Labsが、ゼロから新しい合成音声を設計できる音声合成モデル「Design Voice」を作成していることを明らかにしました。 This Voice Doesn't Exist - Generative Voice AI https://blog.elevenlabs.io/enter-the-new-year-with-a-bang/ Eleven Labsは映画やオーディオブック向けの吹き替えツールを開発している企業。このツールは元の話者の声の性質を維持しながら、自動的に別の言語で読み直すことができるという特徴があります。 Eleven Labsによると、吹き替えツールに使用する音声合成・音声複製手法をひもとくことで、新たな音声合成AIのアイデアが浮かんできたとのこと。実

        まったく新しい合成音声をユーザーが独自設計できる生成モデル「Design Voice」
      • GitHub - w-okada/voice-changer: リアルタイムボイスチェンジャー Realtime Voice Changer

        v.1.5.3.18a Bugfix: FCPE v.1.5.3.18 (removed.) New Feature: FCPE Easy-VC (experimental) v.1.5.3.17b bugfix: clear setting improve file sanitizer chage: default input chunk size: 192. decided by this chart.(https://rentry.co/VoiceChangerGuide#gpu-chart-for-known-working-chunkextra) v.1.5.3.17a Bug Fixes: Server mode error RVC Model merger Misc Add RVC Sample Chihaya-Jinja (https://chihaya369.booth.

          GitHub - w-okada/voice-changer: リアルタイムボイスチェンジャー Realtime Voice Changer
        • ATMの音「お金ないでしょ」に聞こえる? ツイートにセブン銀行は:朝日新聞デジタル

          ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

            ATMの音「お金ないでしょ」に聞こえる? ツイートにセブン銀行は:朝日新聞デジタル
          • 無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた

            「誰でも100種類の声に変換できるAIボイスチェンジャー」や「ディープラーニングで誰でも簡単に結月ゆかりの声になれる技術」を開発したDwango Media Villageのエンジニアであるヒホさんが、入力した文章から自動で読み上げ音声を合成してくれるオープンソースのソフト「VOICEVOX」を公開したので、実際に使ってみました。 VOICEVOX https://voicevox.hiroshiba.jp/ ???????????????????????????????????????????????????????????????? 無料で使える中品質なテキスト音声合成ソフトウェア、#VOICEVOX をリリースしました ???????????????????????????????????????????????????????????????? ぜひダウンロードして遊んでみてくださ

              無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた
            • 声優、井上喜久子さんがCVの『桜乃そら』がAIでほぼ人間に!VOICEPEAKとSynthesizer Vで8月24日発売開始|DTMステーション

              声優の井上喜久子さんがCVを務めるキャラクタ、桜乃そら(読み方:ハルノソラ)。これまで喋るソフトとしてはVOICEROID2、歌うソフトとしてはVOCALOID5で製品が販売されていました。その桜乃そら誕生5周年というタイミングに合わせ、この度新たなバージョンが誕生することが7月25日に発表されるとともに、その翌日、7月26日に、井上喜久子さんご本人も登場する「AHS公式生放送」という形での発表会が開催されました。 その新バージョン、入力文字読み上げソフトとしてはVOICEPEAKを、歌声合成ソフトとしてはSynthesizer Vを使う形で製品化され、「VOICEPEAK 桜乃そら」、「Synthesizer V AI 桜乃そら」という2製品が8月24日にパッケージ版、ダウンロード版で発売されます。いずれのソフトもWindows、Mac、Linuxの環境で動作するため、使えるユーザーが大

                声優、井上喜久子さんがCVの『桜乃そら』がAIでほぼ人間に!VOICEPEAKとSynthesizer Vで8月24日発売開始|DTMステーション
              • Engadget | Technology News & Reviews

                Ryan Gosling and Miller/Lord’s Project Hail Mary could be the sci-fi event of 2026

                  Engadget | Technology News & Reviews
                • 美空ひばりの新曲ライブの実現を支援 あの歌声を当社最新の歌声合成技術『VOCALOID:AI™』で再現

                  美空ひばりの新曲ライブの実現を支援 あの歌声を当社最新の歌声合成技術『VOCALOID:AI™』で再現 「NHKスペシャル AIでよみがえる美空ひばり(仮)」に技術協力 ヤマハ株式会社は、9月29日(日)午後9時から放送予定の「NHKスペシャル AIでよみがえる美空ひばり(仮)」に協力し、現在当社が開発を進めている、深層学習技術(ディープラーニング)を使用した歌声合成技術『VOCALOID:AI』(ボーカロイド:エーアイ)を用いて、故人である美空ひばりさんの歌声を再現し新曲ライブを実現するという取り組みを支援しました。なお、『VOCALOID:AI』の公開および実用化は今回が初となります。 今回の取り組みは、日本放送協会(NHK)主導のもと、多数の協力者を得て実施されたもので、没後30年を迎え、歌謡界のトップを走り続けた絶世のエンターテイナーである美空ひばりさんの新曲ライブを現代のAI(人

                    美空ひばりの新曲ライブの実現を支援 あの歌声を当社最新の歌声合成技術『VOCALOID:AI™』で再現
                  • タレントや声優の声そのもので喋る技術はどのように生まれたのか。A.I.VOICEを発売するエーアイに聞いてみた|DTMステーション

                    ソフトバンクのロボット、Pepperやマツコロイドの声として音声合成エンジンが採用されたり、NTTドコモの音声対話アプリ「しゃべってキャラ」(現在のmy daiz)で採用されるとともに、AHSが発売してきた「VOICEROID」やソースネクストから販売している「かんたん!AITalk」などの音声読み上げソフトを開発してきたのが、2018年にマザーズへの上場を果たした日本の音声合成専門の技術開発会社、株式会社エーアイです。先日「音声合成メーカー自らが個人向けに発売したPCソフト、A.I.VOICEを試してみた」という記事を書いた際、同社にご挨拶で伺ったのですが、お会いした副社長である、廣飯伸一(ひろいしんいち)さんが、私がリクルートで会社員をしていたときの同期・同僚であったことが発覚! 世間は狭いというか、最近こうした偶然のようなことがよくあるのですが、廣飯さんとお会いしたのも20年ぶりくら

                      タレントや声優の声そのもので喋る技術はどのように生まれたのか。A.I.VOICEを発売するエーアイに聞いてみた|DTMステーション
                    • GitHub - serp-ai/bark-with-voice-clone: 🔊 Text-prompted Generative Audio Model - With the ability to clone voices

                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                        GitHub - serp-ai/bark-with-voice-clone: 🔊 Text-prompted Generative Audio Model - With the ability to clone voices
                      • Transformerを用いてオノマトペから環境音を合成する手法をPyTorchで実装した(Transformer版 Onoma-to-Wave) - 備忘録

                        はじめに 事前準備 実装の概要 環境音合成実験 実験条件 実験結果 実装の舞台裏など おわりに はじめに 以前、Onoma-to-Waveを実装した記事を書いたことがあった: tam5917.hatenablog.com Onoma-to-Waveとはオノマトペ(文字列)を環境音(スペクトログラム)に変換するモデルである。RNNに基づくencoderとdecoderから構成されており、いわゆるSequence-to-Sequence(Seq2Seq)の構造を持つ。 それらをTransformerによって置き換えたモデルが、Onoma-to-Waveの著者らによって実はすでに提案されている。 岡本 悠希,井本 桂右,高道 慎之介,福森 隆寛,山下 洋一,"Transformerを用いたオノマトペからの環境音合成," 日本音響学会2021年秋季研究発表会,pp. 943-946,2021. 上

                          Transformerを用いてオノマトペから環境音を合成する手法をPyTorchで実装した(Transformer版 Onoma-to-Wave) - 備忘録
                        • AI歌声合成に「Synthesizer V AI」参入 AHSが発売へ 「Saki」「小春六花」などの音源も

                          7月に発売した歌声合成ソフト「Synthesizer V Studio Pro」に、ディープニューラルネットワーク(DNN)を活用した歌声合成機能を追加。従来は、あらかじめ収録しておいた歌声データを加工して切り貼りする「素片接続」という方式で歌声を合成していた。既存ユーザーには無償でアップデートする。 音楽制作ソフト(DAW)との連携機能を搭載。音声の品質を抑えることで、AIによる歌声の合成スピードを上げる機能も追加した。 AHSはすでに別のAI音声合成ソフト「CeVIO AI」用音源の発売も発表しており、AIによる歌声合成ソフトの取り扱いは2例目になる。AHSの尾形友秀代表は「両者は使い勝手がだいぶ違う。互いに補いながら使えると思う」としている。 Synthesizer V AI専用音源として「Saki」「小春六花」も発売する予定。SakiはSynthesizer V Studio Pr

                            AI歌声合成に「Synthesizer V AI」参入 AHSが発売へ 「Saki」「小春六花」などの音源も
                          • VALL-E

                            Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers [Paper] Chengyi Wang*,   Sanyuan Chen*,   Yu Wu*,   Ziqiang Zhang,   Long Zhou,   Shujie Liu, Zhuo Chen,   Yanqing Liu,   Huaming Wang,   Jinyu Li,   Lei He,   Sheng Zhao,   Furu Wei Microsoft Abstract. We introduce a language modeling approach for text to speech synthesis (TTS). Specifically, we train a neural codec language m

                            • 最新AIでついにラップも実現、まだまだ進化するSynthesizer Vの技術背景と目指す方向|DTMステーション

                              すでに使っている方も多いと思いますが、2023年6月21日にSynthesizer Vの最新バージョン1.9.0が正式にリリースされています。これまでのSynthesizer V Studio Proのユーザーであれば、誰でも無料でバージョンアップできるようになっているのがスゴイところですが、この1.9.0ではついにラップに対応するという、音声合成・歌声合成の世界の中で初の試みが実現されています。これまでラップを音声合成ソフトや歌声合成ソフトで、無理やり実現させようと打ち込みを頑張ってみた経験のある方も少なくないと思います。でも、なかなか思うようにいかなかったのが現実ではないでしょうか? そのラップを今回のSynthesizer V 1.9.0ではついに現実のものにしたのです。現時点においては英語のラップと中国語のラップへの対応で、日本語にはまだ対応できていないようですが、現在準備中なので

                                最新AIでついにラップも実現、まだまだ進化するSynthesizer Vの技術背景と目指す方向|DTMステーション
                              • 機械の声で気持ちよくなれるか ささやきAIで「メイドさんASMR」動画作ってみた

                                「ASMR動画」をご存じだろうか。YouTubeでは主に「脳がゾクゾクするような気持ちいい音を収録した動画」という意味で使われる言葉だ。「包丁でいろんなものを切る音」「耳かきの音」「ささやき声」などを収めた動画が人気ジャンルになっている。そんなASMRにぴったりの“ささやくAI”が登場したので、早速動画にしてみた。 シナリオは普段からASMR動画を楽しんでいるという同僚に頼んで書いてもらった。タイトルは「あなたのことを世界一愛している一途メイドと密着添い寝ASMR」。登場人物はメイド、聞き手は女主人とのこと。後半が少し過激だったためカットしている。 「あなたのことを世界一愛している一途メイドと密着添い寝ASMR」 シナリオ:吉川大貴 コメント「音声作品らしさを出しつつ、プラトニックラブにも見えるようにしました」 いかがだろうか。普段からASMR動画を聞いている人であれば「これは確かにASM

                                  機械の声で気持ちよくなれるか ささやきAIで「メイドさんASMR」動画作ってみた
                                • AI歌声ライブラリ「LAUGH DiAMOND (ラフダイヤモンド)」プロジェクト始動!

                                  ひょんな事から、とある芸能事務所に入ることになり、 篁 響季、風祭 朝陽、小紫 桃果、山田 花音らは ユニット「LAUGH DiAMOND」を結成することになったが、デビューどころか、自分たちの曲も用意してもらえず目下日々自主練(≒放置)状態の憂き目に遭っている。 あまりにも放置されているため、自分たちで路上ライブを試みるが…。 そしていつの日か、ライブハウスでたくさんの曲で ライブをやることが LAUGH DiAMOND の目標に… そんな彼女たちに、 あなたの曲を歌わせてあげてくれませんか? 「LAUGH DiAMOND」プロジェクトとは? 最新のディープラーニング技術を駆使したAI歌声ライブラリでもあり、 「篁 響季(たかむら・ひびき)」「風祭 朝陽(かざまつり・あさひ)」 「小紫 桃果(こむらさき・ももか)」「山田 花音(やまだ・かのん)」 で結成された夢見るシンガーユニット「LA

                                    AI歌声ライブラリ「LAUGH DiAMOND (ラフダイヤモンド)」プロジェクト始動!
                                  • ホーム

                                      ホーム
                                    • ニュータイプになった初音ミクはどこへ向かうのか  “VOCALOIDじゃないミク”の開発者に聞く

                                      VOCALOIDの代名詞と言っても過言ではない「初音ミク」が、VOCALOIDとは別のソフトウェアとして登場した。これまでとは音質や機能も変わり、イメージイラストも新衣装にリニューアルされた彼女は、一体どこへ向かうのか。 11月27日、クリプトン・フューチャー・メディア(CFM)が歌声合成音源「初音ミク NT(ニュータイプ)」を発売した。これまでVOCALOID用の音源としてリリースしてきた初音ミクを、今回は自社開発のオリジナルソフト「Piapro Studio NT」用の音源として大きく作り替えている。 新型ミクはVOCALOID上では動かない。歌声を合成するエンジンも、VOCALOIDに使われているものではなく、産業技術総合研究所(産総研)と共同で新たに開発したものを採用した。 オリジナルの歌声合成エンジンを作るに至った経緯や、初音ミクの新規イラストについて、開発者であるCFMの佐々木

                                        ニュータイプになった初音ミクはどこへ向かうのか  “VOCALOIDじゃないミク”の開発者に聞く
                                      • Unity でリアルタイムにリップシンクを行うプラグインを更に作り直してみた - 凹みTips

                                        はじめに 前回、リップシンクするプラグインを作り直してみた記事を書きました。 tips.hecomi.com 色々とご反響を頂いたのですが、しかしながら母音推定の性能がいまいちでした。第 1 、第 2 フォルマントという周波数スペクトルの 1 つ目、2 つ目のピークを検出する方法を採用していたのですが、このピークの検出が周波数スペクトル包絡を得るために使っている LPC 解析のパラメタに大きく依存したり、またノイズや声の高さによって容易にピークが別の場所に移ってしまったりといったことが原因でした。 そこで手法を変え、MFCC(メル周波数ケプストラム係数)を求める方式へと変更しました。 speechresearch.fiw-web.net これはディープラーニング以前の音声認識に使われていたもののようで、母音だけでなく子音も含む音素の検出が可能な特徴量になります。以前の手法と異なりピッチ変化

                                          Unity でリアルタイムにリップシンクを行うプラグインを更に作り直してみた - 凹みTips
                                        • AI音声プラットフォーム「CoeFont」、最高精度のAI音声モデルのβ版を提供開始

                                          AI音声プラットフォーム「CoeFont」、最高精度のAI音声モデルのβ版を提供開始〜ロゴリニューアルとCoeFontが作り放題となる「Businessプラン」の2ヶ月間無料トライアルも提供開始~ 株式会社CoeFont(本社:東京都港区、代表取締役:早川 尚吾、以下当社)は、AI音声プラットフォーム「CoeFont」の最高精度モデルのβ版を2022年8月22日(月)より提供開始いたします。今後は、順次、すべてのCoeFontに当モデルを適用することで、人が発する音声と遜色ない最高精度のAI音声を誰でも作成、利用可能となります。また、より声の社会インフラになるべく、ロゴのリニューアルも行い、あわせてAI音声を利用しやすくするために「Businessプラン(月額5,000円 / 1アカウント〜)」の2ヶ月間無料トライアルも開始いたします。 AI音声プラットフォーム「CoeFont」、最高精度

                                            AI音声プラットフォーム「CoeFont」、最高精度のAI音声モデルのβ版を提供開始
                                          • 花江夏樹さん,金田朋子さんら人気声優の声を収録無しでアプリやゲームに導入できるサービス「FutureVoice Actors」が登場

                                            花江夏樹さん,金田朋子さんら人気声優の声を収録無しでアプリやゲームに導入できるサービス「FutureVoice Actors」が登場 編集部:Gueed NTTドコモとNTTテクノクロス,アクロス エンタテインメント,GADGETは,NTTテクノクロスが提供する音声合成ソリューション「FutureVoice Crayon」シリーズの新サービス「FutureVoice Actors」の法人向け提供を,本日(2020年11月6日)開始した。 このサービスは,最小限の手続きで,自社のアプリやゲームで人気声優の「声」を活用できるというもの。声優の声をクラウドサービスで提供するため声優の稼働や編集の手間を削減できる点,AIを活用した音声合成技術をもとに人気声優の声を忠実に再現している点,権利調整の手間を削減できる点がウリとなっている。 ラインナップとしては,花江夏樹さん,金田朋子さん,内田 彩さん,

                                              花江夏樹さん,金田朋子さんら人気声優の声を収録無しでアプリやゲームに導入できるサービス「FutureVoice Actors」が登場
                                            • 声質100%再現! 将棋×音声合成フリーソフト「棋譜読みちゃん」

                                              「棋譜読みちゃん」は、音声合成機能を持つ棋譜再生ツールです。クラウドファンディングで開発が実現しました!UTAUのように、ユーザーが用意した声も使えます。その生声感……ぜひ動画でご確認ください!ご興味を持っていただけましたら、フォロー、コメント、拡散をお願いいたします!■公式サイト ⇒ https://help.kify.rei-yumesaki.net/■Twitter ⇒ https://twitter.com/Kifuyomi■続編&補足:棋譜読みちゃんを自動作曲ソフトにしてみた⇒ sm35851360■さらなる続報:マスコットキャラクターのつくよみちゃんが「商用利用もOKなフリー素材キャラクター」になりました!⇒ https://tyc.rei-yumesaki.net/■棋譜読みちゃん音声ライブラリの作り方 → sm35708969■棋譜読みちゃんを応援する方法まとめ → htt

                                                声質100%再現! 将棋×音声合成フリーソフト「棋譜読みちゃん」
                                              • ひろゆきに好きな言葉をしゃべらせる無料メーカーが公開される 「なんだろう、適当なことしゃべらせないでもらっていいですか?」

                                                「2ちゃんねる」開設者のひろゆき(西村博之)さんのAI音声に好きな言葉をしゃべらせた動画を生成できる「おしゃべりひろゆきメーカー」が無料公開されました。SNS上では「#おしゃべりひろゆきメーカー」がトレンド入り。ひろゆきさんのAI音声に「君のことが好きだー」と告白させたり、「写像とは……」と説明させたりする動画が多数投稿されており、大喜利状態になっています。 画像は「おしゃべりひろゆきメーカー」より 「おしゃべりひろゆきメーカー」は、専用ウェブサイトから、好きな文章などを入力することで、ひろゆきさんが話しているような動画コンテンツを手軽に作成できるというもの。自分の名前や伝えたいメッセージなどの文章を自由に入力して動画を生成できます。 画像は「おしゃべりひろゆきメーカー」より 今回の無料公開は、CoeFontが提供するAI音声プラットフォーム「CoeFont」へのひろゆきさんのAI音声の登

                                                  ひろゆきに好きな言葉をしゃべらせる無料メーカーが公開される 「なんだろう、適当なことしゃべらせないでもらっていいですか?」
                                                • 500円・15分の収録で、あなたの声を「AI音声合成」化!?音声合成プラットフォーム「CoeFont CLOUD」先行リリース

                                                  500円・15分の収録で、あなたの声を「AI音声合成」化!?音声合成プラットフォーム「CoeFont CLOUD」先行リリース500円・15分の収録から、あなたの声を「AI音声合成」化できる音声合成プラットフォーム「CoeFont CLOUD」の先行リリースを開始いたします 株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は、リリース3日で5万、月間ユーザー20万人を達成している「CoeFont STUDIO」に続いて、AI音声合成プラットフォーム、「CoeFont CLOUD」(https://coefont.cloud )の先行リリースを開始いたします。本文内リンクから先行リリースの体験の申請が可能です。 ■CoeFont CLOUDとは 当社が『CoeFont STUDIO』に続いてリリースする「CoeFont CLOUD」(https://coefont.c

                                                    500円・15分の収録で、あなたの声を「AI音声合成」化!?音声合成プラットフォーム「CoeFont CLOUD」先行リリース
                                                  • リアルタイム音声変換 ParakeetVC

                                                    誰の声でも好きなようにカスタマイズできる最先端AIを自社研究し,サービスの開発 & 展開をしています.

                                                      リアルタイム音声変換 ParakeetVC
                                                    • Megpoidの音声合成ソフト、A.I.VOICE GUMIが発売開始。7年ぶりとなる製品発売の背景を探る|DTMステーション

                                                      株式会社インターネット 代表取締役 村上昇さんインタビュー --Megpoid製品、だいぶ久しぶりになりますが、どうしてこのタイミングでの登場となったのですか? 村上:昨年の秋ごろから、そろそろ出したいなと検討していました。喋りも、歌唱もどちらも進めたいと考えていました。ただ、昨今の技術進化などからさまざまなメーカーが参入し、エンジンも複数あるから、どれにしようか……と思って考えていたのです。そうした中、今年1月にエーアイさんから具体的な提案をいただいたんです。技術的な背景から、実際の工程なども含め、細かく話を詰めていくなか、これがよさそう、となったのです。 株式会社インターネットの代表取締役、村上昇さんにオンラインミーティングの形でインタビューした --トークもソングもとなると、CeVIO AIやSynthesizer V&voicepeakのほうが、スマートな気もしますが……。 村上:

                                                        Megpoidの音声合成ソフト、A.I.VOICE GUMIが発売開始。7年ぶりとなる製品発売の背景を探る|DTMステーション
                                                      • Koemake Project

                                                        Windowsで使える!AIボイスチェンジャー無料ダウンロードサイト

                                                        • 【準備編】RVCを用いたリアルタイムボイスチェンジの使い方を1から解説してみる|omiz

                                                          用意するもの①VB-CABLE Virtual Audio Device(仮想オーディオデバイスならなんでも) ②7zip ③Hugging Faceアカウント ④VC Client v.1.5.2.2 ⑤hubert_base.pt ⑥RVC-beta ⑦Audacity どれくらいのスペックが必要かメモリを16GB積んでいてかつ、グラボを積んだゲーミングPCであれば問題ないと思います。 私のパソコンは、 GPU NVIDIA GeForce RTX 2070 SUPER CPU Intel(R) Core(TM) i7-10700 メモリ 32GB です。これくらいのスペックがあれば余裕を持って学習・ボイチェンできます。 追記:強いMacでも動くらしいです ①VB-CABLE Virtual Audio Device DiscordとかゲームのVCでボイチェンを使うのに必要です。 公式

                                                            【準備編】RVCを用いたリアルタイムボイスチェンジの使い方を1から解説してみる|omiz
                                                          • DeNA×AI|技術と、革新と、未来と。

                                                            AIを活用した技術の進歩。革新。 幅広いサービスの利用が、当たり前になった昨今、 これからの私たちが、提供できる価値とはいったい何か。 それは、DeNA × AIだからできる 「人」と「テクノロジー」が、組み合わさった未来です。 DeNA × AIが持つ 「意図や思いを汲み取った、質の高い発想力」、 「多岐にわたる経験を元にした、AI、データサイエンスの実践力」、 「複雑なシステムの開発、安定した稼働ができる技術力」など。 それぞれの強みを組み合わせることで、 まだどこにもない「モノづくり」や「コトがら」を、生み出していきます。 ともに、技術の向上を。 ともに、革新の追求を。 ともに、今よりも豊かな未来を。 さあ、DeNA × AIと 新しいモノづくりを一緒に。

                                                              DeNA×AI|技術と、革新と、未来と。
                                                            • 500円で自分の声を深層学習させ、自在に音声合成を可能に。19歳大学生社長が開発したCoeFont CLOUDの破壊力|DTMステーション

                                                              日々、驚くような革新的な進化をしているAIを絡めた音声合成、歌声合成の世界ですが、7月28日、また革命的ともいえる力を持った新たなサービスがスタートしました。19歳の大学生社長がスタートさせたCoeFont CLOUDは自分の声をフォントのように登録するとともに、その登録されたCoeFontを利用すれば、誰でも簡単に、そのCoeFontの声で音声合成ができるというサービスです。 これまで音声合成用に声を登録するには何か月もの時間を要し、数百万円~数千万円がかかるといわれていたものが、15~30分の録音で完了し6~7時間待つだけで自動で完成。その価格も500円~1,500円というのですから、トンでもないことが起きているのは間違いありません。東京工業大学に通う、株式会社Yellstonの代表取締役・早川尚吾(@pigiipanku)さんによれば、「スタートして2日で1,000近くのCoeFon

                                                                500円で自分の声を深層学習させ、自在に音声合成を可能に。19歳大学生社長が開発したCoeFont CLOUDの破壊力|DTMステーション
                                                              • 音声合成はAIの力で“棒読み”を脱した 飛躍の年、2019年を振り返る

                                                                2019年は音声合成の分野にとって、間違いなく飛躍の1年だったといえる。AIが自然な発話や豊かな表情を手に入れ、活躍の場を大きく広げたのが2019年の注目すべき変化ではないだろうか。気付かぬ間にAIの話し声を聞いていることもあるかもしれない。 これまでは一部の人しか耳にすることがなかった歌声の合成についても、ヤマハとNHKが共同開発した「AI美空ひばり」の登場で、多くの人に衝撃とともに伝わったのではないだろうか。AIが芸術的な表現を身に付け、多くの人が好感を持てる音声になってきたのだ。 そのために、今までは研究者や技術者しか知ることのなかった音声合成技術が一般の人々も耳にするまでに広がり、さまざまな議論を巻き起こしたといえる。 そんな19年の注目すべき音声合成ニュースについて振り返りながら、20年の動向を予想してみよう。 AIがプロの歌手になる時代の幕開け 歌声合成といえば、まず思い浮かべ

                                                                  音声合成はAIの力で“棒読み”を脱した 飛躍の年、2019年を振り返る
                                                                • 【COEIROINK】無料トークソフトに新ボイスが2名追加!【大幅アップデート】

                                                                  COEIROINKにボイスが追加されました。「ディアちゃん」「アルマちゃん」です。よろしくお願いします!========= 補足情報 =========「COEIROINK-v.1.0.0」ですが、「ユーザー名が日本語だと起動しない」不具合がありました。現在は不具合が修正された「COEIROINK-v.1.0.1」がリリースされています。========= キャスト =========ナコ:MANA@COEIROINKレコ:つくよみちゃん@COEIROINKカナタ:おふとんP@COEIROINKディアちゃん(立ち絵 - ぱるとねる 様 &amp; MtU 様):ディアちゃん@COEIROINKアルマちゃん(立ち絵 - ぱるとねる 様 &amp; MtU 様):アルマちゃん@COEIROINK========== 音声素材 ==========COEIROINK:https://coeiro

                                                                    【COEIROINK】無料トークソフトに新ボイスが2名追加!【大幅アップデート】
                                                                  • AIを使った約5,000種類以上の高精度な合成音声から簡単に作品を作れる「CoeFont」/商用利用でき、自分の声を合成音声にできるサービスも【レビュー】

                                                                      AIを使った約5,000種類以上の高精度な合成音声から簡単に作品を作れる「CoeFont」/商用利用でき、自分の声を合成音声にできるサービスも【レビュー】
                                                                    • GitHub - leetcode-mafia/cheetah: Mac app for crushing remote tech interviews with AI

                                                                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                        GitHub - leetcode-mafia/cheetah: Mac app for crushing remote tech interviews with AI
                                                                      • AIが声の表現を自動で分析し、抑揚などの演出を与える音声合成ツール「Voice Track Maker」

                                                                        東芝デジタルソリューションズは8月17日、ゲームやコンテンツを制作するクリエーター向けに、AIが声の表現を自動で分析し、音声合成に抑揚とテンポの演出を与える機能を搭載した音声合成ツール「Voice Track Maker」を発表。同日から発売する。 これはWindows PC向けのソフトウェアで、テキストから音声合成を作成できるツール。複数の声の辞書を組み込んで自由で滑らかな発話を作成することができるほか、人の音声の抑揚とテンポの情報をその場で分析し、音声合成に真似させて発声させることができる「韻律射影機能」を搭載している。 これにより、従来の音声合成において、喜びや怒り、哀しみなどといった感情表現機能では難しかった、さまざまな演技表現を再現することが容易になったという。この機能により、ユーザーが模範となる演技表現をソフトウェアに教えることが可能となり、ゲームやコンテンツの制作など、人の声

                                                                          AIが声の表現を自動で分析し、抑揚などの演出を与える音声合成ツール「Voice Track Maker」
                                                                        • 【SynthesizerV】群青/YOASOBI【京町セイカAI】

                                                                          セイカさんとカラオケに行きたいだけの人生でした。SynthesizerVはUIが使いやすくて好きです。音楽系マイリスト>mylist/54396658

                                                                            【SynthesizerV】群青/YOASOBI【京町セイカAI】
                                                                          • GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)

                                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                              GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)
                                                                            • 【図解】超高性能AIボイスチェンジャー「RVC」のしくみ・コツ

                                                                              はじめに ↑に貼った動画は話題の高性能ボイスチェンジャー「RVC」の変換例です(Creative Commonsで配布・改変が可能なライセンスの音声データを学習させたものです。BOOTHで無料配布中です)。今回の記事では動画の4つ+1の計5モデルを作成する中で見えてきたRVCの仕組みや使用時・モデル生成時のコツを紹介したいと思います。 BOOTHで学習済みモデル無料配布中(ライセンスはそれぞれ異なり、元データに準拠します) 注意事項 本編に入る前にいくつか前提を明らかにしておきます。私自身、RVCや音声認識についての専門知識はほぼありません。RVCについて初めて知ったのは約2週間前で、そのレベルは初心者の域を出ないと思っていただければと思います。さらに、RVCのモデルであるHuBERTやトランスフォーマーに関する知識もあまりありません(論文もまともに読んでません)。 したがって、この記事の

                                                                                【図解】超高性能AIボイスチェンジャー「RVC」のしくみ・コツ
                                                                              • 自分の声が500円でAIボイスに? 音声読み上げソフト「CoeFont CLOUD」の品質を動画でチェック

                                                                                いかがだろうか。作るのにかかる作業時間は十数分から、コストは500~1500円だ。ノイズはあるが形になっているだろう。 この音声のように、文章を入力すると話し声を出力する音声読み上げシステムは、スマートスピーカーやGoogle翻訳、ゲーム実況動画の電子音声など身近なところで普通に使われている。 そんな音声読み上げソフトの開発にはある程度大きな資金が必要だ。近年ではクリエイター向けの音声読み上げソフトを開発する際にクラウドファンディングで資金を調達する例が増えている。その目標支援額は、たいてい数百万円規模だ。 しかし、音声読み上げソフト業界に価格破壊ともいえる新サービスが7月19日に登場した。それがAIベンチャーYellston(東京都港区)の「CoeFont CLOUD」だ。これは同社の社長で東京工業大学2年生の早川尚吾さんが開発したクラウドサービスで、500円から自分の声をAI音声読み上

                                                                                  自分の声が500円でAIボイスに? 音声読み上げソフト「CoeFont CLOUD」の品質を動画でチェック
                                                                                • これはヤバすぎる!? ASMRの世界に衝撃が走る『ささやき声』の音声合成。VOICEVOXの破壊力|DTMステーション

                                                                                  昨年8月、彗星のように登場し、音声合成業界に大きな衝撃を与えたオープンソースのAI音声合成ソフトウェア、VOICEVOX。リリース当初はWindows専用で「ずんだもん」と「四国めたん」という2つのキャラクタの声でテキストを読み上げるソフトでしたが、その後、Mac版、Linux版が登場するとともに、GPUを使って高速に処理できるモードも搭載。そして、「春日部つむぎ」、「雨晴はう」、「波音リツ」……などなど多くのキャラクタが追加されてきました。すごいのは、商用・非商用を問わず無料で使えるということで(キャラクタによって利用規約は異なります)、多くの人たちに利用されてきました。 そして今回、VOICEVOXとして10番目となる新キャラクタ、「九州そら」が誕生。ノーマル、まあまあ、ツンツン、セクシーという4つのスタイルに加え、はじめて「ささやき」というものが搭載されたのです。これまで音声合成の世

                                                                                    これはヤバすぎる!? ASMRの世界に衝撃が走る『ささやき声』の音声合成。VOICEVOXの破壊力|DTMステーション