[7ページ] 音声合成の人気記事 296件

241 - 280 件 / 296件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声合成の検索結果241 - 280 件 / 296件

Synthesizer V｜製品情報｜AHS(AH-Software)
- 6 users
- www.ah-soft.com
- テクノロジー
- 2020/06/26
Synthesizer Vとは？「Synthesizer V」は、Dreamtonicsが開発する強力な音声処理エンジンと直感的で柔軟なユーザーインターフェースを併せ持つ歌声合成ソフトウェアです。メロディーを描き歌詞を吹き込むだけで、簡単にオリジナルソングをお作りいただけます。また、従来のサンプルベースの歌声合成と人工知能による歌声合成のハイブリッド手法を採用した、全く新しい歌声合成エンジンを搭載しています。歌声データベースとは？歌声データベースは従来のサンプルベース歌声合成と人工知能による歌声合成のハイブリッド手法を採用した、全く新しい歌声合成エンジンに対応するデータベースです。歌声合成ソフトウェア「Synthesizer V Studio Basic」が付属しているので、単体でも音楽制作が可能です。別売りの歌声合成ソフトウェア「Synthesizer V Studio P
VOICEVOX Nemo
- 6 users
- voicevox.hiroshiba.jp
- テクノロジー
- 2023/11/18
Nemo の音声ライブラリを用いて生成した音声は、「VOICEVOX Nemo」とクレジットを記載すれば、商用・非商用で利用可能です。利用規約の詳細は以下をご確認ください。利用規約
Unity の WebGL で動的にサウンドを生成・再生する方法を調べてみた - 凹みTips
- 5 users
- tips.hecomi.com
- テクノロジー
- 2022/09/30
はじめに通常、Unity で動的にサウンドを生成したいときは、AudioClip の Create で PCMReaderCallback を渡すか、MonoBehaviour の OnAudioFilterRead 中でバッファをセットすることで可能です。 docs.unity3d.com docs.unity3d.com かなり古い記事ですが、以前解説も書きました（一部有料機能と述べているところは現状はすべて無料です） tips.hecomi.com AudioClip に SetData して再生することも出来ますが、初期化時ではなく毎フレームデータを与えたい場合はこれは利用できません。正確にはセットして再生はできるのですが、サウンドの読み取り・再生自体はサウンドのスレッドで行われているため、Update などのメインスレッドから与えるとうまく再生されない（途切れたりする）からです
- Unity
【学習セット用意編】RVCを用いたリアルタイムボイスチェンジを1から解説してみる｜omiz｜note
- 5 users
- note.com/omiz_aiart
- テクノロジー
- 2023/04/10
はじめにこの記事は【準備編】RVCを用いたリアルタイムボイスチェンジを1から解説してみるの続編です。まだ読んでない人は準備編から見てね。この記事で紹介している内容に関して私は一切の責任を負いません、自己責任でお願いします。また、声には著作権・肖像権が関係しているので、トラブルになるようなことはお控えください。 ①学習セットの条件 ②音声の加工 ③加工した音声を分割する ④wavファイルを書き出す ①学習セットの条件条件は、ノイズが少ない数秒間の発話音声(.wav)です。理想はITAコーパスのような、ノイズのない数秒で区切られた音声ですが、用意する難易度が高いです。なので、この記事ではBGMの無い数分から数十分の音声から作る方法を紹介します。追記だだぱんさんがBGM消し去るツールの記事書いてくれました。 ②音声の加工Audacity v2.4.2を開きます。でてきた画面に用意した
- 機械学習
- AI
- RVC
【2022/07/05更新】読み上げソフト・サービスをまとめてみた【29+2種類】 - アマノケイのまったり技術解説
- 5 users
- amanokei.hatenablog.com
- テクノロジー
- 2020/08/28
注意読み上げソフトはめっちゃ多いので調べてないものもあります、無いものがあったらコメントでこっそり教えて下さい、こっそり追加します。一応、利用についてや規約に関しては細心の注意を払っていますが、間違ってる場合もあるので各サービス利用する場合は規約を自分で読み、各自で判断して下さい。 ※なにかしらトラブルがあったとしても、この記事を根拠にしないで下さい。あと、各サービスのデモとしてウェブに体験版が置かれている場合も多いのですが、サービスによっては出力した音声の二次利用を禁止しているので、規約を読んで各自で判断して下さい。注意 Aquest Talk(ゆっくりボイス,Softalk) VOICEROID(ガイノイドTalk・ギャラ子Talk・音街ウナTalk Ex) CeVIO/CeVIO AI A.I.VOICE Megpoid Talk(FineSpeech) SHABERU 唄詠
市場は「ヒアラブル」の時代へ？アマゾン参入でウェアラブルデバイスの音人気加速 | Beyond（ビヨンド）
- 5 users
- boxil.jp
- テクノロジー
- 2019/11/15
高機能なワイヤレスイヤホンや、音声コマンドでも動作するスマートイヤホンなどを総称する「ヒアラブルデバイス」というジャンルが注目されている。出荷台数は順調に伸びスマートウォッチと肩を並べるほどだ。スマートスピーカー市場でトップを走るアマゾンも、アレクサを搭載した「Echo Buds」を発表。ウェアラブル市場で“音”の人気が加速しそうだ。イヤホンなどのヒアラブルデバイスに注目ソニーの携帯カセットテープ・プレーヤー「ウォークマン」が40年前に発売された当初、ヘッドホン姿で街を歩くと奇異な目で見られた。それが今では、当たり前の風景だ。そのあいだに、再生される音楽メディアはテープからCD、MD、MP3ファイルへと変化し、今やストリーミング配信になった。ヘッドホンやイヤホンはワイヤレス型が増え、使われる無線技術もアナログ方式のFM電波から、デジタル方式のBluetoothに進化した。しかも、ただ
- Amazon
- あとで読む
This Voice Doesn't Exist - Generative Voice AI
- 5 users
- elevenlabs.io
- テクノロジー
- 2023/01/13
'Design Voice' will become available on our platform this February, as part of Voice Lab. What's the use?Our tools can already produce speech that's as lifelike as any human's and we expect the sphere of potential applications for artificial voices will only expand. Many of these new applications, including recording audio for news publications or commercials, will require that one voice be confin
- AI
GitHub - teftef6220/Voice_Separation_and_Selection: Separation voice and delete files with majority silence
- 5 users
- github.com/teftef6220
- テクノロジー
- 2023/04/09
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 機械学習
初めてのサウンドプログラミング - Qiita
- 5 users
- qiita.com/kamiro
- テクノロジー
- 2020/04/03
サウンドプログラミングしたい。ゴリゴリの文系、音楽の素養ナシのwebエンジニアが0から音楽系サウンドプログラミングを学んでいく話です。ちなみに最終目標はコーラスを合成するGUIアプリ。道のりとおし。それまでに学んだことをぼちぼち落としていきたいと思っています。サウンドプログラミングとは? サウンドプログラミングと一口に言っても、音声認識だったり音楽だったり、電話の信号変換の話もあったりします。とにかく幅が広い。私が指しているサウンドプログラミングとは、デジタルオーディオの世界の方です。誰向けか? サウンドプログラミングに興味があるけどどこから手をつけるべきかわからない人数学ができない人プログラミングはやったことある人シンセサイザーを自作してみたい人さあ始めよう! しかし、いざサウンドに手を出してみると、知らなければならない情報が多すぎて何を勉強したらいいのかわからないのも
- 数学
- 音楽
- music
- あとで読む
神楽音楽出版 -KAGURA Music Pub.-
- 5 users
- kagura-music.jp
- エンタメ
- 2023/12/10
GitHub - NVIDIA/NeMo: A scalable generative AI framework built for researchers and developers working on Large Language Models, Multimodal, and Speech AI (Automatic Speech Recognition and Text-to-Speech)
- 5 users
- github.com/NVIDIA
- テクノロジー
- 2020/11/30
Large Language Models and Multimodal Accelerate your generative AI journey with NVIDIA NeMo Framework on GKE (2024/03/16) An end-to-end walkthrough to train generative AI models on the Google Kubernetes Engine (GKE) using the NVIDIA NeMo Framework is available at https://github.com/GoogleCloudPlatform/nvidia-nemo-on-gke. The walkthrough includes detailed instructions on how to set up a Google Clou
松任谷由実 – Call me back/松任谷由実with 荒井由実
- 5 users
- www.youtube.com
- エンタメ
- 2022/10/01
10/4発売「ユーミン万歳！〜松任谷由実50周年記念ベストアルバム〜」収録「Call me back」MVを公開。 STREAMING/DL https://lnk.to/Cmbym CD https://lnk.to/ym50thec “松任谷由実with 荒井由実”「Call me back」は、“50年の時を超えて”をテーマに、1980年の未発表トラックを元に新たに歌詞を書き下ろし、最新のAIで作られた荒井由実のボーカルと、現在の松任谷由実のデュエットを実現。ミュージックビデオの舞台は、人類がアバターとしてバーチャル空間で生活するようになった、2072年バーチャルメトロポリス。アナログ電波を取り締まるドローンとカーチェイスを繰り広げる松任谷由実が、100年の時を超えて荒井由実と巡り逢うストーリー。 Music Video Director:工藤伸一 2022年10月4日発売
A new AI-powered speech translation system for Hokkien pioneers a new approach for a primarily oral language
- 5 users
- ai.meta.com
- テクノロジー
- 2022/10/20
Meta’s new AI-powered speech translation system for Hokkien pioneers a new approach for an unwritten language Until now, AI translation has mainly focused on written languages. Yet nearly half of the world’s 7,000+ living languages are primarily oral and do not have a standard or widely used writing system. This makes it impossible to build machine translation tools using standard techniques, whic
- 台湾
- 人工知能
- facebook
- 技術
高品質音声合成エンジンを搭載したお手軽ナレーション作成ツール5人組セット、かんたん！AITalk5が70%オフの4,980円｜DTMステーション
- 5 users
- www.dtmstation.com
- エンタメ
- 2022/03/26
これまでDTMステーションでも何度もとりあげてきた、音声合成専門の上場企業、株式会社エーアイ。同社が開発する最新の音声合成エンジンがAITalk5というもので、従来からのコーパスベース音声合成方式と、最新の深層学習技術を活用したDNN音声合成方式の2つを兼ね備えたハイブリッドな音声合成エンジンとなっています。その新エンジンAITalk5を搭載したことで、より滑らかに、より人間らしく喋る音声合成ソフト、「かんたん！AITalk5 5話者パックダウンロード版」（以下、かんたん！AITalk5）をソースネクストが3月25日より発売開始しました。これは5人の話者をセットとし、キャラクタを切り替えることで、5人の声を切り替えて使うことができるもので、1６，５００円と手ごろな価格を実現したもの。しかも、発売記念としてDTMステーション読者限定で、約70%オフ＝11,520円引きのクーポンコードが提
GitHub - log1stics/voice-generator-webui: A multi-speaker, multilingual speech generation tool
- 5 users
- github.com/log1stics
- テクノロジー
- 2023/04/18
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 機械学習
つくよみちゃんコーパス│声優統計コーパス（JVSコーパス準拠） | つくよみちゃん公式サイト
- 5 users
- tyc.rei-yumesaki.net
- アニメとゲーム
- 2021/02/28
✨つくよみちゃんコーパス公開！✨ ■Vol.1 声優統計コーパス（JVSコーパス準拠） ⇒https://t.co/tfqAFxQEds 高音ウィスパー系の14歳前後のアニメキャラクター風ボイスを目指して作りました。一部の言葉にふりがなやアクセント記号を追加した台本も同梱しています。（詳しい説明もあります） pic.twitter.com/VtJ6ji2Qu3 — つくよみちゃん®【フリー素材キャラクター】 (@TYC_Project) February 26, 2021 ■マルチクリエイター・夢前黎（Rei Yumesaki）がプロデュースするフリー素材キャラクター「つくよみちゃん」（CV.夢前黎）の公式音声コーパスです。 ■高音ウィスパー系の14歳前後のアニメキャラクター風ボイスを目指して作りました。音声合成による「キャラ声」「アニメ声」の再現を目指している方向けの素材です。 ■個人
オトトークのゲストは声優・小岩井ことりさん! CT-S1000Vを小岩井さんの声で歌う楽器にしてみた!?｜DTMステーション
- 4 users
- www.dtmstation.com
- エンタメ
- 2022/04/30
カシオの歌うシンセサイザ、CT-S1000Vをテーマに、マリモレコーズの江夏正晃さんと毎週10分ほど行っているYouTube番組、「江夏と藤本のオトトーク Powered by CASIO」ですが、前回のゲスト、明和電機の土佐信道社長に続き、今回のゲストは声優の小岩井ことり(@koiwai_kotori)さん。ご存じのとおり小岩井さんは声優でありつつ、作詞家・作曲家であり、CubaseユーザーのバリバリなDTMer。その小岩井さんがCT-S1000Vに出会ったらどう遊んでくれるのか、ということでゲストにお招きしました。番組内では小岩井さんに好きな歌詞を作ってもらいCT-S1000Vを弾いて歌わせてもらった一方、ぜひ小岩井さんに試してもらいたかったCT-S1000Vのスゴイ機能を引き出してみました。それは自分の声をサンプリングして、その声で歌わせるというもの。単なるサンプラーではなく、その
MYCOEIROINK
- 4 users
- coeiroink.com
- テクノロジー
- 2022/04/02
無料で使えるAIトークソフト
Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.
- 4 users
- six-loganberry-ba7.notion.site
- テクノロジー
- 2023/04/15
A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team
VOICEVOX - ｋ本的に無料ソフト・フリーソフト
- 4 users
- www.gigafree.net
- テクノロジー
- 2021/08/05
指定した文章を、AI に喋らせることができる音声合成ツール。専用のフォームに入力されたテキストを、「四国めたん」「ずんだもん」「春日部つむぎ」「雨晴はう」「玄野武宏」「No.7」...等々、総勢 30 名以上の AI 話者がそれぞれの個性豊かに喋ってくれます。各文字ごとにアクセントやイントネーションを調整する機能、語句の切れ目を調整する機能、文章ごとに話速 / 抑揚 / 音量等を調整する機能、合成結果を WAVE ファイルに書き出す機能等も付いています。「VOICEVOX」は、文章を AI に喋らせることができる音声合成ソフトです。指定された文章内で使われている文字列の読みアクセントイントネーション句の切れ目などを自動で解析し、その結果を元に（2024/02/18 時点では）AI 話者
自分の声を50万円で合成音声に。声色や抑揚も再現してテキスト読み上げ
- 4 users
- av.watch.impress.co.jp
- テクノロジー
- 2020/09/08
声帯摘出者によるCoeFont CLOUDの利用が無料に！声を失ってもまた自分のAI音声で会話できる世の中をサポートします。
- 4 users
- prtimes.jp
- テクノロジー
- 2021/09/09
声帯摘出者によるCoeFont CLOUDの利用が無料に！声を失ってもまた自分のAI音声で会話できる世の中をサポートします。株式会社Yellston（本社：東京都港区、代表：早川　尚吾、以下当社）は声帯摘出者向けにAI音声合成プラットフォーム「CoeFont CLOUD」の無料提供を開始致します。現在、喉頭がんや下咽頭がんなど喉のがんにより声帯を摘出し、自分の声を失った方が2~3万人程いるといわれています。声帯摘出者は自分の声を失うという辛い思いをしています。この現状に対し、当社は声帯摘出者向けに「CoeFont CLOUD」の無料提供を致します。 ■概要当社は、今後声帯摘出手術などにより声を失う可能性のある方々に対して、AI音声合成プラットフォーム「CoeFont CLOUD」(https://coefont.cloud/ )の無料提供を致します。CoeFont CLOUDで自分の声
GitHub - mikito/zunda-teller
- 4 users
- github.com/mikito
- テクノロジー
- 2023/04/02
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 人工知能
- 機械学習
GitHub - mmorise/ita-corpus: ITAコーパスの文章リスト
- 4 users
- github.com/mmorise
- テクノロジー
- 2021/06/17
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 機械学習
- 言語
ディープフェイクと生成ディープラーニング
- 4 users
- www.nablas.com
- テクノロジー
- 2021/06/17
上の画像は本物の人間の写真のように見えるが、実は、写真に写っているのはすべて実在しない人物だ。全てGANと言われるディープラーニング技術を用いて生成された人物写真である。GANは2014年に当時モントリオール大学で研究をしていたIan Goodfellow氏やYoshua Bengio氏らの研究グループによって、最初のモデルが発表された[2]。その後、ディープラーニング向けのGPUの計算能力が大幅に向上する中で、世界中の研究者がモデルの改良を進め、GANの技術は指数関数的な勢いで進化した。現在では、人間が識別できないほど高精細でリアルな画像を生成できるだけでなく、リアルタイムで動画を変換したり、テキストから画像を生成することも可能だ。ディープラーニングの権威の一人であるYann LeCun氏は、「GANはこの10年間で最も興味深いアイデアである」と語っている。その一方で、急激な技術の進化は
- 機械学習
- 事件
初心者が一か月でTTSつくってみた - Qiita
- 4 users
- qiita.com/niwatiki
- テクノロジー
- 2023/04/12
概要進級制作で発表するための作品として、友人の声からTTSを作成したので、作り方や難しかったところ等を記事にしてみました参考にさせていただいたページは最後に記載しています目次 1.TTSとは 2.きっかけ 3.製作 4.終わりに 5.参考記事 TTSとは Text-To-Speakつまり音声合成のことで、ゆっくり実況でおなじみの「棒読みちゃん」やVOICEROIDの「東北ずん子」、VOICEVOX「ずんだもん」等のことであるきっかけ第一に筆者が音声合成読み上げソフトのキャラクターが好きであり、それを利用した動画コンテンツをよくみるソフト自体も所持しており、購入しているソフトは20本以上になる推しはFEEちゃんまた、VOICEVOXの登場でブームが来ているというのもあり、作ってみたいと入学時から思っていたため、進級制作として作成した製作実際に制作する作業に入る前に目標を定
RVCの構造についてのメモ
- 4 users
- zenn.dev/aivoicelab
- テクノロジー
- 2023/06/18
はじめにこんにちは、nadareです。機械学習エンジニアで、普段はレコメンド・検索関連のお仕事をしています。いろんな競技プログラミングが好きです。 Retrieval-based-Voice-Conversion(以下RVC)という技術に関心を持ち、本家Retrieval-based-Voice-Conversion-WebUIやddPn08さん版RVC-WebUI、VC ClientにPR投げつつ勉強しています。最近は自分でRVCのモデル構造弄って遊んでいます。最近勉強した技術の実験場みたいな感じなので本家にPRださないとは思いますが、その過程でRVCの学習回りについていろいろ分かってきたので自分用にまとめたいと思います。 RVCの構成 RVCはTTS(text to speech)とVC(Voice Convertaion)のモデルであるVITSをベースに、VCに特化させ『模倣対
- 機械学習
GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
- 4 users
- github.com/RVC-Boss
- テクノロジー
- 2024/01/18
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- ai
男女8人の声優の声で収録された掛け声音源“Pop Stars Shout!!”爆誕。膨大な掛け声を自在に叫ばせることが可能に｜DTMステーション
- 4 users
- www.dtmstation.com
- エンタメ
- 2023/06/21
アイドルのライブ現場において、曲の間奏やサビなど、さまざまなタイミングでファンが叫ぶ「はい！はい！」、「それ！それ！それ！それ！」といった掛け声。またアイドルコールと呼ばれるものとして、「世界で一番あいしてる」、「世界で一番あいしてる」とか「やっとみつけたお姫様」のようなガチ恋口上、さらには「虎　火　人造　繊維　海女　振動　化繊」とか「タイガー！ファイヤー！サイバー！ファバー！ダイバー！バイバー！、ジャージャー！」のようなMIX。そしてステージの演者側からの掛け声である「せーの」、「もーいっかい」、「いっくよーー！」…といったものまで、ライブステージで登場するさまざまな掛け声をまとめた音源ライブラリー、「Pop Stars Shout!!」が新進気鋭のメーカー、TWO LANDSの第一弾製品として発表されるとともに、発売が開始されました（通常価格32,780円）。このPop Stars
シロワニさんのつくよみちゃんトークソフト置き場
- 4 users
- shirowanisan.com
- テクノロジー
- 2021/05/17
「シロワニさんのつくよみちゃんトークソフト」は「COEIROINK」として、UI付きのWindowsアプリケーションになりました。もしよければ「COEIROINK」をご利用いただければと思います。
GitHub - Hiroshiba/voicevox_core: 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア
- 3 users
- github.com/Hiroshiba
- テクノロジー
- 2021/09/11
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 言語
AIボイスチェンジャー「Seiren Voice」が高速化＆システム要件緩和で声変換動画の制作が高速・快適に！｜ニコニコインフォ
- 3 users
- blog.nicovideo.jp
- テクノロジー
- 2023/06/04
AIボイスチェンジャー「Seiren Voice」が高速化＆システム要件緩和で声変換動画の制作が高速・快適に！ 2023年6月2日（金）より、ドワンゴが開発した声変換ソフトウェアシリーズ「Seiren Voice（セイレンボイス）」の新しい音声ライブラリを販売開始しました。 Seiren Voiceの新しい音声ライブラリは、これまでのものよりも変換速度が上がり、要求スペックが下がり、お求めやすい価格になり、より動画制作に使いやすくなりました。 Seiren Voiceとは？「Seiren Voice」は、自分の声をキャラクターの声に変換する声変換ソフトウェアです。変換品質を重視しており、リアルタイムな声変換ではなく、いったん録音した声を変換するため、生配信よりも動画制作用途に適しています。テキスト情報から音声合成を行うソフトでは指定が難しい「間の取り方」や「抑揚」などについて、声を入力と
- AI
- 動画
バーチャル音声　自分好みに　AI読み上げなら感情豊か - 日本経済新聞
- 3 users
- www.nikkei.com
- テクノロジー
- 2021/07/12
文章を入力するだけで、人間的で自然な音声を作り出す音声合成ソフトウエア「読み上げソフト」をユーチューブなどの動画作りに活用する人が増えている。かつては企業が動画を作るときに使われるケースが多かったが、最近は在宅勤務の合間に映像作品を作る人の増加もあり、若い個人ユーザーが拡大している。米津玄師、YOASOBIのAyaseなど、ヤマハが開発した音声合成技術「ボーカロイド」で育ったクリエーターが、現
「Seiren Voice 結月ゆかり」の販売開始
- 3 users
- vocalomakets.com
- テクノロジー
- 2022/05/17
2022年5月17日より株式会社ドワンゴおよび株式会社エーアイから「Seiren Voice 結月ゆかり」が発売されました。『Seiren Voice 結月ゆかり』とは、落ち着きのある、大人びた女性の声をベースに、簡単に美しく表現力豊かな音声が作成できるソフト『A.I.VOICE 結月ゆかり』（CV：石黒千尋）の音声を元に作成した声変換ソフトウェアです。アプリケーション内で録音した声や、すでに収録済の声（wav/mp3ファイル）を、結月ゆかりの美しい声に変換することが出来ます。 Seiren Voice 結月ゆかり発売日　　：2022年5月17日販売形態　：ダウンロード価格　　　：19,800円企画　　　：VOCALOMAKETS（株式会社バンピーファクトリー）製造　　　：株式会社ドワンゴ販売　　　：株式会社ドワンゴ、株式会社エーアイ販売サイト：https://seiren-voic
GitHub - yxlllc/DDSP-SVC: Real-time end-to-end singing voice conversion system based on DDSP (Differentiable Digital Signal Processing)
- 3 users
- github.com/yxlllc
- テクノロジー
- 2023/04/09
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
無料のテキスト読み上げツール「VOICEVOX」v0.12.2が公開　ほか～26件を掲載（6月6日のダイジェストニュース）【ダイジェストニュース】
- 3 users
- forest.watch.impress.co.jp
- テクノロジー
- 2022/06/06
- ai
VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]
- 3 users
- blog.shikoan.com
- テクノロジー
- 2022/06/17
PythonからVOICEVOXの音声を合成する方法を紹介します。VOICEVOXの合成音声を、Azure Text to SpeechやGoogle CloudのText-to-speechとも比較してみました。GoogleやAzureと場合によっては互角になりうる期待のソフトウェアです。 VOICEVOX、皆さん使ってますか？　2021年8月ごろに彗星のように登場した、無料なのにかなり優秀な音声合成ソフトウェアです。今回Pythonから使いたかったのですが、コードベースで使う解説記事がどこにもなかったので書いてみました。 https://voicevox.hiroshiba.jp/ GUIでの使い方は解説されている記事が多いので、この記事ではPythonからコマンドラインベースで音声を出力する方法を書いていきます。インストールのやり方は省略します。 VOICEVOX ENGINE V
【学習編】RVCを用いたリアルタイムボイスチェンジを1から解説してみる｜omiz
- 3 users
- note.com/omiz_aiart
- テクノロジー
- 2023/04/10
はじめにこの記事は【準備編】RVCを用いたリアルタイムボイスチェンジを1から解説してみる、【学習セット用意編】RVCを用いたリアルタイムボイスチェンジを1から解説してみるの続編です。まだ読んでない人は準備編から見てね。 RVC-betaフォルダのgo-web.batを起動するとコマンドプロンプトが起動し、ローカルホストでweb-uiが起動します。起動したら训练タブを開きます。 step1输入实验名は完成したモデルの名前になります。分かりやすい名前にしましょう。 ⚠スペースをいれたり'をいれたりした場合、その後の輸出信息にで不具合が発生するようです。数字とアルファベットのみの名前だと問題なく機能します。目标采样率は学習セット用意編に合わせて48kにしましょう。模型是否带音高指导(唱歌一定要，语音可以不要)は是にすると歌えるっぽいです。 step2a输入训练文件夹路径は学習セット用意編で
- 音声合成
- 機械学習
AI音声プラットフォーム「CoeFont」、ALS患者様の利用を無償に！声を失ってもまた自分のAI音声で会話できる社会の実現に向けてインフラを提供
- 3 users
- prtimes.jp
- テクノロジー
- 2022/03/02
株式会社CoeFont（本社：東京都港区、代表取締役：早川尚吾、以下当社）は、ALS患者様ならびにご家族、支援団体に向けて、AI音声プラットフォーム「CoeFont」の無料提供を開始致します。 CoeFont_ALS患者様の利用を無性に ■取り組み概要当社は、今後ALSの症状の進行により、”声を失う可能性のある方々”に対して、AI音声プラットフォーム「CoeFont」(https://coefont.cloud/ )の無料提供を行います。 CoeFontで自分の声を収録することで、声を失った後もスマホやPCから文字入力をすることで、自分の声でテキストを読み上げるAI音声が利用できます。 CoeFontは、従来の1文字ずつ繋げて音声にするサービスとは異なり、AIを活用して本人が話しているような音声が作成でき、実際に会話をしているような体験を提供します。お申し込みは以下のフォームから可能で
- 大学
バスの「とまります」かと思ったら……「こまります」!?　ダイソーの謎商品に「欲しい」の声　声は四国めたん
- 3 users
- nlab.itmedia.co.jp
- テクノロジー
- 2023/06/26
困ったときに押す謎のボタン「こまりますボタン」がTwitterで欲しいと話題です。ダイソーで販売されている商品で価格は220円。この発想はなかった。バスの降車ボタン風の見た目で、「とまります」の音声が流れるかと思いきや、押すと「こまります」の音声が鳴る謎の玩具。本体裏には吸盤付きで、押す部分は「こまります」の文字が光るギミックもついています。ボタンには「お困りの方はこのボタンを押してください」と書かれており、相手に直接言いにくいときなどに使うとどうにかなる……かもしれません。ダイソーの「こまりますボタン」同商品は以前から販売されているものですが、Twitterユーザーのえぐさ（@examplex_）さんが紹介したことで話題に。特に音声として、商用でも利用可能な無料のテキスト読み上げソフトウェア「VOICEVOX」が使われていることに驚きの声が寄せられました。パッケージには利用のた