並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 156件

新着順 人気順

音声合成の検索結果1 - 40 件 / 156件

  • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

    日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

      音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
    • 無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

      CoeFont (コエフォント) @coefont Web音声合成サービス『CoeFont STUDIO』 coefont.studio をリリースしました。全サービス無料公開。すべてのクリエイターに声を届けます。#CoeFontSTUDIO #CoeFont pic.twitter.com/Wu5AFJpZ9d 2021-04-23 12:44:30

        無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」
      • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

        本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

          商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
        • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション

          4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

            19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション
          • マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた

            これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ

              マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた
            • AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開

              音声合成ソフトの開発や販売を手掛けるSSS(仙台市)は3月16日、音声合成ソフト「VOICEVOX」用音源「九州そら」をリリースした。九州そらは、せりふを入力するだけで人間らしい“ささやき声”を出力できるAIだ。 VOICEVOXは、ドワンゴでAIの研究に携わっているヒホ(ヒロシバ)さん(@hiho_karuta)さんが開発した無料の音声合成ソフト。AI技術を活用して、人間らしい話し声を合成できる。イントネーションや話す速さなどの調整も可能。立体音声を制作できるソフトを活用すれば「ASMR動画」の制作にも使える。 九州そらはVOICEVOX用音源として初めてささやき声の合成に対応した。ソフトのダウンロードと利用は無料。「VOICEVOX:九州そら」とクレジットを記入すれば商用利用も無償でできる。 関連記事 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがす

                AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開
              • 無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場

                人間ではなくプログラムによって特定のテキストを読み上げさせる音声合成ソフトは数多く存在しています。ソフトに使われる音声合成エンジンにはさまざまな種類があり、複数の音声合成エンジンや音声ライブラリを使うことができる汎用合成音声エディタ「ユニコエ」をビスさんが公開しています。 ユニコエ 公式サイト https://sites.google.com/view/unicoe/%E3%83%9B%E3%83%BC%E3%83%A0 ユニコエがどういうアプリなのかは以下のムービーを見るとよくわかります。 【ユニコエ】アプリ紹介 - ニコニコ動画 ユニコエでは音声合成エンジンや音声ライブラリを複数登録することができます。 選択した音声合成エンジンが、中央に入力されたテキストを読み上げてくれます。 イントネーションはフレーズごとに調整可能。 また、音声ライブラリの立ち絵も表示されます。 ユニコエは、公式サ

                  無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場
                • もはや人と区別がつかない音声合成ソフト、VOICEPEAKがラインナップを大幅拡充。キャラクターシリーズ含め8ボイスがリリースに|藤本健の"DTMステーション"

                  ※6ナレユーザー優待版とは「VOICEPEAK 商用可能 6ナレーターセット」を所有しており、かつAHSのユーザー/製品登録を行った方を対象とした特別価格の商品です。AHSのサイトログイン後のマイページからのみ購入可能です。 上の5つがキャラクターシリーズであり、下の3つが6ナレーターセットと同様、キャラクターがなく、商用可能なものとなっています。 まずは、8つの喋りがどんなものなのかを確認するため、ちょっとずつ喋らせてみたので、以下の動画をご覧ください。 いかがですか?ご覧いただければ、使い方はだいたい分かると思います。VOICEPEAK上で直接テキストを入力してもいいし、このビデオのようにテキストをコピー&ペーストするのもOK。あとは、ボイスを選択した上で再生ボタンを押せばいいだけ。とにかく簡単です。 VOICEPEAKには、これまででトータル15種類のボイスが揃ったことになる ご存じ

                    もはや人と区別がつかない音声合成ソフト、VOICEPEAKがラインナップを大幅拡充。キャラクターシリーズ含め8ボイスがリリースに|藤本健の"DTMステーション"
                  • 進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る

                    音声合成技術の進化が目覚ましい。人間に近い“自然な発話”が可能になったことで、用途が急速に広がった。歌声合成技術や声質変換技術といった派生技術も実用化に向けた動きが進んでいる。 今の音声合成技術では、声優などによる良質な収録音声が欠かせない。声をなりわいとする声優からすると、音声合成技術の普及は声優から「仕事を奪う」リスク要因ともいえる。にもかかわらず、音声合成技術の活用に積極的なのが大手声優事務所の81プロデュースだ。その狙いについて、同社代表取締役社長の南沢道義氏に聞いた。(聞き手は高野 敦、東 将大=日経 xTECH) なぜ音声合成技術の活用に積極的なのですか。 数多くの人気声優や実力派・ベテラン声優が所属する81プロデュース、およびアニメ関連の音響制作や外国映画の日本語版制作を手掛けるハーフ・エイチ・ピー・スタジオの代表を務め、多方面から声優、俳優を支援する。さらに、一般社団法人デ

                      進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る
                    • うみゆき@AI研究 on Twitter: "なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当… https://t.co/IsmQsTS8is"

                      なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当… https://t.co/IsmQsTS8is

                        うみゆき@AI研究 on Twitter: "なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当… https://t.co/IsmQsTS8is"
                      • 月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

                        何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画から抽出した音声と、音声を文章に起こしたテキストの組み合わせのデータセット約50分ぶんを教師データとして学習した結果 ※学習に必要なデータ量は最低でも1時間程度と言われているので、まだまだ足りていません… 月ノ美兎さんの音声合成ツールを作ってみた https://t.co/YVdWW9vREb via @YouTube — K2 (@K2ML2) May 29, 2020 発話内容が不明瞭な箇所がありますが、一応ご本人の声に近い音声を作成することができているかと思います

                          月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita
                        • 【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch

                            【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch
                          • Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表

                            2023年1月5日にMicrosoftが新しい音声合成AIモデル「VALL-E」を発表しました。VALL-Eはたった3秒間の音声サンプルで人の声を忠実にシミュレートできる他、一度学習したデータからは、その人の声色だけではなく感情のトーンや録音環境も再現した合成音声を作成することが可能になっています。 VALL-E https://valle-demo.github.io/ [2301.02111] Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers https://doi.org/10.48550/arXiv.2301.02111 Microsoft’s new AI can simulate anyone’s voice with 3 seconds of audio | Ars Technica

                              Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表
                            • 無料……だと? めちゃ自然に読み上げてくれるWeb音声合成サービスが登場、営利目的や配信などでも使用可

                              ※本記事はアフィリエイトプログラムによる収益を得ています Yellstonが、音声合成サービス「CoeFont STUDIO」を公開しました。入力した文章を読み上げてくれるWebサービスなのですが、無料とは思えない極めて自然な音声で読み上げてくれるとさまざまなかいわいの人たちをざわつかせています。すごいのが出てきた……! CoeFont STUDIO 試しに吉野家コピペを入力して読み上げさせてみたところ、大変流ちょうに読み上げ始めて爆笑しました。イントネーションが調整できるようになっているのですが、特に調整する必要性は感じないほど。 現在芯の通った声質の「アリアル」と透き通った声質の「ミリアル」の2種類の音声が公開されており、自由に切り替えられます。ミリアルの方は「Prototype」の記述があり、アリアルの方がより自然に読み上げてくれる印象でした。 CoeFont STUDIOはリリース

                                無料……だと? めちゃ自然に読み上げてくれるWeb音声合成サービスが登場、営利目的や配信などでも使用可
                              • 商用OK、無料のAI音声合成「CoeFont Studio」 ゲーム実況・プレゼンなどの利用見込む

                                AI事業を手掛けるYellston(東京都港区)は4月23日、Webブラウザで使えるAI音声合成サービス「CoeFont STUDIO」を公開した。法人・個人を問わず商用利用を認める。利用料は無料で、プレゼンやゲーム実況動画、アニメのアフレコといった用途を見込む。 芯の通った声質「アリアル」と透き通った声質「ミリアル」を提供。ユーザーは200文字までの日本語テキストを音声化できる。読み上げの速さやアクセントの位置も調整可能。複数のテキストを読み上げさせ、それらをつなげて1つの音声データにする機能も備える。音声はwavで出力する。 公序良俗に反する行為に使わない、制作物にCoeFont STUDIOのURLを明記するといった規約を守れば、音声データの商用利用を認める。アリアルやミリアルのキャラクターイラストについても、規約を守った上での二次創作を許可する。ただしイラストをグッズ化して販売する

                                  商用OK、無料のAI音声合成「CoeFont Studio」 ゲーム実況・プレゼンなどの利用見込む
                                • 「ゆっくり」本家アクエスト、公式音声合成アプリ「AquesTalkPlayer」をリリース/個人が非営利で使用する場合に限り無償。年額6,380円の商用ライセンスも用意

                                    「ゆっくり」本家アクエスト、公式音声合成アプリ「AquesTalkPlayer」をリリース/個人が非営利で使用する場合に限り無償。年額6,380円の商用ライセンスも用意
                                  • 新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入

                                    LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog はじめに こんにちは、2020年4月に新卒としてLINE株式会社に入社した二又 航介です。テキスト音声合成システムの研究開発を担当するAI開発室 Voiceチームに所属し、音声合成システムにおけるテキスト処理部の研究開発やチームの機械学習基盤構築に取り組んでいます。 学生時代は機械翻訳や同時通訳に関連する研究に取り組んでいました。研究以外の活動としては、アルバイト・インターンでの対話システムや機械翻訳システムの研究開発、個人活動としてwebアプリケーション開発などを行っていました。このような活動を通じて、数多くのユーザーに利用される自然言語処理技術を活かしたサービスに携わりたいという思いからLINEを志望しました。学生時代は専

                                      新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入
                                    • Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表

                                      2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。 [2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers https://doi.org/10.48550/arXiv.2304.09116 NaturalSpeech 2 https://speechresearch.github.io/na

                                        Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表
                                      • AI音声合成ソフト「VoiSona Talk」が正式公開 ~女性ボイス「田中傘」とともに無償提供/同社のAI歌唱ソフト「VoiSona」をベースにした読み上げツール

                                          AI音声合成ソフト「VoiSona Talk」が正式公開 ~女性ボイス「田中傘」とともに無償提供/同社のAI歌唱ソフト「VoiSona」をベースにした読み上げツール
                                        • 音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析

                                          音声合成技術の進化が目覚ましい。しかし、それを支えているのは声優などによる良質な収録音声だ。声をなりわいとする声優にとって、音声合成技術の普及は「仕事が奪われる」リスク要因でもある。 その音声合成技術を、現場の声優はどう見ているのか。音声合成ソフトウエア「ガイノイドTALK」や歌声合成ソフトウエア「VOCALOID」、声質変換ソフトウエア「リアチェンvoice」などに声を提供し、自身でも音声合成技術を活用しているピアレスガーベラ所属声優の小岩井ことり氏に聞いた。同氏は作詞や作曲なども手掛ける。(聞き手は東 将大、高野 敦=日経 xTECH) 音声合成技術の利点は何だとお考えでしょうか。 ピアレスガーベラ所属。TVアニメ「のんのんびより」宮内れんげ、「THE IDOLM@STER ミリオンライブ!」天空橋朋花などの声を担当する一方、TBSラジオで毎日流れるジングルの作詞作曲編曲を務めるなど作

                                            音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析
                                          • 喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション

                                            5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ

                                              喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション
                                            • 高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表

                                              スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台本を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台本の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月

                                                高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表
                                              • 無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可 | Ledge.ai

                                                サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                  無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可 | Ledge.ai
                                                • 無料のAI音声合成ソフトVOICEVOXに、小岩井ことりさんによるNo.7が3種類の声で登場。でも、このリリースは序章に過ぎない!?|DTMステーション

                                                  オープンソース・ソフトウェアとして公開されているAI音声合成ソフトであるVOICEVOXに、9月30日、また新たなキャラクタが誕生します。今回、3つのキャラクが同時に誕生するのですが、その一つが声優の小岩井ことり(@koiwai_kotori)さんCVによるNo.7です。昨年、AI歌声合成ソフトとしてフリーウェアのNEUTRINO用にNo.7がリリースされていましたが、今度はしゃべるソフトとしての誕生となります。普通のしゃべり声である「ノーマル」と、アナウンサーが読み上げるようにしゃべる「アナウンス」、そして絵本を読み聞かせるように読む「読み聞かせ」の3種類となっています。 このNo.7のプロジェクトは明治大学の専任准教授、森勢将雅(@m_morise)先生を中心に研究・開発されているもので、小岩井ことりさんもここに積極的に参加しつつ、私・藤本健も関わる形で進めてきました。ここで作られたデ

                                                    無料のAI音声合成ソフトVOICEVOXに、小岩井ことりさんによるNo.7が3種類の声で登場。でも、このリリースは序章に過ぎない!?|DTMステーション
                                                  • 人気VTuberのつぶやきをAIによる音声合成で本人の声で再現する「棒読みこち」がすごい

                                                    ホロライブ所属の人気VTuberであるさくらみこさんの声を参考にAIによる音声合成を行い、さくらみこさん本人のツイートをそのまま読み上げる「棒読みこち」が公開されています。 さくらみこさんの声を参考にして作られた音声合成AI、棒読みみこち、生まれました‼️ みこちのツイートを、たまーに読み上げます‼️#miko_Art pic.twitter.com/QiQUvck4ME— 棒読みこち (@bouyomiko35) 例えば、以下のさくらみこさんのツイート。 ショーシャンクの空に みこが目の前が真っ暗になったら 思い出してまた観よう、と思った そんな名作でした???? 泣いたけど気持ちよくGW楽しんでいけるぜぇ! 必死に生きよう⛏#みこ市長— さくらみこ????SakuraMiko (@sakuramiko35) これを読み上げたものが以下。本人の声でツイートを読み上げています。やや人工的な

                                                      人気VTuberのつぶやきをAIによる音声合成で本人の声で再現する「棒読みこち」がすごい
                                                    • 19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで

                                                      早川さんによれば、すでにCoeFont Studioで作成した音声をプラネタリウムの案内に使ったり、企業の採用VTRに使ったりする例が出てきているという。早川さんはこういった利用方法について「有料にしていなかったら出なかったと思う。(開発する)自分でも想像していなかった」としている。 学生とAI企業の社長、二足のわらじを履く早川さんがどういった背景でCoeFont Studioを立ち上げるに至ったのか、そして今後どのような形でサービスを展開し、収益につなげていくのかを聞いた。 きっかけは友達とのゲーム? 「結構使えるものができてしまった」 そもそも、CoeFont Studioはどういった経緯で生まれたサービスなのか。早川さんはきっかけとなったのは「ゲーム実況」だったと話す。 「もともとゲームが好きで、友人と話しながらよく遊んでいた。昔は『ゲーム実況で世界を獲ろう』と思い、プレイの様子を録

                                                        19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで
                                                      • 無料のAI音声合成ソフト「VOICEVOX」公開。商用利用も可

                                                          無料のAI音声合成ソフト「VOICEVOX」公開。商用利用も可
                                                        • 声のプロに音声合成AIの品質はどう映る 声優・森川智之さんが語る“技術への向き合い方”

                                                          「辛口なことを言うと、もっと詰められる部分はある」――声優の森川智之さんは自身の声を再現したAIの声を聞いてそう感じたという。 森川さんといえば、映画「ミッション イン ポッシブル」のイーサン・ハント(トム・クルーズ)役、「ジョン・ウィック」のジョン・ウィック(キアヌ・リーブス)役、「クレヨンしんちゃん」の野原ひろし役などを務める有名声優だ。 森川智之(もりかわとしゆき) 声優事務所アクセルワン代表取締役。 トム・クルーズやキアヌ・リーブスなどハリウッド俳優の吹替を担当する他、アニメ作品にも多数出演。 現在は自身が立ち上げた声優事務所「アクセルゼロ」で後進の育成にも当たっている。 2021年9月、小学館とAI音声合成のスタートアップCoeFont(東京都港区)は、音声合成AIを生成できるクラウドサービス「CoeFont」を活用して森川さんの声をAI化。その音源を使ってオーディオブックを作成

                                                            声のプロに音声合成AIの品質はどう映る 声優・森川智之さんが語る“技術への向き合い方”
                                                          • ディープラーニングで歌声音声合成エンジンを自作する

                                                            この記事は、ドワンゴ Advent Calendar 2019の1日目の記事です。 モチベーション 最近、理想の人工知能(歌ったり踊ったり喋ったりできるキャラクター)を作りたいと思うようになりました。人工知能が歌を歌うためには、歌声音声合成エンジンが必要です。ということで、ディープラーニングを使って、歌声音声合成エンジンの作成に挑戦してみました。この記事では、実際に音声合成した歌声や、その仕組み、別条件での実験結果、ディープラーニング周りの手法を紹介します。 デモ動画実際に作成した音声合成エンジンを使った歌唱のデモです。 (歌声音声合成を作ったら絶対最初にカバーしたいと思っていた歌、ハジメテノオトのカバーです。) 歌唱デモ音声 まだ挑戦し始めてから2週間ほどしか経っていないのでかなり荒削りですが、それでもちゃんと歌詞や音程が取れていたり、溜めの部分で大きく息を吸う音が入っていたりと、そこそ

                                                              ディープラーニングで歌声音声合成エンジンを自作する
                                                            • AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai

                                                              サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai
                                                              • 「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!

                                                                株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は、Web音声合成サービス『CoeFont STUDIO』を2021年4月23日(金)にリリース、無料公開いたします。 当社は、Web上で音声合成が可能な音声合成サービス『 CoeFont STUDIO』(コエフォントスタジオ) https://coefont.studio/ を2021年4月23日(金)にリリースしました。 CoeFont STUDIOのリリースを記念し、全サービスを期間限定で無料で公開いたします。終了時期は未定ですが、その間本サービス及び出力した音声データは営利・非営利問わずご自由にご利用いただけます。ぜひ当社の音声テクノロジーを用いた「声のフォント」をお試しください。 CoeFont STUDIO編集画面 アクセント・ヨミ編集 『CoeFont STUDIO』は、DeepLearningにより人間

                                                                  「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!
                                                                • 親の声で「読み聞かせ」するAI音声合成スピーカー、タカラトミーが発売 複数の声で配役も

                                                                  タカラトミーは5月23日、親の声を合成音声にして子どもに童話などを読み聞かせるスピーカー「coemo(コエモ)」を発表した。価格は1万2980円。9月下旬から全国の玩具店やECサイトで販売する。 コエステ(東京都港区)が提供するAI音声合成技術「コエステーション」を採用。親がスマートフォンで声を登録すると、プロのナレーターの抑揚や感情表現を加え、BGMなどを追加して読み聞かせを行う。複数の声を登録し、登場人物によって声を変えることもできる。 声の登録にはコエステのiOSアプリ「コエステーション」(Android版アプリも提供予定)で指定の原稿を15分ほど読む必要がある。登録後に「coemoアプリ」と連携し、コンテンツを選んで本体に送信すると読み聞かせが始まる。 読み聞かせのコンテンツは日本や世界の童話、オリジナルストーリーなど60本。睡眠計測デバイスなどを手掛けるBLAIN SLEEP(東

                                                                    親の声で「読み聞かせ」するAI音声合成スピーカー、タカラトミーが発売 複数の声で配役も
                                                                  • [スタパ齋藤の「スタパトロニクスMobile」] いろいろスゴい音声合成アプリ「VOICEPEAK」がズギアっと爆誕!!! 即買いしたゼっ!!!

                                                                      [スタパ齋藤の「スタパトロニクスMobile」] いろいろスゴい音声合成アプリ「VOICEPEAK」がズギアっと爆誕!!! 即買いしたゼっ!!!
                                                                    • 唇の動きを読み取ってその人らしく音声合成 インド工科大「Lip2Wav」開発

                                                                      Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 インド工科大学ハイデラバード校と同カンプール校による研究チームが開発した「Learning Individual Speaking Styles for Accurate Lip to Speech Synthesis」は、話者の口唇の動きだけを基に自然な音声を生成する機械学習ベースの手法で、「Lip2Wav」という名称を持つ。

                                                                        唇の動きを読み取ってその人らしく音声合成 インド工科大「Lip2Wav」開発
                                                                      • AI技術でリアルな歌声を再現できる音声合成ツール「CeVIO Pro (仮)」α版が無料公開/商用可のボイスライブラリも付属

                                                                          AI技術でリアルな歌声を再現できる音声合成ツール「CeVIO Pro (仮)」α版が無料公開/商用可のボイスライブラリも付属
                                                                        • 音声合成してみよう

                                                                          第63回シェル芸勉強会のLTで使った資料です

                                                                            音声合成してみよう
                                                                          • あらゆる場面に対応できる音声合成ソフト『VOICEVOX Nemo』リリース&動画制作ソフトウェア『Vrew』提携のお知らせ

                                                                            無料のテキスト読み上げソフトウェア「VOICEVOX」から、新ブランド「VOICEVOX Nemo」が11月17日リリース。動画編集ソフト「Vrew」と提携し、VOICEVOXの音声を簡単に活用可能に。 無料で使える中品質なテキスト読み上げソフトウェア「VOICEVOX」は、キャラクター無しの話者シリーズ「VOICEVOX Nemo」を2023年11月17日(金)にリリースすることをお知らせいたします。 また、VOICEVOXはVoyagerX, Inc.と提携しまして、マルチOS対応の動画制作ソフト「Vrew」にてVOICEVOXの音声を簡単に利用できるようになりました。(VOICEVOX Nemoは今後対応予定) 別途プランに加入せずとも、誰でも無料でお使いいただけます。 VOICEVOX Nemoとは 「VOICEVOX Nemo ( https://voicevox.hiroshi

                                                                              あらゆる場面に対応できる音声合成ソフト『VOICEVOX Nemo』リリース&動画制作ソフトウェア『Vrew』提携のお知らせ
                                                                            • 声質100%再現! 将棋×音声合成フリーソフト「棋譜読みちゃん」

                                                                              「棋譜読みちゃん」は、音声合成機能を持つ棋譜再生ツールです。クラウドファンディングで開発が実現しました!UTAUのように、ユーザーが用意した声も使えます。その生声感……ぜひ動画でご確認ください!ご興味を持っていただけましたら、フォロー、コメント、拡散をお願いいたします!■公式サイト ⇒ https://help.kify.rei-yumesaki.net/■Twitter ⇒ https://twitter.com/Kifuyomi■続編&補足:棋譜読みちゃんを自動作曲ソフトにしてみた⇒ sm35851360■さらなる続報:マスコットキャラクターのつくよみちゃんが「商用利用もOKなフリー素材キャラクター」になりました!⇒ https://tyc.rei-yumesaki.net/■棋譜読みちゃん音声ライブラリの作り方 → sm35708969■棋譜読みちゃんを応援する方法まとめ → htt

                                                                                声質100%再現! 将棋×音声合成フリーソフト「棋譜読みちゃん」
                                                                              • 500円・15分の収録で、あなたの声を「AI音声合成」化!?音声合成プラットフォーム「CoeFont CLOUD」先行リリース

                                                                                500円・15分の収録で、あなたの声を「AI音声合成」化!?音声合成プラットフォーム「CoeFont CLOUD」先行リリース500円・15分の収録から、あなたの声を「AI音声合成」化できる音声合成プラットフォーム「CoeFont CLOUD」の先行リリースを開始いたします 株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は、リリース3日で5万、月間ユーザー20万人を達成している「CoeFont STUDIO」に続いて、AI音声合成プラットフォーム、「CoeFont CLOUD」(https://coefont.cloud )の先行リリースを開始いたします。本文内リンクから先行リリースの体験の申請が可能です。 ■CoeFont CLOUDとは 当社が『CoeFont STUDIO』に続いてリリースする「CoeFont CLOUD」(https://coefont.c

                                                                                  500円・15分の収録で、あなたの声を「AI音声合成」化!?音声合成プラットフォーム「CoeFont CLOUD」先行リリース
                                                                                • Megpoidの音声合成ソフト、A.I.VOICE GUMIが発売開始。7年ぶりとなる製品発売の背景を探る|DTMステーション

                                                                                  株式会社インターネット 代表取締役 村上昇さんインタビュー --Megpoid製品、だいぶ久しぶりになりますが、どうしてこのタイミングでの登場となったのですか? 村上:昨年の秋ごろから、そろそろ出したいなと検討していました。喋りも、歌唱もどちらも進めたいと考えていました。ただ、昨今の技術進化などからさまざまなメーカーが参入し、エンジンも複数あるから、どれにしようか……と思って考えていたのです。そうした中、今年1月にエーアイさんから具体的な提案をいただいたんです。技術的な背景から、実際の工程なども含め、細かく話を詰めていくなか、これがよさそう、となったのです。 株式会社インターネットの代表取締役、村上昇さんにオンラインミーティングの形でインタビューした --トークもソングもとなると、CeVIO AIやSynthesizer V&voicepeakのほうが、スマートな気もしますが……。 村上:

                                                                                    Megpoidの音声合成ソフト、A.I.VOICE GUMIが発売開始。7年ぶりとなる製品発売の背景を探る|DTMステーション