並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 296件

新着順 人気順

音声合成の検索結果81 - 120 件 / 296件

  • 今年の書初めコーディングはAITuberを創る!

    はじめに あけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTやStableDiffusionが2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。 「AITuberを作ってみたら生成AIプログラミングがよくわかった件」 って本も買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。 また、私はプログラミングは多少できますが、イラストや音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の

      今年の書初めコーディングはAITuberを創る!
    • OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる

      OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は

        OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
      • 【悪用厳禁】自分の声を推しの声にリアルタイム変換する方法(全体公開)|めーぷるしろっぷ|pixivFANBOX

        皆様はrvcというAIをご存知でしょうか? RVCはAIボイスチェンジャーとも言うべき代物で、 推しの声をAIに学習させることで、推しの声でおしゃべりすることが出来るようになります! 学習させた音声は推しに迷惑が掛からないように、自己責任で利用してください。 今回はRVCを使った音声の学習から、それを実際に使う方法...

          【悪用厳禁】自分の声を推しの声にリアルタイム変換する方法(全体公開)|めーぷるしろっぷ|pixivFANBOX
        • 【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch

            【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch
          • Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表

            2023年1月5日にMicrosoftが新しい音声合成AIモデル「VALL-E」を発表しました。VALL-Eはたった3秒間の音声サンプルで人の声を忠実にシミュレートできる他、一度学習したデータからは、その人の声色だけではなく感情のトーンや録音環境も再現した合成音声を作成することが可能になっています。 VALL-E https://valle-demo.github.io/ [2301.02111] Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers https://doi.org/10.48550/arXiv.2301.02111 Microsoft’s new AI can simulate anyone’s voice with 3 seconds of audio | Ars Technica

              Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表
            • VOICEPEAK 商用可能 6ナレーターセット

              『VOICEPEAK』は、最新のAI音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。 お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。 感情パラメータによる喜怒哀楽の表現にも対応しています。 「VOICEPEAK 商用可能 6ナレーターセット」には6人のナレーター(男性3名、女性3名)に加えて幼い「女の子」の声も収録されており、様々な声のバリエーションで読み上げが行えます。 個人ユーザー様のご利用はもちろん、教育機関の方や法人様など、様々な商用・業務用途でのご利用も可能です。 OSはWindows、macOS、Linuxに対応。 体験版もご用意しておりますので、ぜひお試しください。 ・女性1 声優:若守みづき 特徴:息づかいが感じられる、やや高めでやわらかく優しい声色です。 ・女性2 声優:野宮佳乃 特徴:落ち着いたトーンの声

                VOICEPEAK 商用可能 6ナレーターセット
              • 完全に別人になっちゃった。話題のAIボイチェン「RVC」を体験してみた/「RVC」と「VC Client」の組み合わせで“声をコスプレする”新時代到来!?【やじうまの杜】

                  完全に別人になっちゃった。話題のAIボイチェン「RVC」を体験してみた/「RVC」と「VC Client」の組み合わせで“声をコスプレする”新時代到来!?【やじうまの杜】
                • 『サイバーパンク2077: 仮初めの自由』では亡くなった声優のキャラクターボイスをAIで実装、遺族の許可と協力のもと実現 | Game*Spark - 国内・海外ゲーム情報サイト

                  CD Projekt SAはポーランド語版『サイバーパンク 2077』の拡張パック「仮初めの自由」において、ポーランドの人気声優だった故Miłogost Reczek氏のボイスをAIで再現し収録していることを、米メディアのブルームバーグへ宛てた声明を通して述べました。なお、Game*Sparkによるローカライズ担当者へのインタビューでも同様の内容についてお話頂いているため、併せてご覧ください。 『サイバーパンク2077: 仮初めの自由』ローカライズの立役者にロングインタビュー。CDPR本国の担当ディレクター&日本語ローカライズマネージャー西尾さんに濃厚な話を訊いた | Game*Spark - 国内・海外ゲーム情報サイト 「ヴィクター・ベクターとしての素晴らしいパフォーマンスに敬意を表することができた」Reczek氏は『サイバーパンク 2077』でリパードクとしてVと関りの深い「ヴィクター

                    『サイバーパンク2077: 仮初めの自由』では亡くなった声優のキャラクターボイスをAIで実装、遺族の許可と協力のもと実現 | Game*Spark - 国内・海外ゲーム情報サイト
                  • 無料……だと? めちゃ自然に読み上げてくれるWeb音声合成サービスが登場、営利目的や配信などでも使用可

                    ※本記事はアフィリエイトプログラムによる収益を得ています Yellstonが、音声合成サービス「CoeFont STUDIO」を公開しました。入力した文章を読み上げてくれるWebサービスなのですが、無料とは思えない極めて自然な音声で読み上げてくれるとさまざまなかいわいの人たちをざわつかせています。すごいのが出てきた……! CoeFont STUDIO 試しに吉野家コピペを入力して読み上げさせてみたところ、大変流ちょうに読み上げ始めて爆笑しました。イントネーションが調整できるようになっているのですが、特に調整する必要性は感じないほど。 現在芯の通った声質の「アリアル」と透き通った声質の「ミリアル」の2種類の音声が公開されており、自由に切り替えられます。ミリアルの方は「Prototype」の記述があり、アリアルの方がより自然に読み上げてくれる印象でした。 CoeFont STUDIOはリリース

                      無料……だと? めちゃ自然に読み上げてくれるWeb音声合成サービスが登場、営利目的や配信などでも使用可
                    • 無料の歌声合成ソフト「NEUTRINO」がプロもうなる完成度 楽譜と歌詞を入れるだけで東北きりたんが自然に歌う

                      新たな歌声合成ソフト「NEUTRINO」が2月21日に無料公開され、高い完成度で大きな反響を呼んでいます。まず試しに以下の作例動画を再生してみてください。ソフトが作り出した歌声の自然さに驚かされることうけあいです。 NEUTRINO NEUTRINOはSHACHI(@SHACHI_KRTN)さんが開発した、ニューラルネットワークによる歌声シンセサイザー。楽譜と歌詞のデータを入力するだけで、同梱の「東北きりたん」か「謡子」の音声データベースをもとに、歌声のデータを作成してくれます。 東北きりたんは、東北地方応援キャラクターの1人。声を担当する茜屋日海夏さんの歌唱データが研究者向けに配布されており、NEUTRINOでも活用されている ニューラルネットワークは楽譜をもとに、発声タイミングや音の高さ、声質、かすれ具合などを推定。いうなれば「東北きりたん(謡子)だったらこの曲をどのように歌うか」を自

                        無料の歌声合成ソフト「NEUTRINO」がプロもうなる完成度 楽譜と歌詞を入れるだけで東北きりたんが自然に歌う
                      • 商用OK、無料のAI音声合成「CoeFont Studio」 ゲーム実況・プレゼンなどの利用見込む

                        AI事業を手掛けるYellston(東京都港区)は4月23日、Webブラウザで使えるAI音声合成サービス「CoeFont STUDIO」を公開した。法人・個人を問わず商用利用を認める。利用料は無料で、プレゼンやゲーム実況動画、アニメのアフレコといった用途を見込む。 芯の通った声質「アリアル」と透き通った声質「ミリアル」を提供。ユーザーは200文字までの日本語テキストを音声化できる。読み上げの速さやアクセントの位置も調整可能。複数のテキストを読み上げさせ、それらをつなげて1つの音声データにする機能も備える。音声はwavで出力する。 公序良俗に反する行為に使わない、制作物にCoeFont STUDIOのURLを明記するといった規約を守れば、音声データの商用利用を認める。アリアルやミリアルのキャラクターイラストについても、規約を守った上での二次創作を許可する。ただしイラストをグッズ化して販売する

                          商用OK、無料のAI音声合成「CoeFont Studio」 ゲーム実況・プレゼンなどの利用見込む
                        • AIシンガーがとうとう我が手に……!! 新歌声合成ソフト「NEUTRINO」を使い倒した

                          2020年2月22日、謎のエンジニア「SHACHI」さんがAI歌声合成ソフト「NEUTRINO」(ニュートリノ)を公開しました。こいつはすごいぞ。楽譜を渡しただけで勝手に歌ってくれるのです。未来来てるわー。 ※これはまさかの調声済み 調声しなくてもしゃくりとかビブラートとかが勝手に適用されて、中の人のように歌うAIシンガーが手に入りました。最強で最高なのでもうしょっぱなから使い倒してやりましたよ。

                            AIシンガーがとうとう我が手に……!! 新歌声合成ソフト「NEUTRINO」を使い倒した
                          • AIで作った「AI音楽」が流行、Discord上には2万人超が集まる人気サーバーも

                            Stable DiffusionやMidjourneyといった画像生成AIや、ChatGPTのようなチャットAIの登場により、AIはますます人々の生活に浸透しています。新たに、AIを用いて著名アーティストの声を模倣し、既存の楽曲やオリジナル曲を歌わせることが流行りつつあると、テクノロジーメディアのMotherboardが報じています。 Inside the Discord Where Thousands of Rogue Producers Are Making AI Music https://www.vice.com/en/article/y3wdj7/inside-the-discord-where-thousands-of-rogue-producers-are-making-ai-music AIを用いて著名アーティストの声を再現し、この合成音声にオリジナルの楽曲や既存の楽曲を歌

                              AIで作った「AI音楽」が流行、Discord上には2万人超が集まる人気サーバーも
                            • 「RVC」+「VC Client」で自分の声を任意の声にリアルタイム変換しよう! - Eヤツのブログ

                              【導入】 ・この記事の最終目標は「リアルタイム変換でずんだもんボイスになってDiscordで通話する」です。 ・大まかな記事の流れは「RVCで学習モデルを作る」→「学習モデルをVC Clientに入れる」→「リアルタイムボイチェン完成!」です。 ・「RVC」という超凄い非リアルタイム音声変換ソフトが話題になったと思ったら、翌日に「VC Client」という超凄いソフトがリアルタイム音声変換に対応したのを聞いたので、急いで記事を書きました。 ・この記事ではずんだもんボイスになることを目標としていますが、学習先の音声さえあればどんな音声にもなれます。 【手順】 ①~RVCのダウンロード~ ・以下のURLを開いて、「RVC-beta.7z」をDLします。(要Hugging Faceアカウント)(Hugging Faceアカウントを持ってない人は無料なので作りましょう) https://huggi

                                「RVC」+「VC Client」で自分の声を任意の声にリアルタイム変換しよう! - Eヤツのブログ
                              • VOICEPEAK 商用可能 6ナレーターセット

                                『VOICEPEAK』は、最新のAI音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。 お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。 感情パラメータによる喜怒哀楽の表現にも対応しています。 「VOICEPEAK 商用可能 6ナレーターセット」には6人のナレーター(男性3名、女性3名)に加えて幼い「女の子」の声も収録されており、様々な声のバリエーションで読み上げが行えます。 個人ユーザー様のご利用はもちろん、教育機関の方や法人様など、様々な商用・業務用途でのご利用も可能です。 OSはWindows、macOS、Linuxに対応。 体験版もご用意しておりますので、ぜひお試しください。 ・女性1 声優:若守みづき 特徴:息づかいが感じられる、やや高めでやわらかく優しい声色です。 ・女性2 声優:野宮佳乃 特徴:落ち着いたトーンの声

                                  VOICEPEAK 商用可能 6ナレーターセット
                                • 無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー

                                  AI技術の進化によって、絵や文章だけではなく音声変換もAIでリアルタイムに行うことが可能になりました。ボイスチェンジャーAIにはRVC(Retrieval-based Voice Changer)やMMVCなどさまざまな種類が存在しますが、「VC Client」は複数ボイスチェンジャーAI向けモデルに対応しており、簡単にリアルタイム音声変換ができるとのことなので実際に試してみました。 GitHub - w-okada/voice-changer https://github.com/w-okada/voice-changer GitHubのレポジトリにアクセスします。 「事前ビルド済みのBinaryでの利用」の欄にあるテーブルで、「win」にある「通常」をクリック。 ダウンロードリンクが表示されるので、「このままダウンロード」をクリックします。なお、VC ClientはZIP形式で配布され

                                    無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー
                                  • 〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud 公式ブログ

                                    〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう 前回は、AutoML Tables による EC サイトの LTV 分析事例を紹介しました。今回は、同じ AutoML Tables を、より身近な課題の解決に使う方法を紹介します。 その課題とは、筆者自身が抱えていた 2 つの悩みです。ひとつは、スキャンして PDF で保管している書籍の「積ん読」を大量に抱えていたこと。もうひとつは、自宅作業ばかりで増え続けてしまっている体重です。 この 2 つの課題を一挙に解決するソリューションとして筆者が思いついたのが、「PDF 書籍をオーディオブックに変換する」という方法です。読みたかった書籍をオーディオブック化しておけば、ランニングしながら積ん読を解消できます。 この動画のように、Cloud Sto

                                      〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud 公式ブログ
                                    • 「AIと共存すべき」人気声優・梶裕貴 自身の声で自由にしゃべれるAIソフト発売へ 「たくさん悩んで」決断

                                      「正直、たくさん悩みました」――人気声優の梶裕貴さんが、自身の声で自由にしゃべらせることができる音声合成ソフト「CeVIO AI 梵そよぎ(そよぎそよぎ) トークボイス」を製品化すると発表した。5月29日午後9時から、クラウドファンディングサイト「CAMPFIRE」で受注をスタートする。 ここ最近、AIを使って人気声優の声などを無断で再現したコンテンツが問題になっており(関連記事)、梶さんも頭を悩ませてきたという。だが「AIと敵対するのではなく、共存すべき」と結論づけ、「あえて私の声を持つ『梵そよぎ』を解禁することで、"正しい音声AIの在り方"を証明できるのではないか」と考えて開発を決断したという。 CeVIO AIは、ソニー・ミュージックエンターテインメントや名古屋工業大学発ベンチャーのテクノスピーチなど、複数の企業が参加する音声合成AIプロジェクト。 「CeVIO AI 梵そよぎ」は、

                                        「AIと共存すべき」人気声優・梶裕貴 自身の声で自由にしゃべれるAIソフト発売へ 「たくさん悩んで」決断
                                      • 「ゆっくり」本家アクエスト、公式音声合成アプリ「AquesTalkPlayer」をリリース/個人が非営利で使用する場合に限り無償。年額6,380円の商用ライセンスも用意

                                          「ゆっくり」本家アクエスト、公式音声合成アプリ「AquesTalkPlayer」をリリース/個人が非営利で使用する場合に限り無償。年額6,380円の商用ライセンスも用意
                                        • zenncast - 技術トレンドをAIがラジオに変換

                                          Zennのトレンド記事をまとめてAIがラジオをつくります。毎朝7時に更新。 お便りも募集中。送っていただいたお便りはAIパーソナリティが読み上げます。

                                            zenncast - 技術トレンドをAIがラジオに変換
                                          • AIが生成した“偽音声”を見抜く技術 99%以上の精度で検出

                                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米フロリダ大学の研究チームが発表した論文「Who Are You(I Really Wanna Know)? Detecting Audio DeepFakes Through Vocal Tract Reconstruction」は、音声生成モデルで作成された合成音声を見抜く検出器を開発し検証した研究報告だ。音声から声の通り道「声道」を作成して、その声道から人の音声か偽物の音声かを識別する。精度は99%以上だという。 人の声をまねた合成音声はロボットっぽい音で出力されていたが、近年では機械学習モデルの進歩により、合成音声の品質は劇的に向上して人間っぽい音で出力されるようになってきた。人間

                                              AIが生成した“偽音声”を見抜く技術 99%以上の精度で検出
                                            • 新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入

                                              LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog はじめに こんにちは、2020年4月に新卒としてLINE株式会社に入社した二又 航介です。テキスト音声合成システムの研究開発を担当するAI開発室 Voiceチームに所属し、音声合成システムにおけるテキスト処理部の研究開発やチームの機械学習基盤構築に取り組んでいます。 学生時代は機械翻訳や同時通訳に関連する研究に取り組んでいました。研究以外の活動としては、アルバイト・インターンでの対話システムや機械翻訳システムの研究開発、個人活動としてwebアプリケーション開発などを行っていました。このような活動を通じて、数多くのユーザーに利用される自然言語処理技術を活かしたサービスに携わりたいという思いからLINEを志望しました。学生時代は専

                                                新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入
                                              • 生成系AIについて開発者が知っておくべきこと | gihyo.jp

                                                この記事は、GitHub Blogに4月7日に掲載された「What developers need to know about generative AI」の翻訳記事です。 昨今のニュースを席捲する「生成系AI(Generative AI⁠)⁠」ですが、厳密にはどのようなものでしょうか? 生成系AIについて知っておくべきこと、また開発者にとってどのような意味を持つのかについて説明します。 皆さんはこれまでに、ChatGPT、DALL-E、GitHub Copilotといった生成系AI(人工知能)ツールについて聞いたことがあるかと思います。生成系AIツールを利用すると、メールの件名からプログラミングコードの関数、アートに至るまで、誰でも瞬時にコンテンツを作成できるため、幅広い関心を集めています。 様々な業界のコンテンツ制作に革命をもたらす可能性があることから、生成系AIとは何か、どのように利

                                                  生成系AIについて開発者が知っておくべきこと | gihyo.jp
                                                • つよすぎるAIシンガーAIきりたんの基本的な使い方。【無料】|赤坂まさか

                                                  【2020/10/22】 商用利用ライセンス停止(商用利用無償化)について追記しました ツイッターフォローしてくださるとうれしみです。おねがいします。 バーチャルYouTuber/SSWの赤坂まさかです。 2/20にリリースされた「AIきりたん」。これが無調声でもめちゃくちゃリアルに歌ってくれると話題です。これが無料で使えてしまっていいの? ↓わたしも歌わせてみました。 というわけで、わたし流ですが、AIきりたんの使い方を解説してみます。 1. NEUTRINOをダウンロードまずはオフィシャルサイトからAIきりたんのエンジンであるNEUTRINOをダウンロードしてきます。AIきりたんが初音ミクなら、NEUTRINOはPiapro Studio的なイメージかと思います。きりたんはNEUTRINOに同梱されています。 ※最新版(Version.0.200以上)はGoogleコラボラトリーを使用

                                                    つよすぎるAIシンガーAIきりたんの基本的な使い方。【無料】|赤坂まさか
                                                  • Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表

                                                    2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。 [2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers https://doi.org/10.48550/arXiv.2304.09116 NaturalSpeech 2 https://speechresearch.github.io/na

                                                      Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表
                                                    • AI音声合成ソフト「VoiSona Talk」が正式公開 ~女性ボイス「田中傘」とともに無償提供/同社のAI歌唱ソフト「VoiSona」をベースにした読み上げツール

                                                        AI音声合成ソフト「VoiSona Talk」が正式公開 ~女性ボイス「田中傘」とともに無償提供/同社のAI歌唱ソフト「VoiSona」をベースにした読み上げツール
                                                      • 音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析

                                                        音声合成技術の進化が目覚ましい。しかし、それを支えているのは声優などによる良質な収録音声だ。声をなりわいとする声優にとって、音声合成技術の普及は「仕事が奪われる」リスク要因でもある。 その音声合成技術を、現場の声優はどう見ているのか。音声合成ソフトウエア「ガイノイドTALK」や歌声合成ソフトウエア「VOCALOID」、声質変換ソフトウエア「リアチェンvoice」などに声を提供し、自身でも音声合成技術を活用しているピアレスガーベラ所属声優の小岩井ことり氏に聞いた。同氏は作詞や作曲なども手掛ける。(聞き手は東 将大、高野 敦=日経 xTECH) 音声合成技術の利点は何だとお考えでしょうか。 ピアレスガーベラ所属。TVアニメ「のんのんびより」宮内れんげ、「THE IDOLM@STER ミリオンライブ!」天空橋朋花などの声を担当する一方、TBSラジオで毎日流れるジングルの作詞作曲編曲を務めるなど作

                                                          音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析
                                                        • 「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査

                                                          現代の音声合成技術は特定の人物の声を基にして、その人と非常に似た合成音声を生成する能力を持つ。このような実在の人物の声の合成は、なりすましや詐欺などの不適切な使用が問題視されていることに加え、声の再現や公開がその人物の人格的利益や名誉感情に影響を与える可能性もある。また声優や歌手のように、自らの声を職業活動に利用する人々にとっては、無許可での声の再現や使用によって経済的損失を被る恐れがある。 この研究の焦点は、特定の人物の音声データから学習させたモデルを用いて、任意のテキストをその人物の声で読み上げる合成音声技術にある。日本ではこの問題に関する具体的な法的争訟例はまだ存在しないとされるが、研究では架空の事例を設定し、この技術が引き起こしうる問題点を探究する。以下がその事例になる。(音声合成AIの利用場面における法的課題―「声」に権利はあるのか―より引用)。 声優Xは、所属するタレント事務所

                                                            「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査
                                                          • 商用可・無料のAI音声読み上げツール「VOICEVOX」、他アプリへの組み込みも可能なコアライブラリも公開/プロジェクトの保存、キャラの立ち絵、設定画面を追加するなど使い勝手も向上

                                                              商用可・無料のAI音声読み上げツール「VOICEVOX」、他アプリへの組み込みも可能なコアライブラリも公開/プロジェクトの保存、キャラの立ち絵、設定画面を追加するなど使い勝手も向上
                                                            • 商用可・無料のAI音声読み上げツール「VOICEVOX」にMac版が登場 ~最新プレビュー版【18:00追記】/ユーザーインターフェイス・機能も熟成。同梱のキャラクターは総勢5人に

                                                                商用可・無料のAI音声読み上げツール「VOICEVOX」にMac版が登場 ~最新プレビュー版【18:00追記】/ユーザーインターフェイス・機能も熟成。同梱のキャラクターは総勢5人に
                                                              • 喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション

                                                                5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ

                                                                  喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション
                                                                • KAWAI、無料で楽譜を編集できる「スコアメーカーZERO エディター」を公開/歌声合成機能も搭載!

                                                                    KAWAI、無料で楽譜を編集できる「スコアメーカーZERO エディター」を公開/歌声合成機能も搭載!
                                                                  • WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始|DTMステーション

                                                                    CeVIO Creative StudioやCeVIO AIなどのエンジン部分を開発してきた株式会社テクノスピーチが2月24日、新たな歌声合成ソフト、「CeVIO Pro (仮)」(チェビオプロ)を発表するとともに、正式版リリースへの準備段階としてα版の無償配布を開始しました。このCeVIO Pro (仮)は、WindowsだけでなくMacでも動作するソフトであり、スタンドアロンで動作するとともに、WindowsおよびMacのVSTiのプラグインとしても動作するものとなっています。 またCeVIO Pro (仮)にはソングエディタともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属。ここで合成された歌声の波形データは個人/法人、商用/非商用を問わず、原則、無料で利用することが可能となっています。実際どんなものなのか、試してみた一方

                                                                      WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始|DTMステーション
                                                                    • 高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表

                                                                      スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台本を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台本の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月

                                                                        高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表
                                                                      • 商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に/イントネーションをリセットする機能や全テキストを繋げて書き出す機能も

                                                                          商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に/イントネーションをリセットする機能や全テキストを繋げて書き出す機能も
                                                                        • 萌えキャラを腐らせたくない 「東北ずん子」運営会社がAI向け学習データを無料公開、その狙いは

                                                                          東北地方を応援する萌えキャラの運営会社が、キャラの声を生かしたAI研究向け学習データを無料で公開している。直接的な収益にもならず、研究者に使ってもらえるとも限らないのに、なぜそのような取り組みを行っているのか。データを公開した萌えキャラ運営会社SSS(仙台市)の小田恭央CEOに話を聞いた。 萌えキャラ「東北ずん子」の運営会社 SSSは東北応援キャラ「東北ずん子」を運営する企業で、グッズの製作や地域振興イベントなど、ライセンスビジネスを展開している。ヤマハの歌声合成ソフト「VOCALOID」用音源の販売などは行っているが、AIの技術開発を行っているテクノロジー企業というわけではない。「AI向けの学習データを無料公開」といわれると少し唐突にも聞こえる。 同社は2019年11月、研究者向けに「東北きりたん歌唱データベース(DB)」を無料公開した。東北ずん子の関連キャラ「東北きりたん」の歌声を約1

                                                                            萌えキャラを腐らせたくない 「東北ずん子」運営会社がAI向け学習データを無料公開、その狙いは
                                                                          • AIがリアルな人の歌声を再現する「VoiSona」正式版が無償公開/追加ボイスライブラリ「さとうささら」の販売は遅延、「鬼龍院翔」「すぅ」の発売決定

                                                                              AIがリアルな人の歌声を再現する「VoiSona」正式版が無償公開/追加ボイスライブラリ「さとうささら」の販売は遅延、「鬼龍院翔」「すぅ」の発売決定
                                                                            • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                                                              無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                                                                無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                                                              • 無料で誰でも「ずんだもん」の声になれるのだ! AIボイチェン「ParakeetVC」でなりきってみた/現在はアルファ版。全109キャラクター&全機能が無料で使えるのは1月末まで!【やじうまの杜】

                                                                                  無料で誰でも「ずんだもん」の声になれるのだ! AIボイチェン「ParakeetVC」でなりきってみた/現在はアルファ版。全109キャラクター&全機能が無料で使えるのは1月末まで!【やじうまの杜】
                                                                                • 自分の声を人気キャラの声に変換 AIボイスチェンジャーをドワンゴが4月に発売

                                                                                  Seiren Voiceはユーザーが声を入力すると、キャラクターの音声に変換して出力するボイスチェンジャー。ドワンゴのAI研究部門「Dwango Media Village」が独自開発した声質変換エンジンを採用する。 ボイスチェンジャーにはリアルタイムに変換するものもあるが、Seiren Voiceは非リアルタイムに特定の人物の声に置換するもの。 入力音声を直接出力音声に変換するのではなく、音素や音の高さ、発音タイミングなどの要素に分解した後にキャラクターの音声として再合成する仕組み。ユーザーとキャラクターの声を対応付けた学習させなくていい点が特徴という。 関連記事 ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換 ドワンゴがディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。自分の声を100人分の声に変換できる。

                                                                                    自分の声を人気キャラの声に変換 AIボイスチェンジャーをドワンゴが4月に発売