並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 296件

新着順 人気順

音声合成の検索結果121 - 160 件 / 296件

  • 歌詞をテキストで流し込むだけで流暢に歌唱。MicrosoftのクラウドAIを駆使したボーカル音源が無償公開

      歌詞をテキストで流し込むだけで流暢に歌唱。MicrosoftのクラウドAIを駆使したボーカル音源が無償公開
    • 無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可 | Ledge.ai

      サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

        無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可 | Ledge.ai
      • 日本俳優連合が“生成AI”に提言 「新たな法律の制定を強く望む」 声の肖像権確立など求める

        俳優・声優の権利保護活動を行う日本俳優連合は6月13日、「生成系AI技術の活用に関する提言」を発表した。著作権法の運用見直しやルール作り、「声の肖像権」の確立などを業界や国に求める。 提言内容は「国内外で活発に意見交換し、EUのAI規制を参考にしたガイドライン策定を行うこと」「著作権法の運用見直しをはかる」「AI生成作品であると明記すること」「AIの表現分野への進出について一定のルールを設けること」「声の肖像権を確立すること」。 日本俳優連合は「新しい技術の進化による人間社会の発展は望ましいこと」とする一方で、「実演家の、表現の模倣・盗用を安易に促し、職域を侵害する恐れがある」と問題視している。 「主体は人間であり、その補助をAIが行うという趣旨のもと、新たなガイドラインや法律の制定を強く望む」(日本俳優連合) 生成AIと俳優・声優を巡っては、実在の女優や女性声優などの画像を生成できる非公

          日本俳優連合が“生成AI”に提言 「新たな法律の制定を強く望む」 声の肖像権確立など求める
        • 無料のAI音声合成ソフトVOICEVOXに、小岩井ことりさんによるNo.7が3種類の声で登場。でも、このリリースは序章に過ぎない!?|DTMステーション

          オープンソース・ソフトウェアとして公開されているAI音声合成ソフトであるVOICEVOXに、9月30日、また新たなキャラクタが誕生します。今回、3つのキャラクが同時に誕生するのですが、その一つが声優の小岩井ことり(@koiwai_kotori)さんCVによるNo.7です。昨年、AI歌声合成ソフトとしてフリーウェアのNEUTRINO用にNo.7がリリースされていましたが、今度はしゃべるソフトとしての誕生となります。普通のしゃべり声である「ノーマル」と、アナウンサーが読み上げるようにしゃべる「アナウンス」、そして絵本を読み聞かせるように読む「読み聞かせ」の3種類となっています。 このNo.7のプロジェクトは明治大学の専任准教授、森勢将雅(@m_morise)先生を中心に研究・開発されているもので、小岩井ことりさんもここに積極的に参加しつつ、私・藤本健も関わる形で進めてきました。ここで作られたデ

            無料のAI音声合成ソフトVOICEVOXに、小岩井ことりさんによるNo.7が3種類の声で登場。でも、このリリースは序章に過ぎない!?|DTMステーション
          • 人気VTuberのつぶやきをAIによる音声合成で本人の声で再現する「棒読みこち」がすごい

            ホロライブ所属の人気VTuberであるさくらみこさんの声を参考にAIによる音声合成を行い、さくらみこさん本人のツイートをそのまま読み上げる「棒読みこち」が公開されています。 さくらみこさんの声を参考にして作られた音声合成AI、棒読みみこち、生まれました‼️ みこちのツイートを、たまーに読み上げます‼️#miko_Art pic.twitter.com/QiQUvck4ME— 棒読みこち (@bouyomiko35) 例えば、以下のさくらみこさんのツイート。 ショーシャンクの空に みこが目の前が真っ暗になったら 思い出してまた観よう、と思った そんな名作でした???? 泣いたけど気持ちよくGW楽しんでいけるぜぇ! 必死に生きよう⛏#みこ市長— さくらみこ????SakuraMiko (@sakuramiko35) これを読み上げたものが以下。本人の声でツイートを読み上げています。やや人工的な

              人気VTuberのつぶやきをAIによる音声合成で本人の声で再現する「棒読みこち」がすごい
            • マークダウンファイルから日本語音声付き動画を作成できる「Video Puppet」を使ってみた! - paiza times

              どうも、まさとらん(@0310lan)です! 今回は、単純なマークダウンファイルから動画を生成してダウンロードできるWebサービスをご紹介します! ブログ記事を書くようにテキストデータを動画に変換できるうえ、自然な日本語音声も自動生成してくれます。また、画像や音楽などのメディアも挿入できるので、チュートリアル動画やPR動画などさまざまな作品を作ることができます。 現在はベータ版で全機能を無料で使えるため、動画作成にご興味がある方はぜひ参考にしてみてください。 【 Video Puppet 】 ■「Video Puppet」の使い方 それでは、最初に「Video Puppet」をどのように使うのか詳しく見ていきましょう! トップページにアクセスしたら、画面上部にある【SIGN UP】ボタンから無料のユーザー登録をしておきます。 (※登録しなくても制限付きで利用することは可能です) ユーザー名

                マークダウンファイルから日本語音声付き動画を作成できる「Video Puppet」を使ってみた! - paiza times
              • AI Voice Generator & Text to Speech

                Rated the best text to speech (TTS) software online. Create premium AI voices for free and generate text-to-speech voiceovers in minutes with our character AI voice generator. Use free text to speech AI to convert text to mp3 in 29 languages with 100+ voices.

                  AI Voice Generator & Text to Speech
                • 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがすごいの? 商用可能でMac対応でほぼ人間

                  経歴だけは長いベテラン記者・編集者の松尾(マツ)と、幾つものテック系編集部を渡り歩いてきた山川(ヤマー)が、ネット用語、テクノロジー用語で知らないことをお互い聞きあったり調べたりしながら成長していくコーナー。交代で執筆します。 マツ 来ましたね。音声合成の時代が。 ヤマー 音声合成ソフト、昔から存在していて息が長い領域だと思ってたんですが、ここ最近立て続けに新作が発表されましたね。 1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応 無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応 マツ 「VOICEPEAK」と「CeVIO Pro」、この2つの発表にはいくつかの共通点があるんですね。 ヤマー なるほど、読み上げと歌声の違いはありますが。 マツ 歌声合成と音声合成には共通する技術基盤が

                    「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがすごいの? 商用可能でMac対応でほぼ人間
                  • 19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで

                    早川さんによれば、すでにCoeFont Studioで作成した音声をプラネタリウムの案内に使ったり、企業の採用VTRに使ったりする例が出てきているという。早川さんはこういった利用方法について「有料にしていなかったら出なかったと思う。(開発する)自分でも想像していなかった」としている。 学生とAI企業の社長、二足のわらじを履く早川さんがどういった背景でCoeFont Studioを立ち上げるに至ったのか、そして今後どのような形でサービスを展開し、収益につなげていくのかを聞いた。 きっかけは友達とのゲーム? 「結構使えるものができてしまった」 そもそも、CoeFont Studioはどういった経緯で生まれたサービスなのか。早川さんはきっかけとなったのは「ゲーム実況」だったと話す。 「もともとゲームが好きで、友人と話しながらよく遊んでいた。昔は『ゲーム実況で世界を獲ろう』と思い、プレイの様子を録

                      19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで
                    • イヤホン配信を支える音のプログラミング〜Accelerate編〜 - Mirrativ Tech Blog

                      こんにちは。shogo4405です。本エントリーは、iOSエンジニア向けにイヤホン配信を支える音のプログラミング入門 - Mirrativ Tech BlogのiOS実装を紹介したいとおもいます。 本稿では、音声信号処理の実装手法としてAppleが提供するAccelerateフレームワークの利用方法を解説しています。音声の信号処理は、AccelerateのvDSPの関連の関数を利用します。 はじめに Accelerateを導入した背景は、for文での実装では、Mirrativで扱うライブ配信の処理速度に合わず体験的に良くありませんでした。そこで、Accelerateを導入することで処理速度の向上に寄与し満足できる体験になったため採用にいたりました。*1 サンプルデータ せっかくなので自分で音声データを作ってみましょう。sin波によるド・レ・ミ・ファ・ソ・ラ・シ・ドのラ(440hz)の音デー

                        イヤホン配信を支える音のプログラミング〜Accelerate編〜 - Mirrativ Tech Blog
                      • ドコモ、人気声優の「声」をAI合成&提供するサービス

                          ドコモ、人気声優の「声」をAI合成&提供するサービス
                        • 無料のAI音声合成ソフト「VOICEVOX」公開。商用利用も可

                            無料のAI音声合成ソフト「VOICEVOX」公開。商用利用も可
                          • 無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox) | テクノエッジ TechnoEdge

                            「VOCALOID β-STUDIO」の試用申し込み受け付けが開始されたという記事を書くとともに、実際に申し込みもしていました。リリース前の協力者による作例が少しずつ公開されてきた23日、初回受付分からの抽選が行われ、筆者は運良く当選しました。 当選の案内著名ボカロPで外れた方もいらしたようなので、かなりの難関だった模様ですが、せっかく試す機会を得られたので、まずはインプレッションを書いてみようと思います。 Cubaseユーザー以外の使い勝手VOCALOIDを開発するヤマハにとって、Cubaseを開発している独Steinbergは子会社。ヤマハのDAWにはCubase LEのライセンスが付属するなど、強い連携をしています。VOCALOIDと連動するVOCALOID Editor for Cubaseも早くから提供されていて、「VOCALOIDを使うならCubase」となるのは当然のことでし

                              無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox) | テクノエッジ TechnoEdge
                            • AI音声のCoeFontが、ゆっくり実況プレイ動画編集ソフトで使えるようになった!|DTMステーション

                              AI技術の進化で、ここ1、2年で急激な性能向上を実現している音声合成の世界。まさに機械が読んでいるのか、人間が読んでいるのか区別がつかないレベルになってきているわけですが、ここにきて、また面白い活用例が登場してきました。いわゆる「ゆっくり実況動画」を作成するフリーウェア「ゆっくりMovieMaker4」で、AI音声合成で人気のCoeFontが利用できるようになり、ゆっくりMovieMakerの利用範囲が一気に広がる形になったのです。 CoeFontは声をフォントのように利用できるようにしたサービスで、誰でも自分の声をCoeFontにできるとともに、ユーザーは公開されているCoeFontを使って喋らせることができる、というもの。今回このCoeFontとゆっくりMovieMakerがシステム的に連携したことにより、まさに人のような声で、誰でも無料で、簡単にテロップ・音声入りの解説動画を作ること

                                AI音声のCoeFontが、ゆっくり実況プレイ動画編集ソフトで使えるようになった!|DTMステーション
                              • 『VOICEPEAK 小春六花』の商用利用に関しまして|TOKYO6 ENTERTAINMENT

                                『VOICEPEAK 小春六花』の商用利用に関しまして、多数のお問い合わせを頂いております。 販売を担当している株式会社AHS様のサイトにおいて、商用利用に当たる範囲、使用可能な用途を整理したサイトがありますのでご参照ください。 【非商用で利用可能な範囲について】 個人、同人活動を目的とする個人の集団(グループ)、法人格を持たず業務や商売を行っている個人事業主がVOICEPEAK キャラクター製品シリーズの合成音声を非商用・非業務目的で利用可能な範囲について

                                  『VOICEPEAK 小春六花』の商用利用に関しまして|TOKYO6 ENTERTAINMENT
                                • 声のプロに音声合成AIの品質はどう映る 声優・森川智之さんが語る“技術への向き合い方”

                                  「辛口なことを言うと、もっと詰められる部分はある」――声優の森川智之さんは自身の声を再現したAIの声を聞いてそう感じたという。 森川さんといえば、映画「ミッション イン ポッシブル」のイーサン・ハント(トム・クルーズ)役、「ジョン・ウィック」のジョン・ウィック(キアヌ・リーブス)役、「クレヨンしんちゃん」の野原ひろし役などを務める有名声優だ。 森川智之(もりかわとしゆき) 声優事務所アクセルワン代表取締役。 トム・クルーズやキアヌ・リーブスなどハリウッド俳優の吹替を担当する他、アニメ作品にも多数出演。 現在は自身が立ち上げた声優事務所「アクセルゼロ」で後進の育成にも当たっている。 2021年9月、小学館とAI音声合成のスタートアップCoeFont(東京都港区)は、音声合成AIを生成できるクラウドサービス「CoeFont」を活用して森川さんの声をAI化。その音源を使ってオーディオブックを作成

                                    声のプロに音声合成AIの品質はどう映る 声優・森川智之さんが語る“技術への向き合い方”
                                  • ディープラーニングで歌声音声合成エンジンを自作する

                                    この記事は、ドワンゴ Advent Calendar 2019の1日目の記事です。 モチベーション 最近、理想の人工知能(歌ったり踊ったり喋ったりできるキャラクター)を作りたいと思うようになりました。人工知能が歌を歌うためには、歌声音声合成エンジンが必要です。ということで、ディープラーニングを使って、歌声音声合成エンジンの作成に挑戦してみました。この記事では、実際に音声合成した歌声や、その仕組み、別条件での実験結果、ディープラーニング周りの手法を紹介します。 デモ動画実際に作成した音声合成エンジンを使った歌唱のデモです。 (歌声音声合成を作ったら絶対最初にカバーしたいと思っていた歌、ハジメテノオトのカバーです。) 歌唱デモ音声 まだ挑戦し始めてから2週間ほどしか経っていないのでかなり荒削りですが、それでもちゃんと歌詞や音程が取れていたり、溜めの部分で大きく息を吸う音が入っていたりと、そこそ

                                      ディープラーニングで歌声音声合成エンジンを自作する
                                    • AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai

                                      サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                        AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai
                                      • 音声読み上げソフト「SofTalk」がゆっくりボイスへの対応を終了→実況界隈への影響やライセンス関係に対するさまざまな意見

                                        リンク SofTalkをご利用の皆様へのお知らせ - SofTalk SofTalkをご利用の皆様へのお知らせ - SofTalk【7/23更新】 日頃よりご愛顧いただき誠にありがとうございます。 SofTalkは、長年AquesTalkに対応してまいりましたが、勝手ながら AquesTalkへの対応を中止させていただくこととしました。 SofT... 337 users 44 cncc ゴメス @cncc_gomes ソフトークとかポケットステーション版DOOMとか作ってます。FCやLDゲームも少し。 /DA PUMP/スーパーチャンプル/ジョン・トラボルタ/ジョジョhttps://t.co/DfBSZs0W2D… https://t.co/QCL1d0Ybvr

                                          音声読み上げソフト「SofTalk」がゆっくりボイスへの対応を終了→実況界隈への影響やライセンス関係に対するさまざまな意見
                                        • 誰の声でもキャラの声に--DeNA、AIを活用した音声変換サービスのプロトタイプを公開

                                          ディー・エヌ・エー(DeNA)は5月12日、開発を進めているAIを活用した「音声変換AI」のトライアルを試験利用することができる「VOICE AVATAR 七声ニーナ」を公開した。PCやスマートフォンのブラウザ上で体験することが可能となっている。 これは、自分の声で話しかけて音声を入力すると、その音声が七声ニーナ(CV:高田憂希)の声に変換されるというもの。VOICE AVATAR 七声ニーナでは、入力されたユーザーの音声から話者に依存しない音の情報を抽出し、それをもとにキャラクターの音声を生成。これにより誰の声であっても、事前にユーザーの音声を収録をしたり、文字起こしをしたりすることなく、自然なキャラクターの声に変換することを可能としている。同社ではトライアルを通じて、技術進化の方向性を検証するとともに、より大きな発展に向けた技術蓄積を行っていくという。 現在もAIを用いた完全なキャラク

                                            誰の声でもキャラの声に--DeNA、AIを活用した音声変換サービスのプロトタイプを公開
                                          • 命綱の本が紙クズに変わる時 芥川賞「ハンチバック」が問うマチズモ:朝日新聞デジタル

                                            ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                              命綱の本が紙クズに変わる時 芥川賞「ハンチバック」が問うマチズモ:朝日新聞デジタル
                                            • 「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた

                                              ヤマハは9月29日、NHK総合で放送されたドキュメンタリー番組「NHKスペシャル AIでよみがえる 美空ひばり」の中で、AIの技術を活用して再現した美空ひばりさんの新規音声を披露した。 美空ひばりさんは1989年に亡くなった、昭和を代表する歌手の一人だ。ヤマハは機械学習の一種であるDNN(ディープニューラルネットワーク)を使い、美空ひばりさんの歌い方や話し方の癖を再現できる音声合成システムを作った。番組では作詞家の秋元康さんがプロデュースした新曲「あれから」を披露。まるで本人が歌っているかのような音声を再現した。 番組を見た人からは、「まるで本物のようだ」と再現度に驚く声もある一方で、「子音が弱い」「声質が機械っぽい」など厳しい評価も上がっていた。 これまで、歌声合成ソフトウェア「VOCALOID」を開発してきたヤマハだが、今は亡き美空ひばりさんの新曲を作るため、いったいどのような工夫を重

                                                「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた
                                              • ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換

                                                ドワンゴは9月14日、ディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。デモページでは、声を録音して変換先の声を選び、変換ボタン押すと自分の声を100人分の声に変換できる。 録音した音声を加工するのではなく、目標の人物の声に変換するもの。選べるターゲットの数は100種類。変換のリアルタイム性より変換品質を優先しており、変換には数十秒から数分の時間がかかる。 既存の声質変換システムはリアルタイムに変換するものが多く、品質を重視したものはあまり見かけないとして開発に挑んだという。音声の合成には、スマートスピーカーなどで使われるWaveNetという方式から派生したWaveRNNを採用した。 ディープラーニングを使った声質変換では、変換前の声と目標とする人物の声をセットで学習する手法がとられることがある。この手法ではボイスチェンジャーを使い

                                                  ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換
                                                • Synthesizer Vの歌声合成は次の次元へ。調声は不要、AIリテイク機能で好みの歌い方を選べる時代に|DTMステーション

                                                  についても、発表があり、「これは何なんだろう?」と気になっていました。この時は具体的な内容まではわからず、その翌日にHigh Dynamics Voice Modelに関する紹介ビデオも公表されたのですが、ここでもいま一つ、ピンときませんでした。が、それが実装されたβ版を使わせてもらうとともに、Kanruさんに話を聞いて、ようやくこれが歌声合成における革命であることが分かりました。 以下が、そのAIリテイクの様子を捉えたビデオです。 だいたいの雰囲気が、理解いただけたでしょうか? そう、このAIリテイク機能は、High Dynamics Voice Modelという技術をSynthesizer Vの機能として実装させたものであり、歌声を新たに作り直すというものなのです。 「歌声合成は、ここ数年で大きく進化してきましたが、やはり人間の歌声の魅力にはかなわない面があります。その大きな理由の一つ

                                                    Synthesizer Vの歌声合成は次の次元へ。調声は不要、AIリテイク機能で好みの歌い方を選べる時代に|DTMステーション
                                                  • VOCALOIDじゃない「初音ミク NT」は何が違う? 現役ユーザーが詳細レビュー

                                                    クリプトン・フューチャー・メディア(CFM)の“VOCALOIDじゃない初音ミク”、6月4日に公開された試作バージョンに早速触れてみたのだが、すぐに「地味でも本当に欲しかった機能が盛りだくさんでうれしい……うれしい……」と語彙力を失った。ミクの歌声をもっと細かくいじり倒したかった人々には、文句なしにおすすめできる。 “VOCALOIDじゃない初音ミク”とは、初音ミク NTのことだ。CFMオリジナルの歌声合成ソフト「Piapro Studio」専用のボーカル音源で、ヤマハの歌声合成ソフト「VOCALOID」では使えない。 開発が自由にできるようになったのか、細かいところから大きなところまで、既存の歌声合成ソフトのいいとこ取りをしている。いじり倒したかった側の人間としては、「そう! それが欲しかったんだよ!」と叫びながら作業してしまう程度には満足度の高いものに仕上がっていた。 これまで約30種

                                                      VOCALOIDじゃない「初音ミク NT」は何が違う? 現役ユーザーが詳細レビュー
                                                    • SHAREVOX

                                                      MIDDLE LEVEL TTS SYSTEM 中品質な音声合成システム SHAREVOXはディープラーニングを用いた音声合成システムを採用し、中品質な音声合成を実現しています。 FREEDOM 自由度の高い調声機能 イントネーションや音の長さ、全体の抑揚や音高、話速の変更が可能な、自由度の高い調声システムを提供します。 BECOME 合成音声になる あなたの声を元に、Google Colaboratoryを用いて自由に話せる音声ライブラリを作ることが可能です。 また、これを他の人に配布することもできます。 (※今後実装されます)

                                                        SHAREVOX
                                                      • 「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!

                                                        株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は、Web音声合成サービス『CoeFont STUDIO』を2021年4月23日(金)にリリース、無料公開いたします。 当社は、Web上で音声合成が可能な音声合成サービス『 CoeFont STUDIO』(コエフォントスタジオ) https://coefont.studio/ を2021年4月23日(金)にリリースしました。 CoeFont STUDIOのリリースを記念し、全サービスを期間限定で無料で公開いたします。終了時期は未定ですが、その間本サービス及び出力した音声データは営利・非営利問わずご自由にご利用いただけます。ぜひ当社の音声テクノロジーを用いた「声のフォント」をお試しください。 CoeFont STUDIO編集画面 アクセント・ヨミ編集 『CoeFont STUDIO』は、DeepLearningにより人間

                                                          「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!
                                                        • VOCALOIDじゃない「初音ミク NT」は利用規約が厳しい? 開発者に聞いた

                                                          クリプトン・フューチャー・メディア(CFM)が開発中のボーカル音源「初音ミク NT」を巡り、Twitter上では5月中旬、試作バージョンのリリースに先駆けて公開された初音ミク NTの規約が厳しいと、ユーザーの間で話題になった。開発者の佐々木渉さんはITmedia NEWSの取材に対し「営利利用しない場合はこれまで通りの使用が可能」と話した。 初音ミク NTの使用許諾には、従来のVOCALOID版初音ミクにはなかった「製品を法人などが営利目的で利用する場合には初音ミクの名前を明示すること」をはじめ、主に営利目的での利用について記述が目立つ。 佐々木さんは取材に対し「タイミング悪く公開してしまい、誤解があったようで申し訳ない」とコメント。「個々のクリエイターにとっては、今までと何ら変わりなく作品を発表できる」と説明した。同人CDでの使用もこれまで通り可能という。 規約を変更した背景について佐々

                                                            VOCALOIDじゃない「初音ミク NT」は利用規約が厳しい? 開発者に聞いた
                                                          • SofTalkが“ゆっくりボイス”対応終了 ライセンス契約で折り合いつかず

                                                            音声読み上げフリーソフト「SofTalk」が、“ゆっくり”などの音声で知られる音声合成エンジン「AquesTalk」への対応を中止した。SofTalkを開発したcnccさんが7月23日に発表した。対応中止の理由は、AquesTalkを提供するアクエスト(神奈川県横浜市)とのライセンス契約に折り合いがつかなかったためとしている。 AquesTalkの音声は、同人サークル「上海アリス幻樂団」が制作する作品群「東方Project」などの二次創作キャラクター「ゆっくり」の声として知られている。SofTalkではAquesTalkの合成音声を利用することができ、SofTalkを利用したさまざまな動画が動画投稿サイトに投稿されている。 cnccさんはSofTalk開発のためにアクエストとのライセンス契約を2015年に更新。これについてcnccさんは「旧ライセンスに比べて冷遇されている」と説明している。

                                                              SofTalkが“ゆっくりボイス”対応終了 ライセンス契約で折り合いつかず
                                                            • オノマトペ(擬音語)から環境音を合成するニューラルネットワーク(Onoma-to-Wave)をPyTorchで実装した - 備忘録

                                                              はじめに 事前準備 ソースコード 実装の概要と動かし方 補助的に作成したモジュールの概要 おまけ:訓練済みモデルのリリース 環境音合成実験 音響イベントによる条件付けなし 音響イベントによる条件付けあり 実装の舞台裏とかTIPS おわりに 参考文献 はじめに 下記の雑誌論文が最近出版された。 Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori and Yoichi Yamashita, "Onoma-to-wave: Environmental Sound Synthesis from Onomatopoeic Words", APSIPA Transactions on Signal and Information Processing: Vol. 11: No.

                                                                オノマトペ(擬音語)から環境音を合成するニューラルネットワーク(Onoma-to-Wave)をPyTorchで実装した - 備忘録
                                                              • 声優・梶裕貴が合成音声化 サンプル動画も公開

                                                                声優の梶裕貴さんは9月3日、合成音声ソフトの開発プロジェクトを発表した。YouTubeやX(旧Twitter)では、梶さんの声を基にした合成音声のサンプルも公開。今後、公式Xアカウントで詳細を案内するという。 サンプルでは平時の声に加え、不機嫌な声や怒った声、ささやき声など、感情を込めた声を出す様子も披露。プロジェクトには、AI歌声合成ソフトを手掛けるテクノスピーチが技術面で協力しているという。 関連記事 音声合成はアナウンサーや声優の仕事を奪うのか? 「AIアナウンサー」など、コンピュータが人間の代わりに音声の読み上げを務める機会が増えている。音声合成はどこまで人間のようにしゃべることができるのか。 AIは歌手の敵か味方か AIシンガー開発者が語る未来 分身がいることが武器になる社会へ AI歌声合成ソフト「CeVIO AI」を開発するテクノスピーチの大浦圭一郎代表は、AIシンガーと歌手の

                                                                  声優・梶裕貴が合成音声化 サンプル動画も公開
                                                                • CeVIO Pro(仮)改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応|DTMステーション

                                                                  6月2日、テクノスピーチが最新のAI技術で人間の歌声をリアルに再現する歌声合成ソフト、VoiSona(ボイソナ)のβ版を無料で公開しました。これは、今年2月に「WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始」という記事で紹介したCeVIO Pro(仮)が名称を変更するとともに、β版へとアップグレードしたもので、ソングエディタとともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属している点も同様です。 CeVIO Pro(仮)でもWindowsとMacに対応するとともにスタンドアロンおよびVSTiプラグインとして動作する形になっていましたが、β版となったVoiSonaではMacのAudio Unitsプラグインにも対応。さらに、MacのM1プロセッサにもネ

                                                                    CeVIO Pro(仮)改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応|DTMステーション
                                                                  • 無料で商用可のAI音声読み上げツール「VOICEVOX」のソング機能が大幅強化/矩形選択・コピー&ペーストなどが可能に。ハミング対応キャラクターも大量追加

                                                                      無料で商用可のAI音声読み上げツール「VOICEVOX」のソング機能が大幅強化/矩形選択・コピー&ペーストなどが可能に。ハミング対応キャラクターも大量追加
                                                                    • litagin/moe-speech · Datasets at Hugging Face

                                                                      Not-For-All-Audiences This repository has been marked as containing sensitive content and may contain potentially harmful and sensitive information. View content

                                                                        litagin/moe-speech · Datasets at Hugging Face
                                                                      • 10秒の歌声を学習し、リアルタイムにその声になれるAIシステム、VocoflexをSynthesizer VのDreamtonicsが発表|DTMステーション

                                                                        いま最先端を行くAI歌声合成ソフトのSynthesizer VやAI音声合成ソフトのVOICEPEAKなどを手掛けるDreamtonicsが、また新たな画期的なシステム、Vocoflexなるものを発表されるとともに、そのベータ版が公開されました。これは人の歌声を10秒程度録音して、その場でAIに学習させると、誰でもその歌声にリアルタイム変換できるというユニークなシステム。WindowsやMacの環境で動かすことができ、マイクに向かって歌えばその場で変換するし、VST/AUのプラグインとしてDAWに挿せば、ボーカルトラックをその学習した人の歌声に変換することができるという、驚くべきソフトです。 単にその10秒程度録音した人の歌声に変換できるだけでなく、AIが歌声を学習し、分析した結果を独特な手法でグラフィック化するUIを採用しているのもユニークな点。その結果、人の歌声の特徴をグラフィックで表

                                                                          10秒の歌声を学習し、リアルタイムにその声になれるAIシステム、VocoflexをSynthesizer VのDreamtonicsが発表|DTMステーション
                                                                        • RVCのWebUIを1から作り直した話|だだっこぱんだ|pixivFANBOX

                                                                          こんにちは、だだっこぱんだです。マイクラのサーバーやってたりエンジニア(わら)だったりします。 経緯 liujing04/Retrieval-based-Voice-Conversion-WebUIのコードがあまりにも汚すぎる。 これがすべての理由です。ほんとに汚いです。読めません。 自分でいろいろ実装したかったのですが、このコードじゃ無理。。。 ...

                                                                            RVCのWebUIを1から作り直した話|だだっこぱんだ|pixivFANBOX
                                                                          • 商用可・無料のAI音声読み上げツール「VOICEVOX」が歌えるように ~ソング機能を搭載/細かい設定を行わなくてもビブラートなどのニュアンスが自動で付加され、自然な歌唱に

                                                                              商用可・無料のAI音声読み上げツール「VOICEVOX」が歌えるように ~ソング機能を搭載/細かい設定を行わなくてもビブラートなどのニュアンスが自動で付加され、自然な歌唱に
                                                                            • DeNAが無料でサービススタート、VOICE AVATAR 七声ニーナの開発裏舞台|DTMステーション

                                                                              ここ1、2年、音声合成や歌声合成が急速に進化し、さまざまなサービスが登場してきていますが、またちょっと違う方向から、スゴいサービスが登場してきました。自分の声をマイクで入力すると、数秒後に女性キャラクターの声になって返ってくる音声変換システム、VOICE AVATAR 七声ニーナ(ボイスアバター・ななこえニーナ)です。5月12日に、突如としてWeb上に誕生し、無料でいくらでも利用できることから、世間を大きく騒がせています。男性でも女性でも、誰がどのようにしゃべっても、声優の高田憂希(@sunflower930316)さんCVの七声ニーナのキャラクタボイスに変換されるというものなのです。 パソコンでもスマホでも、サイトにアクセスしてRECボタンを押してしゃべりかければ、すぐに使えます。そして、その結果を聴けば誰もが驚かされるはず。このシステムはAIを用いて作られているとのことで、それを開発し

                                                                                DeNAが無料でサービススタート、VOICE AVATAR 七声ニーナの開発裏舞台|DTMステーション
                                                                              • 世界最大1万9千時間の音声コーパスと高精度日本語音声認識モデルがオープンソースで公開/商用・非商用を問わず、誰もが自由に利用・改変・再配布可能

                                                                                  世界最大1万9千時間の音声コーパスと高精度日本語音声認識モデルがオープンソースで公開/商用・非商用を問わず、誰もが自由に利用・改変・再配布可能
                                                                                • 無料の音声編集ツール「Audacity」v2.3.3が公開 ~EQがグライコとFilter Curveに分割/M4A(AAC)形式での書き出し時の音声品質設定がファイル保存ダイアログに統合

                                                                                    無料の音声編集ツール「Audacity」v2.3.3が公開 ~EQがグライコとFilter Curveに分割/M4A(AAC)形式での書き出し時の音声品質設定がファイル保存ダイアログに統合