並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 487件

新着順 人気順

音声合成の検索結果281 - 320 件 / 487件

  • AI音声プラットフォーム「CoeFont」、ALS患者様の利用を無償に!声を失ってもまた自分のAI音声で会話できる社会の実現に向けてインフラを提供

    株式会社CoeFont(本社:東京都港区、代表取締役:早川 尚吾、以下当社)は、ALS患者様ならびにご家族、支援団体に向けて、AI音声プラットフォーム「CoeFont」の無料提供を開始致します。 CoeFont_ALS患者様の利用を無性に ■取り組み概要 当社は、今後ALSの症状の進行により、”声を失う可能性のある方々”に対して、AI音声プラットフォーム「CoeFont」(https://coefont.cloud/ )の無料提供を行います。 CoeFontで自分の声を収録することで、声を失った後もスマホやPCから文字入力をすることで、自分の声でテキストを読み上げるAI音声が利用できます。 CoeFontは、従来の1文字ずつ繋げて音声にするサービスとは異なり、AIを活用して本人が話しているような音声が作成でき、実際に会話をしているような体験を提供します。お申し込みは以下のフォームから可能で

      AI音声プラットフォーム「CoeFont」、ALS患者様の利用を無償に!声を失ってもまた自分のAI音声で会話できる社会の実現に向けてインフラを提供
    • バスの「とまります」かと思ったら……「こまります」!? ダイソーの謎商品に「欲しい」の声 声は四国めたん

      困ったときに押す謎のボタン「こまりますボタン」がTwitterで欲しいと話題です。ダイソーで販売されている商品で価格は220円。この発想はなかった。 バスの降車ボタン風の見た目で、「とまります」の音声が流れるかと思いきや、押すと「こまります」の音声が鳴る謎の玩具。本体裏には吸盤付きで、押す部分は「こまります」の文字が光るギミックもついています。 ボタンには「お困りの方はこのボタンを押してください」と書かれており、相手に直接言いにくいときなどに使うとどうにかなる……かもしれません。 ダイソーの「こまりますボタン」 同商品は以前から販売されているものですが、Twitterユーザーのえぐさ(@examplex_)さんが紹介したことで話題に。特に音声として、商用でも利用可能な無料のテキスト読み上げソフトウェア「VOICEVOX」が使われていることに驚きの声が寄せられました。 パッケージには利用のた

        バスの「とまります」かと思ったら……「こまります」!? ダイソーの謎商品に「欲しい」の声 声は四国めたん
      • 【インタビュー】キャラボイス制作のニュースタンダード「FutureVoice Actors」のキーマンに直撃!進化し続ける新時代の音声合成サービスとは | gamebiz

        株式会社NTTドコモ、NTTテクノクロス株式会社、株式会社GADGET(ガジェット)、株式会社アクロス エンタテインメントの4社が発表した音声合成サービス「FutureVoice Actors」(以下、「FVA」)。 アクロス エンタテインメント所属の花江夏樹さんや内田彩さんといった実在する人気声優の声をベースに、本人の声を高いクオリティで再現した次世代の合成音声を扱うことのできるサービスであり、ゲーム開発において期間短縮やコスト削減の可能性に期待されている。 「FutureVoice Actors」 紹介ページ 株式会社サイバードからリリースされている『M-Noah(エムノア)』でも実装されており、従来のアプリとは違った没入感が実現されている。 本記事では、プロジェクト担当者である山崎氏、鳥居氏、浅見氏、原氏(写真左順)にインタビューを実施。「FVA」の立ち上げ経緯や今後の可能性、展望に

          【インタビュー】キャラボイス制作のニュースタンダード「FutureVoice Actors」のキーマンに直撃!進化し続ける新時代の音声合成サービスとは | gamebiz
        • スマートディスプレイって何? 「Google Nest Hub」でできること

            スマートディスプレイって何? 「Google Nest Hub」でできること
          • 商用利用も可能な音声合成ソフト『VOICEPEAK(ボイスピーク)』体験版の紹介&レビュー

            株式会社AHS様から発表されたAI音声合成ソフト『VOICEPEAK(ボイスピーク)』の体験版をお借りし、ソフトの紹介や簡単なレビュー動画を作ってみました。 ※ AHS公式生放送第177回(2022.2.17)を参考にしながら制作しています ▼製品版レビュー動画 https://youtu.be/1hQ5R1Eue5Y ▼AHS公式生放送 第177回(2022.2.17) https://www.youtube.com/watch?v=bGxZtlRhaNs ▼VOICEPEAK体験版 https://www.ah-soft.com/trial/voice.html ▼VOICEVOX https://voicevox.hiroshiba.jp/ ▼チャプター(目次) 00:00 冒頭~動画テーマ 00:33 VOICEPEAKとは? 01:41 調整機能など 03:41 主な用

              商用利用も可能な音声合成ソフト『VOICEPEAK(ボイスピーク)』体験版の紹介&レビュー
            • マイクロソフト AI「りんな」が音声合成に新たに「感情スタイル」を導入、話し声だけではなく歌声にも感情表現を実現 - News Center Japan

              りんな開発チーム AI「りんな」は、ディープラーニング技術の改良により、話し声と歌声に新たに「感情スタイル」を導入しました。りんなの声を音声合成で生成するにあたり、人間の声の表現について、そのニュアンスを学習し表現を再現することを「スタイル」と呼んでおり、今回の「感情スタイル」は、人間の声の感情表現を再現します。 今回、人間が嬉しさ・悲しさを表現する時に出す声のニュアンスを学習し、「嬉しい」「悲しい」という 2 つの感情スタイルをりんなの声に追加しました。また話し声でだけではなく、これまでのポップやバラードなどの音楽的な表現に感情表現を組み合わせた歌声の表現が可能になりました。これら 2 つの感情スタイルの追加によって、より一層聞き手との共感を醸成することを狙いとしています。 アップデートにあたっては、約 2 時間分の「嬉しい」および「悲しい」声をそれぞれデータに用いて学習させています。人

              • 数分間の動画とテキストデータだけで「オンライン講座」を制作可能に NTTドコモとドコモgacco

                数分間の動画とテキストデータだけで「オンライン講座」を制作可能に NTTドコモとドコモgacco:AI活用で動画制作を効率化 NTTドコモとドコモgaccoは、AI技術を活用して大規模公開オンライン講座を制作した。講師が話している数分程度の動画の「口の動き」に、テキストから生成した音声データを重ね合わせることで講師本人が話しているような講義動画を自動生成したという。

                  数分間の動画とテキストデータだけで「オンライン講座」を制作可能に NTTドコモとドコモgacco
                • 3月1日開幕! 合成音声ソフトウェア文化の祭典「#まとめて感謝祭」|ニコニコインフォ

                  2022年3月1日(火)~31日(木)の期間、あらゆる合成音声ソフトウェアを用いた動画作品の投稿祭を開催します。 日夜、合成音声ソフトウェアを利用した動画を公開されているクリエイターの皆さま、ありがとうございます。 ニコニコの中で創作の連鎖反応やコミュニケーションを発生させている、料理や解説、ゲーム実況、寸劇などの動画と、それを支える合成音声ソフトウェアたちへの感謝の気持ちを込めて、今回のイベントを実施いたします。 合成音声ソフトウェアにはVOICEROIDやA.I.VOICE、SofTalk(AquesTalk、ゆっくり〇〇などで利用されるソフト)、CeVIO、CeVIO AI、VOICEVOX、CoeFont、ガイノイドTalk、音街ウナTalk EX、COEIROINK、TALQuなどがあります。 一方で、合成音声ソフトウェア全体を指し示す言葉はまだ定着していないため、「ボイロとかA

                    3月1日開幕! 合成音声ソフトウェア文化の祭典「#まとめて感謝祭」|ニコニコインフォ
                  • 声優並に超リアルな演技ができるボイスロイドが登場しつつある - ナゾロジー

                    声優並に超リアルな演技をするボイスロイドの動画公開された音声読み上げソフトには「Breath(いきづかい)」を簡単に挿入でいる / Credit:Why Obsidian uses AI voices for game development | Sonantic現在、インターネット上にはテキストとして打ち込んだ文字を読み上げてくれる「音声読み上げソフト」で作られた膨大な数の動画が存在します。 読み上げソフトを用いることで、作者は動画の内容を人の声を通して伝えることができるようになりました。 また複数のソフトを利用することで、キャラクター同士の会話も可能になり、動画の演出に人間同士の会話のようなテンポを生み出すことが可能になります。 かつての読み上げソフトは機械音声まる出しの違和感ある声しか出すことができませんでしたが、ここ10年あまりの技術進歩により、より人間の声質に近い表現が行えるよう

                      声優並に超リアルな演技ができるボイスロイドが登場しつつある - ナゾロジー
                    • MYukkuriVoice

                      MYukkuriVoice 動画作成用ゆっくりボイス App for Mac OSX. Download Latest Version Help View on GitHub MYukkuriVoice MYukkuriVoiceは、AquesTalk を利用した Mac OSX 向けの 動画制作向けに調整された合成音声生成アプリケーションです。 入力した日本語メッセージから音声ファイルを作成できます。 macOSX El Capitan (10.11)、macOS X Sierra (10.12)、および、 macOS High Sierra(10.13)以降に対応しています。 本ソフトは、(株)アクエストの音声合成ライブラリ AquesTalk を使用しており、その著作権は同社に帰属します。 本ソフトを営利目的で使用する場合は当該ライブラリの使用ライセンスが必要となります。ご注意くださ

                      • 【梵そよぎ】そよぎフラクタル公式【梶裕貴 音声AIプロジェクト】

                        梶裕貴の声を元にした音声合成ソフト『梵そよぎ(そよぎそよぎ)』を軸に展開するキャラクタープロジェクト。「プロアマ問わず、面白いものを作りたいと思った人が、しがらみなく、気の合う仲間と好きなものを作れる場所づくりをしたい」という想いから、梶裕貴自身が企画立案。 幾何学模様(=フラクタル)の図形のように「同じ理想を持ったクリエイターが集まって作品を生み出していった結果、俯瞰で見てみると、これまでにない全く新しい形を織りなしているはず」という、創作ユニットとしての理想形を願い、誕生したプロジェクト。 梶裕貴の声を元にした音声合成ソフト『梵そよぎ(そよぎそよぎ)』を軸に展開するキャラクタープロジェクト。「プロアマ問わず、面白いものを作りたいと思った人が、しがらみなく、気の合う仲間と好きなものを作れる場所づくりをしたい」という想いから、梶裕貴自身が企画立案。 幾何学模様(=フラクタル)の図形のように

                          【梵そよぎ】そよぎフラクタル公式【梶裕貴 音声AIプロジェクト】
                        • CoeFont、AI音声に感情を纏わせる機能を一般ユーザー向けに提供開始

                          CoeFont、AI音声に感情を纏わせる機能を一般ユーザー向けに提供開始一般ユーザーの優れた喜怒哀楽の感情を表現したCoeFontを選出する、SNS投稿型キャンペーン「CoeFont Fes2022」も開催へ 株式会社CoeFont(本社:東京都港区、代表取締役:早川 尚吾、以下当社)が提供するAI音声プラットフォーム「CoeFont」は、AI音声で”喜怒哀楽の感情”を表現できる機能を2022年1月6日(木)より、一般ユーザーに向けて提供開始いたします。また、このたびの機能リリースを記念して、一般ユーザーが収録した喜怒哀楽の感情表現をしたCoeFontの中から、優れたCoeFontを選出し表彰する、SNS投稿型キャンペーン「CoeFont Fes2022」を2022年1月6日(木)から1月27日(木)までの期間で実施いたします。当期間中は、CoeFontの収録が無料開放となります。 ■一般

                            CoeFont、AI音声に感情を纏わせる機能を一般ユーザー向けに提供開始
                          • Mac上にVOICEVOX Engineを立てて自宅ネットワークに音声合成サーバを用意する - Qiita

                            自宅のローカルネットワーク上にて汎用サーバーやビルドマシンとして使っているMac miniに、VOICEVOX Engineの音声合成サーバーを立ててみたので、その時の手順をまとめました。 経緯 最近、ChatGPT周りのAPIを触っていたら、文章の読み上げをしたくなってきました。もともとVOICEVOXが良さそうなことを聞いていたので利用してみることにしました。 まず、VOICEVOXを利用する上で、自分のニーズは以下でした。 細かいクエリ調整は一旦置いておいて、趣味で作る各種アプリとかで簡易的な読み上げを行いたい 最近ずんだもんをYouTubeでよく見る。かわいい。ずんだもんにしゃべらせたい また、いくつか試している中でパフォーマンス的な問題もでました いつもの作業用PCはMacBook ProなのでVOICEVOXをGPU版で起動できず、音声合成にかかる時間が結構厳しい Docker

                              Mac上にVOICEVOX Engineを立てて自宅ネットワークに音声合成サーバを用意する - Qiita
                            • AmadeuSY

                              最新のAI技術を駆使したAI歌声合成ソフトです。 歌詞付き楽譜を入力することで本人の歌い方の癖や ビブラート、こぶしなどが自動で入ります。 最低1曲の音声ファイルを準備し学習するだけで 比較的品質の良い音声モデルを作成できます。 また、学習前のラベリングもAIが自動で行っております。

                                AmadeuSY
                              • 声優・内海賢二さん、没後10年の節目にAI音声化 夏目漱石など名作文学を朗読

                                アニメ『北斗の拳』ラオウ役などで知られ、2013年に亡くなった声優・内海賢二さん。このほど、内海さんの声が生前の音源をもとに「AI音声」で再現され、日本の名作文学の序章を朗読した音声コンテンツが配信された。 【写真】その他の写真を見る 電子書籍ストア「Reader Store」で独占配信される、AI音声の朗読付き電子書籍「YOMIBITO Plus(ヨミビト・プラス)」のコンテンツとしてリリースされたもので、夏目漱石の小説『吾輩は猫である』『坊っちゃん』の冒頭部分や、宮沢賢治の詩『雨ニモマケズ』が朗読されている。 YOMIBITO公式YouTubeチャンネルでは「YOMIBITO Plus」の制作過程を追ったメイキング映像を公開。今回は内海さんのほかに、小西克幸、梅田修一朗もAI音声化にチャレンジしており、それぞれ声のサンプルを収録し、合成していく様子などが記録されている。 内海さんの息子

                                  声優・内海賢二さん、没後10年の節目にAI音声化 夏目漱石など名作文学を朗読
                                • ドワンゴ開発のAIボイスチェンジャー搭載「Seiren Voice 結月ゆかり」と「Seiren Voice 琴葉 茜・葵」 2022年4月発売決定 ~3月27日、「ボイスコネクト2」でデモを実施~

                                  ドワンゴ開発のAIボイスチェンジャー搭載「Seiren Voice 結月ゆかり」と「Seiren Voice 琴葉 茜・葵」 2022年4月発売決定 ~3月27日、「ボイスコネクト2」でデモを実施~ 株式会社ドワンゴ(本社:東京都中央区、代表取締役社長:夏野剛)および株式会社エーアイ(本社:東京都文京区、代表取締役:吉田大介)は、両社が共同開発した声変換ソフトウェアシリーズ「Seiren Voice 結月ゆかり」と「Seiren Voice 琴葉 茜・葵」を発売することをお知らせします。 ​ 「Seiren Voice(セイレンボイス)」は、ドワンゴの機械学習技術の開発・研究部門「Dwango Media Village」が独自開発した声変換技術です。本技術は、リアルタイム性ではなく自然で高品質な声変換に主眼を置き、音声を「音素」「音高」「発音タイミング」に分解し、それらのデータを基に目標

                                    ドワンゴ開発のAIボイスチェンジャー搭載「Seiren Voice 結月ゆかり」と「Seiren Voice 琴葉 茜・葵」 2022年4月発売決定 ~3月27日、「ボイスコネクト2」でデモを実施~
                                  • ChatGPTとUnityでキャラクター対話システムを構築した - Qiita

                                    はじめに お気に入りキャラクターとおしゃべりできるものを作りました。 このようなシステムは他の人がTwitterでも作っていて二番煎じなのですがどんなものを組み合わせて作ってるのかだったりを書こうと思います。 使用技術など デバイス Looking Glass Portrait 裸眼立体視ディスプレイです。(公式サイト) このディスプレイがなくても対話システムは作れます。でも裸眼立体視ってロマンがあって、女の子をいろんな方向から見れるのは嬉しいですよね! アセットなど DynamicBone 髪の毛や胸が揺れるアセットです。(アセットストアページ) 髪の毛が揺れるのは嬉しいことなので使います。 OVRLipsync Oculusが作ったオーディオデータから口パクを作るアセットです。(公式サイト) 対話するのに口が動かないのは致命的なので使います。 DictationRecognizer 音

                                      ChatGPTとUnityでキャラクター対話システムを構築した - Qiita
                                    • VOICE AVATAR 七声ニーナのリリースまでを振り返る - DeNA Design

                                      こんにちは、ディレクターの樋口です。 デザイン本部 マーケティングデザイン部でディレクターのグループのマネージャーをしています。 ​ このエントリーでは先日リリースされた『VOICE AVATAR 七声ニーナ』(以下、七声ニーナ)について、ディレクター・マネージャーの立場としてプロジェクトへの参加からリリースまでを振り返りたいと思います。 ​ おかげさまでSNSでも話題になり多くの方にご利用いただけていますが、その裏では苦節もあり、意外と地味な調整などもしていました…という話になります! 目次 プロジェクトスタートのきっかけ 当初はアサインの相談を受けただけのはずだった KPTの振り返りで悪い流れを断ち切り新体制へ 共通のゴールを目指せすためのアウトプットを生み出す そしてリリースへ ​ プロジェクトスタートのきっかけは、DeNAの社内制度であるDeligt Boardでした。 Delig

                                        VOICE AVATAR 七声ニーナのリリースまでを振り返る - DeNA Design
                                      • Google's AI Clones Your Voice After Listening for 5 Seconds! 🤐

                                        ❤️ Check out Weights & Biases here and sign up for a free demo: https://www.wandb.com/papers The shown blog post is available here: https://www.wandb.com/articles/fundamentals-of-neural-networks 📝 The paper "Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis" and audio samples are available here: https://arxiv.org/abs/1806.04558 https://google.github.io/tacotr

                                          Google's AI Clones Your Voice After Listening for 5 Seconds! 🤐
                                        • GitHub - uthree/auris: AI based singing voice synthesis

                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                            GitHub - uthree/auris: AI based singing voice synthesis
                                          • つくよみちゃん公式サイト | 商用利用もOKなフリー素材キャラクター

                                            「つくよみちゃんプロジェクト」企画者の夢前黎(ゆめさき れい)と申します。 作曲、文芸、声優、漫画制作、アプリ開発、キャラクターデザインなど、幅広い活動を行うマルチクリエイターです!

                                              つくよみちゃん公式サイト | 商用利用もOKなフリー素材キャラクター
                                            • 東北家が出した「マルチモーダルDB」って要するに何だ? 本家に聞いてきた

                                              先日、東北イタコの話声データベースが公開されましたね。東北イタコはこの前も歌唱DBがリリースされるなど、研究用素材の提供に余念がありません。 前回の歌唱DBはその名の通り歌声WAVEを集めたものでしたが、今回のデータベースは「マルチモーダルDB」という名前がついています。単なる話声DBではないんですね。 おそらく多くの人は「マルチモーダル」という言葉を知らないと思いますので、今回はリリースされたDBの特徴や使い道について、DB構築に携わった九州工業大学の齊藤剛史先生に訊いてみました。 DBに含まれるのは大まかに分けて以上の4種のデータです。 話声.wavは、声優さんの話声を収録した音声(約1GB)です。 音声ラベル.labは「X秒からY秒までが音素[k]、Y秒からZ秒までが音素[a]」といった発声タイミングを記録したデータです。 この2種類だけならシンプルな話声DBになります。マルチモーダ

                                                東北家が出した「マルチモーダルDB」って要するに何だ? 本家に聞いてきた
                                              • VVV MUSIC LIVE

                                                VVV MUSIC LIVE 「VVV MUSIC LIVE(ブイスリー ミュージック ライブ)」(略称:ブイスリー)は、今回が初開催となる、世界最大級の音声合成キャラクターフェス! 総勢30名を超える音声合成キャラクターたちが、特設ステージでライブパフォーマンスやトークセッションを披露する、オンライン配信形式のバーチャル音楽ライブです。 ※VVV MUSIC LIVE配信は、第1部(前半パート)第2部(後半パート)に分かれて配信されます。 オンライン視聴チケット(共通)一枚で、第1部と第2部どちらも視聴いただけます。 ※クラウドファンディングにて6,000円以上のコースに支援された方は、リターン内容に本公演の視聴チケットが含まれております。 誤って重複して購入されないようご注意ください。 日程2023年6月25日(日) 【第1部】13:00 開演 【第2部】16:30 開演 チケット価格

                                                  VVV MUSIC LIVE
                                                • 音声読み上げソフト「SofTalk」、ゆっくりボイスとのライセンス交渉が決裂 | スラド IT

                                                  SofTalkが“ゆっくりボイス”対応終了 ライセンス契約で折り合いつかず(Itmedia NEWS)、SofTalkをご利用の皆様へのお知らせによると、ゆっくりボイスとして知られるSoftTalkが音声合成エンジンであるAques Talkへの対応を終了し、SoftTalk自体も開発を休止する。原因は開発元のcncc氏とAques Talkの開発元のAquestとのライセンス交渉決裂で、2015年に更新したライセンスにcncc氏側が不満があったこと、今回のライセンス更新交渉において「もっとおしゃれな店がいい」とAquest側から要求されたことから、袂を分かつ決断となったとのこと。 そもそも、Aques Talkは各種機器に音声案内機能を組み込む目的で開発され、一定の地位を築いていることから、ゆっくりとしての使用を認めるメリットがなくなっている背景もあるようだ。なお、Aques Talk登

                                                  • End-to-End音声処理ツールキットESPnetの紹介 - Qiita

                                                    以下の内容は、2019年12月時点での最新バージョンであるESPnet Version 0.6.0の内容に基づいています。 はじめに 名古屋大学でポスドクをやりながら、株式会社Human Dataware Labで働いている林知樹 (@kan-bayashi)と申します。 音信号処理に関わる研究をしています。好きなエディタはVim / Neovimです。 今日は、私が開発に参加しているEnd-to-End音声処理ツールキットESPnetについて簡単に紹介したいと思います。 ESPnetとは? ESPnetは、End-to-End (Sequecne-to-Sequence)モデルに特化したオープンソースの音声処理ツールキットです。 ジョンズ・ホプキンス大学の渡部晋治氏をリーダーとして、様々な大学や研究機関、企業に属する日本人が中心となり開発を進めています。 ありがたいことに、既に様々な海外

                                                      End-to-End音声処理ツールキットESPnetの紹介 - Qiita
                                                    • 音声合成系イベント開催情報まとめサイト

                                                      ics形式でも配信しています Googleカレンダー等への追加には以下のURLを使用してください。 https://vo.nrsy.jp/event-schedule.ics Googleカレンダーへの追加方法(PC) Googleカレンダーを開きます 左メニューの「他のカレンダー」横にある「+」ボタンをクリックします 「URL で追加」をクリックします 「カレンダーの URL」に上述のURLを入力します 「カレンダーを追加」をクリックすると同期が始まります スマホでの追加方法 上のボタンをタップすると許可を求めるダイアログが表示され「許可」を押すと追加できます。 イベントの掲載基準について Web上で日程が一般公開されている同人誌即売会を掲載しています。 即売会以外のイベントは、近郊の即売会にあわせて開催されるイベントのみ掲載しています。 Webオンリーなど実地開催しないイベントは掲載し

                                                        音声合成系イベント開催情報まとめサイト
                                                      • 京都市広報キャラクター「京乃つかさ」のキャラクターボイスに「VOICEPEAK 商用可能 6ナレーターセット」が採用

                                                        京都市広報キャラクター「京乃つかさ」のキャラクターボイスに 「VOICEPEAK 商用可能 6ナレーターセット」が採用 株式会社AHS(東京都台東区、代表取締役 兼 CTO:フア カンル)から発売している入力文字読み上げソフト「VOICEPEAK 商用可能 6ナレーターセット」に収録されている音声「女性1(声優:若守みづき)」が京都市広報キャラクター「京乃つかさ」(※1)のキャラクターボイス(CV)として採用されました。 「京乃つかさ」は、京都市の広報紙「きょうと市民しんぶん」の広報キャラクターとして産み出されました。今では市民しんぶんだけでなく京都市の啓発事業の告知ポスターに登場。また、「京都国際マンガ・アニメフェア(京まふ)2022」のメインビジュアルになるなど京都市内で幅広く活躍しています。 今まではイラストのみの登場でしたが、「“しゃべる”京乃つかさ」の第1弾として、市政PR企画「

                                                        • Tacotron2で始める日本語音声合成 - Qiita

                                                          はじめに 最も気になるのはやはりどの程度のものができるのかだと思うので、まずはこちらをお聞きください。 このモデルは pre-trained model を使用した転移学習 約一時間の前処理済みのデータ WaveGlow (published model) で学習、推論しています。 これから始める方の参考になるように私のやり方を紹介します。 Tacotron2についてはこちらが参考になります。 Tacotron2を用いた日本語TTS(Text-to-Speech)の研究・開発【まとめ】 ※デモを既に動かしていることを前提としています。 用意するもの 音声ファイル 22050Hz 16bit モノラル wav 音声区間毎に分割 ノイズが多いもの、笑い声等のテキストにしづらいものは除外します。 長過ぎるものは学習時にメモリエラーが出ることがあります。私は10秒以内のもののみにしています。 テキ

                                                            Tacotron2で始める日本語音声合成 - Qiita
                                                          • コナン君に「#歌わせてみた」流行曲、実はAI偽音声…困惑する声優たち「対処しようがない」

                                                            【読売新聞】 生成AI(人工知能)を使い、声優らの偽音声を作り出して無断利用した動画がSNSに投稿される事態が相次ぎ、当事者らに不安が広がっている。勝手に曲を歌わせたり、文章を朗読させたりしていて、専門家らは、権利の保護や悪用防止の

                                                              コナン君に「#歌わせてみた」流行曲、実はAI偽音声…困惑する声優たち「対処しようがない」 
                                                            • データのアライメントも学習するEnd-To-End新音声合成、EATS!

                                                              3つの要点 ✔️ 真のEnd-to-Endに近づいたDeepMindの新音声合成方式 ✔️ テキストと音声のアライメントを自動で学習可能に ✔️ GAN識別器を使った巧妙な損失関数設計 End-to-End Adversarial Text-to-Speech written by Jeff Donahue,Sander Dieleman,Mikołaj Bińkowski,Erich Elsen,Karen Simonyan (Submitted on 5 Jun 2020) Comments: Published by arXiv Subjects: Sound (cs.SD); Machine Learning (cs.LG); Audio and Speech Processing (eess.AS) はじめに DeepMindからまた新しい音声合成が出ました! すごいの? もうT

                                                                データのアライメントも学習するEnd-To-End新音声合成、EATS!
                                                              • AI技術の祭典「AI EXPO」にAI音声合成「CoeFont」が出展!「AIの音声合成で広がる声の世界」

                                                                AI技術の祭典「AI EXPO」にAI音声合成「CoeFont」が出展!「AIの音声合成で広がる声の世界」 株式会社Yellstonは本日10月27日から29日まで開催される全国のAI技術が集まる「AI EXPO」にて当社のサービス「CoeFont」のブースを出展いたします。 株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は本日10月27日から29日まで開催される全国のAI技術が集まる「AI EXPO」にて当社のサービス「CoeFont」のブースを出展いたします。「AIの音声合成で広がる声の世界」というテーマでAI音声合成の可能性を全世界に発信いたします。 当社は本日10月27日から29日まで開催される全国のAI技術が集まる「第2回 AI・人工知能 EXPO 秋」にて当社のサービス「CoeFont」のブース「AIの音声合成で広がる声の世界」を出展いたします。 AI

                                                                  AI技術の祭典「AI EXPO」にAI音声合成「CoeFont」が出展!「AIの音声合成で広がる声の世界」
                                                                • Unityに最適化した音声デコードライブラリを自作する上で工夫したこと - Activ8 Tech Blog

                                                                  こんにちは、エンジニアリングマネージャーの渡辺(@mochi_neko_7)です。 今回はUnityで音声データをランタイムでデコード/エンコードするライブラリを作った話を紹介します。 先日、OpenAIのChatGPTやWhisperをWebAPIで利用できるようにする話を記事で紹介しました。 synamon.hatenablog.com この延長として、ChatGPTで生成した会話をVOICEVOXやCOEIROINK、Koeiromapなどの音声合成サービスに渡して音声化をしていました。 こういったUnityの外側との音声データのやり取りをする際には、どうしてもランタイムでの音声データの変換処理をする必要が出てきます。 その際に手軽に利用できるライブラリを趣味で開発しました。 github.com こちらの紹介を簡単にしつつ、Unityにおける実装の工夫や使用リソースの最適化などのポ

                                                                    Unityに最適化した音声デコードライブラリを自作する上で工夫したこと - Activ8 Tech Blog
                                                                  • https://twitter.com/izumisatoshi05/status/1641406680545234944

                                                                      https://twitter.com/izumisatoshi05/status/1641406680545234944
                                                                    • Voidol無償配布開始と音宮姉妹Projectスタートのお知らせ

                                                                      お待たせいたしました。 Voidol無償配布がはじまりました。 以下ショップよりダウンロードできます。 ぜひ体験してみてください。 ※ライセンス供給が追いつかず、一時的に販売を停止させていただくことがございます。 ご了承ください。 Windows版 Voidol無償配布に関するよくある質問はこちら。 音宮姉妹Projectが始動します。 弊社キャラクターである音宮いろは、音宮うららを もっとよく知ってもらうためのプロジェクトです。 第1弾として、Twitterを開設しました。 姉のいろはと妹のうららの何気ない会話を通じて 彼女たちの空気感を楽しんでもらいつつ、 みなさまとの交流を深めていけたらいいなと考えております。 また、キャラクターページも公開しましたので、 合わせてチェックいただけると幸いです。

                                                                        Voidol無償配布開始と音宮姉妹Projectスタートのお知らせ
                                                                      • トップページ | Voice Track Maker

                                                                        Voice Track Makerは、テキストの読み上げ機能と、自分の抑揚を真似て読み上げさせる韻律射影機能を搭載した音声合成作成ソフトです。 入力したテキストから音声ファイルを作成し、人が発話しているような自然な抑揚を作り込むことが可能です。

                                                                        • Linux × Node.js × voicevoxで音声読み上げ

                                                                          タイトルの通りvoicevoxとnode.jsを使って音声読み上げをさせます。 コード 最初に結論のコードを載せます。どーん import fetch from "node-fetch"; import fs from "fs" const text = "おはようございます" const res = await fetch(`http://localhost:50021/audio_query?text=${text}&speaker=0`, { method: "POST", headers: { 'Content-Type': 'application/json' } }) const query = await res.json() const sound_row = await fetch(`http://localhost:50021/synthesis?speaker=0&e

                                                                            Linux × Node.js × voicevoxで音声読み上げ
                                                                          • 【#加山雄三監修】若大将ザ・ベスト|001「シングルベッド」シャ乱Q【#名曲カバー】

                                                                            「バーチャル若大将」はじめての企画「若大将ザ・ベスト」は、加山雄三が選曲・監修し、バーチャル若大将が日本のベストソングをカバーしていくYoutubeチャンネル。 まずは加山雄三が昨年12月に出したアルバム「DEDICATED to KAYAMA YUZO」参加アーティストたちに感謝を込めて、そのアーティストたちの代表曲をカバーしていく。 記念すべき一曲目は、シャ乱Qの「シングルベッド」。 ※ 制作はすべてAI ※ 歌唱、ナレーション、ビジュアル、リリックビデオ、その全てがAIが生成 ~~~~~~~~~~~~~~~~~~~~~~~~~ ▼本体加山雄三より つんく♂君、いつもありがとね!また寿司でも食いに行こうや😁 加山雄三 ~~~~~~~~~~~~~~~~~~~~~~~~~ 企画:株式会社 加山プロモーション( http://www.kayamayuzo.com/ ) 運営・

                                                                              【#加山雄三監修】若大将ザ・ベスト|001「シングルベッド」シャ乱Q【#名曲カバー】
                                                                            • 「Voidol for iOS - Powered by リアチェンvoice -」をリリース

                                                                              iPhoneユーザー様の声を人気キャラクターの声にAIリアルタイム声質変換。昨年の発売以来、多くのユーザー実績を持つ、macOS、Windows版アプリ(Mac App Store有料カテゴリ初登場1位、Amazon.co.jp PCソフトダウンロードストア売れ筋ランキング初登場1位)がiOS版のVoidol for iOSとなって新登場! (Voidol for iOS - Powered by リアチェンvoice -) クリムゾンテクノロジー株式会社(本社:東京都世田谷区、代表取締役:飛河 和生)は、画像にCGキャラクターを用いたYouTuberや、ゲーム実況中継、ボイスチェンジチャットなど様々なコンテンツ制作での活用を想定したAIリアルタイム声質変換ソフトウェア、「Voidol for iOS - Powered by リアチェンvoice -」 (以下Voidol)を2020年5

                                                                                「Voidol for iOS - Powered by リアチェンvoice -」をリリース
                                                                              • VOICEVOX ENGINE(API)のスループット検証 - Qiita

                                                                                こんにちは。最近、ChatGPT×VRM 3Dモデル×VOICEVOXで性格・見た目・声をカスタマイズできるAIアシスタントアプリを開発・運営しているうえぞうと申します。 今回、このアプリの3大要素の一つである声を担うVOICEVOXのAPIサーバーの運用が結構大変だったので、その知見を還元することで少しでもコミュニティーに貢献したいと思いこの記事を書きました。 諸々の工夫についてはまた別途記事化するとして、本記事では企画段階で知っておくべきスループットの特徴についてシェアしたいと思います。 検証内容 まずは手元のPC(MacBook Pro 2020 / Core i7 論理8コア / 32GB RAM)で多重度の検証、その後一般的なAWSのサーバーでその処理時間を計測してみます。みなさんがVOICEVOXを利用したサービスを展開される際、一つの目安にしていただけるかと思います。 環境準

                                                                                  VOICEVOX ENGINE(API)のスループット検証 - Qiita
                                                                                • AI音声プラットフォーム「CoeFont」、小説投稿サービス『ノベルバ』アプリの「ボイスノベル」機能に導入

                                                                                  AI音声プラットフォーム「CoeFont」を提供する株式会社CoeFont(本社:東京都港区、代表取締役:早川 尚吾、以下当社)は、株式会社ビーグリー(本社:東京都港区、代表取締役:吉田仁平、東証プライム:3981)が提供する小説投稿サービス『ノベルバ』(https://novelba.com/)が、2022年11月1日(火)より提供開始する、投稿した小説を誰でも簡単にオーディオブック化できる「ボイスノベル」機能において、AI音声プラットフォーム「CoeFont」が導入されたことをお知らせします。 AI音声プラットフォーム「CoeFont」、小説投稿サービス『ノベルバ』アプリの「ボイスノベル」機能に導入 URL: https://novelba.com/voice-novel 小説投稿サービス『ノベルバ』の新機能「ボイスノベル」とは 小説投稿サービス『ノベルバ』の新機能「ボイスノベル」は、

                                                                                    AI音声プラットフォーム「CoeFont」、小説投稿サービス『ノベルバ』アプリの「ボイスノベル」機能に導入