並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 296件

新着順 人気順

音声合成の検索結果41 - 80 件 / 296件

  • 小岩井ことりさん作詞・作曲・歌唱のDB公開で、AI歌声合成の民主化へ躍進。NEUTRINOの新キャラクタ『No.7』がリリースへ|DTMステーション

    NEUTRINO、CeVIO AI、Synthesizer V……と、まるで人間のように歌う、AI歌声合成の世界が賑わっていますが、今年この世界がさらに大きく変わる可能性が出てきました。一般ユーザーが自分の声を収録し、それを元にAI歌声合成をするための統一した楽曲の規格を作り、公開されることになったのです。その仕組みづくりに貢献したのが、声優であり、マルチクリエイターでもある小岩井ことり(@koiwai_kotori)さん。AI歌声合成のために、小岩井さんが作詞・作曲するとともに、自ら歌唱したデータ、計50曲が公開されることとなり、それをテンプレートにして歌えば、それぞれのAI歌声合成ができる世界が実現できることになりそうなのです。 そのプロトタイプとなる小岩井さんの歌唱データベースが公開に向けて、準備を進めているところですが、正式公開前に、実際に歌わせることができるソフトであるNEUTR

      小岩井ことりさん作詞・作曲・歌唱のDB公開で、AI歌声合成の民主化へ躍進。NEUTRINOの新キャラクタ『No.7』がリリースへ|DTMステーション
    • 声優に「録音した音声でAIに合成音声を生成させることを認める」契約を迫るケースが増加、声優や組合からは反対の声

      ゲームやアニメに声を吹き込む声優が、「AIで自分の声を再現する合成音声を生成することを認める」という条項を含む契約書にサインを求められるケースが増えていると、アメリカの声優や組合がIT系ニュースサイトのMotherboardで訴えています。声優たちは、こうした契約がまん延することで声優業界全体が大きなダメージを受ける可能性を危惧しています。 ‘Disrespectful to the Craft:’ Actors Say They’re Being Asked to Sign Away Their Voice to AI https://www.vice.com/en/article/5d37za/voice-actors-sign-away-rights-to-artificial-intelligence AIで声を再現する技術は急速に進歩しており、個人でも本人の音声データを学習させた

        声優に「録音した音声でAIに合成音声を生成させることを認める」契約を迫るケースが増加、声優や組合からは反対の声
      • なりきりひろゆきメーカー | ひろゆきになりきって色々喋っちゃおう!

        ひろゆきになりきって色々喋っちゃおう!!

          なりきりひろゆきメーカー | ひろゆきになりきって色々喋っちゃおう!
        • https://twitter.com/buffett_code/status/1605488460659392514

            https://twitter.com/buffett_code/status/1605488460659392514
          • 1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応

            音声合成ソフトの開発と販売を手掛けるAHS(東京都台東区)は2月17日、AI技術により人間らしいトーク音声を合成できるソフトウェア「VOICEPEAK 商用可能 6ナレーターセット」を3月11日に発売すると発表した。価格は1万5800円からと安価だが、追加の許諾を得なくても商用利用できる。対応OSはWindows、MacOS、Linux。 音声合成エンジンは、AI歌声合成ソフト「Synthesizer V」を開発したDreamtonics(東京都台東区)が開発。文章を入力すると、AIが文脈などを基に人間らしく読み上げる。イントネーションや読み上げ速度、感情表現の変更などのコントロールも可能。 同社製の個人向け・商用利用ライセンス別売の製品は1キャラクターで1万円前後のものが多いが、本ソフトには男性3種類、女性3種類、女の子1種類の計7音源が付属。価格は初回限定版が1万5800円、割引なしの

              1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応
            • 無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力

              市販の歌声合成ソフトとして、ヤマハのVOCALOIDとともに独自の歴史を刻んできた「CeVIO」が1月29日、登場から8年を前に大きく進化。深層学習の技術を取り入れ「CeVIO AI」として、開発元のテクノスピーチが発売した。まずはその歌声を聴いてほしい。 これは、ソフト上で楽譜を打ち込んで再生ボタンを押しただけで出力された音声だ。それだけでこのように人間らしい歌声が出力できる。「しゃくりあげ」や「ビブラート」といった歌唱表現も勝手に付く。メインボーカルとして起用するにはもう少し調整が必要だが、作曲中の仮歌に使うなら文句のないクオリティーになっている。人間らしい歌声を合成するまでの時間が短いため、作業を迅速に進められるのがメリットの一つだ。 CeVIO AIリリースまでの道のり CeVIOは2013年公開のWindows専用音声/歌声合成ソフト。名古屋工業大学が長年研究しているHMM(隠れ

                無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力
              • 男性が喋っても女性の声になるリアルタイムAIボイスチェンジャー「MMVC」でずんだもんなどがサポート

                  男性が喋っても女性の声になるリアルタイムAIボイスチェンジャー「MMVC」でずんだもんなどがサポート
                • アップル、iPhoneやMacが自分そっくりのAI生成声で話す「Personal Voice」発表。学習もローカルで完結(CloseBox) | テクノエッジ TechnoEdge

                  AIを活用して声を学習し、本人そのままの高精度な声で生成する技術がここ数カ月で大きく進化しています。 RVCというAIボイスチェンジャー機能は、岸田首相の声真似を本人の前でデモするまでになり、AIフェイクボイスの問題が一部で取り沙汰されるようにもなりました。 そんな中、アップルがAIを使った人声の学習・生成機能「Personal Voice」を今年下半期のOSアップデートで提供すると発表しました。 iPhone、iPad、そしてAppleシリコンを搭載したMacで15分、ランダムに表示される150の文章を読み上げるだけで自分の声を学習することができ、テキストをタイプすると自分そっくりな声で相手に伝えることが可能になります。ただし、当初は英語のみです。 テキストした文章を音声化する機能(TTS、Text To Speech)をアップルは「Live Speech」という新機能で提供。これまでは

                    アップル、iPhoneやMacが自分そっくりのAI生成声で話す「Personal Voice」発表。学習もローカルで完結(CloseBox) | テクノエッジ TechnoEdge
                  • “ AIで亡き妻の歌声を再現”した作品がAIアートグランプリに | NHK

                    人工知能=AIを使って制作した動画や漫画などの作品を表彰するコンテストが東京・秋葉原で開かれ、亡くなった妻の声などをAIで再現して歌を歌わせた東京都のクリエイターの動画がグランプリに選ばれました。 AIをめぐっては、簡単な命令でテキストや画像など生成してくれる「生成系AI」と呼ばれる新しいタイプのものが次々と登場するなど、ビジネスやアートなどさまざまな分野に利用が広がっています。 「AIアートグランプリ」は、CGクリエイターや研究者などの有志で作る実行委員会が初めて開催したもので、東京の秋葉原で開かれた最終審査会では、AIを使って制作した動画やゲーム、漫画などの279の応募作品から、1次審査を通過した動画と漫画の5作品の審査が行われました。 その結果、グランプリには、東京都のクリエイター松尾公也さんの動画「Desperado by 妻音源とりちゃん[AI]」が選ばれました。 この作品は、亡

                      “ AIで亡き妻の歌声を再現”した作品がAIアートグランプリに | NHK
                    • 無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場

                      人間ではなくプログラムによって特定のテキストを読み上げさせる音声合成ソフトは数多く存在しています。ソフトに使われる音声合成エンジンにはさまざまな種類があり、複数の音声合成エンジンや音声ライブラリを使うことができる汎用合成音声エディタ「ユニコエ」をビスさんが公開しています。 ユニコエ 公式サイト https://sites.google.com/view/unicoe/%E3%83%9B%E3%83%BC%E3%83%A0 ユニコエがどういうアプリなのかは以下のムービーを見るとよくわかります。 【ユニコエ】アプリ紹介 - ニコニコ動画 ユニコエでは音声合成エンジンや音声ライブラリを複数登録することができます。 選択した音声合成エンジンが、中央に入力されたテキストを読み上げてくれます。 イントネーションはフレーズごとに調整可能。 また、音声ライブラリの立ち絵も表示されます。 ユニコエは、公式サ

                        無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場
                      • もはや人と区別がつかない音声合成ソフト、VOICEPEAKがラインナップを大幅拡充。キャラクターシリーズ含め8ボイスがリリースに|藤本健の"DTMステーション"

                        ※6ナレユーザー優待版とは「VOICEPEAK 商用可能 6ナレーターセット」を所有しており、かつAHSのユーザー/製品登録を行った方を対象とした特別価格の商品です。AHSのサイトログイン後のマイページからのみ購入可能です。 上の5つがキャラクターシリーズであり、下の3つが6ナレーターセットと同様、キャラクターがなく、商用可能なものとなっています。 まずは、8つの喋りがどんなものなのかを確認するため、ちょっとずつ喋らせてみたので、以下の動画をご覧ください。 いかがですか?ご覧いただければ、使い方はだいたい分かると思います。VOICEPEAK上で直接テキストを入力してもいいし、このビデオのようにテキストをコピー&ペーストするのもOK。あとは、ボイスを選択した上で再生ボタンを押せばいいだけ。とにかく簡単です。 VOICEPEAKには、これまででトータル15種類のボイスが揃ったことになる ご存じ

                          もはや人と区別がつかない音声合成ソフト、VOICEPEAKがラインナップを大幅拡充。キャラクターシリーズ含め8ボイスがリリースに|藤本健の"DTMステーション"
                        • 無料で商用利用もできるAI音声読み上げツール「VOICEVOX」に新キャラ ~魅惑のウィスパーボイスを利用可能/「ノーマル」「あまあま」「ツンツン」「セクシー」「ささやき」スタイルを利用可能

                            無料で商用利用もできるAI音声読み上げツール「VOICEVOX」に新キャラ ~魅惑のウィスパーボイスを利用可能/「ノーマル」「あまあま」「ツンツン」「セクシー」「ささやき」スタイルを利用可能
                          • イヤホン配信を支える音のプログラミング入門 - Mirrativ Tech Blog

                            こんにちわ。shogo4405です。本エントリーは普段UI開発を行なっているクライアントエンジニア向けに、Mirrativのイヤホン配信を支えている音のプログラムの基礎を紹介していきたいといます。 音のプログラミングの概要を掴んでもらい、より詳しい部分については文献を調べるための参考になれば幸いです。 はじめに イヤホン配信の概要になります。Mirrativの配信はゲーム音源をマイクからの集音に頼っています。ユーザーが配信を行う際に、イヤホンを装着するとゲーム音源が配信にのらず視聴側としては物足りない配信になります。 これを解決する手段として、OS内部で再生中のゲーム音源をキャプチャーした音源。マイクから集音した音源。これらの音源を合成する方法があります。この手段をとることにより、イヤホンしながらでもゲーム音声を視聴者に届けることができるようになります。サービス上では、イヤホン配信と呼称し

                              イヤホン配信を支える音のプログラミング入門 - Mirrativ Tech Blog
                            • アレクサを好きな声に変更可能へ、アマゾンが計画発表

                              米アマゾン・ドット・コムは22日、音声アシスタント機能「アレクサ」について、人工知能(AI)の音声を自分の好きな声に変更できるようにする計画を明らかにした。昨年10月撮影(2022年 ロイター/MIKE BLAKE) [ラスベガス 22日 ロイター] - 米アマゾン・ドット・コムは22日、音声アシスタント機能「アレクサ」について、人工知能(AI)の音声を自分の好きな声に変更できるようにする計画を明らかにした。

                                アレクサを好きな声に変更可能へ、アマゾンが計画発表
                              • 無料&音声をリアルタイムで変換できるAIボイスチェンジャー「Koemake RVC Player」レビュー

                                オープンソースのAIボイスチェンジャー「Retrieval-based Voice Changer(RVC)」は、あらかじめ用意した音声から学習したモデルを作成し、リアルタイムで声質を変換することが可能です。このRVCで作成した音声変換モデルを手軽に実行できるボイスチェンジャーソフト「Koemake RVC player」を電々メイさんが無償でリリースしたので、実際に使ってみました。 Koemake Project https://koemake.com/ Koemake RVC Playerを動かすための推奨スペックは「VRAM4GB以上、NVIDIA製GPU搭載、Windows 10以上」となっているので注意が必要です。 Koemake RVC Playerをダウンロードするには、上記の配布サイトでユーザー登録をする必要があります。配布サイトにアクセスしたら、右上の「ログイン」をクリッ

                                  無料&音声をリアルタイムで変換できるAIボイスチェンジャー「Koemake RVC Player」レビュー
                                • NHKに聞く「人間のアナがいるのにAIがニュースを読む」理由

                                  「AI自動音声でお伝えしています」 ある朝のNHK「おはよう日本」の画面。ニュース映像の右上に、こんな文字が表示されれていて驚いた。音声に違和感がなく、人間のアナウンサーの声だとばかり思っていたからだ。 意識してよく聞けば、イントネーションや“間”がやや不自然だが、流し聞きしているだけでは分からないレベルだ。 場面がスタジオに転換すると、人間のアナウンサーが2人写った。アナウンサーがそこにいるのに、AIがニュースを読んでいたのだ。 「おはよう日本」だけではない。NHKは、平日午後のニュース、ラジオ、Webのニュース番組の一部などでAIによるアナウンスを活用している。 AIアナウンスはどのように作られたのか? 人間のアナがいるのに、なぜわざわざ、AIにニュースを読んでもらうのか? NHKに聞いた。 放送時間ぴったりにニュースが読めるAI AIアナウンスの音声は、NHKが開発した技術だ。気象情

                                    NHKに聞く「人間のアナがいるのにAIがニュースを読む」理由
                                  • 初音ミクの歌が良くてAIの絵がダメなのなんでだろ

                                    初音ミクの歌が良くてAIの絵がダメなのなんでだろ

                                      初音ミクの歌が良くてAIの絵がダメなのなんでだろ
                                    • ディープラーニングの力で誰でもゆかりさんの声になれる声変換技術を作ってみた

                                      2年ほど前に、自分の声を結月ゆかりにする声質変換技術を作り、動画を投稿しました。この技術には利用者の音声データが大量に必要であるという欠点があり、ゆかりさんになりたいというみなさんの願いを叶えるのが難しい状態でした。そこで、この技術を利用者の音声データが不要になるように改良し、誰でも簡単に使えるようにしました。ここではその技術について解説します。 手法 音声を直接変換しようとすると、利用者の音声データが必要になってしまいます。そこで、音声を直接変換するのをやめて、①音声を構成する要素である音素と音高に分解し、②音素と音高を目標の声(ゆかりさん)に再合成することを考えました。 ①は、音素の抽出に音声認識とOpenJTalkとJuliusを、音高の抽出にWORLDを用いれば簡単に実現できます。そのため、②さえ実現できれば、利用者の声のデータを用意することなく、誰でもゆかりさんの声に変換すること

                                        ディープラーニングの力で誰でもゆかりさんの声になれる声変換技術を作ってみた
                                      • WindowsのPythonでデスクトップ通知(トースト)作ってみた【WinRT】 - Qiita

                                        from win11toast import toast toast('Hello Python', 'Click to open url', on_click='https://www.python.org') from win11toast import toast toast('Hello', 'Lorem ipsum dolor sit amet, consectetur adipisicing elit. Earum accusantium porro numquam aspernatur voluptates cum, odio in, animi nihil cupiditate molestias laborum. Consequatur exercitationem modi vitae. In voluptates quia obcaecati!')

                                          WindowsのPythonでデスクトップ通知(トースト)作ってみた【WinRT】 - Qiita
                                        • 進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る

                                          音声合成技術の進化が目覚ましい。人間に近い“自然な発話”が可能になったことで、用途が急速に広がった。歌声合成技術や声質変換技術といった派生技術も実用化に向けた動きが進んでいる。 今の音声合成技術では、声優などによる良質な収録音声が欠かせない。声をなりわいとする声優からすると、音声合成技術の普及は声優から「仕事を奪う」リスク要因ともいえる。にもかかわらず、音声合成技術の活用に積極的なのが大手声優事務所の81プロデュースだ。その狙いについて、同社代表取締役社長の南沢道義氏に聞いた。(聞き手は高野 敦、東 将大=日経 xTECH) なぜ音声合成技術の活用に積極的なのですか。 数多くの人気声優や実力派・ベテラン声優が所属する81プロデュース、およびアニメ関連の音響制作や外国映画の日本語版制作を手掛けるハーフ・エイチ・ピー・スタジオの代表を務め、多方面から声優、俳優を支援する。さらに、一般社団法人デ

                                            進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る
                                          • 好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge

                                            それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff

                                              好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge
                                            • “VOCALOIDじゃない初音ミク”登場 プロトタイプ版の先行予約スタート

                                              クリプトン・フューチャー・メディアは、自社開発の歌声合成ソフト「Piapro Studio」と専用の音源「初音ミク NT(ニュータイプ)」を2020年8月下旬に発売すると発表した。従来とは違い、初音ミク NTはヤマハの「VOCALOID」では使えない。 クリプトン・フューチャー・メディア(CFM)は12月25日、自社製の歌声合成ソフト「Piapro Studio」専用の音源「初音ミク NT(ニュータイプ)」を2020年8月下旬に発売すると発表した。従来の初音ミクはヤマハが開発した歌声合成ソフト「VOCALOID」向けの音源として販売されてきたが、初音ミク NTはVOCALOIDでは使えない。 Piapro Studioは初音ミクなどのバーチャルシンガーを歌わせるためのエディタで、初音ミクをはじめとするCFM製品に付属している。 従来は、歌声を合成するためのシステムとしてVOCALOIDのエ

                                                “VOCALOIDじゃない初音ミク”登場 プロトタイプ版の先行予約スタート
                                              • うみゆき@AI研究 on Twitter: "なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当… https://t.co/IsmQsTS8is"

                                                なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当… https://t.co/IsmQsTS8is

                                                  うみゆき@AI研究 on Twitter: "なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当… https://t.co/IsmQsTS8is"
                                                • “ゆっくりボイス”でお馴染みの「SofTalk」から、ゆっくりボイスが消える。ライセンスとフリーソフトの複雑な関係 - AUTOMATON

                                                  国内のソフトウェア個人開発者であるCNCC氏は7月23日、音声読み上げソフト「SofTalk」において、音声合成ミドルウェア「AquesTalk」への対応を中止することを発表した。また、同氏はしばらくSofTalkの開発自体を休止する意向を示している。 「SofTalk」は、CNCC氏が開発する音声読み上げフリーソフトウェア。テキストを入力すると合成音声を出力してくれる仕組みで、実況動画の音声などに広く用いられてきた。代表的なのは、一頭身化された「東方Project」キャラクターが掛け合いを繰り広げる動画での利用。いわゆる「ゆっくりボイス」だろう。同ソフトは複数の合成音声ライブラリに対応しており、ユーザー側で切り替えが可能。ライブラリの種類で声質も変化する。ゆっくりボイスとして認知されている声は、国内企業AQUEST(アクエスト)が開発する音声合成ミドルウェア「AquesTalk」シリーズ

                                                    “ゆっくりボイス”でお馴染みの「SofTalk」から、ゆっくりボイスが消える。ライセンスとフリーソフトの複雑な関係 - AUTOMATON
                                                  • AI翻訳「人間超え」へ 技術が急発展 - 日本経済新聞

                                                    語学の勉強をしなくても世界の人々と意思疎通できる時代がやってきた。人工知能(AI)を用いた「ニューラル機械翻訳(NMT)」技術が猛烈な勢いで発展しているからだ。言葉の壁は大幅に低くなった。翻訳業界は再編が始まった。街中では自動翻訳機が急増中で、観光業界や店舗、運輸、病院などに普及し始めた。将来的には自動翻訳機が1人に1台、普及する可能性も出てきた。【次回記事】自動翻訳機、1人1台時代へ 観光・交通で活躍30年分の技術を一気に凌駕「翻訳業界全体が、雷に打たれたような衝撃を受けた。これは50年に一度の破壊的技術であると」──。自動翻訳サービスを手掛けるXtra(エクストラ、東京・千代田)社長でロゼッタ執行役員の古谷祐一氏は

                                                      AI翻訳「人間超え」へ 技術が急発展 - 日本経済新聞
                                                    • 一番星はてのがYOASOBIのアイドルを歌ってみた - 一番星はての開発ブログ

                                                      www.youtube.com 一番星はてのに推しの子のOPのアイドルを歌ってもらった。 この曲の「金輪際現れない一番星の生まれ変わり」という部分を聴いたときに、これをはてのに歌ってもらったら面白いなと思い、AIに歌ってもらう方法をいろいろと調べてなんとか公開することができた。ボーカロイド系を触るのが初めてなどころか、楽譜もほぼ読めないところから始めたのでクオリティは高くないけどやりたいことはできたのでよかったと思う。歌詞の打ち込みとか字幕を作るのは楽しかったのでまたやりたい。 ツールについて 楽譜ツールにMuseScore、歌声合成にNEUTRINOを使用している。NEUTRINOには別で調声ツールもあり、タイミングやピッチ、音量なども調整することができる。 なるほど、こんな風に作るのかとやってみて初めてわかり面白かった。 NEUTRINO自体AI学習で調声なしでもそこそこちゃんと歌って

                                                        一番星はてのがYOASOBIのアイドルを歌ってみた - 一番星はての開発ブログ
                                                      • [CEDEC 2023]「スト6」の対戦を盛り上げる「自動実況機能」は,どのように作られたのか。システム構築や技術を解説するセッションをレポート

                                                        [CEDEC 2023]「スト6」の対戦を盛り上げる「自動実況機能」は,どのように作られたのか。システム構築や技術を解説するセッションをレポート 編集部:Junpoco ゲーム開発者会議「CEDEC 2023」の初日となる2023年8月23日,カプコンの薮下剛史氏,岩本卓也氏,アンドリュー・アルフォンソ氏によるセッション「『ストリートファイター6』対戦を熱く盛り上げる自動実況機能の取り組み」が行われた。 「ストリートファイター6」(PC / PS5 / Xbox Series X|S / PS4)で対戦中に使用できる「自動実況機能」を導入した目的や,システム構築,膨大なセリフ量を処理する工夫などが語られた講演の模様をレポートしよう。 そもそもなぜ,実況機能の導入を企画したのか 最初に薮下氏から,「そもそもなぜ,実況機能をゲームに導入したのか」が語られた。 実況機能導入で目指したところには,

                                                          [CEDEC 2023]「スト6」の対戦を盛り上げる「自動実況機能」は,どのように作られたのか。システム構築や技術を解説するセッションをレポート
                                                        • 商用可・無料の音声読み上げツール「VOICEVOX」が公開 ~素人でも手軽に満足のいく品質が得られる丁度よさが魅力【8月6日追記】/イントネーションや感情の表現もある程度可能

                                                            商用可・無料の音声読み上げツール「VOICEVOX」が公開 ~素人でも手軽に満足のいく品質が得られる丁度よさが魅力【8月6日追記】/イントネーションや感情の表現もある程度可能
                                                          • Nintendo Switch新作『カブトクワガタ』が“あまりにも尖っている”として注目集める。配分の偏りがすごすぎる低予算パンチ - AUTOMATON

                                                            小学館は3月15日、『カブトクワガタ』を発売した。対応プラットフォームはNintendo Switch。本作のリアルなムシたちのグラフィックが注目される一方、荒削りでシュールな要素もユーザー間に反響を呼んでいる。筆者は同作を購入しプレイしたことを踏まえて、その内容を紐解いていく。 『カブトクワガタ』は、甲虫バトルゲームだ。舞台となるのは巨大なムシたちが住む異世界。カブトムシとクワガタムシ(以下、カブトクワガタ)が大好きな主人公はある日、現実世界からこの地に迷い込んでしまう。異世界では目の赤く光る凶暴化したムシたちが現れ、人々を襲っていた。主人公はカブトクワガタを育成して戦い、ムシたちが凶暴化した謎に迫っていくことになる。 本作は、ゲーム開発を題材とする漫画「ゲーつくっ!!」との完全連動企画として制作されたタイトル。「ゲーつくっ!!」は、小学館「コロコロコミック」の公式サイトコロコロオンライ

                                                              Nintendo Switch新作『カブトクワガタ』が“あまりにも尖っている”として注目集める。配分の偏りがすごすぎる低予算パンチ - AUTOMATON
                                                            • 花譜の歌声合成ソフト「可不」 花譜本人が違和感を抱き発売延期に

                                                              発売延期となっている人工歌唱ソフトウェア「音楽的同位体 可不(KAFU) collaboration with Synthesizer V AI / The Right Stuff ver.」について4月12日、KAMITSUBAKI STUDIOのプロデューサー・PIEDPIPERさんが自身のXを通じて理由を明らかにした。 「可不」は、KAMITSUBAKI STUDIO所属のバーチャルシンガー・花譜さんの歌声をもとにした歌声合成ソフト。その最新版の発売延期が2023年12月下旬に発表され、今後の動向に注目が集まっていた。 https://twitter.com/i/status/1778731096445968819 PIEDPIPERさんの投稿によれば、Synthesizer V AI版の可不が歌った「フォニイ」の反響を受け、花譜さんから懸念の声が上がり、発売延期の打診があったという

                                                                花譜の歌声合成ソフト「可不」 花譜本人が違和感を抱き発売延期に
                                                              • 岸田総理のAI音声で「解散宣言」も…「ひるおび」の悪ノリに批判殺到

                                                                他人の声になりすますことができる「AI音声」が注目を集めている。TBS系情報番組「ひるおび」では、スタジオで岸田文雄総理に似せた声を再現したものの、あまりの悪ノリに《不謹慎すぎる》《シャレになっていない》などと批判の声が殺到している。 5月24日の放送では、スタジオにAIスタートアップ創業者の安野貴博氏を招いて、AIによる音声の変換を実演。宇内梨沙アナウンサーが白いマイクを手に取って紹介すると、安野氏は「その機器はマイクなんですけど、向こうのノートパソコンの中で動くAIの学習をさせていただきました」と解説。マイクに音声を吹き込むと、ほぼリアルタイムで岸田総理そっくりの声に変換されていくという。 宇内アナがマイクに向かって声を吹き込むと、スタジオには「こんにちは。恵さん、どうですか」と総理そっくりの声が響く。司会の恵俊彰をはじめ、出演者からは驚きの声があがった。 司会の恵は「『G7サミット、

                                                                  岸田総理のAI音声で「解散宣言」も…「ひるおび」の悪ノリに批判殺到
                                                                • 語尾だけで朗読の印象を変えるコツ

                                                                  以前「朗読での間(ま)と緩急でこれだけ変わる」という記事で、一部分を少しかえるだけで、印象が変わる、ということを書きました。 今日は、「語尾」を変えるだけで、これだけ変わる、ことを詳しく紹介します。 語尾に関しては、今までにも 「朗読が暗く聞こえる要因」 「朗読のセリフで喜怒哀楽を表現するコツ」でも語尾の読み方で印象が変わることを紹介しています。 また語尾のくせについても 「朗読の助詞上げのくせを直すコツ」でふれています。 このように「語尾」の扱いは案外難しいのです。 私がナレーションをするときに、いつも難しく感じるのが語尾の扱いです。 実は語尾の扱いひとつで、全体の印象が全く変わるのです。 ということは、語尾の扱いで全体の印象を変えることができるのです。 これはナレーションだけではなく、朗読でも、日常生活でも同じです。 かなり細かい話になっていきますが、チャレンジしてみてください。 なお

                                                                    語尾だけで朗読の印象を変えるコツ
                                                                  • 月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

                                                                    何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画から抽出した音声と、音声を文章に起こしたテキストの組み合わせのデータセット約50分ぶんを教師データとして学習した結果 ※学習に必要なデータ量は最低でも1時間程度と言われているので、まだまだ足りていません… 月ノ美兎さんの音声合成ツールを作ってみた https://t.co/YVdWW9vREb via @YouTube — K2 (@K2ML2) May 29, 2020 発話内容が不明瞭な箇所がありますが、一応ご本人の声に近い音声を作成することができているかと思います

                                                                      月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita
                                                                    • AIが人間のように歌い上げる「CeVIO Pro (仮)」がベータ版に、正式名は「VoiSona」に決定/ボイスライブラリ「知声」(Chis-A)を同梱し、商用でも無料で利用可能

                                                                        AIが人間のように歌い上げる「CeVIO Pro (仮)」がベータ版に、正式名は「VoiSona」に決定/ボイスライブラリ「知声」(Chis-A)を同梱し、商用でも無料で利用可能
                                                                      • NEUTRINO - Neural singing synthesizer

                                                                        NATURAL & SMOOTH実際に歌手が楽曲を歌ったデータから特徴を抽出しており、本人の声質だけではなく癖・歌いまわしなどを最新の歌声生成AIで再現します。歌詞とメロディーを入力するだけで簡単に歌わせることができ、実在の歌手に依頼するような感覚で制作を進めることができます。 QUICK STARTインストールはワンクリックで完了。すぐに制作を開始いただけます。 Windows / MacOS / Linux / Onlineでの動作に対応しており、環境を問わずご利用いただけます。 CLEAN DATA & CLEAN MODELモデルの学習には声優・演者様の許諾の上収録した音声データ、もしくは大学などの公的機関から公開されている音声データのみを利用しております。既存の学習済みモデルは利用しておらず、上記データを用いてフルスクラッチで学習を行っております。権利的・倫理的にクリーンな

                                                                          NEUTRINO - Neural singing synthesizer
                                                                        • 声優・小岩井ことりさん、電子情報通信学会で表彰される 研究向けオリジナル曲を50曲作り貢献

                                                                          声優の小岩井ことりさんは9月15日、明治大学の森勢将雅専任准教授らと共同執筆した論文が電子情報通信学会で船井ベストペーパー賞を受賞したと発表した。作曲で音声合成分野の研究に貢献した。 受賞した論文は「レアなモーラを含む日本語歌唱データベースの構築と基礎評価」。著者は小岩井さん、森勢専任准教授、ライターの藤本健さん。内容は、AI歌声合成技術などの研究に使えるオリジナル曲を集めたデータベースを作成したというもの。 収録したオリジナル曲には、日本語の音素をできる限り含んだ歌詞、さまざまなパターンのメロディーが織り込んである。これまで歌声合成の分野では、著作権などの問題から童謡を使うことが多かったが、オリジナル曲のみでデータベースを構築することで利用条件の緩和を目指した。

                                                                            声優・小岩井ことりさん、電子情報通信学会で表彰される 研究向けオリジナル曲を50曲作り貢献
                                                                          • 第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox) | テクノエッジ TechnoEdge

                                                                              第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox) | テクノエッジ TechnoEdge
                                                                            • 「AI安倍晋三」ネットで物議 合成音声のYouTube動画、“東京大学AI研究会”が公開

                                                                              Twitterアカウント(@AIAbeShinzo)も開設しており、最初に投稿したツイートは26日正午時点で1万件以上リツイートされるなど関心を集めている。ユーザーからは「素晴らしい」や「ありがとう」など絶賛する声の他、「死者への冒涜ではないか」や「AIで美空ひばりの新曲作ったのと同じ感じがして複雑」など疑問を呈する声も見られる。 「東京大学AI研究会」とは何者か? 発起人である東京大学AI研究会のWebサイトによると、同研究会は東京大学教養学部・工学部有志と学生有志が2021年5月10日に設立。5月時点では「東大13名、京大10名、大阪大学6名、早稲田大学9名、慶応義塾大学1名、筑波大学1名、立命館大学3名」(原文ママ)の43人が在籍し、代表者は東京大学・教養学部・理科一類に所属しているという。 目的は「飛躍的・未到達領域のAI開発」としており、最新の活動記録として4月に「SOTA(特定

                                                                                「AI安倍晋三」ネットで物議 合成音声のYouTube動画、“東京大学AI研究会”が公開
                                                                              • 最近のAIボイスチェンジャー(RVC、so-vits-svc)

                                                                                私は趣味で機械学習を学ぶ初学者であり、説明に間違いや勘違いがある可能性があります。そういった点がありましたらコメントで指摘していただけると助かります。 また、so-vits-svcやRVCは論文ベースでの技術発表が無いため、以下はコードや周辺情報からの想像を含みます。 修正履歴 2023/04/15 RVCの動作について誤りがあったので修正しました。nadare🌱さんご指摘ありがとうございます。 AIボイスチェンジャーとは ある発話音声の入力を特定の話者が発話したような声質の発話音声に変換するための、深層学習を使用したアプローチがそう呼ばれている印象です。 以前から、深層学習を用いたリアルタイムボイスチェンジャーはMMVCなどが存在していました。 最近(2022年11月頃から2023年4月頃)では、Retrieval-based-Voice-Conversion 通称RVC や、Soft

                                                                                  最近のAIボイスチェンジャー(RVC、so-vits-svc)
                                                                                • 今年の書初めコーディングはAITuberを創る!

                                                                                  はじめに あけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTやStableDiffusionが2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。 「AITuberを作ってみたら生成AIプログラミングがよくわかった件」 って本も買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。 また、私はプログラミングは多少できますが、イラストや音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の

                                                                                    今年の書初めコーディングはAITuberを創る!