[B! 音声] rat_and_eastのブックマーク

やぴさぷ [灯里愛夏サンプラー]

プロジェクトヴイアライヴアイドル候補生「灯里愛夏」の音声サンプラー（愛夏ボタン）

rat_and_east 2024/01/08

リンク

笑い声や甘いささやきは「左側」から聞こえた時の方が脳に強い反応を引き起こすという研究結果

普段の生活において、話し相手が自分の右側にいるのか左側にいるのかを気にすることは少ないかもしれません。しかし、スイスの研究チームが査読付き学術誌のFrontiers in Neuroscienceに発表した研究結果によると、笑い声やエロティックな声といったポジティブな発声は、自分の「左側」から聞こえてきた時の方が脳に強い反応を引き起こすとのことです。 Frontiers | Emotional sounds in space: asymmetrical representation within early-stage auditory areas https://doi.org/10.3389/fnins.2023.1164334 Our brain prefers positive vocal sounds that come from our left - Science & res

rat_and_east 2023/07/09

脳
音声

リンク

ねこは「ゴハン」と言っているのか検証

元のツイートはこちら： https://twitter.com/chip_potekko/status/1533699884720979968?s=20&t=ogCsRyLsuHRuywjNadCPww ガチの音響音声学の人、動物コミュニケーションの人、なんかおしえてください

rat_and_east 2023/04/21

via https://bluelines.hatenablog.com/entry/2022/12/30/133922 https://dailyportalz.jp/kiji/the-cat-speaks-gohan

リンク

最近のAIボイスチェンジャー(RVC、so-vits-svc)

私は趣味で機械学習を学ぶ初学者であり、説明に間違いや勘違いがある可能性があります。そういった点がありましたらコメントで指摘していただけると助かります。また、so-vits-svcやRVCは論文ベースでの技術発表が無いため、以下はコードや周辺情報からの想像を含みます。修正履歴 2023/04/15 RVCの動作について誤りがあったので修正しました。nadare🌱さんご指摘ありがとうございます。 AIボイスチェンジャーとはある発話音声の入力を特定の話者が発話したような声質の発話音声に変換するための、深層学習を使用したアプローチがそう呼ばれている印象です。以前から、深層学習を用いたリアルタイムボイスチェンジャーはMMVCなどが存在していました。最近(2022年11月頃から2023年4月頃)では、Retrieval-based-Voice-Conversion 通称RVC や、Soft

rat_and_east 2023/04/10

AI
音声

リンク

AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能（CloseBox） | テクノエッジ TechnoEdge

おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI 音声合成で起きました。筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion（拡散）モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI 技術を使っているんですよ」と付け加えなければいけません。妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC（SoftV

rat_and_east 2023/04/10

記事に無いメリットとして、素材が少なくて良い、素材の文字起こし不要、設定が簡単、話し言葉・歌声どっちもいけるのが良い。キャズム越えそう。ただし中国開発で出自が見えない https://www.bilibili.com/video/BV1pm4y1z7Gm/

AI
音声

リンク

スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】

3年振りのリアル開催となった福岡で例年行われるゲーム開発者向けのカンファレンス「CEDEC+KYUSHU 2022」が、2022年11月12日（土）に開催されました。スクウェア・エニックス AI部のAIリサーチャー森友亮氏が登壇し、『意味が分からないからこそ、リアル～「架空言語」音声合成による、没入感の高いボイス付きコンテンツの実現～』と題した講演が行われました。見慣れた母国語のテキストから聞いたことのない架空言語の音声を生成する手法について語られた本講演をレポートします。 TEXT / じく EDIT / 酒井理恵

rat_and_east 2023/02/14

音声

リンク

うみゆき@AI研究 on Twitter: "なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった！！Hugging Faceでデモが試せる！早速まどマギの５人に喋ってもらった！！うわうわうわ！ヤバいよヤバい本当… https://t.co/IsmQsTS8is"

なにやら中国の方が作られた音声合成 AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった！！Hugging Faceでデモが試せる！早速まどマギの５人に喋ってもらった！！うわうわうわ！ヤバいよヤバい本当… https://t.co/IsmQsTS8is

rat_and_east 2022/11/06

試しにウマ娘の数キャラで試してみたけど音声以前のノイズだった。キャラによって学習データの処理が雑なんだろうね。逆にそこしっかりやれば良い品質が得られるはず / 作者がWaifu Diffusionのメンバーだった

AI
音声

リンク

声を“匿名化”するシステム「V-CLOAK」　人間っぽさを残した声に変換、声紋の個人情報漏えいを防ぐ

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。中国のZhejiang UniversityとWuhan Universityの研究チームが発表した論文「V-CLOAK: Intelligibility-, Naturalness- & Timbre-Preserving Real-Time Voice Anonymization」は、音声の明瞭性と自然性、音色を保持したまま、リアルタイムに音声を匿名化するシステムを提案した研究報告だ。機械的な声ではなく人間っぽさを残した声に変換し、声紋から個人が特定されることを防ぐ。声紋は、個人を一意に特定できる重要なバイオメトリクスだ。一方でオンラインサービスによって膨大な音声データを収集・処理で

rat_and_east 2022/11/04

リンク

Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに｜DTMステーション

10月27日、Synthesizer Vの新しい歌声データベースとして、Maiがお披露目となり、その歌唱動画が公開されました。実際にユーザーが入手可能になるまでには、まだもう少し待つ必要がありそうですが、遅くとも年内には登場するそうですから心待ちにしたいところです。今回、Synthesizer Vの開発元であるDreamtonicsによって公開されたMaiの歌声のビデオを見ると、驚くほど滑らか、スマートな歌い方であり、もはや人間の歌声と区別がつかない次元まで進化しているように感じます。しかも、とくに調声をしなくても、音符と歌詞を入力するだけで、非常にリアルな歌い方をしてくれる、というのも、嬉しいところです。一方で、先日リリースされたSynthesizer V Studio Proの最新バージョン1.7.1において、歌声データベースの複数バージョンを利用できる機能が追加されています。なぜそ

rat_and_east 2022/11/03

ベタ打ちでこれはすごいなー

音声

リンク

動画の雑音をほぼ消す技術、米国などのチームが開発　声のみが強調されすぎてアフレコみたいな結果に

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米Dolby LaboratoriesとスペインのUniversitat Pompeu Fabraの研究チームが開発した「Universal Speech Enhancement With Score-based Diffusion」は、収録した映像のバックグラウンドノイズ（背景雑音）を強力に除去する技術だ。動画撮影した雑音を消し去り、話す声だけをくっきり残すことができる。強力すぎるため、映像がアフレコを挿入したみたいな仕上がりになってしまう。実世界で録音した音声には必然的に背景の雑音や残響が含まれ、不快感や明瞭度の妨げになるためノイズ除去が行われる。最近では深層学習の登場によりノイズ除

rat_and_east 2022/06/16

音声
tech

リンク

音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能｜DTMステーション

日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI 音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人＋男性3人＋女の子1人＝7人の声を切り替えることが可能なAI 音声合成ソフトで、テキストを入力すれば

rat_and_east 2022/02/27

音声
AI

リンク

DeNA×AI｜技術と、革新と、未来と。

AIを活用した技術の進歩。革新。幅広いサービスの利用が、当たり前になった昨今、これからの私たちが、提供できる価値とはいったい何か。それは、DeNA × AIだからできる「人」と「テクノロジー」が、組み合わさった未来です。 DeNA × AIが持つ「意図や思いを汲み取った、質の高い発想力」、「多岐にわたる経験を元にした、AI、データサイエンスの実践力」、「複雑なシステムの開発、安定した稼働ができる技術力」など。それぞれの強みを組み合わせることで、まだどこにもない「モノづくり」や「コトがら」を、生み出していきます。ともに、技術の向上を。ともに、革新の追求を。ともに、今よりも豊かな未来を。さあ、DeNA × AIと新しいモノづくりを一緒に。

rat_and_east 2021/05/12

音声
AI

リンク

19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界｜DTMステーション

4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO（コエ・フォント・スタジオ）は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

rat_and_east 2021/05/08

リンク

無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

CoeFont (コエフォント) @coefont Web音声合成サービス『CoeFont STUDIO』 coefont.studio をリリースしました。全サービス無料公開。すべてのクリエイターに声を届けます。#CoeFontSTUDIO #CoeFont pic.twitter.com/Wu5AFJpZ9d 2021-04-23 12:44:30

rat_and_east 2021/04/26

リンク

【WEB動画】シブヤノオト × THE IDOLM＠STER CINDERELLA GIRLS アイマスささやきシンデレラボイス

rat_and_east 2020/10/13

飛鳥が一番近いな

リンク

高品質な音声変換ソフトウェア | Seiren Voice

AIの技術を用いてクオリティを追求した、今までにない音声変換ソフトウェア。いつもと違う声で表現することの楽しさを、ぜひ体験してみてください。 AI 技術を用いた高品質な音声変換ソフトウェアです。誰の声でも狙ったキャラクターの声に変換することができます。クオリティを追求することで、ボイスチェンジャーらしいノイズが乗らない、人間らしい声を実現することができました。キャラクター紹介

rat_and_east 2020/09/14

AI
音声

リンク

Microsoftの音声アシスタント「Cortana」、2021年にフェードアウト　縮小のロードマップ公開

米Microsoftの音声アシスタント「Cortana」の消費者向けアプリおよびサービスの多くが2021年に終了する。Microsoftは8月1日（米国時間）、「Upcoming changes to Cortana」と題したサポートページでCortanaフェードアウトのロードマップを提示した。同社はCortanaをOfficeやクラウドサービスなどを含むサブスクリプションサービス「Microsoft 365」のためのAIベースデジタルアシスタント体験として再定義することを理由に、Cortanaサードパーティースキルのサポートを9月7日で終了。21年初めにはiOSおよびAndroid向けCortanaアプリのサポートを終了する。