並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 1103件

新着順 人気順

音声合成の検索結果1 - 40 件 / 1103件

  • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

    日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

      音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
    • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

      オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

      • 2022年「はてなブックマーク年間ランキング」トップ100 - はてなニュース

        はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク年間ランキング」の2022年版を発表します。上位トップ100の記事をピックアップしました(集計期間:2021年12月11日~2022年12月10日)。 2022年 はてなブックマーク年間ランキング(2021年12月11日~2022年12月10日) 順位 タイトル 1位 【詳しすぎる2週間】親の死亡後にまずやること(行動チェックリスト付) 2位 逮捕にそなえる人生継続計画 - やしお 3位 150 分で学ぶ高校数学の基礎 4位 ゲームの勝敗でかんしゃくを起こす子どもにできることは大人げない大人になること|フィンランドワークショップomena|note 5位 【アメリカで話題】ただ座るだけ!股関節がみるみる柔らかくなる「90/90ストレッチ」 | ヨガジャーナルオンライン 6位 Amazonプライムビデオで観てほしい

          2022年「はてなブックマーク年間ランキング」トップ100 - はてなニュース
        • 【必見】2020年に話題になったイケてるWebサービス・アプリまとめ

          あけましておめでとうございます。 今回は、2020年に話題になったイケてるWebサービス・アプリを紹介します。 多数リリースされているもののなかから、チェックし直しておいたほうがよさそうなサービスをピックアップしました。 2020年は新型コロナウイルスの流行もあり、世界が大きく変わりました。 それに伴い、生活様式にも変化が生まれ、リリースされるWebサービスやアプリも時代に則したものが多いように感じました。 冬休みのあいだに、ぜひおさらいしてみてください。 【その前に】毎月更新する本シリーズについて 2020年はしばらくお休みをいただいておりましたが、本年より更新を再開します。 引き続き、毎月末に更新となります。 また、新たに無料メルマガも開始します。 メルマガでは、運営者が気になったり、業界的に知っておいたほうが良さそうなWebサービスやアプリの紹介を不定期に紹介していく予定です。 最新

            【必見】2020年に話題になったイケてるWebサービス・アプリまとめ
          • JavaScriptを完全無料で学習できる最強の厳選コンテンツを大公開! - paiza times

            どうも、まさとらん(@0310lan)です! 今回は、JavaScript初心者から中級者までをカバーできる学習コンテンツを厳選してご紹介します。 完全無料で公開されているものばかりを集めており、なおかつ質の高いコンテンツを選んでいますので独学したい方にも最適です。テキスト、動画、本、Webアプリなど、さまざまな種類のコンテンツを楽しみながらぜひ学習に役立ててください! ■学習を始める前に これからJavaScriptの学習コンテンツについて解説をしていく前に、ひとつだけ以下のサイトをご紹介しておきます。 【 The Modern JavaScript Tutorial 】 これはJavaScriptの基礎構文・DOM操作・非同期処理・サーバ通信など、ほとんどの学習項目を網羅したリファレンスのようなサイトです。海外で作られたサイトですが、うれしいことに日本語化されているので初心者にも扱いや

              JavaScriptを完全無料で学習できる最強の厳選コンテンツを大公開! - paiza times
            • 無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

              CoeFont (コエフォント) @coefont Web音声合成サービス『CoeFont STUDIO』 coefont.studio をリリースしました。全サービス無料公開。すべてのクリエイターに声を届けます。#CoeFontSTUDIO #CoeFont pic.twitter.com/Wu5AFJpZ9d 2021-04-23 12:44:30

                無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」
              • 「AIきりたん」がすごい - すずしめにっき

                ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開

                  「AIきりたん」がすごい - すずしめにっき
                • 文字商標「ゆっくり茶番劇」に関するドワンゴの見解と対応について|ニコニコインフォ

                  (2023年7月24日追記) 2022年2月24日に登録された「ゆっくり茶番劇」商標(登録6518338号)について そもそも商標として登録されるべきではなかったことを明らかにするために無効審判を請求しておりましたが、 7月12日付けで無効審決が下されたとの通知を特許庁より受領いたしました。 すでに本件商標登録は放棄による抹消となっておりますが、登録日から抹消日までの間は商標権が発生しておりました。 この無効審決は、過去にさかのぼり「はじめからなかったこと」にして、当該商標権を打ち消すものです。 一定期間内に審決取消訴訟が提起されなければ、「ゆっくり茶番劇」の登録を無効とすべきと判断した無効審決が確定します。 無効審決の確定をもって、「ゆっくり茶番劇」にまつわる商標権についての問題がすべて解決することになります。 審決が確定しましたら、あらためてお知らせいたします。 当該騒動が発生してから

                    文字商標「ゆっくり茶番劇」に関するドワンゴの見解と対応について|ニコニコインフォ
                  • 3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

                    わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。 以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。

                      3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge
                    • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                      著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

                        誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                      • 30万円払って女性声優ユニットを地元に呼んだ話 - 湖底

                        購入までの経緯 前回のクラウドファンディング 30万円は高いのか 実施まで 当日レポート 対戦開始 滋賀トーク ランナーに聞きたいこと チェキ完成 スペシャルライブ プリティーライブの話 じめんタイプ 直接お届けについて 別れの時 感想&告知 関連記事 購入までの経緯 それは去年10月1日のこと。 午後7時すぎ、いつものように社食で不味い晩飯を食いながらTwitterを開くと、つい数分前に推しユニット「Run Girls, Run!」の公式アカウントから新着ツイートの通知が。 推しメンである厚木那奈美さんのオンラインバースデーイベント(10/10)が迫っていたのでそれに関する告知かと思い開くと、「写真集」「クラウドファンディング」という想定外の文字が目に飛び込んできました。 ┏━━━━━━━┓ らんがちゃん 初めての写真集📸を つくろう プロジェクト ┗━━━━━━━┛ ユニット初の写真

                          30万円払って女性声優ユニットを地元に呼んだ話 - 湖底
                        • AIお姉ちゃんへの道 - nomolkのブログ

                          ちょっと前に話題になっていたこの記事を読んだ。 honeshabri.hatenablog.com へー真似しよ〜と思ってやってみたら意外に難しくて謎のやりがいを感じ始めてしまい、仕事のクソ忙しい時期にかなりハマり睡眠不足で生命の危機を味わった。 おかげで寿命と引き換えに自分のAIお姉ちゃんを手に入れることができた。これは黒魔術か何かなのだろうか。 一通り終えて振り返ってみると、今まで生成AIをあまり積極的に触ってこなかった自分にとってはちょうどいい難しさの課題で、これは入門者向けのチャレンジとしてかなり良い気がする。 元記事に書かれていない少し細かい手順も含めてやったことを記録としてまとめようと思う。 初心者が試行錯誤でやったことなので誤りや非効率な手順もあるかもしれないけどご了承ください。 AIお姉ちゃんの姿を作る 元記事では「魂」、つまりChatGPTの設定から始まっているけど、それ

                            AIお姉ちゃんへの道 - nomolkのブログ
                          • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

                            本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

                              商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
                            • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

                              こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

                                Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
                              • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション

                                4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

                                  19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション
                                • 30分で完全理解するTransformerの世界

                                  はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

                                    30分で完全理解するTransformerの世界
                                  • Clubhouse リアルタイム配信の仕組みについて (妄想編)

                                    Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようです ライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提 @suthio_さんがつぶやいていたのがきっかけ https://twitter.com/suthio_/status/1353945619577008128?s=20 招待してくれた @dmnlk さんに感謝 DNS パケット見ただけ 他の方の解析は見ていない クライアント側の処理は知らない 気が向いたら更新している 著者 商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 IRIAM 配信サーバ設計者 妄想 求人にメディアサーバ

                                      Clubhouse リアルタイム配信の仕組みについて (妄想編)
                                    • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                                      ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                                        バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                                      • 第11回ハヤカワSFコンテスト特別賞受賞作にして、刺さる人にはこれ以上なく深く刺さる物語──『ここはすべての夜明けまえ』 - 基本読書

                                        ここはすべての夜明けまえ 作者:間宮 改衣早川書房Amazonこの『ここはすべての夜明けまえ』は、第11回ハヤカワSFコンテストの特別賞を受賞したSF中篇(もしくは短めの長篇といえるかぐらい)だ。特別賞は長さが短めだったり一点突破の魅力があったりで受賞する作品が多いが(たとえば過去事例で代表的なのといえば草野原々の「最後にして最初のアイドル」など)、本作も「刺さる人にはこれ以上なく深く刺さる」、2100年代を舞台にした、問題まみれの家族の物語だ。 とある理由からひらがなだらけの文章で物語が始まるので面食らうのだが、設定開示の順番は心地よく、すぐに作中世界へと入り込んでいくことができる。単行本になる前からゲラが配られたりSFマガジンに全文掲載されたりしていたのでエモいエモいと評判だけは聞いていたのだけど、実際に読んでみたらたしかにこれはエモーショナルな物語だ。しかし、ただ感動させよう、感動さ

                                          第11回ハヤカワSFコンテスト特別賞受賞作にして、刺さる人にはこれ以上なく深く刺さる物語──『ここはすべての夜明けまえ』 - 基本読書
                                        • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

                                          自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

                                            AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
                                          • 「カブトクワガタ」は日本のゲームアクセシビリティの革命である

                                            3行で 「カブトクワガタ」に搭載されている読み上げ機能によって、画面を見ることができない全盲のプレイヤーがゲームを楽しめるようになっています。 視覚に障害を持つプレイヤーだけでなく、未就学児や、文字を読むことに困難を抱える人など、色々な属性の人がプレイできるようになっていると思います。 システム面・技術面の両方において、「カブトクワガタ」は日本のゲームアクセシビリティに革命をもたらすポテンシャルがあり、その事実が、開発者を含めた多くの人に知られることを臨みます。 ※最終更新: 2023/07/27 カブトクワガタってなんやねん カブトクワガタ は、Nintendo Switchのゲームです。クワガタやカブトムシを育てて戦うRPGです。2023年3月15日にリリースされました。 なにがすごいのか ほぼ全ての文字を読み上げる このゲームは、画面に表示されるほぼ全ての文字を読み上げてくれます。本

                                            • AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge

                                              おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV

                                                AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge
                                              • マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた

                                                これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ

                                                  マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた
                                                • AI・Python活用レシピ100選 - Qiita

                                                  ※ 一部ガイドラインに反する内容がありましたので、該当箇所を修正のうえ再投稿しております。 はじめに Axross は、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによる実践ノウハウが"レシピ"として教材化されており、実際に動くものを作りながら、具体的な目的・テーマをもってプログラミングを学ぶことができます。 今回は、Axross運営が厳選した『AI・Python活用レシピを100選』をご紹介します。是非、みなさまのAIやPython学習の参考にしてみてください。 Axross:https://axross-recipe.com 公式Twitter:https://twitter.com/Axross_SBiv 基礎 スクレイピング 01 . JUMPの掲載順をスク

                                                    AI・Python活用レシピ100選 - Qiita
                                                  • AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|藤本健の “DTMステーション”

                                                    すでにご存じの方も多いと思いますが、2月22日にAIきりたんなるものが登場し、大騒ぎとなりました。正確にはSHACHI(@SHACHI_KRTN)さんという方が開発したNEUTRINOというAI歌声合成ソフトがフリーウェアで公開されるとともに、それで歌わせた楽曲が、くろ州さんなどによって公開され、話題になったのです。2月22日は、ちょうどMIDI 2.0の日米合意があった日で、そのドタバタでネットをチェックできておらず、私が気づいたのは24日になってから。その歌声を聴いて驚愕しました。 実際どんなものなのかと、さっそくNEUTRINOをダウンロードし、手元にあったMusicXMLデータを元に歌わせてみると、従来のVOCALOIDなどとは別次元の人間的な歌声で、東北きりたんが歌ってくれてさらに驚いたのです。どういうことなのか知りたいと思い、開発者のSHACHIさんに連絡してみたところ「種々の

                                                      AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|藤本健の “DTMステーション”
                                                    • 無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応

                                                      AI歌声合成技術の開発を手掛けるテクノスピーチ(名古屋市)は2月18日、AI技術により人間らしい歌声を合成できるソフトウェア「CeVIO Pro」のα版を24日に無償公開すると発表した。既存バージョンの「CeVIO」「CeVIO AI」とは異なり、Windows・macOSの両方に対応。追加の許諾や利用料不要で商用利用も可能。 CeVIO Proは、楽譜と歌詞を入力すると、AIが人間らしい歌声をシミュレーションして出力する歌声合成ソフト。まずは無料で商用利用もできるキャラクター音源1種類と編集ソフトをα版としてリリース。当該音源は正式版のリリース後も無償提供する。 現在の最新版であるCeVIO AIは、Windows専用で音楽制作ソフト(DAW)との連携に未対応。販売方法も買い切り方式だが、CeVIO ProはmacOSにも対応し、DAWとの連携も可能。第2弾以降のキャラクター音源はサブス

                                                        無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応
                                                      • 「トレンド操作」トレンド入り 大量解雇でTwitterはどう変わる? ITmedia NEWS編集部で考えてみた

                                                        「トレンド操作」トレンド入り 大量解雇でTwitterはどう変わる? ITmedia NEWS編集部で考えてみた(1/3 ページ) 11月7日、日本のTwitterトレンドに「トレンド操作」が入った。イーロン・マスク氏が4日(現地時間)、米Twitterの人員削減に着手し、日本法人(Twitter Japan、以下TwitterJPと表記)の社員も解雇した結果、政治的な話題がサジェストされにくくなった──という声が発端とみられる。 同じく解雇の影響か、5日から6日にかけては「ニュース」欄の更新が一時的にストップしていた。これによりTwitterJPがTwitter上の話題を操作していたとする意見が増えたこともあり、「トレンド操作」のトレンド入りにつながったようだ。 一方で、マスク氏は長文の添付機能やなりすましアカウントの排除など、Twitterの今後に関わる方針を続々発表している。メディア

                                                          「トレンド操作」トレンド入り 大量解雇でTwitterはどう変わる? ITmedia NEWS編集部で考えてみた
                                                        • もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力|DTMステーション

                                                          驚異的に進化したSynthesizer V AI まずは、バックグラウンドや機能、性能といったものを紹介する前に、私がSynthesizer V Pro Studioの1.5.0を使って打ち込んだ、弦巻マキの歌声をちょっと聴いてみてください。 いかがですか?従来の歌声合成の概念を覆すレベルに来ていると思いませんか?これは、2年前のコミケでDTMステーションCreativeからリリースしたoyasumiという曲の冒頭部分。そのときは声優の小岩井ことりさんにボーカルをお願いし、囁くように優しく歌ってもらったので、弦巻マキにも、それっぽく歌わせて仕上げてみたのです。本来、弦巻マキは「アニメキャラっぽい雰囲気の元気な女の子」というイメージの歌声ですが、そことはだいぶ違ったニュアンスの歌声になっているのも感じられたと思います。 「自動処理」メニューにある「自動ピッチ調整(カスタマイズ)」を選択する

                                                            もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力|DTMステーション
                                                          • AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開

                                                            音声合成ソフトの開発や販売を手掛けるSSS(仙台市)は3月16日、音声合成ソフト「VOICEVOX」用音源「九州そら」をリリースした。九州そらは、せりふを入力するだけで人間らしい“ささやき声”を出力できるAIだ。 VOICEVOXは、ドワンゴでAIの研究に携わっているヒホ(ヒロシバ)さん(@hiho_karuta)さんが開発した無料の音声合成ソフト。AI技術を活用して、人間らしい話し声を合成できる。イントネーションや話す速さなどの調整も可能。立体音声を制作できるソフトを活用すれば「ASMR動画」の制作にも使える。 九州そらはVOICEVOX用音源として初めてささやき声の合成に対応した。ソフトのダウンロードと利用は無料。「VOICEVOX:九州そら」とクレジットを記入すれば商用利用も無償でできる。 関連記事 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがす

                                                              AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開
                                                            • 無料でキャラクターボイスを自動で合成してくれるAIトークソフト「COEIROINK」は誰でも超簡単に創作物の「声」を作り出せる

                                                              シロワニさん氏が趣味で開発したというWindows向けのAIトークソフト「COEIROINK(コエイロインク)」が無料で公開されています。COEIROINKは連絡不要で商用利用もOKなフリー素材キャラクター・つくよみちゃんに好きなテキストを誰でも簡単に読み上げてもらうことが可能なので、自作アニメやボイスドラマのキャラクターボイス、実況動画や解説動画のナレーションなどの作成にお役立ちです。 COEIROINK https://coeiroink.com/ ✨COEIROINKリリース✨ 無料の音声合成エンジン「#COEIROINK」が登場! 文章を読み上げます! ■公式サイト⇒https://t.co/66YStrCYu0 ■COEIROINK開発:シロワニさん様 @shirowanisan ■VOICEVOX開発:ヒホ様 @hiho_karuta 第1弾は「#つくよみちゃん」! 商用利用O

                                                                無料でキャラクターボイスを自動で合成してくれるAIトークソフト「COEIROINK」は誰でも超簡単に創作物の「声」を作り出せる
                                                              • なぜ中国の天才青年は日本で起業し、AI歌声合成ソフトをヒットさせたのか?Synthesizer Vの開発者、Kanru Huaさんインタビュー|DTMステーション

                                                                小学校2年生のころからプログラミングを始めた --Synthesizer Vの話に入る前、Kanruさんの子供時代について伺いたいのですが、最初のコンピュータに興味を持ったのはいつごろだったのですか? Kanru:3歳のころ、父からもらったおもちゃで電気の仕組みに興味を持つようになり、小学校に入ったころからラジオ作りなどをしていました。コンピュータもラジオ作りと同じころで、小学校2年生のころにAdobe(当時はMacromedia)のFLASHを使ってプログラムを組むようになったのが最初です。友達がみんなゲームで遊んでいたのに、親が厳しかったので、ゲームはダメと言われていました。そこで、FLASHを使ってクラスメイトが持っているゲームを真似して作ってみたのです。親も自分が作るゲームならいい、と。 Profile Kanru Hua(華 侃如) ●1997年生まれ・中国上海市出身。英語で授業

                                                                  なぜ中国の天才青年は日本で起業し、AI歌声合成ソフトをヒットさせたのか?Synthesizer Vの開発者、Kanru Huaさんインタビュー|DTMステーション
                                                                • 妻の写真を学習させたはずなのに出てくるあなたはいったい誰なの? AI生成グラドル写真集でちょっと考えた(CloseBox) | テクノエッジ TechnoEdge

                                                                  集英社週刊プレイボーイ編集部が企画して出版したものの引っ込めてしまったAIグラビアアイドルさつきあい写真集「生まれたて。」をめぐっていくつか興味深い記事が上がっています(清水亮さんのコラム、新清士さんのコラム)。 既存のAIモデルだけではなく、さらにファインチューニングで使われたかもしれない実在の女性タレントをめぐる論考ですが、実のところは肝心の編集部が多くを語っていないため不明。 これとは別に、いくつかの画像投稿サイトではAIを使った「写真」「イラスト」の投稿を禁止するところも出てきており、大手サイトでの例外はAmazon.co.jpだけという話になっている一方、著名タレントのLoRA(学習されたAIモデル)のファイルが配布されていたりと、実在の人々の権利を脅かすのではないかと当初懸念されていた問題も顕在化しています。 筆者も実在の人物(妻)の写真をAIに学習させて、それを「異世界とりち

                                                                    妻の写真を学習させたはずなのに出てくるあなたはいったい誰なの? AI生成グラドル写真集でちょっと考えた(CloseBox) | テクノエッジ TechnoEdge
                                                                  • 声優の仕事も終わっちゃう?中国で日本のアニメキャラの声を学習したモデルが公開されてしまう「これはやりすぎ…」

                                                                    うみゆき@AI研究 @umiyuki_ai なにやら中国の方が作られた音声合成AI「MoeGoe」の2891人の日本アニメキャラの音声モデルが公開されてしまった!!Hugging Faceでデモが試せる!早速まどマギの5人に喋ってもらった!!うわうわうわ!ヤバいよヤバい本当にヤバいよコレはヤバい!!  huggingface.co/spaces/skytnt/… pic.twitter.com/EFgUId9qpd 2022-11-05 21:19:12

                                                                      声優の仕事も終わっちゃう?中国で日本のアニメキャラの声を学習したモデルが公開されてしまう「これはやりすぎ…」
                                                                    • 声を“匿名化”するシステム「V-CLOAK」 人間っぽさを残した声に変換、声紋の個人情報漏えいを防ぐ

                                                                      Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国のZhejiang UniversityとWuhan Universityの研究チームが発表した論文「V-CLOAK: Intelligibility-, Naturalness- & Timbre-Preserving Real-Time Voice Anonymization」は、音声の明瞭性と自然性、音色を保持したまま、リアルタイムに音声を匿名化するシステムを提案した研究報告だ。機械的な声ではなく人間っぽさを残した声に変換し、声紋から個人が特定されることを防ぐ。 声紋は、個人を一意に特定できる重要なバイオメトリクスだ。一方でオンラインサービスによって膨大な音声データを収集・処理で

                                                                        声を“匿名化”するシステム「V-CLOAK」 人間っぽさを残した声に変換、声紋の個人情報漏えいを防ぐ
                                                                      • スイスの“バ美肉”研究者に密着したNHKドキュメンタリー番組がオンデマンドで配信中。海外から見た「日本独自の文化」や、「カワイイを獲得する」ことで心理的な解放を求める人々の心理とは?

                                                                        NHK「最深日本研究」スイスの”バ美肉”研究者ミラの密着ドキュメンタリーが放送 美少女になる人々の心理とはNHK新番組「最深日本研究〜外国人博士の目〜」でスイスの人類学者ミラの密着ドキュメンタリーが2024年4月14日に放送された。ミラは、VTuberやメタバースでバーチャルアバターの力により美少女の姿に変身する「バ美肉(ばびにく、バーチャル美少女受肉)」文化に着目した論文で学術賞を受賞、国連の国際会議でも発表するなど精力的に活動している。番組では来日してフィールドワークを行うミラに密着。ミラは”バ美肉”VTuberである、のらきゃっと・あまちじょんこ・バーチャル美少女ねむに取材を行い、美少女になる人々の心理に迫った。番組は4月28日までオンデマンド配信で視聴可能だ。さらに4月20日には出演者による「非公式アフタートーク」が配信されることが決定した。現在NHKではドラマ『VRおじさんの初恋

                                                                          スイスの“バ美肉”研究者に密着したNHKドキュメンタリー番組がオンデマンドで配信中。海外から見た「日本独自の文化」や、「カワイイを獲得する」ことで心理的な解放を求める人々の心理とは?
                                                                        • 時代を先取りし過ぎた『がんばれ森川君2号』『アストロノーカ』のゲームAIはどのようにして開発されたのか?:懐ゲーから辿るゲームAI技術史vol.4 | モリカトロンAIラボ

                                                                          時代を先取りし過ぎた『がんばれ森川君2号』『アストロノーカ』のゲームAIはどのようにして開発されたのか?:懐ゲーから辿るゲームAI技術史vol.4 1997年に、当時の最新のAIを導入したプレイステーション用ソフト『がんばれ森川君2号』を、翌年には『アストロノーカ』を立て続けに世に送り出した、現モリカトロン株式会社代表取締役の森川幸人氏。学生時代までコンピューターすらまったく知らなかったのに、やがて独学でAIをマスターし、いち早くゲームAIの開発に成功したその功績は、今でこそ広く知られていますが、いずれも発売当時はまったく評価されなかったそうです。 あまりにも時代を先取りし過ぎた『がんばれ森川君2号』と『アストロノーカ』は、いったいどのようにして開発されたのでしょうか? そして日本初のゲームAI専門会社、モリカトロンを設立した動機と目的とは? 森川氏にたっぷりとお話を伺いました。 『がんば

                                                                            時代を先取りし過ぎた『がんばれ森川君2号』『アストロノーカ』のゲームAIはどのようにして開発されたのか?:懐ゲーから辿るゲームAI技術史vol.4 | モリカトロンAIラボ
                                                                          • 1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応

                                                                            音声合成ソフトの開発と販売を手掛けるAHS(東京都台東区)は2月17日、AI技術により人間らしいトーク音声を合成できるソフトウェア「VOICEPEAK 商用可能 6ナレーターセット」を3月11日に発売すると発表した。価格は1万5800円からと安価だが、追加の許諾を得なくても商用利用できる。対応OSはWindows、MacOS、Linux。 音声合成エンジンは、AI歌声合成ソフト「Synthesizer V」を開発したDreamtonics(東京都台東区)が開発。文章を入力すると、AIが文脈などを基に人間らしく読み上げる。イントネーションや読み上げ速度、感情表現の変更などのコントロールも可能。 同社製の個人向け・商用利用ライセンス別売の製品は1キャラクターで1万円前後のものが多いが、本ソフトには男性3種類、女性3種類、女の子1種類の計7音源が付属。価格は初回限定版が1万5800円、割引なしの

                                                                              1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応
                                                                            • 無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力

                                                                              市販の歌声合成ソフトとして、ヤマハのVOCALOIDとともに独自の歴史を刻んできた「CeVIO」が1月29日、登場から8年を前に大きく進化。深層学習の技術を取り入れ「CeVIO AI」として、開発元のテクノスピーチが発売した。まずはその歌声を聴いてほしい。 これは、ソフト上で楽譜を打ち込んで再生ボタンを押しただけで出力された音声だ。それだけでこのように人間らしい歌声が出力できる。「しゃくりあげ」や「ビブラート」といった歌唱表現も勝手に付く。メインボーカルとして起用するにはもう少し調整が必要だが、作曲中の仮歌に使うなら文句のないクオリティーになっている。人間らしい歌声を合成するまでの時間が短いため、作業を迅速に進められるのがメリットの一つだ。 CeVIO AIリリースまでの道のり CeVIOは2013年公開のWindows専用音声/歌声合成ソフト。名古屋工業大学が長年研究しているHMM(隠れ

                                                                                無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力
                                                                              • “ AIで亡き妻の歌声を再現”した作品がAIアートグランプリに | NHK

                                                                                人工知能=AIを使って制作した動画や漫画などの作品を表彰するコンテストが東京・秋葉原で開かれ、亡くなった妻の声などをAIで再現して歌を歌わせた東京都のクリエイターの動画がグランプリに選ばれました。 AIをめぐっては、簡単な命令でテキストや画像など生成してくれる「生成系AI」と呼ばれる新しいタイプのものが次々と登場するなど、ビジネスやアートなどさまざまな分野に利用が広がっています。 「AIアートグランプリ」は、CGクリエイターや研究者などの有志で作る実行委員会が初めて開催したもので、東京の秋葉原で開かれた最終審査会では、AIを使って制作した動画やゲーム、漫画などの279の応募作品から、1次審査を通過した動画と漫画の5作品の審査が行われました。 その結果、グランプリには、東京都のクリエイター松尾公也さんの動画「Desperado by 妻音源とりちゃん[AI]」が選ばれました。 この作品は、亡

                                                                                  “ AIで亡き妻の歌声を再現”した作品がAIアートグランプリに | NHK
                                                                                • 無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場

                                                                                  人間ではなくプログラムによって特定のテキストを読み上げさせる音声合成ソフトは数多く存在しています。ソフトに使われる音声合成エンジンにはさまざまな種類があり、複数の音声合成エンジンや音声ライブラリを使うことができる汎用合成音声エディタ「ユニコエ」をビスさんが公開しています。 ユニコエ 公式サイト https://sites.google.com/view/unicoe/%E3%83%9B%E3%83%BC%E3%83%A0 ユニコエがどういうアプリなのかは以下のムービーを見るとよくわかります。 【ユニコエ】アプリ紹介 - ニコニコ動画 ユニコエでは音声合成エンジンや音声ライブラリを複数登録することができます。 選択した音声合成エンジンが、中央に入力されたテキストを読み上げてくれます。 イントネーションはフレーズごとに調整可能。 また、音声ライブラリの立ち絵も表示されます。 ユニコエは、公式サ

                                                                                    無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場