並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 1267件

新着順 人気順

音声合成の検索結果1 - 40 件 / 1267件

  • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

    日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

      音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
    • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

      オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

      • 2022年「はてなブックマーク年間ランキング」トップ100 - はてなニュース

        はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク年間ランキング」の2022年版を発表します。上位トップ100の記事をピックアップしました(集計期間:2021年12月11日~2022年12月10日)。 2022年 はてなブックマーク年間ランキング(2021年12月11日~2022年12月10日) 順位 タイトル 1位 【詳しすぎる2週間】親の死亡後にまずやること(行動チェックリスト付) 2位 逮捕にそなえる人生継続計画 - やしお 3位 150 分で学ぶ高校数学の基礎 4位 ゲームの勝敗でかんしゃくを起こす子どもにできることは大人げない大人になること|フィンランドワークショップomena|note 5位 【アメリカで話題】ただ座るだけ!股関節がみるみる柔らかくなる「90/90ストレッチ」 | ヨガジャーナルオンライン 6位 Amazonプライムビデオで観てほしい

          2022年「はてなブックマーク年間ランキング」トップ100 - はてなニュース
        • 【必見】2020年に話題になったイケてるWebサービス・アプリまとめ

          あけましておめでとうございます。 今回は、2020年に話題になったイケてるWebサービス・アプリを紹介します。 多数リリースされているもののなかから、チェックし直しておいたほうがよさそうなサービスをピックアップしました。 2020年は新型コロナウイルスの流行もあり、世界が大きく変わりました。 それに伴い、生活様式にも変化が生まれ、リリースされるWebサービスやアプリも時代に則したものが多いように感じました。 冬休みのあいだに、ぜひおさらいしてみてください。 【その前に】毎月更新する本シリーズについて 2020年はしばらくお休みをいただいておりましたが、本年より更新を再開します。 引き続き、毎月末に更新となります。 また、新たに無料メルマガも開始します。 メルマガでは、運営者が気になったり、業界的に知っておいたほうが良さそうなWebサービスやアプリの紹介を不定期に紹介していく予定です。 最新

            【必見】2020年に話題になったイケてるWebサービス・アプリまとめ
          • JavaScriptを完全無料で学習できる最強の厳選コンテンツを大公開! - paiza times

            どうも、まさとらん(@0310lan)です! 今回は、JavaScript初心者から中級者までをカバーできる学習コンテンツを厳選してご紹介します。 完全無料で公開されているものばかりを集めており、なおかつ質の高いコンテンツを選んでいますので独学したい方にも最適です。テキスト、動画、本、Webアプリなど、さまざまな種類のコンテンツを楽しみながらぜひ学習に役立ててください! ■学習を始める前に これからJavaScriptの学習コンテンツについて解説をしていく前に、ひとつだけ以下のサイトをご紹介しておきます。 【 The Modern JavaScript Tutorial 】 これはJavaScriptの基礎構文・DOM操作・非同期処理・サーバ通信など、ほとんどの学習項目を網羅したリファレンスのようなサイトです。海外で作られたサイトですが、うれしいことに日本語化されているので初心者にも扱いや

              JavaScriptを完全無料で学習できる最強の厳選コンテンツを大公開! - paiza times
            • 無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

              CoeFont (コエフォント) @coefont Web音声合成サービス『CoeFont STUDIO』 coefont.studio をリリースしました。全サービス無料公開。すべてのクリエイターに声を届けます。#CoeFontSTUDIO #CoeFont pic.twitter.com/Wu5AFJpZ9d 2021-04-23 12:44:30

                無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」
              • 「AIきりたん」がすごい - すずしめにっき

                ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開

                  「AIきりたん」がすごい - すずしめにっき
                • 文字商標「ゆっくり茶番劇」に関するドワンゴの見解と対応について|ニコニコインフォ

                  (2023年7月24日追記) 2022年2月24日に登録された「ゆっくり茶番劇」商標(登録6518338号)について そもそも商標として登録されるべきではなかったことを明らかにするために無効審判を請求しておりましたが、 7月12日付けで無効審決が下されたとの通知を特許庁より受領いたしました。 すでに本件商標登録は放棄による抹消となっておりますが、登録日から抹消日までの間は商標権が発生しておりました。 この無効審決は、過去にさかのぼり「はじめからなかったこと」にして、当該商標権を打ち消すものです。 一定期間内に審決取消訴訟が提起されなければ、「ゆっくり茶番劇」の登録を無効とすべきと判断した無効審決が確定します。 無効審決の確定をもって、「ゆっくり茶番劇」にまつわる商標権についての問題がすべて解決することになります。 審決が確定しましたら、あらためてお知らせいたします。 当該騒動が発生してから

                    文字商標「ゆっくり茶番劇」に関するドワンゴの見解と対応について|ニコニコインフォ
                  • ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」

                    チキン@ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中(2024年の5月ごろ出版かな?) webwhiter-skill.com/job/

                      ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」
                    • 校長先生の話エンドレス

                      このサイトでは、マルコフ連鎖で作成した校長先生の話を永遠に聞くことが出来ます。ぜひ音声ありでご視聴ください。

                        校長先生の話エンドレス
                      • 3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

                        わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。 以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。

                          3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge
                        • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                          著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

                            誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                          • 高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応(CloseBox) | テクノエッジ TechnoEdge

                            オープンソースのAI声質変換(ボイスチェンジャー)ソフトウェア「RVC WebUI」が、日本語での表示に対応しました。 VITSという声質変換技術をベースにしたRVC(Retrieval-based Voice Changer)に、Webユーザーインタフェースを付加したのが「RVC WebUI」です。

                              高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応(CloseBox) | テクノエッジ TechnoEdge
                            • 30万円払って女性声優ユニットを地元に呼んだ話 - 湖底

                              購入までの経緯 前回のクラウドファンディング 30万円は高いのか 実施まで 当日レポート 対戦開始 滋賀トーク ランナーに聞きたいこと チェキ完成 スペシャルライブ プリティーライブの話 じめんタイプ 直接お届けについて 別れの時 感想&告知 関連記事 購入までの経緯 それは去年10月1日のこと。 午後7時すぎ、いつものように社食で不味い晩飯を食いながらTwitterを開くと、つい数分前に推しユニット「Run Girls, Run!」の公式アカウントから新着ツイートの通知が。 推しメンである厚木那奈美さんのオンラインバースデーイベント(10/10)が迫っていたのでそれに関する告知かと思い開くと、「写真集」「クラウドファンディング」という想定外の文字が目に飛び込んできました。 ┏━━━━━━━┓ らんがちゃん 初めての写真集📸を つくろう プロジェクト ┗━━━━━━━┛ ユニット初の写真

                                30万円払って女性声優ユニットを地元に呼んだ話 - 湖底
                              • AIお姉ちゃんへの道 - nomolkのブログ

                                ちょっと前に話題になっていたこの記事を読んだ。 honeshabri.hatenablog.com へー真似しよ〜と思ってやってみたら意外に難しくて謎のやりがいを感じ始めてしまい、仕事のクソ忙しい時期にかなりハマり睡眠不足で生命の危機を味わった。 おかげで寿命と引き換えに自分のAIお姉ちゃんを手に入れることができた。これは黒魔術か何かなのだろうか。 一通り終えて振り返ってみると、今まで生成AIをあまり積極的に触ってこなかった自分にとってはちょうどいい難しさの課題で、これは入門者向けのチャレンジとしてかなり良い気がする。 元記事に書かれていない少し細かい手順も含めてやったことを記録としてまとめようと思う。 初心者が試行錯誤でやったことなので誤りや非効率な手順もあるかもしれないけどご了承ください。 AIお姉ちゃんの姿を作る 元記事では「魂」、つまりChatGPTの設定から始まっているけど、それ

                                  AIお姉ちゃんへの道 - nomolkのブログ
                                • AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース|DTMステーション

                                  今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO(ニュートリノ)です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT(いずれも学術的に公開されている歌声データベースを利用して開発している)の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです(9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です)。 先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ

                                    AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース|DTMステーション
                                  • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

                                    本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

                                      商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
                                    • AIによるボイスチェンジャーソフト「Voidol」が期間限定で無償配布

                                        AIによるボイスチェンジャーソフト「Voidol」が期間限定で無償配布
                                      • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

                                        こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

                                          Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
                                        • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション

                                          4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

                                            19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション
                                          • 誰でもブラウザで簡単にAI作曲。AIボーカルも入って1日5曲まで無料で作れるSongR BETA登場|DTMステーション

                                            ここ数か月、AIの進化が加速していて、時代についていけなくなりそうです。音楽関連のものも次々と登場していて、いつも驚くばかりですが、ここ数日SNSのタイムラインで何度か目にしたのがSongRなるもの。「これ、何だろう?」とリンクを踏んでみたところ、AIが自動作曲・編曲してくれ、作詞もしてくれるし、自分で歌詞を入力すればそれに合わせて歌ってもくれるというサービスだったのです。 アプリをインストールしたりする必要もなく、ブラウザで使えるサービスであるためWindwosでもMacでもiPhone、Androidでも何でもOKというもの。まだスタートして1、2週間のようですが、現在ベータ版という扱いだからか、誰でも無料で使うことができ、サービスとなっています。まだ発展途上という感じではありますが、今後進化していくと、かなり凄いものになりそうな気もするシステムだったので、ちょっと紹介してみましょう。

                                              誰でもブラウザで簡単にAI作曲。AIボーカルも入って1日5曲まで無料で作れるSongR BETA登場|DTMステーション
                                            • ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション

                                              自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して

                                                ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション
                                              • 30分で完全理解するTransformerの世界

                                                はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

                                                  30分で完全理解するTransformerの世界
                                                • Clubhouse リアルタイム配信の仕組みについて (妄想編)

                                                  Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようです ライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提 @suthio_さんがつぶやいていたのがきっかけ https://twitter.com/suthio_/status/1353945619577008128?s=20 招待してくれた @dmnlk さんに感謝 DNS パケット見ただけ 他の方の解析は見ていない クライアント側の処理は知らない 気が向いたら更新している 著者 商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 IRIAM 配信サーバ設計者 妄想 求人にメディアサーバ

                                                    Clubhouse リアルタイム配信の仕組みについて (妄想編)
                                                  • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                                                    ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                                                      バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                                                    • 歌声合成ソフト【NEUTRINO】が公開、無調声でも人間っぽく歌唱してる様に聴こえる事に神前暁さん始め音楽家等から驚愕の声が! #AIきりたん

                                                      技術はついにここまで来たか…!という感想です。 諸々ざっくりとまとめましたが、各地に既にこのソフトを使用して色々公開されているので、探してみてください。

                                                        歌声合成ソフト【NEUTRINO】が公開、無調声でも人間っぽく歌唱してる様に聴こえる事に神前暁さん始め音楽家等から驚愕の声が! #AIきりたん
                                                      • 第11回ハヤカワSFコンテスト特別賞受賞作にして、刺さる人にはこれ以上なく深く刺さる物語──『ここはすべての夜明けまえ』 - 基本読書

                                                        ここはすべての夜明けまえ 作者:間宮 改衣早川書房Amazonこの『ここはすべての夜明けまえ』は、第11回ハヤカワSFコンテストの特別賞を受賞したSF中篇(もしくは短めの長篇といえるかぐらい)だ。特別賞は長さが短めだったり一点突破の魅力があったりで受賞する作品が多いが(たとえば過去事例で代表的なのといえば草野原々の「最後にして最初のアイドル」など)、本作も「刺さる人にはこれ以上なく深く刺さる」、2100年代を舞台にした、問題まみれの家族の物語だ。 とある理由からひらがなだらけの文章で物語が始まるので面食らうのだが、設定開示の順番は心地よく、すぐに作中世界へと入り込んでいくことができる。単行本になる前からゲラが配られたりSFマガジンに全文掲載されたりしていたのでエモいエモいと評判だけは聞いていたのだけど、実際に読んでみたらたしかにこれはエモーショナルな物語だ。しかし、ただ感動させよう、感動さ

                                                          第11回ハヤカワSFコンテスト特別賞受賞作にして、刺さる人にはこれ以上なく深く刺さる物語──『ここはすべての夜明けまえ』 - 基本読書
                                                        • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

                                                          自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

                                                            AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
                                                          • 「カブトクワガタ」は日本のゲームアクセシビリティの革命である

                                                            3行で 「カブトクワガタ」に搭載されている読み上げ機能によって、画面を見ることができない全盲のプレイヤーがゲームを楽しめるようになっています。 視覚に障害を持つプレイヤーだけでなく、未就学児や、文字を読むことに困難を抱える人など、色々な属性の人がプレイできるようになっていると思います。 システム面・技術面の両方において、「カブトクワガタ」は日本のゲームアクセシビリティに革命をもたらすポテンシャルがあり、その事実が、開発者を含めた多くの人に知られることを臨みます。 ※最終更新: 2023/07/27 カブトクワガタってなんやねん カブトクワガタ は、Nintendo Switchのゲームです。クワガタやカブトムシを育てて戦うRPGです。2023年3月15日にリリースされました。 なにがすごいのか ほぼ全ての文字を読み上げる このゲームは、画面に表示されるほぼ全ての文字を読み上げてくれます。本

                                                            • AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge

                                                              おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV

                                                                AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge
                                                              • マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた

                                                                これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ

                                                                  マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた
                                                                • SofTalkをご利用の皆様へのお知らせ - SofTalk

                                                                  日頃よりご愛顧いただき誠にありがとうございます。 SofTalkは、長年AquesTalkに対応してまいりましたが、勝手ながら AquesTalkへの対応を中止させていただくこととしました。 SofTalkのようにAquesTalkを同梱している場合、利用者がAquesTalkの機能を使わずに、 OpenJTalkを商用利用する場合でも、AquesTalkのライセンス料を支払わなければなりません。 AQUEST社たってのお願いで7年ほど前に新ライセンスに移行しましたが、旧ライセンスに比べて 冷遇されている状況を思うと、趣味であるはずのプログラミングを苦痛に感じるようになりました。 AQUEST社とは一度話し合いの場が設けられることになりましたが、「ごあいさつ程度の意味合いで」 「食事のできるオープンなお店で」と言われたときに建設的な意見交換が望めないように感じ、 お会いしたくありませんと言

                                                                  • AI・Python活用レシピ100選 - Qiita

                                                                    ※ 一部ガイドラインに反する内容がありましたので、該当箇所を修正のうえ再投稿しております。 はじめに Axross は、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによる実践ノウハウが"レシピ"として教材化されており、実際に動くものを作りながら、具体的な目的・テーマをもってプログラミングを学ぶことができます。 今回は、Axross運営が厳選した『AI・Python活用レシピを100選』をご紹介します。是非、みなさまのAIやPython学習の参考にしてみてください。 Axross:https://axross-recipe.com 公式Twitter:https://twitter.com/Axross_SBiv 基礎 スクレイピング 01 . JUMPの掲載順をスク

                                                                      AI・Python活用レシピ100選 - Qiita
                                                                    • AIボイチェンソフト「Voidol 1」が無償化

                                                                        AIボイチェンソフト「Voidol 1」が無償化
                                                                      • Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに|DTMステーション

                                                                        10月27日、Synthesizer Vの新しい歌声データベースとして、Maiがお披露目となり、その歌唱動画が公開されました。実際にユーザーが入手可能になるまでには、まだもう少し待つ必要がありそうですが、遅くとも年内には登場するそうですから心待ちにしたいところです。 今回、Synthesizer Vの開発元であるDreamtonicsによって公開されたMaiの歌声のビデオを見ると、驚くほど滑らか、スマートな歌い方であり、もはや人間の歌声と区別がつかない次元まで進化しているように感じます。しかも、とくに調声をしなくても、音符と歌詞を入力するだけで、非常にリアルな歌い方をしてくれる、というのも、嬉しいところです。一方で、先日リリースされたSynthesizer V Studio Proの最新バージョン1.7.1において、歌声データベースの複数バージョンを利用できる機能が追加されています。なぜそ

                                                                          Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに|DTMステーション
                                                                        • AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|藤本健の “DTMステーション”

                                                                          すでにご存じの方も多いと思いますが、2月22日にAIきりたんなるものが登場し、大騒ぎとなりました。正確にはSHACHI(@SHACHI_KRTN)さんという方が開発したNEUTRINOというAI歌声合成ソフトがフリーウェアで公開されるとともに、それで歌わせた楽曲が、くろ州さんなどによって公開され、話題になったのです。2月22日は、ちょうどMIDI 2.0の日米合意があった日で、そのドタバタでネットをチェックできておらず、私が気づいたのは24日になってから。その歌声を聴いて驚愕しました。 実際どんなものなのかと、さっそくNEUTRINOをダウンロードし、手元にあったMusicXMLデータを元に歌わせてみると、従来のVOCALOIDなどとは別次元の人間的な歌声で、東北きりたんが歌ってくれてさらに驚いたのです。どういうことなのか知りたいと思い、開発者のSHACHIさんに連絡してみたところ「種々の

                                                                            AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|藤本健の “DTMステーション”
                                                                          • Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話

                                                                            稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」 ぼく「はい」 Google「そちらの営業時間を教えてください」 ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と日曜日の営業時間も教えてください」 ↓ 2022-01-25 10:26:41 稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h ぼく「土曜と日曜は普通にお休みです」 Google「確認させてください。そちらの営業時間は月曜から金曜の9時〜18時でよろしいでしょうか」 ぼく「はい」 Google「ありがとうございました(電話を切りそうな気配)」 ぼく「待って。参

                                                                              Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話
                                                                            • 無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応

                                                                              AI歌声合成技術の開発を手掛けるテクノスピーチ(名古屋市)は2月18日、AI技術により人間らしい歌声を合成できるソフトウェア「CeVIO Pro」のα版を24日に無償公開すると発表した。既存バージョンの「CeVIO」「CeVIO AI」とは異なり、Windows・macOSの両方に対応。追加の許諾や利用料不要で商用利用も可能。 CeVIO Proは、楽譜と歌詞を入力すると、AIが人間らしい歌声をシミュレーションして出力する歌声合成ソフト。まずは無料で商用利用もできるキャラクター音源1種類と編集ソフトをα版としてリリース。当該音源は正式版のリリース後も無償提供する。 現在の最新版であるCeVIO AIは、Windows専用で音楽制作ソフト(DAW)との連携に未対応。販売方法も買い切り方式だが、CeVIO ProはmacOSにも対応し、DAWとの連携も可能。第2弾以降のキャラクター音源はサブス

                                                                                無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応
                                                                              • 高品質な音声変換ソフトウェア | Seiren Voice

                                                                                AIの技術を用いてクオリティを追求した、今までにない音声変換ソフトウェア。 いつもと違う声で表現することの楽しさを、ぜひ体験してみてください。 AI技術を用いた高品質な音声変換ソフトウェアです。 誰の声でも狙ったキャラクターの声に変換することができます。 クオリティを追求することで、ボイスチェンジャーらしいノイズが乗らない、 人間らしい声を実現することができました。 キャラクター紹介

                                                                                  高品質な音声変換ソフトウェア | Seiren Voice
                                                                                • 「トレンド操作」トレンド入り 大量解雇でTwitterはどう変わる? ITmedia NEWS編集部で考えてみた

                                                                                  「トレンド操作」トレンド入り 大量解雇でTwitterはどう変わる? ITmedia NEWS編集部で考えてみた(1/3 ページ) 11月7日、日本のTwitterトレンドに「トレンド操作」が入った。イーロン・マスク氏が4日(現地時間)、米Twitterの人員削減に着手し、日本法人(Twitter Japan、以下TwitterJPと表記)の社員も解雇した結果、政治的な話題がサジェストされにくくなった──という声が発端とみられる。 同じく解雇の影響か、5日から6日にかけては「ニュース」欄の更新が一時的にストップしていた。これによりTwitterJPがTwitter上の話題を操作していたとする意見が増えたこともあり、「トレンド操作」のトレンド入りにつながったようだ。 一方で、マスク氏は長文の添付機能やなりすましアカウントの排除など、Twitterの今後に関わる方針を続々発表している。メディア

                                                                                    「トレンド操作」トレンド入り 大量解雇でTwitterはどう変わる? ITmedia NEWS編集部で考えてみた