並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 593件

新着順 人気順

音声の検索結果41 - 80 件 / 593件

  • 文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK

    会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインを求められます

      文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
    • 声優・小岩井ことりさんと実験! オンライン会議アプリの音質比較してみた 前編【藤本健のDigital Audio Laboratory】

        声優・小岩井ことりさんと実験! オンライン会議アプリの音質比較してみた 前編【藤本健のDigital Audio Laboratory】
      • 録音した音声を文字起こしするiOS無料アプリ「Qyur2(キュルキュル)」 - ITmedia Mobile

        Qyur2のユニークな仕掛けも特徴的で、昭和のカセットレコーダーのようなUI(ユーザーインタフェース)に、キュルキュルと音を立てながらデータを巻き戻せる。 この他にも、英会話用コンテンツ「完全改訂版 起きてから寝るまで英語表現700」「究極の英会話(上)中学1~2年レベル英文法100パーセント攻略」において、音声に合わせてテキストを表示する機能も追加した。 対応OSのバージョンはiOS 10.0以降を搭載したiPhone、iPad、iPod touchで、対応言語は日本語、英語、中国語(簡体、繁体)。ダウンロードは無料だが、英語・英会話用、中国語、韓国語コンテンツ、自動文字変換を利用するにはポイントの購入が必要となる。 【訂正:2019年6月7日21時22分 初出時に、タイトルに「無料アプリ」と記載していましたが、自動文字変換は有償のため、タイトルから「無料」を削除いたしました】 【訂正:

          録音した音声を文字起こしするiOS無料アプリ「Qyur2(キュルキュル)」 - ITmedia Mobile
        • 逆FM音源

          与えられた楽器の音色に近いFM音源パラメータの探索を勾配法で解く方法を解説します これは2020年2月8日に行われた カーネル/VM探検隊@関西 10回目 での発表資料です サンプルコード: https://github.com/Fadis/ifm

            逆FM音源
          • Futuri AudioAI

            Need Help? Report an Issue Troubleshooting Topics Privacy

              Futuri AudioAI
            • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

              自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

                AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
              • 同人音声がすごいことになっている2022 - セミになっちゃた

                「同人音声」や「音声作品」と呼ばれるメディアがある。 特殊な録音技術を使ってさも耳元で本当に囁いているかのように聞こえるのが特徴で、耳かきや散髪音などリラックスできる全年齢向け作品のほか、耳舐めをはじめとしたポルノ作品も多い。最近ではゲームやアニメといった別ジャンルから大きなIPの参入や、有名声優の起用など、話題にことかかないホットな分野である。 中にはかなり変わった作品もあり、すごいことになっているのでその一端を紹介する。 今回紹介する入門編は2つ、三途の川の渡し守に毒針で耳かきされる音声(?)と、耳なし芳一が怨霊に耳責めされてしまう音声(???)である。 1. 三途の川の渡し守に毒針で耳かきされる音声 www.dlsite.com みなさんは「毒針耳かき」をご存知だろうか? 毒針耳かきとは、文字通り毒針で耳かきをすることである。サークル・チームランドセルを中心に複数の作品があり、さまざ

                  同人音声がすごいことになっている2022 - セミになっちゃた
                • 『なんでclubhouseやらないんですか?』に対する答えの一例にインターネット老人たちが共感「これが一番みやすいから」

                  大槻幸夫 @yukio 今夜のZoom飲み会で「何で大槻さんはclubhouseやらないんですか?」と問われ、「僕の好きなインターネットはテキストとリンクと検索。それができないライブ音声にはあんまり興味が湧かないんだよね」とインターネット老人力強めの発言をし、若者たちを当惑させるなどした。 2021-02-10 00:51:44 大槻幸夫 @yukio DeNA(コーポレートブランディング担当)←サイボウズ (コーポレートブランディング部長 /「 サイボウズ式」創刊編集長、TVCM「がんばるな、ニッポン。」等)←レスキューナウ 創業メンバー https://t.co/17s6RrChcX

                    『なんでclubhouseやらないんですか?』に対する答えの一例にインターネット老人たちが共感「これが一番みやすいから」
                  • 「カブトクワガタ」は日本のゲームアクセシビリティの革命である

                    3行で 「カブトクワガタ」に搭載されている読み上げ機能によって、画面を見ることができない全盲のプレイヤーがゲームを楽しめるようになっています。 視覚に障害を持つプレイヤーだけでなく、未就学児や、文字を読むことに困難を抱える人など、色々な属性の人がプレイできるようになっていると思います。 システム面・技術面の両方において、「カブトクワガタ」は日本のゲームアクセシビリティに革命をもたらすポテンシャルがあり、その事実が、開発者を含めた多くの人に知られることを臨みます。 ※最終更新: 2023/07/27 カブトクワガタってなんやねん カブトクワガタ は、Nintendo Switchのゲームです。クワガタやカブトムシを育てて戦うRPGです。2023年3月15日にリリースされました。 なにがすごいのか ほぼ全ての文字を読み上げる このゲームは、画面に表示されるほぼ全ての文字を読み上げてくれます。本

                    • AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge

                      おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV

                        AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge
                      • AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す【藤本健のDigital Audio Laboratory】

                          AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す【藤本健のDigital Audio Laboratory】
                        • 発音の違いによって声優が大体何歳くらいかが分かってしまう『若者と年寄りではもはや話してる言語が違う』

                          すきえんてぃあ@書け @cicada3301_kig 着ぐるみ生命体/トランスヒューマニスト/コピミズム/言語/謎エスニック料理/リキュール/主なるねこかわの御名において にゃーん twitter.com/search?q=%E6%9… すきえんてぃあ@書け @cicada3301_kig 歳をとった女性声優が若作りして出す声、独特のダミ声のような老化の特徴もあるんだけど、それ以上に言語の変化として音素の世代差が隠しきれていない。若者はマジでガ行が全然鼻に抜けないし、サ行が過剰に無声化して独特のシャリシャリした響きが入る。年寄り声優にはそれがない。言語が違う。 2021-07-13 18:44:33

                            発音の違いによって声優が大体何歳くらいかが分かってしまう『若者と年寄りではもはや話してる言語が違う』
                          • マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた

                            これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ

                              マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた
                            • 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開

                              株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 2023年1月18日 株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 ※音声コーパス: 音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右する。 ※2「ReazonSpeech」を用いた文字起こしサービスをプロジェクトwebサイトにて実際に試すことができます。 プロジェクトwebサイト:https://

                                超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開
                              • Web会議での疲労感は“音質の悪さ”が原因。NTTデータ経営研究所とShureが検証

                                  Web会議での疲労感は“音質の悪さ”が原因。NTTデータ経営研究所とShureが検証
                                • 【2023年ベスト】無料で使えるすごい神AIツール27個まとめ

                                  AIツールはビジネスやクリエイティブなど、あらゆる分野で活用され、業務効率化や生産性向上に貢献しています。 2023年は、コストをかけずにAIを最大限に活用できる無料AIツールが、たくさん登場した年となりました。 この記事では、無料で利用できるAIツール28個をご紹介します。 チャットボット、テキストエディティング、画像生成、音楽生成、音声生成など、さまざまなカテゴリのツールを厳選しています。

                                    【2023年ベスト】無料で使えるすごい神AIツール27個まとめ
                                  • NEC、73億円で受注したオリパラアプリを平井卓也デジタル改革担当大臣の恫喝で38億円に値切られていたことが判明(株価は無風) : 市況かぶ全力2階建

                                    日刊SPA!に登場の医学生投資家、儲け自慢に熱を入れるあまり「11歳から親の口座で投資を始めた」と借名取引をうっかり告白

                                      NEC、73億円で受注したオリパラアプリを平井卓也デジタル改革担当大臣の恫喝で38億円に値切られていたことが判明(株価は無風) : 市況かぶ全力2階建
                                    • AIボイチェンソフト「Voidol 1」が無償化

                                        AIボイチェンソフト「Voidol 1」が無償化
                                      • 他の増田が有名な話を書いてるけどこれは実は間違い。確かに日本語には「..

                                        他の増田が有名な話を書いてるけどこれは実は間違い。確かに日本語には「促音+濁音」で終わる単語は少ない、だから清音になるという説(※1)。 だけど、これには簡単に物凄い数の反例が出る。 「ウィッグ」のこと「ウィック」って言う? 「エッグ」のこと「エック」って言う? 「ゴッド」のこと「ゴット」って言う? 「マッドサイエンティスト」のこと「マットサイエンティスト」って言う? こんな間違いする人1度も見たことないよね。 実のところ、この現象が起こるのって「ベッド」と「バッグ」だけなんだ。他にあるとしても、ごく一部の単語に集中する。「ビッグ→ビック」も、ビックカメラがbic cameraって社名にしたから。 実はこれは単に明治期の単語の輸入と誤用の問題なんだ。音声学的な説明は一応最後に書いとくね。 なんで「ベッド」と「バッグ」でだけこんなことが起きるのさ、ってのは、明治期の日本がドイツからかなりの単

                                          他の増田が有名な話を書いてるけどこれは実は間違い。確かに日本語には「..
                                        • Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに|DTMステーション

                                          10月27日、Synthesizer Vの新しい歌声データベースとして、Maiがお披露目となり、その歌唱動画が公開されました。実際にユーザーが入手可能になるまでには、まだもう少し待つ必要がありそうですが、遅くとも年内には登場するそうですから心待ちにしたいところです。 今回、Synthesizer Vの開発元であるDreamtonicsによって公開されたMaiの歌声のビデオを見ると、驚くほど滑らか、スマートな歌い方であり、もはや人間の歌声と区別がつかない次元まで進化しているように感じます。しかも、とくに調声をしなくても、音符と歌詞を入力するだけで、非常にリアルな歌い方をしてくれる、というのも、嬉しいところです。一方で、先日リリースされたSynthesizer V Studio Proの最新バージョン1.7.1において、歌声データベースの複数バージョンを利用できる機能が追加されています。なぜそ

                                            Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに|DTMステーション
                                          • Netflix | パートナーヘルプセンター

                                            Submit a request ご質問がありますか? あるいは問題解決のヘルプが必要ですか? チケットをお送りください。解決のお手伝いをいたします。. Partner Management Programs Discover how the Netflix Partner Management Programs can help with your projects and equipment considerations.

                                              Netflix | パートナーヘルプセンター
                                            • AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|藤本健の “DTMステーション”

                                              すでにご存じの方も多いと思いますが、2月22日にAIきりたんなるものが登場し、大騒ぎとなりました。正確にはSHACHI(@SHACHI_KRTN)さんという方が開発したNEUTRINOというAI歌声合成ソフトがフリーウェアで公開されるとともに、それで歌わせた楽曲が、くろ州さんなどによって公開され、話題になったのです。2月22日は、ちょうどMIDI 2.0の日米合意があった日で、そのドタバタでネットをチェックできておらず、私が気づいたのは24日になってから。その歌声を聴いて驚愕しました。 実際どんなものなのかと、さっそくNEUTRINOをダウンロードし、手元にあったMusicXMLデータを元に歌わせてみると、従来のVOCALOIDなどとは別次元の人間的な歌声で、東北きりたんが歌ってくれてさらに驚いたのです。どういうことなのか知りたいと思い、開発者のSHACHIさんに連絡してみたところ「種々の

                                                AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること|藤本健の “DTMステーション”
                                              • Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話

                                                稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」 ぼく「はい」 Google「そちらの営業時間を教えてください」 ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と日曜日の営業時間も教えてください」 ↓ 2022-01-25 10:26:41 稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h ぼく「土曜と日曜は普通にお休みです」 Google「確認させてください。そちらの営業時間は月曜から金曜の9時〜18時でよろしいでしょうか」 ぼく「はい」 Google「ありがとうございました(電話を切りそうな気配)」 ぼく「待って。参

                                                  Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話
                                                • 無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応

                                                  AI歌声合成技術の開発を手掛けるテクノスピーチ(名古屋市)は2月18日、AI技術により人間らしい歌声を合成できるソフトウェア「CeVIO Pro」のα版を24日に無償公開すると発表した。既存バージョンの「CeVIO」「CeVIO AI」とは異なり、Windows・macOSの両方に対応。追加の許諾や利用料不要で商用利用も可能。 CeVIO Proは、楽譜と歌詞を入力すると、AIが人間らしい歌声をシミュレーションして出力する歌声合成ソフト。まずは無料で商用利用もできるキャラクター音源1種類と編集ソフトをα版としてリリース。当該音源は正式版のリリース後も無償提供する。 現在の最新版であるCeVIO AIは、Windows専用で音楽制作ソフト(DAW)との連携に未対応。販売方法も買い切り方式だが、CeVIO ProはmacOSにも対応し、DAWとの連携も可能。第2弾以降のキャラクター音源はサブス

                                                    無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応
                                                  • 隣の部屋をミリ波で盗聴 防音の壁でも喉元の皮膚振動を捉え音声復元

                                                    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国の浙江大学と米State University of New York at Buffaloによる研究チームが開発した「Wavesdropper: Through-wall Word Detection of Human Speech via Commercial mmWave Devices」は、ミリ波(mmWave)を用い、防音環境で守られている部屋内を外部から盗聴するシステムだ。被害者が発話した際の喉元付近の皮膚振動をミリ波で捉え、音声(単語)を復元する。 壁に防音材を配置すれば、音波の伝搬を利用した攻撃などからは守れるが、音源(例えば、人間の話者)からの直接漏えいを保証すること

                                                      隣の部屋をミリ波で盗聴 防音の壁でも喉元の皮膚振動を捉え音声復元
                                                    • 高品質な音声変換ソフトウェア | Seiren Voice

                                                      AIの技術を用いてクオリティを追求した、今までにない音声変換ソフトウェア。 いつもと違う声で表現することの楽しさを、ぜひ体験してみてください。 AI技術を用いた高品質な音声変換ソフトウェアです。 誰の声でも狙ったキャラクターの声に変換することができます。 クオリティを追求することで、ボイスチェンジャーらしいノイズが乗らない、 人間らしい声を実現することができました。 キャラクター紹介

                                                        高品質な音声変換ソフトウェア | Seiren Voice
                                                      • AI スマホに指当たる音で文字推測可能に 対策必要か | NHKニュース

                                                        スマートフォンで文字を入力する際に、画面と指が当たるごくわずかな音をAIで解析すると入力された文字を高い精度で推測できることが静岡大学のグループの研究で分かりました。グループでは新たなセキュリティー対策が必要になる可能性があるとしています。 グループでは、スマートフォンに文字を入力する際に指や爪が画面に当たってわずかに音が鳴ることに注目し、実際のスマートフォンで「0」から「9」までの数字をそれぞれ100回ずつ入力して、その際に出る音をAIに学習させました。 そして、実際に画面をタップしてその音から、どの数字を入力したのかAIに解析させたところ、95%以上の精度で正しい数字を推測することができたということです。 グループによりますと、スマートフォンの画面は内部の部品の取り付け方などで場所により音質や反響にわずかな違いがあり、AIはその違いからタップした位置を推測しているとみられるということで

                                                          AI スマホに指当たる音で文字推測可能に 対策必要か | NHKニュース
                                                        • インターホンにハーモニカを付けると、急なセールスもハーモニーとともに断れるので便利です→「何食ってたらこんなの思いつくんだ…」

                                                          ウミノ🍘 @umin00000 @ARuFa_FARu なぜクロネコヤマトでもUber eatsでもなく佐川急便なのかを考えてみたけど、多分熟考の結果拍数と響きが1番おもしろい。という結論に至ったのかなと思いました。 2023-08-05 19:18:22

                                                            インターホンにハーモニカを付けると、急なセールスもハーモニーとともに断れるので便利です→「何食ってたらこんなの思いつくんだ…」
                                                          • 『エヴァンゲリオン』シリーズのファン創作物の公開に関するガイドライン

                                                            『エヴァンゲリオン』 シリーズの ファン創作物の公開に 関するガイドライン (本ガイドラインは日本語で公開しています。自動翻訳等によって他国語でお読みの方は、あくまで日本語の原文が尊重されることをご理解ください。) 本文: 本ガイドラインは、弊社が原作権を持つ『エヴァンゲリオン』シリーズ(以下、「本作品」といいます)のファン創作を楽しみたい方々を対象とした、創作物公開のためのものです。 ファンの方々に安心してファンアートなどを制作していただくためのルールですので、ぜひご確認の上、創作活動を楽しんでください。 1.このガイドラインは、個人の方がファン活動としての創作物を、基本的に無償で公開するためのものです。法人の方々、個人でも商用利用を目的とするものは、個別に作品の使用許諾が必要です。 なお、ここでいう商用利用は、無償・有償を問いません。何らかの広告・宣伝・販促を目的とする行為は無償配布で

                                                              『エヴァンゲリオン』シリーズのファン創作物の公開に関するガイドライン
                                                            • 「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売

                                                              「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売 インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、「音源分離」技術の基礎から実装までを解説した書籍『Pythonで学ぶ音源分離 機械学習実践シリーズ』を2020年8月24日(月)に発売いたします。 ■身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊 近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術で

                                                                「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売
                                                              • 女の子になれる。変幻自在のAIボイスチェンジャー「Voidol3」

                                                                  女の子になれる。変幻自在のAIボイスチェンジャー「Voidol3」
                                                                • Ippei Oshida on Twitter: "息子が小さかった頃、「は」に点々をつけると「ば」になるということが、何度教えても理解できなかった。「か→が」や「た→だ」の対応関係はきちんと理解しているのに、なぜか「は→ば」だけが理解できない。「『は』に点々をつけると何になるかな?」「う〜ん、わかんない」の繰り返しだった。"

                                                                    Ippei Oshida on Twitter: "息子が小さかった頃、「は」に点々をつけると「ば」になるということが、何度教えても理解できなかった。「か→が」や「た→だ」の対応関係はきちんと理解しているのに、なぜか「は→ば」だけが理解できない。「『は』に点々をつけると何になるかな?」「う〜ん、わかんない」の繰り返しだった。"
                                                                  • Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開

                                                                    Spotifyが無料で使えるオープンソースのAI搭載ツール「Basic Pitch」を公開しています。 Basic Pitchは、SpotifyのAudio Intelligence LabとSpotify傘下のSoundtrapが共同で開発したオーディオをMIDIに変換してくれるツール。ユーザーが楽器や声といったオーディオファイルをBasic Pitchのサイト上にアップロードすると、そのオーディオファイルをAIに搭載された機械学習モデルが分析。MIDIファイルとして書き出してくれます。 例えば、ユーザーがギターのメロディーフレーズの音源をBasic Pitchにアップロードすると、Basic Pitchは、その音源を分析し、アップロードされたギターのメロディーフレーズをMIDIに変換。ユーザーはそのMIDIファイルを自由にDAWに取り込み、シンセなど別の音源に割り当てて再生することがで

                                                                      Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開
                                                                    • 美少女声への変換と合成

                                                                      Introduction今までは主に可愛い女の子の画像(or 動画)を生成することに取り組んできましたが、画面上に映せるようになったらやはり可愛い声で話して欲しいものです。そこで今回は、別の人の声が与えられた時に美少女声へと変換するための声質変換と、テキストが与えられた時に美少女声を生成するText-to-Speech(TTS)を行なった試行結果について述べようと思います。 Voice ConversionIntroduction声質変換のデータには2種類あります。それが、パラレルデータとノンパラレルデータです。以下にそれぞれの特徴を述べていきます。 パラレルデータを用いた声質変換 同じセリフを発する2種類の声を学習データとして用います。発話内容が同じのため、言語特徴を気にせず音響特徴量の変換を行うことが可能です。しかし、話速の違い等によって言葉を発するタイミングがずれてしまうのでDyna

                                                                        美少女声への変換と合成
                                                                      • 娘に『なんでファミコンのゲームは楽器みたいな音がしないの?』と聞かれて頭を抱える作曲家→リプ欄にアイディアが集まる

                                                                        Yuzo Koshiro @yuzokoshiro 娘が「何でファミコンのゲームって楽器みたいな音しないの?」って聞いてくるんだけど、これはレベル高い質問だな… 2020-12-29 02:19:29 Yuzo Koshiro @yuzokoshiro アナログシンセからサンプラーまでの仕組みと歴史をざっと説明しましたが、「テープレコーダーに録音した音が鍵盤を弾くと鳴るような感じ」の「テープ」をそもそも知らない、ので中々難易度高いです。😅 2020-12-29 09:49:14 Yuzo Koshiro @yuzokoshiro 皆さんのレスを読んでて補足しないと、と思ったのですが、娘の言う「楽器みたいな音」は、今時普通に聞ける(チップチューンではない)ゲーム音楽のことです。マリカーやスプラなどで聞ける音楽のことを指します。だからファミコンがなぜあの独特な音がするのか気になったようですね

                                                                          娘に『なんでファミコンのゲームは楽器みたいな音がしないの?』と聞かれて頭を抱える作曲家→リプ欄にアイディアが集まる
                                                                        • AI作曲サービスの新星「Udio」が誰でも利用可能に。Sunoを超えたか、試してみた(CloseBox) | テクノエッジ TechnoEdge

                                                                          Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。

                                                                            AI作曲サービスの新星「Udio」が誰でも利用可能に。Sunoを超えたか、試してみた(CloseBox) | テクノエッジ TechnoEdge
                                                                          • オリンピック・パラリンピック関係システムの調達に関する私の発言につきまして “English as follow.” | 平井卓也[ひらいたくや] デジタル改革担当大臣 自民党 衆議院議員

                                                                            オリンピック・パラリンピック関係システムの調達に関する私の発言につきまして “English as follow.” 一部の報道で政府のシステム調達に関する私の発言が問題だと指摘がありました。 私は、かねてより政府のシステム調達に関して大きな問題意識を持っており、国民の血税をお預かりする立場として、国民に説明ができる調達しかしないという強い気持ちと覚悟を持っております。 私自身は、直接事業者との交渉に臨む立場ではありませんが、今回の契約の見直しに際しても、必要な機能に見合った契約金額の圧縮となるよう、担当責任者には詳細に検討を行うよう強く指示してきました。 報道されている音声データにつきましては、契約見直しに当たっての自分の考えを、10年来一緒に仕事をして来て自分の真意が分かる幹部職員へ対面で檄を飛ばしたものであり、事業者への脅しでは決してありません。しかし、幹部職員に対する発言だったとし

                                                                              オリンピック・パラリンピック関係システムの調達に関する私の発言につきまして “English as follow.” | 平井卓也[ひらいたくや] デジタル改革担当大臣 自民党 衆議院議員
                                                                            • 最も音が良い会議アプリは? 声優・小岩井ことりさんと音質比較してみた 後編【藤本健のDigital Audio Laboratory】

                                                                                最も音が良い会議アプリは? 声優・小岩井ことりさんと音質比較してみた 後編【藤本健のDigital Audio Laboratory】
                                                                              • AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開

                                                                                音声合成ソフトの開発や販売を手掛けるSSS(仙台市)は3月16日、音声合成ソフト「VOICEVOX」用音源「九州そら」をリリースした。九州そらは、せりふを入力するだけで人間らしい“ささやき声”を出力できるAIだ。 VOICEVOXは、ドワンゴでAIの研究に携わっているヒホ(ヒロシバ)さん(@hiho_karuta)さんが開発した無料の音声合成ソフト。AI技術を活用して、人間らしい話し声を合成できる。イントネーションや話す速さなどの調整も可能。立体音声を制作できるソフトを活用すれば「ASMR動画」の制作にも使える。 九州そらはVOICEVOX用音源として初めてささやき声の合成に対応した。ソフトのダウンロードと利用は無料。「VOICEVOX:九州そら」とクレジットを記入すれば商用利用も無償でできる。 関連記事 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがす

                                                                                  AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開
                                                                                • 音を操るWeb技術 - Web Audio API入門 - ICS MEDIA

                                                                                  Webにおける表現はどんどん進化しています。Webサイトには当然のように動画が埋め込まれるようになり、CSSやSVG、canvasでのさまざまな表現が頻繁に見られるようになりました。さらにAR、VRといった表現も台頭し筆者も毎日ワクワクしながらインターネットの海を泳いでいます。 その中であまりメジャーではないと感じるのは「音」による表現です。もちろん音を用いた素晴らしいWebサイトはたくさんありますが、環境の制約が視覚表現以上に大きいため多くは見られないのでしょう。 とはいえ、音と視覚表現を組み合わせることによって表現できる世界観、インタラクション、その他諸々は計り知れないと筆者は思っています。今後オーディオなどの技術の進歩によって上記で述べた制約も乗り越えられるようになるかもしれません。時代を先どりしたい読者に向けて、今回の記事ではWebで音を扱う技術Web Audio APIについてお

                                                                                    音を操るWeb技術 - Web Audio API入門 - ICS MEDIA