並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 765件

新着順 人気順

音声の検索結果161 - 200 件 / 765件

  • ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside

    こんにちは、VRoid部のkeshigomuです。 普段は主にVRoid Hubのフロントエンドエンジニアとして、3Dキャラクターを表示するビューワーの開発に携わっています。また@pixiv/three-vrmという、Web上で3Dモデルを使ったコンテンツを開発するためのOSSライブラリの運用も行っています。 今回、ブラウザで簡単に3Dキャラクターと会話できる技術デモ「ChatVRM」とそのコードをオープンソースで公開しました。 「ChatVRM」は、テキスト・口頭で話しかけた言葉にキャラクターがフルボイスで回答してくれる「キャラクターと会話できる」デモです。WEBブラウザ上で動作でき、3Dキャラクターのインポート・切り替え、キャラクターに併せて声を調整することもできます。 (2023/07/10追記) 読み上げ音声の生成に使用していたKoeiro APIの提供終了に伴い、以前のデモとコー

      ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside
    • writeout.ai

      Transcribe and translate any audio file. Upload your audio file and get a transcript in seconds. Writeout.ai is a free online transcription service.

        writeout.ai
      • ビデオ会議中にマイクをミュートにしてもアプリはマイクの音声を収集し続けている

        ビデオ会議や音声チャットの途中で諸用を済ませるために一時的に離席する時、余計な音声が相手に届かないようにマイクをミュートにすることがあります。しかし、「ビデオ会議中にマイクをミュートにすると、たとえ相手に音声は届かなくても、アプリ自体は音声データを収集している」と、ウィスコンシン大学電気・コンピューター工学科のカッセム・ファワズ助教の研究チームが発表しました。 Are You Really Muted?: A Privacy Analysis of Mute Buttons in Video Conferencing Apps (PDFファイル)https://wiscprivacy.com/papers/vca_mute.pdf You’re muted — or are you? Videoconferencing apps may listen even when mic is of

          ビデオ会議中にマイクをミュートにしてもアプリはマイクの音声を収集し続けている
        • 語尾だけで朗読の印象を変えるコツ

          以前「朗読での間(ま)と緩急でこれだけ変わる」という記事で、一部分を少しかえるだけで、印象が変わる、ということを書きました。 今日は、「語尾」を変えるだけで、これだけ変わる、ことを詳しく紹介します。 語尾に関しては、今までにも 「朗読が暗く聞こえる要因」 「朗読のセリフで喜怒哀楽を表現するコツ」でも語尾の読み方で印象が変わることを紹介しています。 また語尾のくせについても 「朗読の助詞上げのくせを直すコツ」でふれています。 このように「語尾」の扱いは案外難しいのです。 私がナレーションをするときに、いつも難しく感じるのが語尾の扱いです。 実は語尾の扱いひとつで、全体の印象が全く変わるのです。 ということは、語尾の扱いで全体の印象を変えることができるのです。 これはナレーションだけではなく、朗読でも、日常生活でも同じです。 かなり細かい話になっていきますが、チャレンジしてみてください。 なお

            語尾だけで朗読の印象を変えるコツ
          • Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。|Sangmin Ahn

            【主要なアップデート】 (2020.02.04)「7  関連ノート」のセクションを追加 (2020. 01.30)図にImageの番号を追加 こんにちは、Choimirai School のサンミンです。 0  はじめに機械学習を使って文字起こしを行なっているサービスはいくつかありますが、Amazon Transcribe もその一つです。11月21日から日本語も対象となりましたので、使い方を簡単に紹介します。 文字起こしは、業者に頼むと1時間に1万円はすると思う。納期も最低2〜3日はかかる。ところが、Amazon Transcribe を使えば1時間で150円。そして、20分もあれば終わる!会話の場合、10人までだと参加者毎に文字起こしすることも可。言語に関する仕事をされてる方は技術の変化に注目すべき。 https://t.co/G7bJaMin6M — Sangmin @Choimir

              Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。|Sangmin Ahn
            • 月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

              何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画から抽出した音声と、音声を文章に起こしたテキストの組み合わせのデータセット約50分ぶんを教師データとして学習した結果 ※学習に必要なデータ量は最低でも1時間程度と言われているので、まだまだ足りていません… 月ノ美兎さんの音声合成ツールを作ってみた https://t.co/YVdWW9vREb via @YouTube — K2 (@K2ML2) May 29, 2020 発話内容が不明瞭な箇所がありますが、一応ご本人の声に近い音声を作成することができているかと思います

                月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita
              • 商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生|DTMステーション

                ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS=Text to Speech(音声読み上げソフト)の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。 さらにStoryblocksという音素

                  商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生|DTMステーション
                • 効果音・音声・BGM 素材 by プロ生

                  効果音・音声・BGM 素材 by プロ生 このサイトでは、無料で使える(諸条件あり)効果音・音声・BGM を試聴・ダウンロードできます。カテゴリーによって利用条件が異なります。 随時 編集・追加予定です。素材情報も編集途中です。 カテゴリー紹介 プロ生 無料素材 プロ生が提供する使用条件のゆるい無料素材です。 暮井 慧(プロ生ちゃん) プロ生のキャラクター、プロ生ちゃんこと暮井 慧(CV: 上坂すみれ)のボイスと楽曲 BGM です。アプリなどに設定して使えるシステムボイスや、条件を守っていただくとご自身のアプリや動画などの作品にも使えます。 HSP3 無料素材 「プログラミング言語 HSP3」で提供されている効果音・BMG 素材を許諾を得て転載しています。ソフト作成に使えます。 Adobe Audition Sound Effects 「Adobe Audition Sound Effec

                  • ロアネア@最多情報源バズニュース on Twitter: "すげえええええ! ジョジョの日本人声優の音声データをもとにAIが英語に吹き替え https://t.co/xb9S7bZCOl"

                    すげえええええ! ジョジョの日本人声優の音声データをもとにAIが英語に吹き替え https://t.co/xb9S7bZCOl

                      ロアネア@最多情報源バズニュース on Twitter: "すげえええええ! ジョジョの日本人声優の音声データをもとにAIが英語に吹き替え https://t.co/xb9S7bZCOl"
                    • エロゲにバイノーラル音声が実装されにくい理由

                      【宅録で】バイノーラル収録対応可能な声優さんが増えた結果、それを【ゲームにも利用したい】というクライアントが増えましたが、非常に利用が難しい「理由」をまとめました。同じ界隈でない人には全く意味のない記事です。

                        エロゲにバイノーラル音声が実装されにくい理由
                      • ChatGPTと音声会話ができるChrome拡張機能「TalkBerry」がすごい #TrendBuzz | ライフハッカー・ジャパン

                        楽天ゴールドカードはメリットない?プレミアムカード・年会費無料楽天カードとの違いや元を取る損益分岐点はいくら?

                          ChatGPTと音声会話ができるChrome拡張機能「TalkBerry」がすごい #TrendBuzz | ライフハッカー・ジャパン
                        • 上様が刀を振り回すたびにポップな効果音が流れる動画

                          上様が刀を振り回すたびにお色気な効果音が流れる動画→sm41736268上様が刀を振り回すたびにシオンタウンのBGMが流れる動画→sm40870391「ホモと見るCM集」→mylist/73711962

                            上様が刀を振り回すたびにポップな効果音が流れる動画
                          • 俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

                            こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。 麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか? 特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。 そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ 現状の点数計算の練習

                              俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ
                            • https://twitter.com/ShogoNu/status/1463539988390318085

                                https://twitter.com/ShogoNu/status/1463539988390318085
                              • 【暴行直後の公園音声】元NGT山口真帆がメンバー名指しで犯人詰問「正直に言わないと……」 | 文春オンライン

                                吉成氏は「犯人側の言い分」と前置きしながらも、「犯人たちと、もともと繋がっていたのは山口さん」「山口さんはあることが原因で男性と不仲になり、無視するようになった。連絡をとれなくなった男性(犯人)が、直接話そうと山口の部屋を突然訪れた。そのために事件は起こった」などと語っていたことが判明。 これは山口が1月に告発した内容を根底からひっくり返す発言だと言える。しかし山口に対し、犯人との繋がりについて事実確認を求めたところ、山口は所属事務所を通じて「そのような事実はございません」と回答。AKSにも質問状を送ったが、期日内に回答はなかった。 両者の言い分は真っ向から食い違う。一体、NGT暴行事件とは何だったのか――。 事件に関与しているメンバーを聞き出そうと…… 「週刊文春デジタル」では今回、山口と犯行グループの関係を裏付ける新たな客観的証拠を入手した。第三者委員会報告書にもたびたび登場した元メン

                                  【暴行直後の公園音声】元NGT山口真帆がメンバー名指しで犯人詰問「正直に言わないと……」 | 文春オンライン
                                • 老舗音声編集ソフトのAudacityをインストール不要でブラウザでも使える「Wavacity」

                                  無料で提供されているオープンソースの音声編集ソフトウェア「Audacity」をフォークし、ブラウザ上で動作するようにした「Wavacity」が公開されています。 Wavacity https://wavacity.com/ 上記のリンクにアクセスすると、以下のような画面が表示されます。本家のAudacityは表示言語を日本語に設定する必要がありますが、Wavacityは最初から日本語で表示されるので、日本語ネイティブユーザーにとってかなり取っ付きやすくなっています。 記事作成時点で最新バージョンとなる本家Audacity(v3.3.3)の画面が以下。 比較するとこんな感じ。スライダーを右に動かすとWavacityが、左に動かすとAudacityが表示されます。 楽曲ファイルをインポートするには「ファイル」から「開く」をクリックし、ファイルを選択します。 タイムライン上でドラッグすると、編集

                                    老舗音声編集ソフトのAudacityをインストール不要でブラウザでも使える「Wavacity」
                                  • 「本当に鳴くのが大変好評でした」来日したポーランド人が本物のミンミンゼミの声を聞いて感動…理由はセミの声を勘違いしてたからだった

                                    芝田文乃 SHIBATA Ayano◎ポーランド語翻訳 @ayanos_pl 来日したポーランド人、本物の蟬の声を聞いて感動していた。日本映画の夏の場面で聞こえるノイズは音声による心理描写だと思ってたそうです。あと、ミンミンゼミが本当にミーンミンミンミンミンミーッと鳴くのが大変好評でした。 2020-08-02 22:38:02 芝田文乃 SHIBATA Ayano◎ポーランド語翻訳 @ayanos_pl このポーランド人はヒグラシの声を聞いて「あれは何の鳥?」と言ってました。あれも蟬の一種だと教えたらびっくりしていました。蟬が大好きになり、拾ったアブラゼミの死骸をおみやげに持って帰国しました。 2020-08-03 12:44:40

                                      「本当に鳴くのが大変好評でした」来日したポーランド人が本物のミンミンゼミの声を聞いて感動…理由はセミの声を勘違いしてたからだった
                                    • Meta、新音声生成AIモデル「Voicebox」 短い音声から自在に声を生成

                                        Meta、新音声生成AIモデル「Voicebox」 短い音声から自在に声を生成
                                      • 声優・小岩井ことりさん、電子情報通信学会で表彰される 研究向けオリジナル曲を50曲作り貢献

                                        声優の小岩井ことりさんは9月15日、明治大学の森勢将雅専任准教授らと共同執筆した論文が電子情報通信学会で船井ベストペーパー賞を受賞したと発表した。作曲で音声合成分野の研究に貢献した。 受賞した論文は「レアなモーラを含む日本語歌唱データベースの構築と基礎評価」。著者は小岩井さん、森勢専任准教授、ライターの藤本健さん。内容は、AI歌声合成技術などの研究に使えるオリジナル曲を集めたデータベースを作成したというもの。 収録したオリジナル曲には、日本語の音素をできる限り含んだ歌詞、さまざまなパターンのメロディーが織り込んである。これまで歌声合成の分野では、著作権などの問題から童謡を使うことが多かったが、オリジナル曲のみでデータベースを構築することで利用条件の緩和を目指した。

                                          声優・小岩井ことりさん、電子情報通信学会で表彰される 研究向けオリジナル曲を50曲作り貢献
                                        • 第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox) | テクノエッジ TechnoEdge

                                            第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox) | テクノエッジ TechnoEdge
                                          • 1文字ずつ口パクでスペル入力できるシステム、東大などが技術開発 タイピング速度はスマホに匹敵

                                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 東京大学、米ジョージア工科大学などによる研究チームが開発した「SilentSpeller: Towards mobile, hands-free, silent speech text entry using electropalatography」は、口パク(無声発話)で1文字ずつタイピングするハンズフリーの入力システムを提案する。 歩きながらでも入力が行える安定性を持ち、スマートフォンのQWERTY文字入力に匹敵するほどの十分なタイピング速度を兼ね備える。1文字ずつのスペル入力により、これまでの単語ベースで認識する無声発話入力よりも認識可能な語彙(ごい)が大幅に増加した。 音声入力だと

                                              1文字ずつ口パクでスペル入力できるシステム、東大などが技術開発 タイピング速度はスマホに匹敵
                                            • 大量のスピーカーが演奏!? 「無人オーケストラコンサート」に行ってみた【藤本健のDigital Audio Laboratory】

                                                大量のスピーカーが演奏!? 「無人オーケストラコンサート」に行ってみた【藤本健のDigital Audio Laboratory】
                                              • 世界初の「軟骨」伝導ヘッドホンが登場。ながら聞きを本気聞きする意気込みです

                                                世界初の「軟骨」伝導ヘッドホンが登場。ながら聞きを本気聞きする意気込みです2022.10.09 20:3546,428 ヤマダユウス型 骨伝導もついに枝分かれしてきた。 オーディオテクニカから、世界初を謳うワイヤレス軟骨伝導ヘッドホン「ATH-CC500BT」が発表されました。「骨」伝導はわかるけど、「軟骨」伝導ってなんだろ? 何が違うの? 第3の音の伝わり方オーディオテクニカによると、そもそも音が伝わる道筋である聴覚経路には「気導経路」と「骨導経路」の2種類が考えられていたとのこと。前者は普通に音を聞く耳の穴、後者は骨伝導系のイヤホンですね。 ところが、2004年に「軟骨伝導経路」という第3の聴覚経路が発見されたそうな。研究がすすむと軟骨伝導経路は非常に効率よく音を伝えられることがわかったそうで、今回の「ATH-CC500BT」はこの軟骨伝導経路を利用したヘッドホンになるそうです。なんか

                                                  世界初の「軟骨」伝導ヘッドホンが登場。ながら聞きを本気聞きする意気込みです
                                                • 文春砲で株価急落のCasa(カーサ)、宮地正剛社長のVシネマ風語録また増える : 市況かぶ全力2階建

                                                  のぞみ全車指定のJR西日本、「お乗りになってから初めて自由席がないことにお気付きのお客様」とつい煽ってしまう

                                                    文春砲で株価急落のCasa(カーサ)、宮地正剛社長のVシネマ風語録また増える : 市況かぶ全力2階建
                                                  • スマホでの録音を無効化するツール、中・米の研究者らが開発 部屋内での会話を収録不可に

                                                    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国の浙江大学や米マサチューセッツ大学アマースト校などに所属する研究者らが発表した論文「Cancelling Speech Signals for Speech Privacy Protection against Microphone Eavesdropping」は、マイクによる録音を無効化する手法についての研究報告である。この手法を用いると、隠し持ったスマートフォンや録音機で録音しても、その部屋での会話を収録することはできなくなる。 スマートフォンや音声アシスタントのようなデバイスは、盗聴のリスクを増加させている。この問題への対策として

                                                      スマホでの録音を無効化するツール、中・米の研究者らが開発 部屋内での会話を収録不可に
                                                    • 「AI安倍晋三」ネットで物議 合成音声のYouTube動画、“東京大学AI研究会”が公開

                                                      Twitterアカウント(@AIAbeShinzo)も開設しており、最初に投稿したツイートは26日正午時点で1万件以上リツイートされるなど関心を集めている。ユーザーからは「素晴らしい」や「ありがとう」など絶賛する声の他、「死者への冒涜ではないか」や「AIで美空ひばりの新曲作ったのと同じ感じがして複雑」など疑問を呈する声も見られる。 「東京大学AI研究会」とは何者か? 発起人である東京大学AI研究会のWebサイトによると、同研究会は東京大学教養学部・工学部有志と学生有志が2021年5月10日に設立。5月時点では「東大13名、京大10名、大阪大学6名、早稲田大学9名、慶応義塾大学1名、筑波大学1名、立命館大学3名」(原文ママ)の43人が在籍し、代表者は東京大学・教養学部・理科一類に所属しているという。 目的は「飛躍的・未到達領域のAI開発」としており、最新の活動記録として4月に「SOTA(特定

                                                        「AI安倍晋三」ネットで物議 合成音声のYouTube動画、“東京大学AI研究会”が公開
                                                      • 【Python】プログラムでフーリエ変換を理解しよう!【FFT, 標本化定理, ナイキスト周波数】 | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]

                                                        こんにちは。早く業務に慣れたい開発チーム入社1年目の髙垣です。 急ですが皆さん。ふと、音をフーリエ変換したい時ってありませんか? ありますよね。 でも、「フーリエ変換って学校で計算式で習ったけど、結局は何をしているんだ?」となることありませんか? そこで今回は計算式なんてほっといて、Pythonを使ってフーリエ変換が何をやっているのか体験してみましょう! 環境構築 下記リポジトリをクローンしてください https://github.com/takaT6/fft-tutorial クローンができたら下記のライブラリをインストールしてください↓ pip install numpy matplotlib japanize_matplotlib japanize_matplotlib はmatplotlibに日本語を書き込めるようにするライブラリです。 日本語化をするにはフォントを入れたり、設定フ

                                                          【Python】プログラムでフーリエ変換を理解しよう!【FFT, 標本化定理, ナイキスト周波数】 | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]
                                                        • Windowsユーザにオススメの万能仮想ミキサー「VoiceMeeter Banana」が凄い【藤本健のDigital Audio Laboratory】

                                                            Windowsユーザにオススメの万能仮想ミキサー「VoiceMeeter Banana」が凄い【藤本健のDigital Audio Laboratory】
                                                          • GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること

                                                            GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:009,334 Maxwell Zeff・Gizmodo US [原文] ( mayumine ) これは嬉しい進化です。 OpenAIの開発者向けカンファレンス「DevDay」で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました(こちらの記事もどうぞ)。 いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。本をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。 さらにGPT-4 Turboでは、JSONモードが実装され、JS

                                                              GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
                                                            • AVマニアが「PS5」を“AV機器”として使ってみたら - 価格.comマガジン

                                                              新「PS5」はスリムなサイズとなったことが最大の特徴で、サイズは約358×216×96mm(横置き時の幅×奥行×高さ)と従来モデルと比較して30%以上小型化。重量も約3.2kg(ディスクドライブ搭載モデル)と18%も軽量となっている。採用する技術や機能はそのままで、内蔵するSSDストレージは1TBだ。 希望小売価格はディスクドライブ搭載モデルの「CFI-2000A01」が66,980円(税込)、ディスクドライブなしのデジタル・エディション「CFI-2000B01」が59,980円(税込)。昨今の物価高騰などの影響もありSSDストレージが増量されているとはいえ、従来よりも価格が高くなっているのは少し残念。 ただし、ディスクドライブの着脱が可能になり、デジタル・エディションを購入した後でもディスクドライブを購入して増設できるようになっているなど、改善が図られた点もある。なお、1台付属するDua

                                                                AVマニアが「PS5」を“AV機器”として使ってみたら - 価格.comマガジン
                                                              • 新しいBing、アプリになる 音声対応+チャットで応答

                                                                  新しいBing、アプリになる 音声対応+チャットで応答
                                                                • ロシア軍内部の音声をイギリス調査会社が入手 砲撃命令に兵士困惑「それは違う!」 涙も (FNNプライムオンライン) - Yahoo!ニュース

                                                                  3月3日、クライナの首都・キエフに近い街、チェルニヒウの住宅街で撮影された映像です。 【画像】ウクライナ住民からパンと紅茶を受け取るロシア軍兵士 現地メディアによると、撃ち込まれたのはロシア軍のミサイル。すぐ近くには歩行者の姿もありました。 周辺の住宅は窓や壁が破壊され、肩を寄せ合って避難する人の姿もあります。地上には瓦礫が散乱し、大破した車も。 そして、マンションを見上げると黒い穴が。ここをミサイルが襲ったのでしょうか。 ロシアの国防総省は2日、南部の都市・へルソンを掌握したと発表。都市部への攻撃を激化させています。そんな中で行われた停戦交渉は、ウクライナの思うようには進みませんでした。 停戦交渉「人道回廊」は合意2時間半ほど行われた交渉。ウクライナ側が即時停戦、ロシア側が武装解除などを求め、両者の主張は平行線をたどりました。 その一方で、人道措置として戦闘地域から脱出するためのルートを

                                                                    ロシア軍内部の音声をイギリス調査会社が入手 砲撃命令に兵士困惑「それは違う!」 涙も (FNNプライムオンライン) - Yahoo!ニュース
                                                                  • 喪失感埋まる?ただの"電子人形"? 中国で賛否「バーチャル故人」AIとCG駆使、ビデオ通話もOK(西日本新聞) - Yahoo!ニュース

                                                                    【北京・坂本信博】人工知能(AI)やデジタル技術の普及が進む中国で、亡くなった親族らの生前の画像や音声データを基に本人そっくりの「バーチャル故人」を制作し、スマートフォンやパソコンを使って対話することが話題を集めている。交流サイト(SNS)では「遺族の喪失感を埋められる」と理解が示される一方で「電子人形に過ぎない」との指摘もあり、賛否が分かれている。 【画像】「AIおばあちゃん」との会話の様子 「生きていた頃、おばあちゃんは父さんと電話でどんな話をしてたの?」。孫の問いかけに画面の中で白髪の女性が「酒を飲むな、節約しろ、ばくちはするなって言ったんだよ」と湖北省なまりで答える。20代のビジュアルデザイナー呉伍六さん=上海市=は3月、動画配信サイトで「AIおばあちゃん」とのやりとりを公開した。 彼女は本物の人間のようにまばたきをし、呉さんが職場での昇進や最近の体調を報告すると、うなずいたり、笑

                                                                      喪失感埋まる?ただの"電子人形"? 中国で賛否「バーチャル故人」AIとCG駆使、ビデオ通話もOK(西日本新聞) - Yahoo!ニュース
                                                                    • ZOOM会議に効果音をいれて超楽しくするには|深津 貴之 (fladdict)

                                                                      拡張現実(AR)は、音声からはじまる…というのが以前からの持論。そんなわけでZOOMの会議に、効果音をブチ込める環境を作ってみました。 会議中に、Hahahaha!とかOhhhhh…みたいな、アメリカンなアクションやりたい!ファンファーレやドラムロールとか、拍手やブーイング、ズキューンとか鳴らしたいじゃない? ユーザー体験が超変わる!!と思ったのですが、ググってもでてこなかったので環境構築してみました。 環境概要物理機材はなしソフトで解決。バーチャルミキサーを使って、マイクと各種音声アプリのサウンドを合算します。初回設定20分。会議前設定30秒ぐらい。ZOOMには、バーチャルミキサーを擬似マイクとして設定。こうすることで、様々な効果音や音楽、楽器をZOOMに流しこめます。 バーチャルミキサー音の合成には、Loopbackというアプリを使います。このアプリは、複数のオーディオインプット(マイ

                                                                        ZOOM会議に効果音をいれて超楽しくするには|深津 貴之 (fladdict)
                                                                      • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                                                                        こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                                                                          OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                                                                        • 最近のAIボイスチェンジャー(RVC、so-vits-svc)

                                                                          私は趣味で機械学習を学ぶ初学者であり、説明に間違いや勘違いがある可能性があります。そういった点がありましたらコメントで指摘していただけると助かります。 また、so-vits-svcやRVCは論文ベースでの技術発表が無いため、以下はコードや周辺情報からの想像を含みます。 修正履歴 2023/04/15 RVCの動作について誤りがあったので修正しました。nadare🌱さんご指摘ありがとうございます。 AIボイスチェンジャーとは ある発話音声の入力を特定の話者が発話したような声質の発話音声に変換するための、深層学習を使用したアプローチがそう呼ばれている印象です。 以前から、深層学習を用いたリアルタイムボイスチェンジャーはMMVCなどが存在していました。 最近(2022年11月頃から2023年4月頃)では、Retrieval-based-Voice-Conversion 通称RVC や、Soft

                                                                            最近のAIボイスチェンジャー(RVC、so-vits-svc)
                                                                          • OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる

                                                                            OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は

                                                                              OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
                                                                            • 【悪用厳禁】自分の声を推しの声にリアルタイム変換する方法(全体公開)|めーぷるしろっぷ|pixivFANBOX

                                                                              皆様はrvcというAIをご存知でしょうか? RVCはAIボイスチェンジャーとも言うべき代物で、 推しの声をAIに学習させることで、推しの声でおしゃべりすることが出来るようになります! 学習させた音声は推しに迷惑が掛からないように、自己責任で利用してください。 今回はRVCを使った音声の学習から、それを実際に使う方法...

                                                                                【悪用厳禁】自分の声を推しの声にリアルタイム変換する方法(全体公開)|めーぷるしろっぷ|pixivFANBOX
                                                                              • 【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch

                                                                                  【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch
                                                                                • ニッポン放送、AMステレオ放送をモノラルに。「保守・維持が困難」

                                                                                    ニッポン放送、AMステレオ放送をモノラルに。「保守・維持が困難」