並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 3383件

新着順 人気順

音声の検索結果161 - 200 件 / 3383件

  • 老舗音声編集ソフトのAudacityをインストール不要でブラウザでも使える「Wavacity」

    無料で提供されているオープンソースの音声編集ソフトウェア「Audacity」をフォークし、ブラウザ上で動作するようにした「Wavacity」が公開されています。 Wavacity https://wavacity.com/ 上記のリンクにアクセスすると、以下のような画面が表示されます。本家のAudacityは表示言語を日本語に設定する必要がありますが、Wavacityは最初から日本語で表示されるので、日本語ネイティブユーザーにとってかなり取っ付きやすくなっています。 記事作成時点で最新バージョンとなる本家Audacity(v3.3.3)の画面が以下。 比較するとこんな感じ。スライダーを右に動かすとWavacityが、左に動かすとAudacityが表示されます。 楽曲ファイルをインポートするには「ファイル」から「開く」をクリックし、ファイルを選択します。 タイムライン上でドラッグすると、編集

      老舗音声編集ソフトのAudacityをインストール不要でブラウザでも使える「Wavacity」
    • Meta、新音声生成AIモデル「Voicebox」 短い音声から自在に声を生成

        Meta、新音声生成AIモデル「Voicebox」 短い音声から自在に声を生成
      • 音声入力でメモを書けるウェブアプリを書いた、x-callbackを使ったアプリケーション連携

        voicodという音声入力でメモを書けるシンプルなウェブアプリケーションを書きました。 音声入力でメモができるシンプルなアプリケーションを書きました。https://t.co/EHSKnNKNaL x-callbackを使ってショートカット.app 等と連携すれば、入力内容をNotionに保存したりできます。 Note: SpeechRecognitionに対応したブラウザ(ChromeやSafari)が必要 Source: https://t.co/NnzXVjlGnF pic.twitter.com/yzoA3VIzzl — azu (@azu_re) February 10, 2022 SpeechRecognitionというウェブブラウザで音声認識をするAPIを使っているので、このAPIに対応しているブラウザが必要になります。 具体的にはGoogle ChromeやSafariなど

          音声入力でメモを書けるウェブアプリを書いた、x-callbackを使ったアプリケーション連携
        • 羽藤 由美 on Twitter: "NHKより長い下村氏の恫喝音声。「東大は記者会見して,先頭に立ってやるということを言って頂きたい」これが圧力でなくて何が圧力? 下村氏によると,東大では改革しようとするトップの足を現場が引っ張ったらしい。下村氏の視野に受験生は入っ… https://t.co/LHRudrBvrF"

          NHKより長い下村氏の恫喝音声。「東大は記者会見して,先頭に立ってやるということを言って頂きたい」これが圧力でなくて何が圧力? 下村氏によると,東大では改革しようとするトップの足を現場が引っ張ったらしい。下村氏の視野に受験生は入っ… https://t.co/LHRudrBvrF

            羽藤 由美 on Twitter: "NHKより長い下村氏の恫喝音声。「東大は記者会見して,先頭に立ってやるということを言って頂きたい」これが圧力でなくて何が圧力? 下村氏によると,東大では改革しようとするトップの足を現場が引っ張ったらしい。下村氏の視野に受験生は入っ… https://t.co/LHRudrBvrF"
          • はじまります、Twitterスペース Clubhouseみたいな“音声Twitter”いよいよ正式提供 まずはフォロワー600人以上のアカウントで

            Twitterは5月4日、Twitter上で音声ライブ配信ができる、iOS・Android版Twitterの新機能「スペース」を正式に提供開始すると発表しました。同日より、フォロワー数600人以上の全てのアカウントでスペースが作成できるようになります。 スペースを開始する方法 以前から「Twitter版Clubhouse」と話題になっていた機能で、これまではテストとして一部のユーザーにのみ解放されていました。スペース内では最大11人まで同時に話すことができ、リスナーの人数は無制限。ホストはツイートやダイレクトメッセージで参加者を募ったり、参加者にスピーカーとして発言を促したりできるほか、不適切なユーザーをミュートしたり、ブロックしたりすることも可能です。自分がリスナーとして参加したい場合は、タイムライン最上部に表示されるアイコンをタップすることで、自分がフォローしているユーザーのスペースに

              はじまります、Twitterスペース Clubhouseみたいな“音声Twitter”いよいよ正式提供 まずはフォロワー600人以上のアカウントで
            • “起こしたい人”と“起こされたい人”をマッチング モーニングコールでつながる音声アプリが3月に登場

              スタートアップのmoneep(東京都千代田区)は2月8日、モーニングコールをされたい人としたい人をマッチングするサービス「moneep」(モニープ)を発表した。朝起きるのがつらい人や、モーニングコールを通じてファンを増やしたいYouTuberなどのクリエイターによる利用を見込む。3月からiOSとAndroid向けに提供を始める。

                “起こしたい人”と“起こされたい人”をマッチング モーニングコールでつながる音声アプリが3月に登場
              • X (旧Twitter)にビデオ・音声通話機能がまもなく追加、スーパーアプリ化へ一歩。ヤッカリーノCEOが予告 | テクノエッジ TechnoEdge

                X(旧Twitter)のリンダ・ヤッカリーノCEOは、まもなくXにビデオ通話機能を追加することを予告しました。 このコメントは、米CNBCのテレビインタビューで行われたもの。Xを「万能アプリ(everything app)」に作りかえる目標を再確認し、すでに提供している長尺動画の投稿やユーザーに広告収益を分配するレベニューシェア等に言及した後「もうすぐ、プラットフォーム上で誰にも電話番号を教えることなく、ビデオ通話チャットが可能となります」と述べています。

                  X (旧Twitter)にビデオ・音声通話機能がまもなく追加、スーパーアプリ化へ一歩。ヤッカリーノCEOが予告 | テクノエッジ TechnoEdge
                • 「AI安倍晋三」ネットで物議 合成音声のYouTube動画、“東京大学AI研究会”が公開

                  Twitterアカウント(@AIAbeShinzo)も開設しており、最初に投稿したツイートは26日正午時点で1万件以上リツイートされるなど関心を集めている。ユーザーからは「素晴らしい」や「ありがとう」など絶賛する声の他、「死者への冒涜ではないか」や「AIで美空ひばりの新曲作ったのと同じ感じがして複雑」など疑問を呈する声も見られる。 「東京大学AI研究会」とは何者か? 発起人である東京大学AI研究会のWebサイトによると、同研究会は東京大学教養学部・工学部有志と学生有志が2021年5月10日に設立。5月時点では「東大13名、京大10名、大阪大学6名、早稲田大学9名、慶応義塾大学1名、筑波大学1名、立命館大学3名」(原文ママ)の43人が在籍し、代表者は東京大学・教養学部・理科一類に所属しているという。 目的は「飛躍的・未到達領域のAI開発」としており、最新の活動記録として4月に「SOTA(特定

                    「AI安倍晋三」ネットで物議 合成音声のYouTube動画、“東京大学AI研究会”が公開
                  • AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す(Impress Watch) - Yahoo!ニュース

                    ステレオミックスされたオーディオからボーカルを抽出したり、ベースを抽出するなど、任意の音を取り出したり消すということは、昔からいろいろな人がさまざまな方法でトライしてきた、ある意味、夢のテクニックだ。それが近年、AIを用いた手法により、ほぼ完ぺきな形で実現できるようになってきており、さまざまな企業が製品化を行っている。 【この記事に関する別の画像を見る】 そうした中、オープンソースのフリーウェアでもかなり優秀なものが登場している。「Demucs」というソフトがそれだ。以前からPythonで実行するタイプのものは出ていたようだが、現在はWindowsやMacで普通に起動できるソフトも登場しており、誰でも手軽に使えるようになっている。実際試してみたので、どんなものなのか紹介してみたい。 ■ AI技術の進化で、大きく変わった夢の“音声分離” “ステレオにミックスされた音からボーカルを消してカラオ

                      AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す(Impress Watch) - Yahoo!ニュース
                    • 新しいBing、アプリになる 音声対応+チャットで応答

                        新しいBing、アプリになる 音声対応+チャットで応答
                      • ロシア軍内部の音声をイギリス調査会社が入手 砲撃命令に兵士困惑「それは違う!」 涙も (FNNプライムオンライン) - Yahoo!ニュース

                        3月3日、クライナの首都・キエフに近い街、チェルニヒウの住宅街で撮影された映像です。 【画像】ウクライナ住民からパンと紅茶を受け取るロシア軍兵士 現地メディアによると、撃ち込まれたのはロシア軍のミサイル。すぐ近くには歩行者の姿もありました。 周辺の住宅は窓や壁が破壊され、肩を寄せ合って避難する人の姿もあります。地上には瓦礫が散乱し、大破した車も。 そして、マンションを見上げると黒い穴が。ここをミサイルが襲ったのでしょうか。 ロシアの国防総省は2日、南部の都市・へルソンを掌握したと発表。都市部への攻撃を激化させています。そんな中で行われた停戦交渉は、ウクライナの思うようには進みませんでした。 停戦交渉「人道回廊」は合意2時間半ほど行われた交渉。ウクライナ側が即時停戦、ロシア側が武装解除などを求め、両者の主張は平行線をたどりました。 その一方で、人道措置として戦闘地域から脱出するためのルートを

                          ロシア軍内部の音声をイギリス調査会社が入手 砲撃命令に兵士困惑「それは違う!」 涙も (FNNプライムオンライン) - Yahoo!ニュース
                        • 【独自】立憲・石垣のりこ議員、菅野完氏との「不倫の証拠」と「隠ぺい音声」を入手(週刊女性PRIME) - Yahoo!ニュース

                          5月17日発売の『週刊ポスト』で不倫疑惑が報じられた立憲民主党の石垣のりこ参議院議員(46)と著述家の菅野完(すがの・たもつ)氏(46)。 【写真】同時期に交際女性が複数いたという菅野氏と、寄り添う石垣議員 『週刊女性』の取材により、2人の交際当時、菅野氏が既婚者であったことが判明。疑惑は真実となった。 また、昨年秋頃に石垣事務所内で交わされた、不倫が当選後も続いていた事実を隠ぺいする内部音声も入手。その内実を明らかにする──。 強制わいせつ未遂で書類送検された過去を持つ菅野氏 エフエム仙台のアナウンサーを経て、2019年の参議院選挙で宮城県から初当選を果たした石垣議員。 「野党第一党は、政権批判こそが職責です」 過去にSNSでそう語っていた彼女は、立憲民主党内でも屈指の政権批判の急先鋒だ。 「選挙の際、石垣議員は擁立した立憲民主党のほか、国民民主党、共産党などからも支持を得て、野党共闘の

                            【独自】立憲・石垣のりこ議員、菅野完氏との「不倫の証拠」と「隠ぺい音声」を入手(週刊女性PRIME) - Yahoo!ニュース
                          • 甘利明幹事長「金銭授受」説明に疑問「大臣もこの案件は知っている」秘書“口利き”音声 | 文春オンライン

                            口利きを求める建設業者から甘利明幹事長(72)と秘書が現金を受け取っていた問題で、「事情を全く知らされていない。寝耳に水だった」などとしている甘利氏の説明と異なる音声データがあることが、「週刊文春」の取材でわかった。また、「辞任会見で質問が出尽くすまで答えた」とする説明は虚偽だった。 事の発端は、URが2013年当時、千葉県で進めていた道路建設を巡り、予定地と隣接する建設会社・S社との間で起きたトラブルだ。工事の影響で建物が歪み、地下から硫化水素が発生するなどしたため、S社はURに補償を求めていたが、交渉はなかなか進展しなかった。 だが、S社の総務担当者が2013年5月、甘利経済再生担当相(当時)の公設第一秘書(当時)の清島健一氏に相談したのを境に事態は動く。S社は3カ月後の8月、URから補償金として約2億2000万円を得ることができた。 甘利氏はその後、2013年11月14日に大臣室で現

                              甘利明幹事長「金銭授受」説明に疑問「大臣もこの案件は知っている」秘書“口利き”音声 | 文春オンライン
                            • 音声による伝達を日常的に行うのもうやめない?

                              飛沫感染のリスクというのはコロナが無くなったあとも通常の細菌感染症やインフルエンザでも起こるよね? そもそも論として音声による伝達は文字の発明によって言語の抽象化を完成させた人類にとってはレガシーツール以外の何物でもない。 文字が存在しない時代は「伝達したい事象をイメージ」→「音声言語化」→「発声」→「認識」というプロセスだったが、今は「伝達したい事象をイメージ」→「文字言語化」→「音声言語変換」→「発声」→「文字言語変換」→「認識」というプロセスを踏んでいる。 プロセスの間に変換工程が挟まることによって齟齬が生じるリスクが発生する。 いわゆる「空耳」と呼ばれる現象だ。 また外国語話者の場合は「発音」という壁が発生する。 外国語習得の際に文字だけでなく発音法についても学ぶ必要があり余計なコストがかかる上に、発音法の習得は長い時間外国で暮らしていても身につかずいつまで経っても会話成立において

                                音声による伝達を日常的に行うのもうやめない?
                              • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                                こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                                  OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                                • 会食時音声は総務省局長の声と一部認める | 共同通信

                                  総務省は18日の衆院予算委員会理事会で、菅義偉首相の長男と会食した際のやりとりとされる音声の一部について、秋本芳徳情報流通行政局長が「自身の声だ」と認めたと野党に回答した。衛星放送を話題にしたことは認めなかった。

                                    会食時音声は総務省局長の声と一部認める | 共同通信
                                  • 《虐待音声公開》1歳児に「泣けばいいと思ってんじゃねーよ、この野郎!」都内保育施設虐待 恐怖の“お叱りベッド”も | 文春オンライン

                                    「笑ってんだけど! 超ムカつく!」 「いらないの、そんな子は!」 「どういう教育受けてんだよお前は全く」 取材班が入手した音声に記録されていたのは、女性の怒号と幼児が泣き叫ぶ声。この音声が録音されたのは、東京・足立区の竹ノ塚駅東口から徒歩13分ほどの場所にある24時間営業の認可外保育施設(ベビーホテル)「X」だ(本稿の最後に実際の録音データを公開中)。約100平米のワンフロアで、園庭はない。保育資格を保有している職員は4名、それ以外の職員が10名。時間帯にもよるが、2~3名で平均10名程度の子供を保育している。

                                      《虐待音声公開》1歳児に「泣けばいいと思ってんじゃねーよ、この野郎!」都内保育施設虐待 恐怖の“お叱りベッド”も | 文春オンライン
                                    • 「音声をネットに」花畑牧場が従業員を刑事告訴 名誉毀損の疑い:朝日新聞デジタル

                                      ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                        「音声をネットに」花畑牧場が従業員を刑事告訴 名誉毀損の疑い:朝日新聞デジタル
                                      • 【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch

                                          【特集】音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた - PC Watch
                                        • NHKの聖火配信から音声消され、抗議へ 「五輪反対」:朝日新聞デジタル

                                          ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                            NHKの聖火配信から音声消され、抗議へ 「五輪反対」:朝日新聞デジタル
                                          • AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に

                                            AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に Amazon Lexを利用することで、「すべてのデベロッパーがAmazon Alexaに採用されている深層学習技術と同じ技術を利用できる」(Amazon Lexの説明文から)とされています。 Amazon Lexは、自動音声認識による音声からテキストへの変換機能と、テキストの内容からその意図を認識する自然言語理解機能を備えています。 つまり、電話やオンライン会議などを経由して日本語の音声をAmazon Lexに入力すると、いわゆる文字起こしのようにその内容をテキストに変換してくれます。 そしてこの音声から変換されたテキストや、Slackなどのテキストチャットなどで入力されたテキストの内容から、Amazon Lexはその意図などを理解し、会話の中から必要な

                                              AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に
                                            • コロナ患者の受け入れ拒否 旭川医科大学学長がクラスター発生病院に「なくなるしかない」と暴言音声 | 文春オンライン

                                              国内最大級のクラスター(感染集団)が複数の病院で発生し、自衛隊看護師が派遣されるなど医療崩壊の渦中にある北海道旭川市。北海道医師会は12月14日、記者会見を開き、独自の「医療緊急事態宣言」を発表した。旭川の医療崩壊のきっかけとなったのが、11月上旬から新型コロナウイルスのクラスターが発生し、現在までに患者や職員ら200人以上が感染した慶友会吉田病院。感染を封じ込められず、クラスターが発生してしまった同病院は、同じ市内にある国立旭川医科大学病院を名指しして、ホームページ上に、「感染患者の受け入れ拒否で転院が遅れた」などと批判(12月1日付け、現在は削除)し、波紋を呼んでいた。

                                                コロナ患者の受け入れ拒否 旭川医科大学学長がクラスター発生病院に「なくなるしかない」と暴言音声 | 文春オンライン
                                              • 和田政宗参院議員の「公職選挙法違反疑惑」音声 | 文春オンライン

                                                今夏の参院選に比例区から出馬予定の自民党・和田政宗参院議員(44)に、公職選挙法違反(事前運動)の疑いがあることが、「週刊文春」が入手した音声データで分かった。 元NHKアナウンサーの和田氏は2013年、宮城選挙区でみんなの党から出馬し、初当選。2017年に自民党入りした。安倍晋三首相に近い保守系議員としても知られている。 その和田氏の“問題発言”が飛び出したのは、5月20日、さいたま市内で開かれた「埼玉合同安全衛生推進大会」(積水ハウスほか主催)でのことだった。 積水ハウスは和田氏を招いた理由について、以下のように回答する。 「和田議員は、ご自身の推進政策の中で、若い世代が住宅を購入しやすい制度づくり等を掲げておられることから、ご挨拶を頂く機会を設けることとなりました。本大会は特定の議員の支援を目的として参加者を集めた会合ではありません」 約1000人が集まったというこの会合で、和田氏は

                                                  和田政宗参院議員の「公職選挙法違反疑惑」音声 | 文春オンライン
                                                • Otter|Otterは英語音声の文字起こしアプリです

                                                  Otterは会議やインタビュー、講義を始めとしてさまざまな場面での英語での会話をリアルタイムにテキスト化する、AIを活用したサービスです。

                                                    Otter|Otterは英語音声の文字起こしアプリです
                                                  • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                    画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ

                                                      無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                    • 【音声入手】「どこまで頭悪いんだよ!」報ステ富川悠太アナ コロナ療養の自宅に警察・児相が緊急出動(文春オンライン) - Yahoo!ニュース

                                                      「“黒い家”って、このへんではかなり有名なんですよ。あの日も『てめえはホント馬鹿だな!』と火のついたような怒鳴り声が聞こえていた。『ぎゃあ』とか『あぁ~』とかお子さんが激しく泣きわめいている声が聞こえてくるので、うちの子は怖がっていたんです」(近隣住民) 【画像】富川アナの自宅を訪ねる警察官 小池百合子都知事がゴールデンウイークの「ステイホーム」を呼びかけていた5月3日(日)の午前1時頃、都内のとある閑静な高級住宅街の一軒家に、警察官と児童相談所職員が駆け付けるトラブルが発生したことがわかった。この“黒い家”のあるじは、テレビ朝日の報道番組「報道ステーション」のメインキャスターを務める富川悠太アナウンサー(43)だ。 富川アナの自宅に警察・児相が緊急出動 富川アナを番組で観なくなってから約1カ月が経つ。富川アナは4月11日(土)、新型コロナウイルスの感染検査で陽性が確認されたことが明らかと

                                                        【音声入手】「どこまで頭悪いんだよ!」報ステ富川悠太アナ コロナ療養の自宅に警察・児相が緊急出動(文春オンライン) - Yahoo!ニュース
                                                      • [速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開

                                                        [速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開 GitHubは、年次イベント「GitHub Universe 2022」の基調講演で、音声によるGitHubの操作やコーディングを可能にする実験的機能「Hey, GitHub!」をプレビュー公開しました。 'Hey, GitHub!' is an experiment from the GitHub Next team that aims to reduce the need for a keyboard by enabling voice-based interaction with GitHub Copilot. Sign up now to join the waitlist: https://t.co/4YOSuA6cUr — GitHub (@github

                                                          [速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開
                                                        • Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表

                                                          2023年1月5日にMicrosoftが新しい音声合成AIモデル「VALL-E」を発表しました。VALL-Eはたった3秒間の音声サンプルで人の声を忠実にシミュレートできる他、一度学習したデータからは、その人の声色だけではなく感情のトーンや録音環境も再現した合成音声を作成することが可能になっています。 VALL-E https://valle-demo.github.io/ [2301.02111] Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers https://doi.org/10.48550/arXiv.2301.02111 Microsoft’s new AI can simulate anyone’s voice with 3 seconds of audio | Ars Technica

                                                            Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表
                                                          • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                                                            OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                                                              音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                                                            • 「バ~ニラ!バニラ 高収入♪」と実際に歌う!荷台が光る!1/32スケールプラモデル「バニラ宣伝カー」が、公式音源収録の音声ユニット&LED照明搭載で青島文化教材社から登場! | 電撃ホビーウェブ

                                                              「バ~ニラ!バニラ 高収入♪」と実際に歌う!荷台が光る!1/32スケールプラモデル「バニラ宣伝カー」が、公式音源収録の音声ユニット&LED照明搭載で青島文化教材社から登場! 「バ~ニラ! バニラ 高収入♪」の宣伝文句で有名な「高収入求人情報バニラ」の「バニラ宣伝カー」が、音声ユニットとLED照明を搭載した1/32スケールプラモデルとなって青島文化教材社から登場! アオシマオンラインショップ限定販売で、2024年2月発売予定です。 【2023年9月15日14:50追記】商品プロモーションの動画が完成したとのことで、記事末尾に追加しました。 お馴染み「バニラ」のテーマソングが約1分間、「メンズバニラ」のテーマソングが約1分間、それぞれ公式音源の提供を受けて音声ユニットに収録されており、外付けスイッチにてテーマソングの音声を操作可能。自宅で、あの音声を楽しむことができます。 青島文化教材社 コレ

                                                                「バ~ニラ!バニラ 高収入♪」と実際に歌う!荷台が光る!1/32スケールプラモデル「バニラ宣伝カー」が、公式音源収録の音声ユニット&LED照明搭載で青島文化教材社から登場! | 電撃ホビーウェブ
                                                              • 『スカイリム』にて、“AIによる生成音声”を含むポルノModの存在が問題視される。声優コミュニティから批判続出 - AUTOMATON

                                                                Mod制作者のRobbie氏は7月1日に、『The Elder Scrolls V: Skyrim』(以下、スカイリム)にてユーザーが制作するポルノModに関する注意喚起を投稿。同氏は一部のポルノModには、ゲームの音声ファイルを無断で利用したAIによる生成音声が含まれている点に強い懸念を表明している。この投稿は海外の声優コミュニティからも注目を集めており、海外メディアPC Gamerなどが報じている。 『スカイリム』は、Bethesda Softworksが2011年11月にリリースしたオープンワールドARPG。発売から12年を迎える現在に至っても根強く愛されている作品だ。ユーザーによるMod制作が盛んで、Modの内容も多種多様。中にはゲーム内のキャラがAIによる合成音声で喋るものもある。 そんな同作のMod制作コミュニティでは、ゲーム内の声優のボイスがAIによる生成音声としてポルノコン

                                                                  『スカイリム』にて、“AIによる生成音声”を含むポルノModの存在が問題視される。声優コミュニティから批判続出 - AUTOMATON
                                                                • 月額250円で32kbps、mineoに新プラン「マイそく スーパーライト」 音声専用やサブ回線用に

                                                                  オプテージが1月31日、MVNOサービス「mineo」向けの新料金プランとして「マイそく スーパーライト」を発表。2023年2月22日から提供する。 マイそくスーパーライトでは、月額250円(税込み、以下同)で32kbpsのデータ通信と音声通話が利用できる。通信速度は24時間365日、32kbpsで変わらないが、1回330円の「24時間データ使い放題」を利用することで、通常速度に切り替えられる。 これまで、マイそくでは平日昼間(12~13時)の通信速度を32kbpsに抑える代わりに、一定の速度で使い放題となるプランを提供してきた。その内容は、3Mbpsで月額2200円の「プレミアム」、1.5Mbpsで月額990円の「スタンダード」、300kbpsで月額600円の「ライト」。 今回加わったスーパーライトでは、これまでのマイそくの制限速度である32kbpsが通常速度になる代わりに、安価に回線を

                                                                    月額250円で32kbps、mineoに新プラン「マイそく スーパーライト」 音声専用やサブ回線用に
                                                                  • 音声推理ADV『Unheard』日本語吹替版が2023年発売へ。音を頼りに真実を解き明かす、アコースティック探偵の事件簿 - AUTOMATON

                                                                    パブリッシャーの505 Gamesは9月16日、『Unheard』日本語吹替版を発表した。対応プラットフォームはPlayStation 4/Xbox One/Nintendo Swtichで、2023年発売予定となっている。なお本情報は、情報番組「505 Games 新作タイトルショーケース TGS2022」内で発表されたものだ。 『Unheard』は、アコースティック探偵となって音声を頼りに真実を解き明かす、音声推理アドベンチャーゲームだ。ゲームを開始すると、主人公には俯瞰視点の事件現場マップと、音声ファイルの再生UIが映されたタブレットが渡される。プレイヤーは、タブレット端末を操作。何らかの事件が起こった建物内で「音を聞くポイント」を移動させながら、事件当時の音声ファイルを再生していく。場所によって再生される音が変化するので、事件当時その周辺で流れていた音に耳を傾けることで、事件の犯人

                                                                      音声推理ADV『Unheard』日本語吹替版が2023年発売へ。音を頼りに真実を解き明かす、アコースティック探偵の事件簿 - AUTOMATON
                                                                    • 音声データ入手! 旧統一教会・田中会長が「内部会議」で衝撃告白(FRIDAY) - Yahoo!ニュース

                                                                      「この場で綺麗事言ってもしょうがないので、私としては皆様方に通ずる言葉で、ある程度のことは申し上げたいと思っております。もし失言・暴言があったとしたら、全部、澤田局長の責任にさせていただいて(笑)、皆様方と向き合う時間にしたいと思います」 【画像】極めて貴重…!統一教会「内部会議」の様子…! 司会役を務める澤田拓也総務局長から促されて登場した田中富広・旧統一教会会長(66)は、そう語り始めた。過去2回の会見(7月11日、8月10日)とはまるで違い、その語り口は感情豊かだ。 安倍晋三元首相銃撃事件から40日が過ぎた8月19日、世界平和統一家庭連合(以下、旧統一教会)は全国の公職者に向けて「特別ネット会議」を開催。本誌はその音声データを独占入手した。 「公職者とは、全国各地にある教団支部の現場責任者クラスを指し、一般信徒がこの会議を見ることはできませんでした。今回のネット会議は、事前に現場から

                                                                        音声データ入手! 旧統一教会・田中会長が「内部会議」で衝撃告白(FRIDAY) - Yahoo!ニュース
                                                                      • ChatGPTと“声”で会話する方法解説書が発売 ~ブラウザーやAlexaにも組み込める!/『ChatGPTと音声で会話する3つの方法』発売【Book Watch/ニュース】

                                                                          ChatGPTと“声”で会話する方法解説書が発売 ~ブラウザーやAlexaにも組み込める!/『ChatGPTと音声で会話する3つの方法』発売【Book Watch/ニュース】
                                                                        • “ワイヤレス充電器”周辺のスマホをハッキング 聞き取れない音声攻撃で操作

                                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国のThe Hong Kong Polytechnic Universityの研究チームが発表した論文「Inducing wireless chargers to voice out」は、ワイヤレス充電器の近く(充電中含む)のスマートフォンを音声攻撃する研究報告だ。電磁干渉によって、聞こえない音声コマンドをスマートフォンのマイクに注入して操作する。 音声アシスタントの普及に伴い、スマートフォンの内蔵マイクを使った音声コマンド攻撃が新たな弱点となっている。スマートフォンの近くのスピーカーから「Hey Siri」「Hey Google」「Hi Xiaoai」などの音声コマンドを送り、操作する

                                                                            “ワイヤレス充電器”周辺のスマホをハッキング 聞き取れない音声攻撃で操作
                                                                          • Googleが発音のチェックを行う音声認識サービスを開始

                                                                            By Prostock-studio Googleが単語の発音チェックを行う新しいサービスを2019年11月14日(木)から開始しました。音声ファイルをAIが認識して文字起こしをしたり、声を出さずに音声入力をしたりと音声認識の技術は日々進化しています。Googleによる発音チェック機能は機械学習を用いた技術となっており、英語学習を格段に効率的にしてくれます。 How do you pronounce quokka? Practice with Search https://www.blog.google/products/search/how-do-you-pronounce-quokka-practice-search/ Google search will now give you feedback on your pronunciation - The Verge https://w

                                                                              Googleが発音のチェックを行う音声認識サービスを開始
                                                                            • 無料で商用利用もできるAI音声読み上げツール「VOICEVOX」に4人のキャラクターが追加/読み方とアクセントの辞書機能も

                                                                                無料で商用利用もできるAI音声読み上げツール「VOICEVOX」に4人のキャラクターが追加/読み方とアクセントの辞書機能も
                                                                              • 【文春】神田沙也加が交際相手の前山剛久から「死ね」と連呼される音声流出 : 痛いニュース(ノ∀`)

                                                                                【文春】神田沙也加が交際相手の前山剛久から「死ね」と連呼される音声流出 1 名前:サビイロネコ(SB-Android) [CN]:2022/01/05(水) 16:21:41.72 ID:TdE71hRq0 沙也加「怒鳴らないで」 前山「死ねよ、もう。めんどくせぇな」 沙也加「『死ね』って言わないで」 前山「死ねよ」 沙也加「『死ね』って言わないで」 前山「(遮るように)死ねよ」 沙也加「(やや涙声で)何で言うの?」 前山「死ねよ、マジで」 -------------------------------------------------------- 昨年12月18日に急逝した女優の神田沙也加(享年35)。亡くなる直前に、交際相手の俳優と激しく口論する音声が存在していることが、「週刊文春」の取材でわかった。中には、「死ね」などと罵倒を受ける場面もあった。 前山からの繰り返される厳しい言葉

                                                                                  【文春】神田沙也加が交際相手の前山剛久から「死ね」と連呼される音声流出 : 痛いニュース(ノ∀`)
                                                                                • ヘッドセットでリマインダー音声入力という言霊2.0 - 本しゃぶり

                                                                                  唱えたことが現実になる。 これはオカルトではなくテクノロジーの話だ。 常時装着したヘッドセットが人生を変える。 常時装着の有効活用 左耳の前を触ってみよう。きっとそこには「ボタン」がある。 そこにはブームマイクしかないが、という人は右側を触ろう。 本記事はこのボタンを有効活用する記事である。 何も無いとのたまう旧人類は早くヘッドセット常時装着(アップデート)してほしい。 前回の記事への反応で、「読んでAfterShockzを買った」というコメントをわりと見た。記事を書いた者として、せっかく買って常時装着するのなら有効活用してほしい。そこで前回の記事では触れていなかった活用方法、リマインダーへの音声入力の話をする。これは音声アシスタントへの入力端末を常時装着することの、真の価値を感じられる手法である。 これを前回紹介しなかったのは、俺はApple Watchで音声入力をすることが多いからであ

                                                                                    ヘッドセットでリマインダー音声入力という言霊2.0 - 本しゃぶり