並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 538件

新着順 人気順

voiceの検索結果281 - 320 件 / 538件

  • オノマトペ(擬音語)から環境音を合成するニューラルネットワーク(Onoma-to-Wave)をPyTorchで実装した - 備忘録

    はじめに 事前準備 ソースコード 実装の概要と動かし方 補助的に作成したモジュールの概要 おまけ:訓練済みモデルのリリース 環境音合成実験 音響イベントによる条件付けなし 音響イベントによる条件付けあり 実装の舞台裏とかTIPS おわりに 参考文献 はじめに 下記の雑誌論文が最近出版された。 Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori and Yoichi Yamashita, "Onoma-to-wave: Environmental Sound Synthesis from Onomatopoeic Words", APSIPA Transactions on Signal and Information Processing: Vol. 11: No.

      オノマトペ(擬音語)から環境音を合成するニューラルネットワーク(Onoma-to-Wave)をPyTorchで実装した - 備忘録
    • 人気ゲームスタジオ、ある声優により「スタジオに声をAI利用される」との懸念を示され波紋を広げる。スタジオは断固否定しつつも契約書を改訂 - AUTOMATON

      声優のHenry Schrader氏が現地時間8月17日におこなった投稿が波紋を広げている。同氏はHi-Rez Studiosが声優と交わす契約書において、「収録された音声をAIによる合成・複製に使用される」ことに同意させられる懸念があると主張。これが大きな注目を集めることとなり、スタジオ側はそうした懸念はないと反論しつつも、契約書面から懸念の寄せられた条項を削除する対応がとられることとなった。 Hi-Rez Studiosはアメリカ・アトランタに拠点をおくデベロッパー。基本プレイ無料の人気MOBA『SMITE』やヒーローシューター『Paladins』など、スタジオが設立された2005年以来長きにわたってゲーム開発に携わってきた。 『SMITE』 事態の発端となったのは、Henry Schrader氏がX(旧Twitter)上でおこなったポストだ。投稿された内容は同氏の知人の声優からの証言

        人気ゲームスタジオ、ある声優により「スタジオに声をAI利用される」との懸念を示され波紋を広げる。スタジオは断固否定しつつも契約書を改訂 - AUTOMATON
      • オンライン会議でマイク・イヤホンの音質が悪い! 気付いていない人も多いトラブルの原因と対策【高橋忍のにゃんともWindows】

          オンライン会議でマイク・イヤホンの音質が悪い! 気付いていない人も多いトラブルの原因と対策【高橋忍のにゃんともWindows】
        • 無料で商用可のAI音声読み上げツール「VOICEVOX」のソング機能が大幅強化/矩形選択・コピー&ペーストなどが可能に。ハミング対応キャラクターも大量追加

            無料で商用可のAI音声読み上げツール「VOICEVOX」のソング機能が大幅強化/矩形選択・コピー&ペーストなどが可能に。ハミング対応キャラクターも大量追加
          • litagin/moe-speech · Datasets at Hugging Face

            Not-For-All-Audiences This repository has been marked as containing sensitive content and may contain potentially harmful and sensitive information. View content

              litagin/moe-speech · Datasets at Hugging Face
            • 私の音声入力と格闘した16年の歴史を語る - 勝間和代が徹底的にマニアックな話をアップするブログ

              最近やっとフットスイッチで、Androidの音声入力ができるようになって落ち着きました、そしていつから音声入力を始めたんだろうと思って調べていたところ、2005年からでした。 メールを検索してみたところ、まずは2005年の8月にViaVoiceというソフトウェアを買っています。 当時の音声入力は本当に認識性能が悪くて明らかに手で打った方が早かったのですが、それでも毎日色々レポートを書く仕事をしていましたのでわらにもすがる思いで音声入力ソフトを試していました。 そして、2008年ぐらいから、ドラゴンスピーチやAmiVoiceという少しましなソフトウェアが出始めて、何をしていたかというと、せっせと私の発音の癖を覚えさせてちょっとでも単語認識が違うものについてはもう一度教育をするといったようなわりと地味なことをしていました。 ところがそんなこんなをしてるうちにスマホの音声入力が出回り始めて、20

                私の音声入力と格闘した16年の歴史を語る - 勝間和代が徹底的にマニアックな話をアップするブログ
              • 「Googleドキュメント」の音声入力機能がアップデート--使い方を解説

                声は強力なツールだ。Googleの音声入力機能は、声による文字入力を支援するだけでなく、プレゼンにも活用できる。 Googleの音声入力機能を使えば、自分の声を使って、頭の中の考えを素早く簡単にデジタル化できる。 Googleは米国時間1月9日、音声入力でより正確かつ安定した文字起こしを実現するアップデートを段階的にリリースすると発表した。 主な変更点は次のとおりだ。 音声を文字起こしする際の変換ミスを削減 文字起こしの漏れを最小化 対象が大半の主要ブラウザーに拡大 「Googleスライド」のキャプションに句読点を自動挿入 強化された音声入力機能を実際に使えようになるのは大半のユーザーの場合、2月9日以降だ。その間に、Googleの音声入力機能を使って「Googleドキュメント」で入力・編集をしたり、Googleスライドのスピーカーノートに音声でテキストを入力したりする方法を紹介しよう。

                  「Googleドキュメント」の音声入力機能がアップデート--使い方を解説
                • アフレコってスタジオで優雅に録音するイメージ→令和の宅録声優さんの収録シーンがこちらです「努力がすごすぎる」

                  梓来 有未 【声優】YouTube(Vtuber)自力運営中 @mamehina_0626 例の簡易防音の外と中、音比べてみたかった! youtube.com/shorts/U9aK4_Q… いや普通に普段の生配信の音とそれ以外の動画の音を比較してもらった方がより確実なのでは…? などとさっき投稿したあとに気づきました あれはおはよう動画だ、おはよー_(:3」z)_ 2022-11-02 08:51:54 リンク YouTube 例の簡易防音の外と中、音比べてみたかった! 普段の生配信と歌ってみたや台詞系の動画聴き比べてもらった方が確実なのでは…?などと今気づいたけど気にしない!まったく参考にならないかもしれない、とりいそぎの簡易防音ブラックボックスくん(手作り)の中と外の音比較です!台本はタブレットにデータ入れて中に立てかけて手動、録音は一旦そとに出て手動でポチポチしてます。アナ...

                    アフレコってスタジオで優雅に録音するイメージ→令和の宅録声優さんの収録シーンがこちらです「努力がすごすぎる」
                  • リアルタイムでボイチェンできる「CoeFont Voice Changer」

                      リアルタイムでボイチェンできる「CoeFont Voice Changer」
                    • ゲーム実況・Vtuber・YouTuber・リモート会議など配信で最も気になる音関係を一段階上のレベルへコンパクト&1台でカバーできる「Live Streamer NEXUS(AX310)」レビュー

                      ゲーム配信や映像配信をYouTubeなどで行うにあたって、配信者(ストリーマー)が気をつけなければいけない点の1つが「配信用機材」。本当に最低限の「プレイ中のゲーム画面をそのまま配信する」の先をやるためには、配信を助けてくれるストリームデッキのような機器やミックスアンプ、オーディオインターフェイスがあった方が便利。 AVerMediaの「Live Streamer NEXUS(AX310)」は、まさにこの「ストリームデッキ」「アンプ」「オーディオインターフェイス」の3つの機器の機能を1台でカバーしてくれる存在だということなので、実際に触ってみることにしました。なお、配信機材の名前も、機材を操作するためのソフトウェアも「NEXUS」という名称なので、記事中では機材を「AX310」、ソフトウェアを「NEXUS」と表記しています。 Live Streamer NEXUS(AX310) | 比較す

                        ゲーム実況・Vtuber・YouTuber・リモート会議など配信で最も気になる音関係を一段階上のレベルへコンパクト&1台でカバーできる「Live Streamer NEXUS(AX310)」レビュー
                      • 漫☆画太郎プロデュース、杉田智和や竹達彩奈が声入れた「TERRACE HORSE」公開(コメントあり)

                        これはJRA(日本中央競馬会)が、秋競馬の開幕に合わせて展開したもの。特設サイトでは「TERRACE HORSE THE COMIC」と題し、1つ屋根の下で男女6人が共同生活を送る様子を切り取ったリアリティショー「テラスハウス」をモチーフにしたボイス付きマンガ全5話が公開されている。キャストは菊花翔役の杉田智和、都秋華役の竹達彩奈、JC役の中村悠一、エリーザ・ベス役の悠木碧、真入千六役の諏訪部順一、樹部名あいる役の田村ゆかり、ババァ役ほかの木村昴。読者は最初に男女2人のキャラクターからどちらかを選択し、ストーリーを読むことが可能。ときおり出題される選択肢の回答に応じて、各話の展開や結末が大きく変わる。 なお特設サイトでは漫☆画太郎がプロデュースした声優陣の似顔絵も掲載。また声優陣のサイン入り台本が当たるキャンペーンや、恋愛競馬診断「LOVE STAKES」も展開されている。さらに11月10

                          漫☆画太郎プロデュース、杉田智和や竹達彩奈が声入れた「TERRACE HORSE」公開(コメントあり)
                        • ディープラーニングで誰でも簡単に「結月ゆかり」の声になれる音声変換技術が開発される

                          AH-Softwareの読み上げ用音声合成ソフトのVOICEROIDは、自分で好きな言葉をソフトウェアに読み上げさせることができるため、動画のナレーションやロボットの発話によく使われています。しかし、VOICEROIDの設定はやや面倒で時間がかかるもの。そこで、マイクで録音した音声をVOICEROIDの「結月ゆかり」さんの声に誰でも簡単に変換できるボイスチェンジ技術を、Dwango Media Villageのエンジニアであるヒホさんがニコニコ動画で発表しました。 ディープラーニングの力で誰でもゆかりさんの声になれる声変換技術を作ってみた - ニコニコ動画 今回ヒホさんが開発したのは、高品質に誰の声でもゆかりさんの声に変換できるという技術です。 ムービー中では、実際にヒホさんの声をゆかりさんの声に変換したものを聞くことができます。 「声を変換する」ということは、入力された音声データを別の音

                            ディープラーニングで誰でも簡単に「結月ゆかり」の声になれる音声変換技術が開発される
                          • GitHub - Plachtaa/VALL-E-X: An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io

                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                              GitHub - Plachtaa/VALL-E-X: An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io
                            • 「よ”ろ”し”く”ぅ”」 絶叫するAI「松嘩りすく」 きれいな叫び声を合成する技術

                              ここ数カ月、画像生成AIが広く注目を集めている。自動で欲しい写真素材やイラストを合成できる上、上手に扱えば、工夫次第でクオリティーを上げることもでき、やりこみ要素もあって触るだけでも楽しい。 AIにもさまざまあるが、本連載では面白いAI、癖のあるAIを紹介する。ぜひとも使ってAIが得意なことや、その裏に見える将来の可能性、人間にも負けないちょっとした恐ろしさなどを、感じとってほしい。 「絶叫」を高品質に再現できる時代に 音声合成ソフトというと、アニメキャラクターやアナウンサーのような声で文章を読み上げるものを想像するかもしれない。そんななかで特に異彩を放っているのが「COEIROINK」という無料のAI音声合成ソフトで使えるキャラクター「松嘩(まつか)りすく」だ。この音源は、入力された文章を“絶叫”できる。 COEIROINKはAIを活用して、入力された文章の読み上げ音声を出力する無料ソフ

                                「よ”ろ”し”く”ぅ”」 絶叫するAI「松嘩りすく」 きれいな叫び声を合成する技術
                              • ズートピアのニックのこのセリフで救われる命があると思う→救われた命が集まる「肌荒れめっちゃ治った」「息を吹き返す」

                                夜道 @warp_days ズートピアのニック(森川智之)のセリフ「しょうがないな わかったよ よしよし あ〜もう本当にがんばるんだから さあほら息を吸って」で救われる命があると思う 2023-12-11 18:22:12 リンク ディズニー ズートピア|映画/ブルーレイ・DVD・デジタル配信|ディズニー公式 『ズートピア』の作品サイト。ブルーレイ・DVD・MovieNEX・デジタル配信最新情報のほか新作ディズニー映画、海外ドラマ、デジタル配信など、豊富な作品ラインナップをお届けします。ディズニー公式 Disney.jp 8 users 32

                                  ズートピアのニックのこのセリフで救われる命があると思う→救われた命が集まる「肌荒れめっちゃ治った」「息を吹き返す」
                                • 無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと

                                  無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと:PCでもスマホでも使える!(1/2 ページ) 会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。 また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。 β版として無料提供 アプリでもファイルのアップロードでも利用可能 CLOVA Noteは、LINEがこの5月からβ版として無料で提供

                                    無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと
                                  • GitHub - fonoster/fonoster: 🚀 The open-source alternative to Twilio.

                                    Fonoster Inc is researching an innovative Programmable Telecommunications Stack that will allow businesses to connect telephony services with the Internet entirely through a cloud-based utility. Attention ⚠️: Exploring Fonoster: We encourage new users to initially explore Fonoster's features through our SaaS (Software as a Service) option. This platform is free to start and offers a comprehensive

                                      GitHub - fonoster/fonoster: 🚀 The open-source alternative to Twilio.
                                    • 岡本信彦が新事務所立ち上げ 鬼頭明里、ファイルーズあいら34名、プロ・フィットから移籍へ

                                      声優事務所のプロ・フィットがプロダクション業務を来年3月末で閉鎖することにともなう、声優の移籍先が15日、発表された。岡本信彦とプロ・フィットの現場マネージャーが新プロダクション「ラクーンドッグ」を立ち上げ、鬼頭明里、ファイルーズあいなど34名が同事務所に移籍することが決定した。来年4月1日付での所属となる。 プロ・フィットは「2021年11月4日に『ご報告』させて頂きました『プロダクション業務閉鎖』に伴い、所属声優の『岡本信彦』が作るプロダクションと、プロ・フィットの現場マネージャー達が作るプロダクションが、当初予定しておりました業務提携の枠を超えて『一つの会社』としてまとまり、新プロダクション『ラクーンドッグ』として活動していくことが決まりました」と報告。 『ラクーンドッグ』への移籍が発表された声優は以下の通り。 岡本信彦、増岡太郎、高橋伸也、相馬康一、杉崎亮、峰健一、小林康介、堀江瞬

                                        岡本信彦が新事務所立ち上げ 鬼頭明里、ファイルーズあいら34名、プロ・フィットから移籍へ
                                      • “コピーロボット”の働きが声優の収益に AIシンガー業界に到来したサブスクビジネスの可能性

                                        藤子・F・不二雄さんの漫画「パーマン」に「コピーロボット」というアイテムがあったのを覚えているだろうか。鼻のボタンを押すと、自分そっくりの姿に変化して、自分の身代わりになってくれる人形だ。 あのアイテムに近いようなことが歌声合成業界では可能になっている。自分の歌い方をそっくりに再現して人間のように歌う“AIシンガー”がかなり普及してきているのだ。 最近では、バーチャルYouTuberの「花譜」さんが「CeVIO AI」というブランドのAIシンガーになり、ヒット曲もたくさんリリースされている。8月8日にはVTuberのキズナアイさんの歌声を再現したAI「#kzn」が先行販売された。 そして、CeVIO AIの音声合成エンジンを開発しているテクノスピーチが、9月1日に新たな試みを始める。AIシンガーのサブスクリプションサービス提供だ。 今回は同社の大浦圭一郎代表とエンタメ事業部の塚田恵佑さん、

                                          “コピーロボット”の働きが声優の収益に AIシンガー業界に到来したサブスクビジネスの可能性
                                        • フォークリフト自動化のニュースに気を取られてアナウンサーが既に自動化されてることにみんな気づかない

                                          NHKニュース @nhk_news NHKニュースの公式アカウントです。最新のニュースを24時間休みなくお届けします。 nhk.jp/rules をご確認、ご了承ください。問い合わせは nhk.or.jp/css/ nhk.jp/news

                                            フォークリフト自動化のニュースに気を取られてアナウンサーが既に自動化されてることにみんな気づかない
                                          • ゲームの「主人公の声」を「自分の声」にしたらどうなる? 米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】

                                            TOPコラム海外最新IT事情ゲームの「主人公の声」を「自分の声」にしたらどうなる? 米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】 ゲームの「主人公の声」を「自分の声」にしたらどうなる? 米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】 2021年12月13日 米パデュー大学と米ミシガン州立大学の研究チームが発表した論文「The Effects of a Self-Similar Avatar Voice in Educational Games」は、ゲームにおいて、自身の声と自身が動きを操作するアバターの声の類似性がユーザーにどのような影響を与えるかを検証した研究だ。 アバターの声は、バーチャルYouTuberやソーシャルVRのようなリアルタイムに自分の声が反映されるコンテンツではなく、予め決められたセリフをゲーム上のアバターが発するものを想定している。

                                              ゲームの「主人公の声」を「自分の声」にしたらどうなる? 米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】
                                            • 無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた

                                              「誰でも100種類の声に変換できるAIボイスチェンジャー」や「ディープラーニングで誰でも簡単に結月ゆかりの声になれる技術」を開発したDwango Media Villageのエンジニアであるヒホさんが、入力した文章から自動で読み上げ音声を合成してくれるオープンソースのソフト「VOICEVOX」を公開したので、実際に使ってみました。 VOICEVOX https://voicevox.hiroshiba.jp/ ???????????????????????????????????????????????????????????????? 無料で使える中品質なテキスト音声合成ソフトウェア、#VOICEVOX をリリースしました ???????????????????????????????????????????????????????????????? ぜひダウンロードして遊んでみてくださ

                                                無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた
                                              • 【山田祥平のRe:config.sys】 AIがもたらす同時通訳の新しい当たり前

                                                  【山田祥平のRe:config.sys】 AIがもたらす同時通訳の新しい当たり前
                                                • Twitterも真似するClubhouse、新ラウンドで資金調達 クリエイター支援へ

                                                  米音声チャットプラットフォームのClubhouseは1月24日(現地時間)、米VC大手Andreessen Horowitz主導のシリーズBラウンドの資金調達を行うと発表した。調達総額は公表されていない。 Clubhouseは2020年創業でサンフランシスコに拠点を置く米Alpha Explorationが同年3月に立ち上げたソーシャルサービス。プラットフォーム上に好きなテーマで自分のチャットルームを開設し、世界中の人々と会話できるというコンセプトだ。音声版Twitterとも呼ばれる。まだ招待制でiPhoneアプリしかないが、200万人以上が訪れたという。 ユーザーは好きなチャットルームに自由に出入りし、会話に参加できる(だまって聞くだけも可)。ライブコンサートを開いたり、民主主義について討論したり、語学教室を開いたり、同じ病気の子を持つ親が話し合ったり、様々なテーマの部屋が開設されている

                                                    Twitterも真似するClubhouse、新ラウンドで資金調達 クリエイター支援へ
                                                  • 「15年間、毎日ブログを書きつづけた」声優・茅原実里が振り返る自身の経歴と“夢”(新R25) - Yahoo!ニュース

                                                    2004年、アニメ『天上天下』の棗亜夜役で声優デビュー。2006年にはアニメ『涼宮ハルヒの憂鬱』の長門有希役で広く知られるようになり、歌手としても武道館ライブを成功させるなど、精力的に活動を続け、今年デビュー15周年を迎える茅原実里さん。 しかし、茅原さんがもともと抱いていた夢は、「声優」ではなく「歌手」だったんです。 彼女はどのような経歴をたどってきたのか。茅原さんのデビューから今に至るまでの15年間の軌跡を、ご本人と一緒に振り返りました。 〈聞き手=いしかわゆき〉

                                                      「15年間、毎日ブログを書きつづけた」声優・茅原実里が振り返る自身の経歴と“夢”(新R25) - Yahoo!ニュース
                                                    • 多くの声優は「仕事のギャラ」も知らされていない!? 榎本温子がエンタメ業界弁護士に聞く「声優業界の法律問題」|FINDERS

                                                      CAREER | 2023/10/20 多くの声優は「仕事のギャラ」も知らされていない!? 榎本温子がエンタメ業界弁護士に聞く「声優業界の法律問題」 近年、声優業界の労働環境についてのニュースが度々、世間を賑わせる。FINDERSでは現役の声優/ナレーターである榎本温子... 近年、声優業界の労働環境についてのニュースが度々、世間を賑わせる。FINDERSでは現役の声優/ナレーターである榎本温子さんと共に過去2回に渡り問題の根源を探った。 対話を重ねていく中で「声優業界、そしてアニメの制作現場で慣例的に行われてることが果たして正常なのか?法律的な問題はないのか?」という疑問が噴出した。 そこで今回は元ゲーム開発プロデューサーという異色な経歴を持つ弁護士、貞永憲佑さんと対談を行うことで法務面から声優業界の問題点を紐解く。 文・構成・聞き手:ひでたかくん/神保勇揮(FINDERS編集部) 写真

                                                        多くの声優は「仕事のギャラ」も知らされていない!? 榎本温子がエンタメ業界弁護士に聞く「声優業界の法律問題」|FINDERS
                                                      • AI歌声合成を実現するCeVIO AIが年内発売。IA、ONEに加え、結月ゆかり、flowerなどもCeVIO AIに対応|DTMステーション

                                                        AI歌声合成の世界が、一気に活気づいてきています。今年2月にNEUTRINOがフリーウェアとしてリリースされ、AIきりたんが話題になり、現在その第2弾となる東北イタコのクラウドファンディングが実施中なのは先日も記事にしたとおりです。さらに6月26日にはAI歌声合成と従来の歌声合成のハイブリッドというSynthesizer Vが発表され、7月30日に発売が開始されます。 そこに来て、CeVIOの新ラインナップであるCeVIO AIが登場し、年内に発売されることが本日発表されました。CeVIO AIでの歌声合成は、従来の歌声合成とは一線を画すもので、AI技術を利用することでまさに人間が歌っているかのようなリアルな歌い方を実現するもの。そしてそのCeVIO AIで利用可能なソングボイス(歌わせるためのデータベースライブラリ)・トークボイス(しゃべらせるためのデータベースライブラリ)として、これま

                                                          AI歌声合成を実現するCeVIO AIが年内発売。IA、ONEに加え、結月ゆかり、flowerなどもCeVIO AIに対応|DTMステーション
                                                        • 「新しいBing×音声認識」で感じた“検索新時代” スマートスピーカーはもう古い

                                                          2月8日、Microsoftのブラウザ「Edge」にAIを搭載した「新しいBing」が搭載されたことで、ブラウザをEgdeに乗り換える人もそこそこあったのではないだろうか。筆者もAI搭載のBingを使ってみたい一心で、ChromeからEdgeに乗り換えてみたところだ。 筆者は2015年に執筆環境をMacへ移行したので、Edgeはほとんど使ったことがない。MacOSに初めてEdgeをインストールしてみたのだが、Chromiumベースというだけあって、Chromeから設定を移行すると、拡張機能のほとんどがそのまま利用できた。乗り換えは比較的スムーズである。 ブラウザの世界シェアは、2022年の調査ではChromeが64.95%でぶっちぎりのトップ、継いでSafariの19.01%、3位がEdgeの3.99%、4位がFirefoxの3.26%となっている。EdgeがデフォルトのWindowsユー

                                                            「新しいBing×音声認識」で感じた“検索新時代” スマートスピーカーはもう古い
                                                          • Google Cloud Speech-to-Text APIをいろいろ調査してみる - OPTiM TECH BLOG

                                                            こんにちは、2020年新卒入社予定の山口です!修論と引越し準備とアルバイトで慌ただしい日々を過ごしています。今日は業務で触った、Google製API Google Cloud Speech-to-Text API について皆さんと共有できればと思います。 Google Cloud Speech-to-Text API とは APIを導入していく GCP側 PC側 実際に試してみる 認識モデルを変更してみる マルチチャンネルで試してみる ファイル形式・サンプリング周波数を比較してみる ナレーション音声(「本日は〜」の音声です。) 走れメロス_朗読 おわりに Google Cloud Speech-to-Text API とは Google Cloud Speech-to-Text API は名前の通り、音声データから文字起こしをするAPIです。この音声データは私たちが日頃聞いているような音声

                                                              Google Cloud Speech-to-Text APIをいろいろ調査してみる - OPTiM TECH BLOG
                                                            • 高橋李依版アイドル、おもしろいよね

                                                              https://www.youtube.com/watch?v=FEktA0Nmnjs ↑これね YOASOBI(Ayase)の作曲術と推しの子AyaseYOASOBIは必ず原作小説から歌を作成します。(普通に誤記です) 今回も漫画「推しの子」を直接参照しているわけではなく、スピンオフ小説の45510(原作者赤坂アカ書下ろし作品)から書き起こされています。 この45510が曲者で、推しの子第1巻/アニメ第1話の主役級の星野アイについて作中の第三者が語っている作品です。 (アイの所属するユニットB小町のメンバーの1人であることは想像できるが、具体的な名言はされていない) アイドルの歌詞は何も知らないとアイを素直に描いた歌のように思えますが、実際にはメタ的な視点から描かれてます。 それも前半だけの話で、ある部分からはアイ本人の視点が入り込んでいる、ともされています。 この作品におけるアイは信頼

                                                                高橋李依版アイドル、おもしろいよね
                                                              • ファイルーズあいさん、最終話アフレコ直後に浪川大輔さんから花束を渡され号泣した写真を投稿。「徐倫とアナスイ過ぎて尊い」の声

                                                                ファイルーズあい|Fairouz Ai @fairouzzzzzz ラクーンドッグ所属の声優🦄 鼠とハロウィンが好き。ステッカー作るのも好き。ファンアートはぜひ『 #ファイルーズ展 』で❤️‍🔥❤️‍🔥❤️‍🔥 (Instagram) instagram.com/p/CeOge2SFGz8/… https://t.co/QJTL0T0ZR3 ファイルーズあい|Fairouz Ai @fairouzzzzzz ジョジョのオーディションを受けた日に泣きながら書いた日記。 緊張しすぎて実力を出しきれなかったから悔しくて悲しくて涙でぐちゃぐちゃに滲んでるし、感情のままに書いてるから漢字もすっごい間違ってる…(笑) この悔しさをバネに強くなれてよかった!! pic.twitter.com/CVeFEeciRI 2022-11-30 19:20:59

                                                                  ファイルーズあいさん、最終話アフレコ直後に浪川大輔さんから花束を渡され号泣した写真を投稿。「徐倫とアナスイ過ぎて尊い」の声
                                                                • Shinnosuke Takamichi (高道 慎之介) - jvs_corpus

                                                                  This corpus consists of Japanese text (transcripts) and multi-speaker voice data. The specification is as follows. 100 professional speakers Each speaker utters: "parallel100" ... 100 reading-style utterances that are common among speakers "nonpara30" ... 30 reading-style utterances that are completely different among speakers "whisper10" ... 10 whispered utterances "falsetto10" ... 10 falsetto ut

                                                                    Shinnosuke Takamichi (高道 慎之介) - jvs_corpus
                                                                  • 無料で音声をテキストに書き起こしてWebページへ入力できる拡張機能「Voice In」/「Gmail」や「Google ドキュメント」へのテキスト入力を音声で【レビュー】

                                                                      無料で音声をテキストに書き起こしてWebページへ入力できる拡張機能「Voice In」/「Gmail」や「Google ドキュメント」へのテキスト入力を音声で【レビュー】
                                                                    • 【レビュー】 Windows 10はBluetoothの高音質通話「HD Voice」に対応したのか? ~バッファロー製ヘッドセットで実証テスト

                                                                        【レビュー】 Windows 10はBluetoothの高音質通話「HD Voice」に対応したのか? ~バッファロー製ヘッドセットで実証テスト
                                                                      • 音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト

                                                                        会議録を作る際、録音を繰り返し聞いて文字起こしするのは大変だ。最近は音声認識の技術が急速に進化し、無料でテキスト化できるアプリもある。使わないのは損だ。 「LINE CLOVA Note」は認識精度が高く、複数の話者を区別できるので実用性が高い(図1)。利用にはLINEアカウントが必要(図2、図3)。スマホアプリ版はその場で録音するか、音声ファイルをアップロードして使える(図4)。録音する場合でも即座にテキスト化されるわけではなく、録音終了後に文字認識が始まる。パソコンではウェブサービス版を利用できる(図5)。よく使う単語を登録しておくと、認識精度がより高まる(図6)。

                                                                          音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト
                                                                        • Microsoft hologram speaking Japanese

                                                                          Microsoft is using its Mixed Reality studios and neural TTS engines to create a hologram of a person speaking in another language. The voice will sound just like the original person, but with a different language.

                                                                            Microsoft hologram speaking Japanese
                                                                          • 音声を文字起こししてくれる「Amazon Transcribe」、言語の種類を自動識別する新機能。人間によるタグ付けが不要に

                                                                            音声を文字起こししてくれる「Amazon Transcribe」、言語の種類を自動識別する新機能。人間によるタグ付けが不要に Amazon Web Services(AWS)が提供する「Amazon Transcribe」は、音声をテキストに変換する、いわゆる文字起こしを機械が行ってくれるサービスです。 例えば、ボイスメールをテキストに変換して送信するサービスの構築や、電話での問い合わせなどを受け付けるコールセンターなどで顧客とのやり取りの記録をテキストで残すサービスの開発などに役立ちます。 AWSはこのAmazon Transcribeに、話されている言語が英語なのか日本語なのか中国語なのか、などの言語の種類を自動的に識別する機能を追加したと発表しました。 New #AWSLaunches! New AWS Solutions Consulting Offer - Confluence

                                                                              音声を文字起こししてくれる「Amazon Transcribe」、言語の種類を自動識別する新機能。人間によるタグ付けが不要に
                                                                            • Voidol

                                                                              リアルタイムで特定のキャラクターの声へ変換 V-Tuberの配信やゲーム実況などで活躍します 販売終了につき、2024年3月より無償配布開始いたしました! 無償配布版は以下のページからダウンロードいただけます。 無償配布版ダウンロードページ ※こちらの製品のサポートに関しましては年内で終了いたします。 ※ご購入いただいたボイスモデルはVoidol2・Voidol3で引き続きご利用いただけます。 ★★★世界発信コンペティション2020 製品・技術部門 大賞受賞★★★ ★★★TBS系列「審査員長・松本人志」近未来テクノロジーコンテスト まつもトロフィー受賞★★★ この製品は(公財)東京都中小企業振興公社 中小企業ニューマーケット開拓支援事業の支援対象製品です。 ※但し、公社は製品の効能効果を保証するものではありません 「Voidol - Powered by リアチェンvoice -」 ナレー

                                                                                Voidol
                                                                              • 「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン

                                                                                寝ている相手を起こさないように…搭載されたばかりの新機能 2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。 夜遅くにLINEを送ると「相手を起こしてしまうのでは?」と気を使ってしまうが、そんな時、この機能がとっても便利! この記事の画像(25枚) 使い方は、LINEの右上にある設定アイコンをタップして「LINE Labs」を選択。 その中にある、「ミュートメッセージ」の設定をONにすれば、準備OK。 後は送信ボタンを長押しして、ミュートメッセージを選んで送れば、相手の通知音は鳴らさずに、メッセージを送ることができる。 若者世代のLINEの使い方は、今もっと進化している! そこで「LINEの便利機能と新常識」をココ調する! 「トークスクショ」「文字認識」あなたは使っている?LINEの便利機能 街で、よく使うLINEの機能を聞いてみると… 街頭インタビュー

                                                                                  「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン
                                                                                • 18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史

                                                                                  近年では、AI技術や合成音声技術の進歩に伴って、まるで人間の声のような音声シミュレーションは目覚ましい発展を遂げています。しかし、18世紀のヨーロッパでも、人間の声をシミュレートするような技術や機械が数多く開発されていました。 “You Are My Friend”: Early Androids and Artificial Speech — The Public Domain Review https://publicdomainreview.org/essay/early-androids-and-artificial-speech/ 最初の「人間の機能を模した」アンドロイドが誕生したのは、1738年2月のこと。エンジニアのジャック・ヴォーカンソンがアントワーヌ・コワズヴォーの「フルートを演奏する羊飼い」をモデルに製作し、パリのサンジェルマン見本市で展示されたアンドロイドは、これまで

                                                                                    18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史