並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 3378件

新着順 人気順

音声の検索結果241 - 280 件 / 3378件

  • 商用可・無料のAI音声読み上げツール「VOICEVOX」、他アプリへの組み込みも可能なコアライブラリも公開/プロジェクトの保存、キャラの立ち絵、設定画面を追加するなど使い勝手も向上

      商用可・無料のAI音声読み上げツール「VOICEVOX」、他アプリへの組み込みも可能なコアライブラリも公開/プロジェクトの保存、キャラの立ち絵、設定画面を追加するなど使い勝手も向上
    • 商用可・無料のAI音声読み上げツール「VOICEVOX」にMac版が登場 ~最新プレビュー版【18:00追記】/ユーザーインターフェイス・機能も熟成。同梱のキャラクターは総勢5人に

        商用可・無料のAI音声読み上げツール「VOICEVOX」にMac版が登場 ~最新プレビュー版【18:00追記】/ユーザーインターフェイス・機能も熟成。同梱のキャラクターは総勢5人に
      • ブラウザで動くリアルタイム画像/音声処理アプリをStreamlitでサクッと作る

        Overview 画像/音声処理をリアルタイムで行う、Webブラウザから利用できるアプリをStreamlitで作る方法を解説します。 StreamlitのおかげでPythonだけでwebアプリが作れます。さらに、一番簡単な例なら10行程度のPythonコードで、webカメラを入力にしてブラウザから利用できるリアルタイム画像処理アプリケーションになります。 Webベースなのでクラウドにデプロイでき、ユーザに簡単に共有して使ってもらえ、UIもイマドキで綺麗です。 人物・物体検知、スタイル変換、画像フィルタ、文字起こし、ビデオチャット、その他様々な画像・音声処理の実装アイディアをデモ・プロトタイピングするのになかなかハマる技術スタックではないでしょうか。 Webブラウザから利用できる物体検知デモの例。実行中に閾値をスライダーで変えられる。オンラインデモ🎈 同様にスタイル変換デモの例。実行中にモ

          ブラウザで動くリアルタイム画像/音声処理アプリをStreamlitでサクッと作る
        • 軽量版Googleアプリ「Google Go」、日本を含む世界で公開 音声読み上げ機能も

          米Googleは8月20日(現地時間)、主に新興国市場向けに展開している「Android Go」の軽量検索アプリ「Google Go」を世界で公開したと発表した。日本でもGoogle Playストアからダウンロードできる。 Google Goは、2017年12月に発表したローエンド端末向けOS「Android Oreo(Go edition)」のGoogleアプリとして登場した。アプリ容量が約7MBと軽量で、ネットワークが不安定な環境でも検索が可能という。通常のGoogleアプリでも可能な、オフラインでの検索をネットに接続できてから表示する機能も備える。 Google Goには検索の他に、音声検索、画像およびGIFの検索、翻訳、「Google Lens」、Webページの読み上げ機能もある。Google Lensについては、Google I/O 2019で予告されていた。 Webページの読み

            軽量版Googleアプリ「Google Go」、日本を含む世界で公開 音声読み上げ機能も
          • 声優・田村ゆかり、肺炎および急性声帯炎による音声障害 「10日間程度の沈黙」必要でライブ延期

            公式サイトでは「先日からの喉の不調により本日医師の診察を受けましたところ、肺炎および急性声帯炎による音声障害との診断を受け、今後さらに10日間程度の沈黙、安静加療が必要との医師の判断により、開催を予定しておりました「田村ゆかり LOVE LIVE 2024 *Honey bunny*」6月8日(土)浦安市文化会館公演、6月9日(日)栃木県総合文化センターはやむを得ず延期とさせていただくこととなりました」と説明。 「現在、6月2日に開催を予定しておりましたJ:COMホール八王子公演と合わせて振替日程を調整しておりますが、調整がつかない場合は中止とさせていただく場合もございますので予めご了承ください」と伝えた。 続けて「それぞれの公演のチケットをお持ちの方へは詳細が決まり次第、払い戻し方法をオフィシャルホームページにてご案内いたしますので、お手元の電子チケットはそのままお持ちください」と呼びか

              声優・田村ゆかり、肺炎および急性声帯炎による音声障害 「10日間程度の沈黙」必要でライブ延期
            • スニーカーだけのEC、音声版YouTube 21年は「特化型」に注目

              withコロナで生活者の意識や行動は大きく変わりつつある。そうした中、ビジネスの新潮流を探るため、ベンチャーキャピタル(VC)を訪ねる本連載。第2回は、インターネット関連を中心に幅広く投資するYJキャピタル(東京・千代田)の社長、堀新一郎氏に今後注目の領域や企業を聞いた。 慶応義塾大学(SFC)卒業後、フューチャーシステムコンサルティング(現フューチャーアーキテクト)を経て、ドリームインキュベータ(DI)にて経営コンサルティングおよび投資活動に従事。 2007年よりDIのベトナム法人立ち上げのため、ホーチミン市に赴任。 13年よりヤフーに入社し、同年7月よりYJキャピタルへ参画。同社COO(最高執行責任者)を経て、16年11月より現職。アクセラレータープログラムCode Republicアドバイザー、ソフトバンクのグループ内新規事業開発・投資会社であるSBイノベンチャー取締役も兼務 ——

                スニーカーだけのEC、音声版YouTube 21年は「特化型」に注目
              • 音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと

                「Unreal Engine (UE) Advent Calendar 2022 その3」23日目の記事です。 はじめに OpenAIの音声認識AI「Whisper」がすごいらしい。これをUnreal Engineでリアルタイムに動かせるようにしたら応用範囲が広がっておもしろいんじゃないかと思いました。 (「異議あり!」って実際に声に出させたいよね) (NLPアドベンチャーを音声入力で、みたいな夢も広がる) しかし、いざやってみたらいろいろな課題にぶつかりました。この記事は、それらをどう解決したかの記録です。 目次 目標設定:C++とONNX Runtimeで実装する Whisperの処理の全体感 課題と対応 課題1:マイク入力と前処理をC++で実装する 課題2:Whisperの機械学習モデルをONNXにエクスポートする 課題3:ONNXモデルをtransformer&FP16向けに最適化

                  音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと
                • 配信者向け神デバイス! AVerMedia「Live Streamer NEXUS」徹底活用講座 ~音声ミキサーからマクロ操作まで1台で実現。ガチくんにも使ってもらった[Sponsored]

                    配信者向け神デバイス! AVerMedia「Live Streamer NEXUS」徹底活用講座 ~音声ミキサーからマクロ操作まで1台で実現。ガチくんにも使ってもらった[Sponsored]
                  • Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた

                    2021年3月3日にリリースされたデスクトップ版Google Chrome 89の安定版で、ブラウザ上で再生される音声やムービーからリアルタイムで字幕を生成する「自動字幕起こし」機能が追加されたことが明らかになったので、実際にどんな感じなのか使ってみました。 Google's Live Caption feature rolling out for Chrome desktop users https://www.xda-developers.com/google-chrome-live-caption-feature-rolls-out-transcribe-speech-videos/ Google's Live Caption is now rolling out to Chrome on desktop | Android Central https://www.androidce

                      Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた
                    • Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように

                      Metaの研究チームが音楽を生成するAIモデル「MusicGen」を公開しました。オープンソースでの公開となっているため誰でも無料でモデルを利用できるほか、作例やデモが公開されており、その品質を実際に確かめることが可能になっています。 [2306.05284] Simple and Controllable Music Generation https://doi.org/10.48550/arXiv.2306.05284 MusicGen: Simple and Controllable Music Generation https://ai.honu.io/papers/musicgen/ MusicGenはChatGPTなどの大規模言語モデルと同様にTransformerを利用したモデルです。言語モデルは文の次の言葉を予測しますが、MusicGenは音楽の次のセクションを予測する仕組

                        Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように
                      • 喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション

                        5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ

                          喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション
                        • コナン君に「#歌わせてみた」流行曲、実はAI偽音声…困惑する声優たち「対処しようがない」 (読売新聞オンライン) - Yahoo!ニュース

                          生成AI(人工知能)を使い、声優らの偽音声を作り出して無断利用した動画がSNSに投稿される事態が相次ぎ、当事者らに不安が広がっている。勝手に曲を歌わせたり、文章を朗読させたりしていて、専門家らは、権利の保護や悪用防止のため、AIの利用について一定の規制が必要と指摘している。(福元理央) 【写真】「コナン君に歌ってもらった」とティックトックに投稿された動画 無許可 「コナン君に歌ってもらった」。今年7月、動画共有アプリ「TikTok(ティックトック)」などに、そんなタイトルの動画が投稿された。人気アニメ「名探偵コナン」の主人公・江戸川コナンの「声」と称して、アニメとは全く関係のない流行曲を歌わせた動画で、投稿者は「音声はAIで作成」としている。

                            コナン君に「#歌わせてみた」流行曲、実はAI偽音声…困惑する声優たち「対処しようがない」 (読売新聞オンライン) - Yahoo!ニュース
                          • 音楽ソース分離エンジンSpleeterを利用し、YouTubeの動画からボーカルの音声を取り除いたカラオケ音源を作成してくれるアプリ「Youka for Mac/Windows」がリリース。

                            音楽ソース分離エンジンSpleeterを利用し、YouTubeの動画からボーカルの音声を取り除いたカラオケを作成する「Youka for Mac/Windows」がリリースされています。詳細は以下から。 昨年、音楽ストリーミングサービスを提供しているフランスのDeezerが、機械学習を利用し複数のオーディオトラックからなる音楽を各トラックへ分離できる「Spleeter」というツールをオープンソースで公開し話題になりましたが、このSpleeterを利用し、YouTubeで公開されているPVやMVから音声のみのカラオケを作成できるツール「Youka」が新たに公開されています。 我々はSpleeterをリリースすることで、音楽情報検索(MIR)を研究するコミュニティが最先端のソース分離アルゴリズムの力をより活用できるようにします。SpleeterはTensorflowに基づいたPythonライブ

                              音楽ソース分離エンジンSpleeterを利用し、YouTubeの動画からボーカルの音声を取り除いたカラオケ音源を作成してくれるアプリ「Youka for Mac/Windows」がリリース。
                            • AIを使った音声圧縮で従来の圧縮を超えた圧縮率と圧縮速度を「Encodec」が実現

                              ガブリエル・シナエーブ氏らによるMeta AIの研究チームが、インターネットにおける音声の「圧縮」に対してAIを用いることで従来の圧縮よりもさらなる圧縮が可能である、という研究を発表しました。AIを用いた圧縮により、豊かなマルチメディア体験を楽しむことができると説明しています。 Using AI to compress audio files for quick and easy sharing https://ai.facebook.com/blog/ai-powered-audio-compression-technique/ 今日のインターネットにおいて「圧縮」はなくてはならない要素で、圧縮により、高品質な画像やストリーミングが可能になります。しかし、現状の圧縮技術には高速なインターネット接続と十分なストレージ容量が必要になり、高品質で中断のないインターネットは一部の人しか体験できま

                                AIを使った音声圧縮で従来の圧縮を超えた圧縮率と圧縮速度を「Encodec」が実現
                              • 「お風呂が沸きました」が音商標に登録 クラシック音楽を含む音声で初

                                「タララ~ラララ~ラララ~ラ~、タララ~ラララ~ラ~ラララララン♪ お風呂が沸きました」――日々の疲れを癒やすお風呂が沸いたことを知らせてくれるおなじみの“お湯はり完了メロディー”が、クラシック音楽を含む音声で初めて「音商標」に登録された。 おふろがわきました♪ メロディ ーに続いて「お風呂が沸きました」という人の声が入り全体で11秒 “あのメロディー”が聞けるのは、湯まわり設備メーカーのノーリツの給湯器のリモコン。1997年から搭載されており、2020年までの音声リモコンの累計販売台数は約1650万台で、(累計販売台数を設置された世帯数と仮定し)1世帯の平均人数2.39人(※)とすると日本の人口総数の約3人に1人の割合に相当(※厚生労働省の2019年国民生活基本調査より)する。 元々は目が不自由な方のお風呂沸かしの不便さを解消するために音で沸き上がりを知らせるアイデアを形にしたもので、聞

                                  「お風呂が沸きました」が音商標に登録 クラシック音楽を含む音声で初
                                • 貴方の歌声が“ボカロ音声”に。新機能「VOCALO CHANGER」が面白い【藤本健のDigital Audio Laboratory】

                                    貴方の歌声が“ボカロ音声”に。新機能「VOCALO CHANGER」が面白い【藤本健のDigital Audio Laboratory】
                                  • 9m先のスマートフォンを超音波で“攻撃” 人に聞かれずに音声入力も

                                    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ミシガン州立大学、中国科学院、ネブラスカ大学リンカーン校、セントルイス・ワシントン大学による米中の研究チームが開発した「SurfingAttack」は、机などの固体を介した超音波によって、離れた場所に置かれているスマートフォンなどへ音声入力する伝送法だ。 SurfingAttackは、音声コマンドを人には聞こえない周波数帯域に変調し、超音波トランスデューサー(圧電トランスデューサー)を用い、固体を介した振動で信号を送ることで、机の上に置いてあるスマートフォンなどに音声入力する。 人には聞き取れない周波数を用いるため、スマートフォンの近くにいる人に気が付かれず音声入力できる。そのため、持ち主

                                      9m先のスマートフォンを超音波で“攻撃” 人に聞かれずに音声入力も
                                    • 高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表

                                      スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台本を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台本の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月

                                        高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表
                                      • えっちな同人音声を、安易に自身の声で販売するべきではない - 健常者エミュレータ事例集Wiki

                                        健常者エミュレータ事例集Wiki 集合知を構築しよう トップページページ一覧メンバー掲示板編集 えっちな同人音声を、安易に自身の声で販売するべきではない 最終更新:ID:BwsFDR5ahQ 2023年01月26日(木) 15:56:18履歴 5W1H+Then状況説明 Who(誰が)私がWhen(いつ)社会人のときWhere(どこで)インターネット上でWhy(なぜ)友人に「お前の声で抜ける」と言われたからWhat(何を)えっちな同人音声の演技指導用に、自分自身の声で録音した音声ファイルをHow(どのように)大手ダウンロード販売サイトで、予定していたタイトルに「○○○○(自主規制)男子」を付与して販売したThen(どうなった)予想以上に多くの人から支持を集め、情緒がめちゃくちゃになった 前提条件 ・筆者、友人共に男性である。 ・筆者と友人はSNS上では比較的仲が良く、リプライのやりとりをす

                                          えっちな同人音声を、安易に自身の声で販売するべきではない - 健常者エミュレータ事例集Wiki
                                        • “メカ平野レミ” と平野レミが対面 ChatGPT搭載ロボ登場 本人そっくりのAI音声で会話

                                          森永乳業は9月20日、料理研究家の平野レミさんを模したロボット「AI平野レミロイド」を公開した。ChatGPTや本人の声を模したAI合成音声を活用しており、会話が可能。同日に発表したモッツァレラチーズの新製品のプロモーションに加え「コロナ禍や人手不足が問題になる中、試食会などの販促や営業・商談の場でロボットが活躍する可能性を見越し、プロトタイプとして開発した」(同社)という。 AI平野レミロイドは、平野レミさんの顔や体を再現した3Dデータを基に、熟練の造形師がシリコンなどを素材に製作したという。AI合成音声については、ユーザーが自分の声を合成音声化できるプラットフォーム「CoeFont」を活用し、平野さん本人の声を再現した。 同日に森永乳業の本社ビルで開催した発表会では、平野さん本人とAI平野レミロイドが対面。平野さんが「どうして(プロモーションに)平野レミを起用したんですか」と聞くと、A

                                            “メカ平野レミ” と平野レミが対面 ChatGPT搭載ロボ登場 本人そっくりのAI音声で会話
                                          • CV.日高のり子のASMR音声作品が発売して、まさかのトレンド入り…過去にも同サークルから有名声優の作品が発売されていた「このサークル何者」

                                            CANDY VOICE 「ねこぐらし。」 @CandyVoiceASMR ねこぐらし。第7弾 猫神様(CV. 日髙のり子)の超越耳かきボイスに包まれて、今宵はお眠りくださいませ。ここに唯一無二の癒しがあります。代表作は語らずとも。言わずと知れたおかたでございますね。(2回目のPRどうぞお許しください!) ▼作品販売ページ dlsite.com/home/dlaf/=/t/… #日高のりこ pic.twitter.com/XeOW8VuYg0 2020-07-27 00:38:42

                                              CV.日高のり子のASMR音声作品が発売して、まさかのトレンド入り…過去にも同サークルから有名声優の作品が発売されていた「このサークル何者」
                                            • 原子力規制委 更田委員長の「虚偽説明」明白に 事前会議の音声記録入手 資料を基に議論主導 | 毎日新聞

                                              原子力規制委員会が非公開の事前会議で、関西電力に求める火山灰対策の2案を1案に絞り込む方針を決めた問題で、更田(ふけた)豊志委員長が2案を比較する資料を基に議論する様子を収めた音声記録を入手した。更田氏はこれまでの記者会見で「資料を基に議論した事実はない」と繰り返し主張し、議事録の未作成は公文書管理法に抵触しないとの見解を示していたが、この説明が虚偽であることが明らかになった。 更田氏は3月10日の参院内閣委員会で 「(事前会議で)2案から1案を選ぶような意思決定はしていない」と答弁したが、音声記録では更田氏が議論を主導して1案を退けており、答弁とも大きく矛盾する。

                                                原子力規制委 更田委員長の「虚偽説明」明白に 事前会議の音声記録入手 資料を基に議論主導 | 毎日新聞
                                              • 面倒な文字起こし作業を一瞬で実行可能なLINE製AI音声認識アプリ「CLOVA Note」の使い方まとめ

                                                インタビューの記録や会議の議事録を作成する際は録音した音声を聞いて文字起こしする作業が必要ですが、自分の耳で聞いて一から文字起こしするのは非常に手間がかかる作業です。LINE株式会社が開発した音声認識アプリ「CLOVA Note」ならAIの力を利用して文字起こしが可能とのことなので、実際に使って文字起こしの手順や精度を確かめてみました。 CLOVA Note公式サイト https://clovanote.line.me/ CLOVA NoteにはiOS版・Android版・ブラウザ版が存在しており、利用の際にはLINEアカウントが必須です。今回はiOS版とブラウザ版を使ってみます。 ・目次 ◆1:iOS版CLOVA Noteのインストール&初期設定 ◆2:アプリ版CLOVA Noteの使い方 ◆3:ブラウザ版CLOVA Noteの使い方 ◆4:アプリ版CLOVA Noteとブラウザ版CLO

                                                  面倒な文字起こし作業を一瞬で実行可能なLINE製AI音声認識アプリ「CLOVA Note」の使い方まとめ
                                                • 同人音声作品の【スタジオバイノーラル収録】で、【複数声優同時収録】すると起きること

                                                  最近、同人音声作品の【スタジオバイノーラル収録】で、【複数声優同時収録】どうですか?的な依頼が来たり、流行ってたりするので、サークルさん側(依頼側)は知らないかもしれないけど、知ると「ひえぇ…」てなることをまとめます。身内に送る用まとめなので、全くわからない方は参考程度にどうぞ。違うな…と思う方はまとめページをご自分で作って公開してからURLをコメントにでも貼っておいて下さい。(参考URLとして記事に後で貼っておきます)

                                                    同人音声作品の【スタジオバイノーラル収録】で、【複数声優同時収録】すると起きること
                                                  • GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応

                                                      GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応
                                                    • サウナ市長の音声データ入手!パワハラ疑惑も噴出「黙れ」「顔出せ」と恫喝 | AERA dot. (アエラドット)

                                                      池田市議会百条委員会で証言する冨田市長(手前)(C)朝日新聞社 冨田市長の結婚式の写真 昨年10月、市長控室などに家庭用サウナ、エアロバイク、ベッドなどを持ち込んでいたことが発覚したことで「サウナ市長」とも呼ばれる、大阪府池田市の冨田裕樹市長。現在、池田市議会には調査特別委員会(以下百条委員会)が設置されており、「不適切な庁舎使用並びに公金等の私的流用に関すること」などに加えて、冨田市長の市職員らへの「パワハラ疑惑」についても調査項目に入っている。 【写真入手】結婚式でアメフトのユニフォームを着用した市長はこちら 本誌は、冨田氏が池田市の関係者に対して発した「恫喝」「叱責」とも疑われるパワハラ的な言動の録音データ(YouTubeの「AERA dot.編集部」にて公開中)を入手した。 「思い出すだけで震えます」 と語るのは、池田市の関係者Aさん。冨田市長とのやりとりについてそう証言した。 事

                                                        サウナ市長の音声データ入手!パワハラ疑惑も噴出「黙れ」「顔出せ」と恫喝 | AERA dot. (アエラドット)
                                                      • 今話題の音声SNS「Clubhouse」はどう盛り上がっているのかデータ分析してみた(鳥海不二夫) - エキスパート - Yahoo!ニュース

                                                        Clubhouse(クラブハウス)という音声SNSが突然日本で流行りだしました.Clubhouseの詳細はこの辺の記事をご覧ください. 流行りだしたんだからデータを分析したくなるのが,計算社会科学者のサガなわけですが,残念ながらClubhouseの内部データを直接取ることは当然できません.一部では「クラブハウスのAPIが公開されている」という噂もありましたが,違うClubhouseでした.割と一般的に使われる名称をSNSとかに使われるとこういう時になかなか困ります. というわけで,代替手段としてTwitter上に投稿されたイベントの告知データを取得して,そこからClubhouseの現状について分析してみたいと思います. イベント告知のURLはある程度決まっているため,当該URLが含まれるツイートを収集し,イベントページから情報を確認します. データは1月21日から1月25日まで収集しました

                                                          今話題の音声SNS「Clubhouse」はどう盛り上がっているのかデータ分析してみた(鳥海不二夫) - エキスパート - Yahoo!ニュース
                                                        • 商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に/イントネーションをリセットする機能や全テキストを繋げて書き出す機能も

                                                            商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に/イントネーションをリセットする機能や全テキストを繋げて書き出す機能も
                                                          • IIJmio、音声通話対応「eSIM」10月25日スタート

                                                              IIJmio、音声通話対応「eSIM」10月25日スタート
                                                            • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                                              無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                                                無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                                              • 日本では一ヶ月かかる論文を海外は7日で書き終える→まさかの”音声入力”がカギ

                                                                りっく @marudewakaran40 留学先のボスに『日本の研究者は国際会議の論文1本書くのに1ヶ月かけるって本当かい?ウチのスタッフは3日で書いて3日でリバイスして1日かけて最終確認&投稿する、7日のワークと決めている。報告書は鮮度が命だからね』と言われて、そんなことができるのかと思っていたら、(1/2) 2023-08-20 12:07:23 りっく @marudewakaran40 ある日ラボのスタッフがなにやらブツブツ言っていて『なにしてるのん?』と聞いたら『論文書いてる。打つの面倒だからディクテーション機能で書いてる。これが早いんだよ』と言っていて当時は目から鱗なのん。 最近の私は、口頭で書き殴ってGPTに文法ミス指摘させてるのん(2/2) 2023-08-20 12:10:53

                                                                  日本では一ヶ月かかる論文を海外は7日で書き終える→まさかの”音声入力”がカギ
                                                                • エロゲの音声って全部飛ばさずに聞いてる人っているんですか?

                                                                  Wi @Wi_ALPC 個人的にはエロゲー、特にノベルゲームの衰退を招いた大きな原因ってフルボイス化だと思ってます。自分の意思で読む時間をコントロールできるノベルゲームという表現手段と、受け手の時間を拘束するフルボイスというのは実は相性が悪いと思うんですよね。 2020-05-11 01:33:25 Wi @Wi_ALPC 当時のエロゲー業界に「可処分時間の取り合い」という概念があったかどうかは知りませんが、それをシナリオ量とボイスだけに頼っていたら、そりゃユーザーに飽きられても仕方ないなあ、と思えてくる。 2020-05-11 01:59:35 Wi @Wi_ALPC 「ンなこと言ったら映画だってTVアニメだって、ましてボイスドラマだって音声で受け手の時間を拘束してるだろ」となりますが、それらのメディアは普通受け手に飽きられない様に諸々の工夫が加えられてて、キャラクターの台詞を長々と読ま

                                                                    エロゲの音声って全部飛ばさずに聞いてる人っているんですか?
                                                                  • 歌手・大森靖子さんゲスト回の放送見送りについて【荻上チキのコメント音声あり】 | トピックス | TBSラジオ FM90.5 + AM954~何かが始まる音がする~

                                                                    TBSラジオ『荻上チキ・Session』(平日15時半~生放送)17:15~「Frontline Session」【大森靖子さんゲスト回の放送見送りについて】8/17(火)のFrontline Sessionは、歌手の大森靖子さんのインタビューを放送する予定でした。しかし

                                                                      歌手・大森靖子さんゲスト回の放送見送りについて【荻上チキのコメント音声あり】 | トピックス | TBSラジオ FM90.5 + AM954~何かが始まる音がする~
                                                                    • Shigeto Kawahara@Keio on Twitter: "オレゴン大学の出丸先生から連絡があり、ネット上に掲載された記事が音声学的な観点から明らかに間違っている議論に基づいていることから、連名で反論させて頂きます。当該記事はこちら: https://t.co/hJXLNQt84y 日本人がマスクを取らないのは日本語の音声学的特徴に起因するとしています。"

                                                                      • DeNA目線で見る 音声変換の最先端 - Qiita

                                                                        (2021年5月13日追記)七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。 私は今まで音声合成や距離学習の研究をしてきて、音声変換(voice conversion;VC)については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。 想定する読者は、音声変換に興味を持つ方、音声技術を生かして新たなエンタメ作りに挑戦したい方です。特に、 音声変換に関心がある学生がサクッと論文レベルで最先端の音声変換を把握できるようなお得な記事で 読者の「音声変換による新しいエンタメ作りに向けた研究開発の一歩」になる ように努めます。

                                                                          DeNA目線で見る 音声変換の最先端 - Qiita
                                                                        • 音声入力をテキスト化して即共有できるショートカットがヤバイ!【iOS13】

                                                                          以上です。 「え?何を説明されたの?」と思うかもしれません。 カンタンに説明するとこのようになります。 ①「ショートカットのアイコンをタップ」→②「音声入力を止める」→③共有が立ち上がる つまり、2タップで音声をテキストでLINEや色んなアプリでシェアできる状態になる訳ですよ! もちろんメモアプリに保存できますし、コピーして色んなアプリに貼ることもできます。 これまでも音声入力はできましたが、2タップでここまでできるアプリは無かったハズ! ショートカットの作り方 作り方はカンタンです。概要は以下の通りです。※中級者は概要だけ読めば意味が分かると思います。 ショートカットアプリで新規ショートカットを追加 「テキストを音声入力」を選択 次のアクションで「共有」を選択 まずiOSのショートカットアプリを立ち上げ「+」ボタンを押します。 そしてアクションを追加し、検索窓に「音声」と入力します。 そ

                                                                            音声入力をテキスト化して即共有できるショートカットがヤバイ!【iOS13】
                                                                          • 平井デジタル相会議、音声データをほぼ廃棄 デジタル庁の発足前:朝日新聞デジタル

                                                                            ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                                                              平井デジタル相会議、音声データをほぼ廃棄 デジタル庁の発足前:朝日新聞デジタル
                                                                            • 話題の音声SNS「クラブハウス(Clubhouse)」を使ってみた。高齢者専用Discord? - すまほん!!

                                                                              すまほん!! » iOS端末 » iPhoneアプリ » 話題の音声SNS「クラブハウス(Clubhouse)」を使ってみた。高齢者専用Discord? イーロンマスク降臨でアクセス殺到、日本人ユーザーも爆発的に増え、サーバーが不安定になることもしばしばある、話題の「招待制」音声SNS「クラブハウス( Clubhouse )」。 「自動車通勤文化のアメリカ」「セレブにiPhoneが受けているアメリカ」にフィットするよう作られている音声SNSサービスですが、意外と日本でも受けています。さて、どんなアプリなのか? 基本概念としては、好きな話題の「部屋」を立てて、そこに入ってきた人で通話を展開できます。これがめちゃくちゃいい。 部屋に入った人同士で通話ができる……まるでゲーマー向け通話アプリDiscordのようなサービス。電話を掛けると相手のスマホに割り込んで時間を専有しますが、クラブハウス・D

                                                                                話題の音声SNS「クラブハウス(Clubhouse)」を使ってみた。高齢者専用Discord? - すまほん!!
                                                                              • 安倍氏AI音声を突如公開→削除 「東大AI研」倫理上の問題は | 毎日新聞

                                                                                天国から皆様の素晴らしい活躍と我が国の発展を見られることを楽しみにしております――。銃撃事件で亡くなったはずの安倍晋三元首相が、そう語っているような音声が突如、インターネット上にアップされた。肉声をAI(人工知能)で再現したとするもので、公開は賛否両論が渦巻く国葬の2日前。制作したという「東京大学AI研究会」(東大AI研)と名乗る団体の実体ははっきりしない。誰が何のために。【金森崇之】 自民議員がシェアやツイート 9月25日、「AI安倍晋三元総理からのご挨拶」などと題した1~2分程度の音声数本が動画投稿サイト「ユーチューブ」に公開された。いずれも、生前の写真とともに安倍元首相が有権者や若者に向けて語りかける構成だ。投稿者とする東大AI研は特設サイトで、安倍元首相の声を「優しくも、力強さを秘めた」と評し、AI技術で「よみがえらせた」と記した。 「東京大学人工知能研究会が総力を挙げて私の声を再

                                                                                  安倍氏AI音声を突如公開→削除 「東大AI研」倫理上の問題は | 毎日新聞
                                                                                • 次世代Bluetooth音声“LE Audio”は、ワイヤレスイヤフォンのなにを変えるか?【本田雅一のAVTrends】

                                                                                    次世代Bluetooth音声“LE Audio”は、ワイヤレスイヤフォンのなにを変えるか?【本田雅一のAVTrends】