[8ページ] voiceの人気記事 538件 - はてなブックマーク

281 - 320 件 / 538件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

voiceの検索結果281 - 320 件 / 538件

オノマトペ（擬音語）から環境音を合成するニューラルネットワーク（Onoma-to-Wave）をPyTorchで実装した - 備忘録
- 38 users
- tam5917.hatenablog.com
- テクノロジー
- 2022/07/01
はじめに事前準備ソースコード実装の概要と動かし方補助的に作成したモジュールの概要おまけ：訓練済みモデルのリリース環境音合成実験音響イベントによる条件付けなし音響イベントによる条件付けあり実装の舞台裏とかTIPS おわりに参考文献はじめに下記の雑誌論文が最近出版された。 Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori and Yoichi Yamashita, "Onoma-to-wave: Environmental Sound Synthesis from Onomatopoeic Words", APSIPA Transactions on Signal and Information Processing: Vol. 11: No.
人気ゲームスタジオ、ある声優により「スタジオに声をAI利用される」との懸念を示され波紋を広げる。スタジオは断固否定しつつも契約書を改訂 - AUTOMATON
- 37 users
- automaton-media.com
- テクノロジー
- 2023/08/19
声優のHenry Schrader氏が現地時間8月17日におこなった投稿が波紋を広げている。同氏はHi-Rez Studiosが声優と交わす契約書において、「収録された音声をAIによる合成・複製に使用される」ことに同意させられる懸念があると主張。これが大きな注目を集めることとなり、スタジオ側はそうした懸念はないと反論しつつも、契約書面から懸念の寄せられた条項を削除する対応がとられることとなった。 Hi-Rez Studiosはアメリカ・アトランタに拠点をおくデベロッパー。基本プレイ無料の人気MOBA『SMITE』やヒーローシューター『Paladins』など、スタジオが設立された2005年以来長きにわたってゲーム開発に携わってきた。『SMITE』事態の発端となったのは、Henry Schrader氏がX（旧Twitter）上でおこなったポストだ。投稿された内容は同氏の知人の声優からの証言
- AI
- 音声
- ゲーム
- 仕事
オンライン会議でマイク・イヤホンの音質が悪い！気付いていない人も多いトラブルの原因と対策【高橋忍のにゃんともWindows】
- 37 users
- forest.watch.impress.co.jp
- テクノロジー
- 2020/07/31
- PC
- tips
- トラブル
- trouble
- あとで読む
- ガジェット
無料で商用可のAI音声読み上げツール「VOICEVOX」のソング機能が大幅強化／矩形選択・コピー＆ペーストなどが可能に。ハミング対応キャラクターも大量追加
- 37 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/03/27
- 人工知能
- あとで読む
- techfeed
- AI
- Software
litagin/moe-speech · Datasets at Hugging Face
- 37 users
- huggingface.co
- テクノロジー
- 2024/01/24
Not-For-All-Audiences This repository has been marked as containing sensitive content and may contain potentially harmful and sensitive information. View content
私の音声入力と格闘した16年の歴史を語る - 勝間和代が徹底的にマニアックな話をアップするブログ
- 37 users
- katsumakazuyo.hatenablog.com
- 学び
- 2021/09/16
最近やっとフットスイッチで、Androidの音声入力ができるようになって落ち着きました、そしていつから音声入力を始めたんだろうと思って調べていたところ、2005年からでした。メールを検索してみたところ、まずは2005年の8月にViaVoiceというソフトウェアを買っています。当時の音声入力は本当に認識性能が悪くて明らかに手で打った方が早かったのですが、それでも毎日色々レポートを書く仕事をしていましたのでわらにもすがる思いで音声入力ソフトを試していました。そして、2008年ぐらいから、ドラゴンスピーチやAmiVoiceという少しましなソフトウェアが出始めて、何をしていたかというと、せっせと私の発音の癖を覚えさせてちょっとでも単語認識が違うものについてはもう一度教育をするといったようなわりと地味なことをしていました。ところがそんなこんなをしてるうちにスマホの音声入力が出回り始めて、20
- 文章
- IT
- あとで読む
- japanese
- 歴史
「Googleドキュメント」の音声入力機能がアップデート--使い方を解説
- 37 users
- japan.cnet.com
- テクノロジー
- 2023/01/17
声は強力なツールだ。Googleの音声入力機能は、声による文字入力を支援するだけでなく、プレゼンにも活用できる。 Googleの音声入力機能を使えば、自分の声を使って、頭の中の考えを素早く簡単にデジタル化できる。 Googleは米国時間1月9日、音声入力でより正確かつ安定した文字起こしを実現するアップデートを段階的にリリースすると発表した。主な変更点は次のとおりだ。音声を文字起こしする際の変換ミスを削減文字起こしの漏れを最小化対象が大半の主要ブラウザーに拡大「Googleスライド」のキャプションに句読点を自動挿入強化された音声入力機能を実際に使えようになるのは大半のユーザーの場合、2月9日以降だ。その間に、Googleの音声入力機能を使って「Googleドキュメント」で入力・編集をしたり、Googleスライドのスピーカーノートに音声でテキストを入力したりする方法を紹介しよう。
- google
- あとで読む
アフレコってスタジオで優雅に録音するイメージ→令和の宅録声優さんの収録シーンがこちらです「努力がすごすぎる」
- 36 users
- togetter.com
- 暮らし
- 2022/11/03
梓来有未【声優】YouTube(Vtuber)自力運営中 @mamehina_0626 例の簡易防音の外と中、音比べてみたかった！ youtube.com/shorts/U9aK4_Q… いや普通に普段の生配信の音とそれ以外の動画の音を比較してもらった方がより確実なのでは…？などとさっき投稿したあとに気づきましたあれはおはよう動画だ、おはよー_(:3」z)_ 2022-11-02 08:51:54 リンク YouTube 例の簡易防音の外と中、音比べてみたかった！普段の生配信と歌ってみたや台詞系の動画聴き比べてもらった方が確実なのでは…？などと今気づいたけど気にしない！まったく参考にならないかもしれない、とりいそぎの簡易防音ブラックボックスくん(手作り)の中と外の音比較です！台本はタブレットにデータ入れて中に立てかけて手動、録音は一旦そとに出て手動でポチポチしてます。アナ...
- togetter
- 声優
- 社会学
- YouTube
リアルタイムでボイチェンできる「CoeFont Voice Changer」
- 35 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/08/04
- あとで読む
ゲーム実況・Vtuber・YouTuber・リモート会議など配信で最も気になる音関係を一段階上のレベルへコンパクト＆1台でカバーできる「Live Streamer NEXUS(AX310)」レビュー
- 35 users
- gigazine.net
- エンタメ
- 2021/07/22
ゲーム配信や映像配信をYouTubeなどで行うにあたって、配信者(ストリーマー)が気をつけなければいけない点の1つが「配信用機材」。本当に最低限の「プレイ中のゲーム画面をそのまま配信する」の先をやるためには、配信を助けてくれるストリームデッキのような機器やミックスアンプ、オーディオインターフェイスがあった方が便利。 AVerMediaの「Live Streamer NEXUS(AX310)」は、まさにこの「ストリームデッキ」「アンプ」「オーディオインターフェイス」の3つの機器の機能を1台でカバーしてくれる存在だということなので、実際に触ってみることにしました。なお、配信機材の名前も、機材を操作するためのソフトウェアも「NEXUS」という名称なので、記事中では機材を「AX310」、ソフトウェアを「NEXUS」と表記しています。 Live Streamer NEXUS（AX310） | 比較す
漫☆画太郎プロデュース、杉田智和や竹達彩奈が声入れた「TERRACE HORSE」公開（コメントあり）
- 34 users
- natalie.mu
- アニメとゲーム
- 2019/10/07
これはJRA（日本中央競馬会）が、秋競馬の開幕に合わせて展開したもの。特設サイトでは「TERRACE HORSE THE COMIC」と題し、1つ屋根の下で男女6人が共同生活を送る様子を切り取ったリアリティショー「テラスハウス」をモチーフにしたボイス付きマンガ全5話が公開されている。キャストは菊花翔役の杉田智和、都秋華役の竹達彩奈、JC役の中村悠一、エリーザ・ベス役の悠木碧、真入千六役の諏訪部順一、樹部名あいる役の田村ゆかり、ババァ役ほかの木村昴。読者は最初に男女2人のキャラクターからどちらかを選択し、ストーリーを読むことが可能。ときおり出題される選択肢の回答に応じて、各話の展開や結末が大きく変わる。なお特設サイトでは漫☆画太郎がプロデュースした声優陣の似顔絵も掲載。また声優陣のサイン入り台本が当たるキャンペーンや、恋愛競馬診断「LOVE STAKES」も展開されている。さらに11月10
ディープラーニングで誰でも簡単に「結月ゆかり」の声になれる音声変換技術が開発される
- 34 users
- gigazine.net
- テクノロジー
- 2020/12/28
AH-Softwareの読み上げ用音声合成ソフトのVOICEROIDは、自分で好きな言葉をソフトウェアに読み上げさせることができるため、動画のナレーションやロボットの発話によく使われています。しかし、VOICEROIDの設定はやや面倒で時間がかかるもの。そこで、マイクで録音した音声をVOICEROIDの「結月ゆかり」さんの声に誰でも簡単に変換できるボイスチェンジ技術を、Dwango Media Villageのエンジニアであるヒホさんがニコニコ動画で発表しました。ディープラーニングの力で誰でもゆかりさんの声になれる声変換技術を作ってみた - ニコニコ動画今回ヒホさんが開発したのは、高品質に誰の声でもゆかりさんの声に変換できるという技術です。ムービー中では、実際にヒホさんの声をゆかりさんの声に変換したものを聞くことができます。「声を変換する」ということは、入力された音声データを別の音
- GIGAZINE
- あとで読む
GitHub - Plachtaa/VALL-E-X: An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io
- 34 users
- github.com/Plachtaa
- テクノロジー
- 2023/08/27
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- TTS
- github
- microsoft
- deeplearning
- あとで読む
- 言語
「よ”ろ”し”く”ぅ”」　絶叫するAI「松嘩りすく」　きれいな叫び声を合成する技術
- 34 users
- www.itmedia.co.jp
- テクノロジー
- 2023/01/30
ここ数カ月、画像生成AIが広く注目を集めている。自動で欲しい写真素材やイラストを合成できる上、上手に扱えば、工夫次第でクオリティーを上げることもでき、やりこみ要素もあって触るだけでも楽しい。 AIにもさまざまあるが、本連載では面白いAI、癖のあるAIを紹介する。ぜひとも使ってAIが得意なことや、その裏に見える将来の可能性、人間にも負けないちょっとした恐ろしさなどを、感じとってほしい。「絶叫」を高品質に再現できる時代に音声合成ソフトというと、アニメキャラクターやアナウンサーのような声で文章を読み上げるものを想像するかもしれない。そんななかで特に異彩を放っているのが「COEIROINK」という無料のAI音声合成ソフトで使えるキャラクター「松嘩（まつか）りすく」だ。この音源は、入力された文章を“絶叫”できる。 COEIROINKはAIを活用して、入力された文章の読み上げ音声を出力する無料ソフ
- AI
- 音声
- あとで読む
- 未分類
- 文章
- technology
ズートピアのニックのこのセリフで救われる命があると思う→救われた命が集まる「肌荒れめっちゃ治った」「息を吹き返す」
- 33 users
- togetter.com
- エンタメ
- 2023/12/13
夜道 @warp_days ズートピアのニック（森川智之）のセリフ「しょうがないな　わかったよ　よしよし　あ〜もう本当にがんばるんだから　さあほら息を吸って」で救われる命があると思う 2023-12-11 18:22:12 リンクディズニーズートピア｜映画／ブルーレイ・DVD・デジタル配信｜ディズニー公式『ズートピア』の作品サイト。ブルーレイ・DVD・MovieNEX・デジタル配信最新情報のほか新作ディズニー映画、海外ドラマ、デジタル配信など、豊富な作品ラインナップをお届けします。ディズニー公式 Disney.jp 8 users 32
- Togetter
- 映画
- 心理
- 声優
- anime
- movie
- アニメ
- あとで読む
無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと
- 33 users
- www.itmedia.co.jp
- テクノロジー
- 2022/08/02
無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと：PCでもスマホでも使える！（1/2 ページ）会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。 β版として無料提供　アプリでもファイルのアップロードでも利用可能 CLOVA Noteは、LINEがこの5月からβ版として無料で提供
GitHub - fonoster/fonoster: 🚀 The open-source alternative to Twilio.
- 33 users
- github.com/fonoster
- テクノロジー
- 2020/10/15
Fonoster Inc is researching an innovative Programmable Telecommunications Stack that will allow businesses to connect telephony services with the Internet entirely through a cloud-based utility. Attention ⚠️: Exploring Fonoster: We encourage new users to initially explore Fonoster's features through our SaaS (Software as a Service) option. This platform is free to start and offers a comprehensive
- oss
- Twilio
- voice
- github
- cloud
岡本信彦が新事務所立ち上げ　鬼頭明里、ファイルーズあいら34名、プロ・フィットから移籍へ
- 33 users
- www.oricon.co.jp
- アニメとゲーム
- 2021/12/15
声優事務所のプロ・フィットがプロダクション業務を来年3月末で閉鎖することにともなう、声優の移籍先が15日、発表された。岡本信彦とプロ・フィットの現場マネージャーが新プロダクション「ラクーンドッグ」を立ち上げ、鬼頭明里、ファイルーズあいなど34名が同事務所に移籍することが決定した。来年4月1日付での所属となる。プロ・フィットは「2021年11月4日に『ご報告』させて頂きました『プロダクション業務閉鎖』に伴い、所属声優の『岡本信彦』が作るプロダクションと、プロ・フィットの現場マネージャー達が作るプロダクションが、当初予定しておりました業務提携の枠を超えて『一つの会社』としてまとまり、新プロダクション『ラクーンドッグ』として活動していくことが決まりました」と報告。『ラクーンドッグ』への移籍が発表された声優は以下の通り。岡本信彦、増岡太郎、高橋伸也、相馬康一、杉崎亮、峰健一、小林康介、堀江瞬
- 声優
- あとで読む
“コピーロボット”の働きが声優の収益に　AIシンガー業界に到来したサブスクビジネスの可能性
- 32 users
- www.itmedia.co.jp
- テクノロジー
- 2022/08/29
藤子・F・不二雄さんの漫画「パーマン」に「コピーロボット」というアイテムがあったのを覚えているだろうか。鼻のボタンを押すと、自分そっくりの姿に変化して、自分の身代わりになってくれる人形だ。あのアイテムに近いようなことが歌声合成業界では可能になっている。自分の歌い方をそっくりに再現して人間のように歌う“AIシンガー”がかなり普及してきているのだ。最近では、バーチャルYouTuberの「花譜」さんが「CeVIO AI」というブランドのAIシンガーになり、ヒット曲もたくさんリリースされている。8月8日にはVTuberのキズナアイさんの歌声を再現したAI「#kzn」が先行販売された。そして、CeVIO AIの音声合成エンジンを開発しているテクノスピーチが、9月1日に新たな試みを始める。AIシンガーのサブスクリプションサービス提供だ。今回は同社の大浦圭一郎代表とエンタメ事業部の塚田恵佑さん、
- business
- あとで読む
フォークリフト自動化のニュースに気を取られてアナウンサーが既に自動化されてることにみんな気づかない
- 32 users
- togetter.com
- エンタメ
- 2023/08/29
NHKニュース @nhk_news NHKニュースの公式アカウントです。最新のニュースを24時間休みなくお届けします。 nhk.jp/rules をご確認、ご了承ください。問い合わせは nhk.or.jp/css/ nhk.jp/news
- Togetter
- nhk
- TV
- 企業
- これはすごい
- web
ゲームの「主人公の声」を「自分の声」にしたらどうなる？　米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】
- 32 users
- levtech.jp
- テクノロジー
- 2021/12/13
TOPコラム海外最新IT事情ゲームの「主人公の声」を「自分の声」にしたらどうなる？　米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】ゲームの「主人公の声」を「自分の声」にしたらどうなる？　米研究チームは声の類似性がユーザーに与える影響を実験【研究紹介】 2021年12月13日米パデュー大学と米ミシガン州立大学の研究チームが発表した論文「The Effects of a Self-Similar Avatar Voice in Educational Games」は、ゲームにおいて、自身の声と自身が動きを操作するアバターの声の類似性がユーザーにどのような影響を与えるかを検証した研究だ。アバターの声は、バーチャルYouTuberやソーシャルVRのようなリアルタイムに自分の声が反映されるコンテンツではなく、予め決められたセリフをゲーム上のアバターが発するものを想定している。
- コメ
- VR
- game
- 論文
- 学習
無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた
- 32 users
- gigazine.net
- テクノロジー
- 2021/08/02
「誰でも100種類の声に変換できるAIボイスチェンジャー」や「ディープラーニングで誰でも簡単に結月ゆかりの声になれる技術」を開発したDwango Media Villageのエンジニアであるヒホさんが、入力した文章から自動で読み上げ音声を合成してくれるオープンソースのソフト「VOICEVOX」を公開したので、実際に使ってみました。 VOICEVOX https://voicevox.hiroshiba.jp/ ???????????????????????????????????????????????????????????????? 無料で使える中品質なテキスト音声合成ソフトウェア、#VOICEVOX をリリースしました ???????????????????????????????????????????????????????????????? ぜひダウンロードして遊んでみてくださ
- voice
- tool
- あとで読む
- *tips
- tech
【山田祥平のRe:config.sys】 AIがもたらす同時通訳の新しい当たり前
- 32 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/11/11
- AI
- あとで読む
Twitterも真似するClubhouse、新ラウンドで資金調達　クリエイター支援へ
- 32 users
- www.itmedia.co.jp
- テクノロジー
- 2021/01/25
米音声チャットプラットフォームのClubhouseは1月24日（現地時間）、米VC大手Andreessen Horowitz主導のシリーズBラウンドの資金調達を行うと発表した。調達総額は公表されていない。 Clubhouseは2020年創業でサンフランシスコに拠点を置く米Alpha Explorationが同年3月に立ち上げたソーシャルサービス。プラットフォーム上に好きなテーマで自分のチャットルームを開設し、世界中の人々と会話できるというコンセプトだ。音声版Twitterとも呼ばれる。まだ招待制でiPhoneアプリしかないが、200万人以上が訪れたという。ユーザーは好きなチャットルームに自由に出入りし、会話に参加できる（だまって聞くだけも可）。ライブコンサートを開いたり、民主主義について討論したり、語学教室を開いたり、同じ病気の子を持つ親が話し合ったり、様々なテーマの部屋が開設されている
- service
- app
- communication
- ios
- テスト
- あとで読む
- アプリ
「15年間、毎日ブログを書きつづけた」声優・茅原実里が振り返る自身の経歴と“夢”（新R25） - Yahoo!ニュース
- 32 users
- headlines.yahoo.co.jp
- アニメとゲーム
- 2019/07/08
2004年、アニメ『天上天下』の棗亜夜役で声優デビュー。2006年にはアニメ『涼宮ハルヒの憂鬱』の長門有希役で広く知られるようになり、歌手としても武道館ライブを成功させるなど、精力的に活動を続け、今年デビュー15周年を迎える茅原実里さん。しかし、茅原さんがもともと抱いていた夢は、「声優」ではなく「歌手」だったんです。彼女はどのような経歴をたどってきたのか。茅原さんのデビューから今に至るまでの15年間の軌跡を、ご本人と一緒に振り返りました。〈聞き手＝いしかわゆき〉
- 声優
- 茅原実里
- あとで読む
- Interview
- インタビュー
- 人
- 言葉
- media
- アニメ
多くの声優は「仕事のギャラ」も知らされていない!? 榎本温子がエンタメ業界弁護士に聞く「声優業界の法律問題」｜FINDERS
- 31 users
- finders.me
- アニメとゲーム
- 2023/10/20
CAREER | 2023/10/20 多くの声優は「仕事のギャラ」も知らされていない!? 榎本温子がエンタメ業界弁護士に聞く「声優業界の法律問題」近年、声優業界の労働環境についてのニュースが度々、世間を賑わせる。FINDERSでは現役の声優/ナレーターである榎本温子... 近年、声優業界の労働環境についてのニュースが度々、世間を賑わせる。FINDERSでは現役の声優/ナレーターである榎本温子さんと共に過去2回に渡り問題の根源を探った。対話を重ねていく中で「声優業界、そしてアニメの制作現場で慣例的に行われてることが果たして正常なのか？法律的な問題はないのか？」という疑問が噴出した。そこで今回は元ゲーム開発プロデューサーという異色な経歴を持つ弁護士、貞永憲佑さんと対談を行うことで法務面から声優業界の問題点を紐解く。文・構成・聞き手：ひでたかくん／神保勇揮（FINDERS編集部）　写真
- law
- あとで読む
- 法律
- work
- 声優
- アニメ
AI歌声合成を実現するCeVIO AIが年内発売。IA、ONEに加え、結月ゆかり、flowerなどもCeVIO AIに対応｜DTMステーション
- 31 users
- www.dtmstation.com
- テクノロジー
- 2020/07/22
AI歌声合成の世界が、一気に活気づいてきています。今年2月にNEUTRINOがフリーウェアとしてリリースされ、AIきりたんが話題になり、現在その第2弾となる東北イタコのクラウドファンディングが実施中なのは先日も記事にしたとおりです。さらに6月26日にはAI歌声合成と従来の歌声合成のハイブリッドというSynthesizer Vが発表され、7月30日に発売が開始されます。そこに来て、CeVIOの新ラインナップであるCeVIO AIが登場し、年内に発売されることが本日発表されました。CeVIO AIでの歌声合成は、従来の歌声合成とは一線を画すもので、AI技術を利用することでまさに人間が歌っているかのようなリアルな歌い方を実現するもの。そしてそのCeVIO AIで利用可能なソングボイス（歌わせるためのデータベースライブラリ）・トークボイス（しゃべらせるためのデータベースライブラリ）として、これま
「新しいBing×音声認識」で感じた“検索新時代”　スマートスピーカーはもう古い
- 31 users
- www.itmedia.co.jp
- テクノロジー
- 2023/03/24
2月8日、Microsoftのブラウザ「Edge」にAIを搭載した「新しいBing」が搭載されたことで、ブラウザをEgdeに乗り換える人もそこそこあったのではないだろうか。筆者もAI搭載のBingを使ってみたい一心で、ChromeからEdgeに乗り換えてみたところだ。筆者は2015年に執筆環境をMacへ移行したので、Edgeはほとんど使ったことがない。MacOSに初めてEdgeをインストールしてみたのだが、Chromiumベースというだけあって、Chromeから設定を移行すると、拡張機能のほとんどがそのまま利用できた。乗り換えは比較的スムーズである。ブラウザの世界シェアは、2022年の調査ではChromeが64.95％でぶっちぎりのトップ、継いでSafariの19.01％、3位がEdgeの3.99％、4位がFirefoxの3.26％となっている。EdgeがデフォルトのWindowsユー
- AI
- あとで読む
Google Cloud Speech-to-Text APIをいろいろ調査してみる - OPTiM TECH BLOG
- 31 users
- tech-blog.optim.co.jp
- テクノロジー
- 2020/02/21
こんにちは、2020年新卒入社予定の山口です！修論と引越し準備とアルバイトで慌ただしい日々を過ごしています。今日は業務で触った、Google製API Google Cloud Speech-to-Text API について皆さんと共有できればと思います。 Google Cloud Speech-to-Text API とは APIを導入していく GCP側 PC側実際に試してみる認識モデルを変更してみるマルチチャンネルで試してみるファイル形式・サンプリング周波数を比較してみるナレーション音声（「本日は〜」の音声です。）走れメロス＿朗読おわりに Google Cloud Speech-to-Text API とは Google Cloud Speech-to-Text API は名前の通り、音声データから文字起こしをするAPIです。この音声データは私たちが日頃聞いているような音声
- google
- python
- プログラミング
- HotEntry
- API
高橋李依版アイドル、おもしろいよね
- 31 users
- anond.hatelabo.jp
- エンタメ
- 2024/02/04
https://www.youtube.com/watch?v=FEktA0Nmnjs ↑これね YOASOBI（Ayase）の作曲術と推しの子AyaseYOASOBIは必ず原作小説から歌を作成します。(普通に誤記です）今回も漫画「推しの子」を直接参照しているわけではなく、スピンオフ小説の45510（原作者赤坂アカ書下ろし作品）から書き起こされています。この45510が曲者で、推しの子第1巻/アニメ第1話の主役級の星野アイについて作中の第三者が語っている作品です。（アイの所属するユニットB小町のメンバーの1人であることは想像できるが、具体的な名言はされていない）アイドルの歌詞は何も知らないとアイを素直に描いた歌のように思えますが、実際にはメタ的な視点から描かれてます。それも前半だけの話で、ある部分からはアイ本人の視点が入り込んでいる、ともされています。この作品におけるアイは信頼
- 増田
- 表現
- あとで読む
- review
- 声優
- anime
- これはすごい
- 音楽
- music
ファイルーズあいさん、最終話アフレコ直後に浪川大輔さんから花束を渡され号泣した写真を投稿。「徐倫とアナスイ過ぎて尊い」の声
- 30 users
- togetter.com
- アニメとゲーム
- 2022/12/01
ファイルーズあい｜Fairouz Ai @fairouzzzzzz ラクーンドッグ所属の声優🦄 鼠とハロウィンが好き。ステッカー作るのも好き。ファンアートはぜひ『 #ファイルーズ展』で❤️‍🔥❤️‍🔥❤️‍🔥 (Instagram) instagram.com/p/CeOge2SFGz8/… https://t.co/QJTL0T0ZR3 ファイルーズあい｜Fairouz Ai @fairouzzzzzz ジョジョのオーディションを受けた日に泣きながら書いた日記。緊張しすぎて実力を出しきれなかったから悔しくて悲しくて涙でぐちゃぐちゃに滲んでるし、感情のままに書いてるから漢字もすっごい間違ってる…（笑）この悔しさをバネに強くなれてよかった！！ pic.twitter.com/CVeFEeciRI 2022-11-30 19:20:59
Shinnosuke Takamichi (高道慎之介) - jvs_corpus
- 30 users
- sites.google.com
- エンタメ
- 2019/08/17
This corpus consists of Japanese text (transcripts) and multi-speaker voice data. The specification is as follows. 100 professional speakers Each speaker utters: "parallel100" ... 100 reading-style utterances that are common among speakers "nonpara30" ... 30 reading-style utterances that are completely different among speakers "whisper10" ... 10 whispered utterances "falsetto10" ... 10 falsetto ut
- language
- 日本語
- 言語
- research
- データ
- dataset
- 研究
無料で音声をテキストに書き起こしてWebページへ入力できる拡張機能「Voice In」／「Gmail」や「Google ドキュメント」へのテキスト入力を音声で【レビュー】
- 30 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/04/14
- chrome
- あとで読む
- 無料
- google
- web
【レビュー】 Windows 10はBluetoothの高音質通話「HD Voice」に対応したのか? ～バッファロー製ヘッドセットで実証テスト
- 30 users
- pc.watch.impress.co.jp
- テクノロジー
- 2019/10/09
- bluetooth
- オーディオ
- windows
- PC
- あとで読む
- hfp
音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト
- 30 users
- xtech.nikkei.com
- 学び
- 2022/09/28
会議録を作る際、録音を繰り返し聞いて文字起こしするのは大変だ。最近は音声認識の技術が急速に進化し、無料でテキスト化できるアプリもある。使わないのは損だ。「LINE CLOVA Note」は認識精度が高く、複数の話者を区別できるので実用性が高い（図1）。利用にはLINEアカウントが必要（図2、図3）。スマホアプリ版はその場で録音するか、音声ファイルをアップロードして使える（図4）。録音する場合でも即座にテキスト化されるわけではなく、録音終了後に文字認識が始まる。パソコンではウェブサービス版を利用できる（図5）。よく使う単語を登録しておくと、認識精度がより高まる（図6）。
- Software
- あとで読む
Microsoft hologram speaking Japanese
- 29 users
- www.youtube.com
- テクノロジー
- 2019/07/18
Microsoft is using its Mixed Reality studios and neural TTS engines to create a hologram of a person speaking in another language. The voice will sound just like the original person, but with a different language.
- HoloLens
- translation
- microsoft
- voice
- 翻訳
- 人工知能
- ar
音声を文字起こししてくれる「Amazon Transcribe」、言語の種類を自動識別する新機能。人間によるタグ付けが不要に
- 29 users
- www.publickey1.jp
- テクノロジー
- 2020/09/18
音声を文字起こししてくれる「Amazon Transcribe」、言語の種類を自動識別する新機能。人間によるタグ付けが不要に Amazon Web Services（AWS）が提供する「Amazon Transcribe」は、音声をテキストに変換する、いわゆる文字起こしを機械が行ってくれるサービスです。例えば、ボイスメールをテキストに変換して送信するサービスの構築や、電話での問い合わせなどを受け付けるコールセンターなどで顧客とのやり取りの記録をテキストで残すサービスの開発などに役立ちます。 AWSはこのAmazon Transcribeに、話されている言語が英語なのか日本語なのか中国語なのか、などの言語の種類を自動的に識別する機能を追加したと発表しました。 New #AWSLaunches! New AWS Solutions Consulting Offer - Confluence
- 機械学習
- あとで読む
- AWS
- amazon
- docker
- 言語
- サービス
Voidol
- 29 users
- crimsontech.jp
- テクノロジー
- 2019/06/10
リアルタイムで特定のキャラクターの声へ変換 V-Tuberの配信やゲーム実況などで活躍します販売終了につき、2024年3月より無償配布開始いたしました！無償配布版は以下のページからダウンロードいただけます。無償配布版ダウンロードページ ※こちらの製品のサポートに関しましては年内で終了いたします。 ※ご購入いただいたボイスモデルはVoidol2・Voidol3で引き続きご利用いただけます。 ★★★世界発信コンペティション2020 製品・技術部門大賞受賞★★★ ★★★TBS系列「審査員長・松本人志」近未来テクノロジーコンテストまつもトロフィー受賞★★★ この製品は（公財）東京都中小企業振興公社中小企業ニューマーケット開拓支援事業の支援対象製品です。 ※但し、公社は製品の効能効果を保証するものではありません「Voidol - Powered by リアチェンvoice -」ナレー
- sound
- app
- windows
- free
- ai
- mac
「文字を打つのが面倒」進化するLINEの新常識　ミュート・スクショ・文字認識…若者が使う便利機能を紹介｜FNNプライムオンライン
- 28 users
- www.fnn.jp
- テクノロジー
- 2022/08/30
寝ている相手を起こさないように…搭載されたばかりの新機能 2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。夜遅くにLINEを送ると「相手を起こしてしまうのでは？」と気を使ってしまうが、そんな時、この機能がとっても便利！この記事の画像（25枚）使い方は、LINEの右上にある設定アイコンをタップして「LINE Labs」を選択。その中にある、「ミュートメッセージ」の設定をONにすれば、準備OK。後は送信ボタンを長押しして、ミュートメッセージを選んで送れば、相手の通知音は鳴らさずに、メッセージを送ることができる。若者世代のLINEの使い方は、今もっと進化している！そこで「LINEの便利機能と新常識」をココ調する！「トークスクショ」「文字認識」あなたは使っている？LINEの便利機能街で、よく使うLINEの機能を聞いてみると… 街頭インタビュー
- LINE
- あとで読む
18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史
- 28 users
- gigazine.net
- 学び
- 2024/06/06
近年では、AI技術や合成音声技術の進歩に伴って、まるで人間の声のような音声シミュレーションは目覚ましい発展を遂げています。しかし、18世紀のヨーロッパでも、人間の声をシミュレートするような技術や機械が数多く開発されていました。 “You Are My Friend”: Early Androids and Artificial Speech — The Public Domain Review https://publicdomainreview.org/essay/early-androids-and-artificial-speech/ 最初の「人間の機能を模した」アンドロイドが誕生したのは、1738年2月のこと。エンジニアのジャック・ヴォーカンソンがアントワーヌ・コワズヴォーの「フルートを演奏する羊飼い」をモデルに製作し、パリのサンジェルマン見本市で展示されたアンドロイドは、これまで
- 技術
- 歴史
- あとで読む
- technology
- history
- science