チキン@ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中(2024年の5月ごろ出版かな?) webwhiter-skill.com/job/
We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w
声優のHenry Schrader氏が現地時間8月17日におこなった投稿が波紋を広げている。同氏はHi-Rez Studiosが声優と交わす契約書において、「収録された音声をAIによる合成・複製に使用される」ことに同意させられる懸念があると主張。これが大きな注目を集めることとなり、スタジオ側はそうした懸念はないと反論しつつも、契約書面から懸念の寄せられた条項を削除する対応がとられることとなった。 Hi-Rez Studiosはアメリカ・アトランタに拠点をおくデベロッパー。基本プレイ無料の人気MOBA『SMITE』やヒーローシューター『Paladins』など、スタジオが設立された2005年以来長きにわたってゲーム開発に携わってきた。 『SMITE』 事態の発端となったのは、Henry Schrader氏がX(旧Twitter)上でおこなったポストだ。投稿された内容は同氏の知人の声優からの証言
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国の浙江大学と米State University of New York at Buffaloによる研究チームが開発した「Wavesdropper: Through-wall Word Detection of Human Speech via Commercial mmWave Devices」は、ミリ波(mmWave)を用い、防音環境で守られている部屋内を外部から盗聴するシステムだ。被害者が発話した際の喉元付近の皮膚振動をミリ波で捉え、音声(単語)を復元する。 壁に防音材を配置すれば、音波の伝搬を利用した攻撃などからは守れるが、音源(例えば、人間の話者)からの直接漏えいを保証すること
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米コロンビア大学の研究チームが発表した「Real-Time Neural Voice Camouflage」は、不正なマイクが取得したユーザーの会話の言葉を正しく聞き取れないようにする攻撃を提案した論文だ。無線で妨害音を発し、自動音声認識(ASR)システムをリアルタイムに混乱させ、本来盗聴側が取得したい会話を間違った形で認識させる。80%の確率でユーザーの言葉を誤認識させられたという。 この妨害音は、その場にいるユーザーの邪魔にならないような静かな音に最適化されている。 妨害を実際に行った3つの例。攻撃していない時の音声信号スペクトログラム(上)、攻撃した際の音声信号スペクトログラム(下)
地獄の苦しみだった収録 「ETC(※)カードが挿入されました」 車に乗ってエンジンを掛けると車内に響き渡る声、この音声を担当しているのが私だということをご存知ない方はまだまだ多い。なのでイベントなどでご披露すると「おお~」と思わず声を洩らす方もたくさんいる。そしてその声がどのキャラクターを演じたときよりも大きかったりして、私のほうがびっくりしてしまう。 反応の大きさは、その声のシェア率に比例している。どの世代にも満遍なく知られている私の声は、今のところ南ちゃんとETCが半々という感じだ。 いやいや出世しましたなぁ~ETC! 今となってはETC音声に起用していただいてありがとうございます、という気持ちだけれど、その収録は、実は地獄の苦しみだった。 「収録の前に一つだけ約束してほしいことがあるんだけど」 ETC音声収録の当日、機械音声の制作を専門にしている会社の社長さんが誰にも聞こえないように
稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」 ぼく「はい」 Google「そちらの営業時間を教えてください」 ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と日曜日の営業時間も教えてください」 ↓ 2022-01-25 10:26:41 稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h ぼく「土曜と日曜は普通にお休みです」 Google「確認させてください。そちらの営業時間は月曜から金曜の9時〜18時でよろしいでしょうか」 ぼく「はい」 Google「ありがとうございました(電話を切りそうな気配)」 ぼく「待って。参
MIMOSYS®(Mind Monitoring System)は、本人でもなかなか分かりづらい、常に変化している心の状態を声から知る技術です。MIMOSYS®は不随意反応を見ているため、自記式でのレポーティングバイアス(被検者の意識・無意識による過小評価)がなく、嘘もつけません。本人の心の状態を正確に把握することができるのがMIMOSYS®の大きな特長です。MIMOSYS®は声帯の不随意反応に着目し、声の周波数の変動パターン等から心の状態を分析しています。例えば、人前での発表で緊張し、声が上ずった経験はありませんか?声帯の緊張は自分では操作することはできません、これが声帯の不随意反応なのです。MIMOSYS®の分析に必要なのは「声」のみです。他に何も必要ありませんし、注射のように痛くもありません。声のみで心の状態を知ることができるのです。
【宅録で】バイノーラル収録対応可能な声優さんが増えた結果、それを【ゲームにも利用したい】というクライアントが増えましたが、非常に利用が難しい「理由」をまとめました。同じ界隈でない人には全く意味のない記事です。
拡張現実(AR)は、音声からはじまる…というのが以前からの持論。そんなわけでZOOMの会議に、効果音をブチ込める環境を作ってみました。 会議中に、Hahahaha!とかOhhhhh…みたいな、アメリカンなアクションやりたい!ファンファーレやドラムロールとか、拍手やブーイング、ズキューンとか鳴らしたいじゃない? ユーザー体験が超変わる!!と思ったのですが、ググってもでてこなかったので環境構築してみました。 環境概要物理機材はなしソフトで解決。バーチャルミキサーを使って、マイクと各種音声アプリのサウンドを合算します。初回設定20分。会議前設定30秒ぐらい。ZOOMには、バーチャルミキサーを擬似マイクとして設定。こうすることで、様々な効果音や音楽、楽器をZOOMに流しこめます。 バーチャルミキサー音の合成には、Loopbackというアプリを使います。このアプリは、複数のオーディオインプット(マイ
みなさんは自分の声そっくりにしゃべる合成音声をお持ちだろうか? 筆者は2年4カ月前から自分の声「松尾P」を使えるようになっていて、たまに記事で使っている。ちょっとした自慢だ。 Open JTalkの音響モデルを作ってもらったので自分と会話ができちゃうのだ Google Home Miniに自分の声でコマンドライン命令してみた ところがこの先行者特権が失われようとしている。4月17日に東芝デジタルソリューションズが公開したモバイルアプリ「コエステーション」が原因だ。自分の観測範囲でもかなりの人が自分の合成音声「コエ」を持ち始めている。コエステーションは、自分の声で10個の文を読み上げるだけで自分の声を基にした「コエ」ができて、TTS(Text to Speech)による発声をアプリ内でできる。しかも無料。これはとんでもない価格破壊だ。 これがどのくらいの価格破壊かというと、既存の音声合成企業
スマートスピーカー Advent Calendar 2019 5日目の記事です。 ちょうど一年前、Googleアシスタントで「サンタの脱出」をリリースしました。サンタの脱出は20分ほどでクリアできる脱出ゲームで、日本語版に加えて英語版(Santa Claus Escape)もリリースしています。 この一年で、なんと140万人もの方がアクセスしてくれました。 図1 アクセス数の推移(Daily active user) レビューをつけくださったのは1,447人。 図2 サンタの脱出のレビュー人数 「VUIで遊べる脱出ゲームがもっと増えるといいなー」と思いつつ、サンタの脱出がこれほどたくさんの方に遊んでいただけた理由について仮説をご紹介していきます。 仮説1: 世界中の人々が「謎解き」を求めている 「サンタの脱出」は私が初めて作った脱出ゲームです。面白くするコツは全て次の書籍で学びました: テ
本連載は、マイクロソフトのSaaS型デスクトップ&Webアプリケーション「Office 365」について、仕事の生産性を高める便利機能や新機能、チームコラボレーションを促進する使い方などのTipsを紹介する。 Office 365を使いこなして仕事を早く終わらせたい皆様にお届けする本連載。第15回は音声入力を取り上げる。 市場を見渡せば、スマートフォンは既に音声入力をサポートし、今年に入って音声で情報取得や家電の制御などができるスマートスピーカーが続々登場した。WindowsはXPの時代から音声入力をサポートしているが、その精度から利用するユーザーは多くない。ではOfficeはどうだろうか。 Officeは音声合成機能を備えているが、音声入力機能は見当たらないのが現状だ。この現状をMicrosoftの開発者が憂いたかどうかは不明だが、同社の実験的プロジェクト「Microsoft Garag
Amazonは米国時間11月30日、「Alexa for Business」を発表した。Amazonの音声駆動デジタルアシスタントを新たに職場にもたらすものとなる。オフィスでこのサービスを利用して、音声コマンドで備品を再注文したり、電話会議を始めたりできるようになる。 Alexaは、「Echo」スピーカやストリーミングデバイスのリモコン、カメラなどの一般的に家庭で使われる製品に搭載されているが、Alexa for Businessは、その高い人気を誇るAlexaのサービスを新たに拡大させたものだ。Alexaをオフィス環境に導入するには、デバイスのIT管理や企業レベルのセキュリティが必要になるなど多数の課題が伴うが、こうした新たな環境にAlexaを導入することに成功すれば、Echoデバイスの販売を拡大し、同社の音声アシスタントを人々の日常生活の主要な側面に普及させていくことにつながる可能性が
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く