チキン@ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中(2024年の5月ごろ出版かな?) webwhiter-skill.com/job/
We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国の浙江大学と米State University of New York at Buffaloによる研究チームが開発した「Wavesdropper: Through-wall Word Detection of Human Speech via Commercial mmWave Devices」は、ミリ波(mmWave)を用い、防音環境で守られている部屋内を外部から盗聴するシステムだ。被害者が発話した際の喉元付近の皮膚振動をミリ波で捉え、音声(単語)を復元する。 壁に防音材を配置すれば、音波の伝搬を利用した攻撃などからは守れるが、音源(例えば、人間の話者)からの直接漏えいを保証すること
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米コロンビア大学の研究チームが発表した「Real-Time Neural Voice Camouflage」は、不正なマイクが取得したユーザーの会話の言葉を正しく聞き取れないようにする攻撃を提案した論文だ。無線で妨害音を発し、自動音声認識(ASR)システムをリアルタイムに混乱させ、本来盗聴側が取得したい会話を間違った形で認識させる。80%の確率でユーザーの言葉を誤認識させられたという。 この妨害音は、その場にいるユーザーの邪魔にならないような静かな音に最適化されている。 妨害を実際に行った3つの例。攻撃していない時の音声信号スペクトログラム(上)、攻撃した際の音声信号スペクトログラム(下)
地獄の苦しみだった収録 「ETC(※)カードが挿入されました」 車に乗ってエンジンを掛けると車内に響き渡る声、この音声を担当しているのが私だということをご存知ない方はまだまだ多い。なのでイベントなどでご披露すると「おお~」と思わず声を洩らす方もたくさんいる。そしてその声がどのキャラクターを演じたときよりも大きかったりして、私のほうがびっくりしてしまう。 反応の大きさは、その声のシェア率に比例している。どの世代にも満遍なく知られている私の声は、今のところ南ちゃんとETCが半々という感じだ。 いやいや出世しましたなぁ~ETC! 今となってはETC音声に起用していただいてありがとうございます、という気持ちだけれど、その収録は、実は地獄の苦しみだった。 「収録の前に一つだけ約束してほしいことがあるんだけど」 ETC音声収録の当日、機械音声の制作を専門にしている会社の社長さんが誰にも聞こえないように
稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」 ぼく「はい」 Google「そちらの営業時間を教えてください」 ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と日曜日の営業時間も教えてください」 ↓ 2022-01-25 10:26:41 稲田エイジ|BtoBのWebサイト制作/Web活用支援/コンテンツ支援/HubSpot @inada_h ぼく「土曜と日曜は普通にお休みです」 Google「確認させてください。そちらの営業時間は月曜から金曜の9時〜18時でよろしいでしょうか」 ぼく「はい」 Google「ありがとうございました(電話を切りそうな気配)」 ぼく「待って。参
MIMOSYS®(Mind Monitoring System)は、本人でもなかなか分かりづらい、常に変化している心の状態を声から知る技術です。MIMOSYS®は不随意反応を見ているため、自記式でのレポーティングバイアス(被検者の意識・無意識による過小評価)がなく、嘘もつけません。本人の心の状態を正確に把握することができるのがMIMOSYS®の大きな特長です。MIMOSYS®は声帯の不随意反応に着目し、声の周波数の変動パターン等から心の状態を分析しています。例えば、人前での発表で緊張し、声が上ずった経験はありませんか?声帯の緊張は自分では操作することはできません、これが声帯の不随意反応なのです。MIMOSYS®の分析に必要なのは「声」のみです。他に何も必要ありませんし、注射のように痛くもありません。声のみで心の状態を知ることができるのです。
【宅録で】バイノーラル収録対応可能な声優さんが増えた結果、それを【ゲームにも利用したい】というクライアントが増えましたが、非常に利用が難しい「理由」をまとめました。同じ界隈でない人には全く意味のない記事です。
みなさんは自分の声そっくりにしゃべる合成音声をお持ちだろうか? 筆者は2年4カ月前から自分の声「松尾P」を使えるようになっていて、たまに記事で使っている。ちょっとした自慢だ。 Open JTalkの音響モデルを作ってもらったので自分と会話ができちゃうのだ Google Home Miniに自分の声でコマンドライン命令してみた ところがこの先行者特権が失われようとしている。4月17日に東芝デジタルソリューションズが公開したモバイルアプリ「コエステーション」が原因だ。自分の観測範囲でもかなりの人が自分の合成音声「コエ」を持ち始めている。コエステーションは、自分の声で10個の文を読み上げるだけで自分の声を基にした「コエ」ができて、TTS(Text to Speech)による発声をアプリ内でできる。しかも無料。これはとんでもない価格破壊だ。 これがどのくらいの価格破壊かというと、既存の音声合成企業
先日一般販売が始まったことがアメリカのメディアを中心に話題のAmazonの人工知能スピーカー『Echo』。先日の記事でも取り上げたとおり、Amazonレビューの評価がやたらと高く、音声認識のAIデバイスとして少々気になる存在。日本発売が未定なら現地在住のユーザーに聞けば良い!ということで、サンフランシスコ在住にしてEchoのリアルユーザーの丹羽さんからのレビューが届きました。Echoがもたらす体験は、良くも悪くも"ヘイ!Siri"や"OK,Google"とはまったく違うそうです。 Amazon Echoのプロモーションビデオ これは未来だ 昨年のある日 Twitter でなにやら Amazon が筒状の変なものを作ったと話題になっていました。そこで見たものはこのビデオ。 「未来きた!」と思いました。ビデオに登場する、まるでもう一人の人間のように思えたんですね。早速ウェブサイトで招待状の登
話しかけるとすぐに応答し、まるで人間と会話していると錯覚するほど流ちょうな言葉で返答してくれるスピーカータイプの音声アシスタント端末「Amazon Echo」は、英語圏では大ヒット商品になっています。Amazonのカスタマーレビューで3人に2人は☆5つを付けるほど高い満足度を生みだし、Amazonの次の10億ドル(約1100億円)ビジネスになるとも言われるEchoの開発秘話について、Amazon幹部が明らかにしています。 The inside story of how Amazon created Echo - Business Insider http://www.businessinsider.com/the-inside-story-of-how-amazon-created-echo-2016-4 Apmazon幹部のデイブ・リンプ氏はBusiness Insiderの取材に対して
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く