並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 2137件

新着順 人気順

音声認識の検索結果201 - 240 件 / 2137件

  • ペンタックス音声合成ソフトウェア

    ペンタックスの「VoiceText(ボイステキスト)」は、コーパスベース方式の音声合成により、人間の声に近い自然な音質の合成音声を提供します。VoiceTextで作成した、音声を是非ご視聴ください。 下記のをクリックしますと音声が再生されます。

    • Amazon Alexaの基礎知識 | DevelopersIO

      はじめに 1月ももうすぐ終わりそうですが、僕にとってこれが2017年一発目のブログ記事となります。 2017年はAmazon Alexaが激アツだと確信したのですが、概要は把握していたものの、きちんと情報をキャッチアップ出来ていなかったため、改めてAmazon Alexaについて学びました。 基礎知識 Amazon Alexaとは、Amazonが提供する、クラウドベースの音声認識サービスです。Alexaに対応したデバイスが認識した音声はクラウドサービスに送信されます。クラウドサービスは音声をテキスト変換し、そのテキストを処理し、処理結果をデバイスに返して音声として再生されます。 Alexaが登場したのは2014年11月、Amazon Echoとして発表されました。発表時にはAmazon Echoの機能のように報道されていましたが、その後Amazon EchoはAlexaファミリーを構成する

        Amazon Alexaの基礎知識 | DevelopersIO
      • アップル、Siriの日本語版を2012年に提供開始する予定

        アップルが、2012年からSiriの日本語を含む5ヶ国語(中国語・韓国語・イタリア語・スペイン語)での追加提供を開始すると公式FAQで掲載しています。 昨日iPhone 4Sを手に入れてSiriを使ってみたばかりですが、英語で使うのは難しいと感じてたばかりでした...。日本語で使えるようになるのは嬉しいですね。 [Apple - Siri - Frequently Asked Questions via : ringo-sanco] (大野恭希)

        • さようならCortana──Copilot登場でMicrosoftがサポート終了へ

          米MicrosoftはサポートページでWindowsでのCortanaのサポート終了を告知した。「2023年後半以降、WindowsではスタンドアロンアプリとしてCortanaはサポートされなくなります」となっている。 2014年に「Windows Phone 8.1」の新機能としてデビューしたCortanaは、米Appleの「Siri」対抗の音声アシスタントと目されていた。その後、Windows 10のタスクバーで利用できるようになったが、Windows 11ではタスクバーから消えていた。 Microsoftが5月に開催したBuild 2023で発表した「Windows Copilot」は、Cortanaよりはるかに高機能なアシスタントなので、Cortanaの役目が終了になっても当然だろう。 MicrosoftはCortanaのWindowsでのサポート終了時期について具体的にはまだ発表

            さようならCortana──Copilot登場でMicrosoftがサポート終了へ
          • Engadget | Technology News & Reviews

            Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

              Engadget | Technology News & Reviews
            • 「スマートスピーカーの誤反応」はどれくらい起こる? 100時間テストした結果

              「スマートスピーカーの誤反応」はどれくらい起こる? 100時間テストした結果:山口真弘のスマートスピーカー暮らし(1/3 ページ) スマートスピーカーやその関連デバイスについて、試行錯誤を繰り返しつつ、機能をバリバリ使えるようになる(予定)までの過程を、時系列でお届けする本連載。今回はスマートスピーカーがテレビの音声でどれだけ誤反応を起こすか、約100時間にわたってテストを行った。 スマートスピーカーは音声でコントロールするだけに、コマンドではない音声に誤反応することは少なからずある。特にテレビのように音声が絶えず流れ続けている環境では、思わぬときに反応してしまったという経験がある方も少なくないだろう。 筆者自身、こうした現象には何度か遭遇しており、どのスマートスピーカーで起こりやすいかは感覚的に把握しているが、まとまった時間をかけて、かつ複数の製品を同一環境で測定したことはなかった。 今

                「スマートスピーカーの誤反応」はどれくらい起こる? 100時間テストした結果
              • クラウドの音声認識APIで、ライターにとって実用的な「文字起こしサービス」は作れるのか?

                文章を書く仕事をしている多くのライターが苦手にしている作業のひとつに、かつて「テープ起こし」と呼ばれ、いまは「文字起こし」と呼ばれるものがあります。 これは取材やインタビューを行う際に録音したものを聞き返して、逐一正確に文字にしていく作業なのですが、とにかく単調で集中力が必要です。僕はこの作業が苦手ですぐ集中力が切れてしまうので、たとえば60分のインタビューの文字起こしをしようとすると、だいたいその3倍以上の時間がかかることを覚悟しなければなりません。 ある日、たまたま後輩と一緒にインタビューの仕事をしているときに、後輩が僕にこう言いました「新野さん、もし文字起こしを自動でやってくれるソフトがあったら僕は100万円出してもいいですよ」と。 まったく同感でした。この先ずっと、必要な時にいつでも機械がその場で自動的に文字起こしをしてくれるのなら、100万円ぐらい払ってもいい(僕もたまにクラウド

                  クラウドの音声認識APIで、ライターにとって実用的な「文字起こしサービス」は作れるのか?
                • 音声認識ソフトを使ってキーボードより速くプログラムをコーディングする実例

                  By Gray 音声認識で文字入力する技術は古くからありますが、まだまだ実用にはほど遠いという印象を持っている場合の方が多いはず。しかし、音声認識入力でキーボードよりも速くプログラミングすることは可能であることが判明しました。 Using Voice to Code Faster than Keyboard http://ergoemacs.org/emacs/using_voice_to_code.html このムービーはプログラミング言語「Python」の世界会議Python Conference 2013におけるプレゼンテーションで撮影されたもので、キーボードによるタイピングよりも速く音声認識入力によりプログラムがコーディングされていく様子がよく分かります。 Using Python to Code by Voice - YouTube 音声入力によるプログラムコーディングの様子をプ

                    音声認識ソフトを使ってキーボードより速くプログラムをコーディングする実例
                  • Pythonで音声信号処理 - 人工知能に関する断創録

                    今年の目標(2011/1/1)の1つに音声認識技術の深耕というのを立ててます。いきなり音声認識をやるのは知識不足でかなり大変だということが分かったので、まずは音声のいろんな性質や信号処理の技術を一つ一つ試しながら習得していくことにしました。 音声信号処理ではよくMatlabが使われるようなのですが、 Matlabは高くて買えない(フリーのOctaveってのもあります) すでに使っているPython、Rと文法が似ていて混乱する というわけでMatlabはやめてPythonを使います。SciPyにフーリエ変換の機能があったのでたぶん同じようなことができるでしょう。Pythonのいろんな音声関係のライブラリなんかも紹介できればと思います。 当面の目標は、簡単な類似楽曲検索システムを作ることです。その後は、いろんなツール(HTKなど)を駆使して音声認識システムを作りたいと思ってます。 このページは

                      Pythonで音声信号処理 - 人工知能に関する断創録
                    • 音の良いポッドキャストを録音するために ― Turing Complete FMの収録テクニック|Rui Ueyama

                      僕は最近Turing Complete FMというポッドキャストを運営しているのですが、その収録のためにポッドキャスト録音テクニックを結構研究しました。ここではそのノウハウをシェアしようと思います。音がよくて聞きやすいポッドキャストの収録に役立ててもらえると幸いです。 はじめにポッドキャストでは音質は死活的に重要です。音質の大切さは強調してしすぎることはないと思うのですが、この点は甘く見られがちなようです。音の悪い録音を何十分も聞くのは耳が辛くて不必要にストレスがかかります。よいコンテンツを届けたいのなら、音質という、コンテンツ以前の問題は解決しておくべきです。 良い音質のポッドキャストを作成するためには、良い音質で録音する必要があります。良い録音から良い出力を作るのは簡単ですが、悪い録音から良い出力を作るのは、どんなにポストプロダクションを工夫してもほとんど不可能です。悪い音で録音してし

                        音の良いポッドキャストを録音するために ― Turing Complete FMの収録テクニック|Rui Ueyama
                      • 初音ミクとも簡単に対話できる「MMDAgent」、その詳細を聞いてきた

                        初音ミクなどのMMDと音声で対話できるようにするオープンソースツール「MMDAgent」を開発している名古屋工業大学のチームに、対話システムの作り方から、Sinsyの今後についても答えてもらった。 ニコニコ動画で初音ミクなどのMMD(MikuMikuDance)キャラクターと音声で対話できるシステム「MMDAgent」を発表した名古屋工業大学が、CEATEC会場でデモを行っている。開発を担当した名古屋工業大学国際音声技術研究所の徳田恵一教授、李晃伸准教授、大浦圭一郎特任助教に話を聞いた。 MMDAgentはこう記述する ITmedia デモを見せてもらいましたが、最初の質問の回答が出る前に別の質問をしてもうまく対応できるんですね。 徳田教授 音声対話システムでは割り込みができず、命令が終わるまでじっと待っていなければならないものが多いのですが、MMDAgentは音声認識エンジンも自分たちで

                          初音ミクとも簡単に対話できる「MMDAgent」、その詳細を聞いてきた
                        • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                          こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                            OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                          • 無料なのにココまでできる! 音声認識アプリを使ったテキストおこし(基本編) | ライフハッカー・ジャパン

                            デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール

                            • AppleのSiri搭載ホームスピーカー「HomePod」が登場、日本での発売時期は未定

                              「Siriベースの音声認識端末」として開発がウワサされていた端末が、WWDC 2017の中で発表されました。発表されたSiri搭載のホームスピーカーの名称は「HomePod」で、iTunesやiPodなどで音楽に革命をもたらしてきたAppleによる「家の中での新しい音楽のかたち」を示す端末となっています。 Apple Events - WWDC Keynote, June 2017 - Apple https://www.apple.com/apple-events/june-2017/ 6つ目の発表は…… 「Apple×音楽」について。 AppleはこれまでiTunesやiPodなどで音楽に革命を起こしてきましたが…… 次は「家庭での音楽」に革命を起こします。 家庭用スピーカーとしてはGoogle HomeやAmazon Alexaなどがありますが…… これらを超越したホームスピーカーを

                                AppleのSiri搭載ホームスピーカー「HomePod」が登場、日本での発売時期は未定
                              • OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる

                                OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は

                                  OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
                                • TechCrunch

                                  Identity and access giant Okta said a hacker broke into its customer support ticket system and stole sensitive files that can be used to break into the networks of Okta’s customers. Okta chief s

                                    TechCrunch
                                  • iPhone 3G Sに触った! 日本語音声コントロールのレスポンスに感動

                                    iPhone 3G Sに触った! 日本語音声コントロールのレスポンスに感動:WWDC 2009現地リポート(1/2 ページ) Worldwide Developers Conference 2009(WWDC 2009)の基調講演で最大の目玉といえば、カメラ機能の強化と大幅なスピードアップを実現した新型iPhone「iPhone 3G S」だ。もっとも、このiPhone 3G S、フィル・シラー上級副社長による基調講演中も、スライドには表示されたものの、実機が出てくることはなかった。アメリカでは約10日後に発売されるというのに、本当にきちんと動いているのだろうか。 この疑問は、WWDC 2009基調講演の直後に行われたグループインタビューセッションで氷解した――筆者は幸運にもグループの中で、ただ1人、このiPhone 3G Sを音声操作する幸運に恵まれた。そのときの模様をお伝えしよう。なお

                                      iPhone 3G Sに触った! 日本語音声コントロールのレスポンスに感動
                                    • 会話が見える! 世界最速の「リアルタイム字幕」にびっくり

                                      会話が見える! 世界最速の「リアルタイム字幕」にびっくり:水曜インタビュー劇場(瞬時公演)(1/5 ページ) 「UDトーク」というアプリをご存じだろうか。目の前の会話が次々に字幕になるサービスだが、その仕組みはどうなっているのか? アプリを開発した青木秀仁さんに聞いたところ……。 2月某日、幕張メッセ(千葉市)。記事のネタを探すために、記者はとあるセミナーを聴講していたところ、大きなモニターに釘付けとなった。 モニターには、登壇者の発言がリアルタイムで文字になって映し出されていたのだ。「ITmedia ビジネスオンラインって最高ね」と発言すると、瞬時に「ITmedia ビジネスオンラインって最高ね」と表示される。それだけではない。日本語の横で、英語のスペルも次々に並んでいたのだ。 よーく見ると、ところどころで“おかしな日本語”も登場する。例えば、「ITmedia ビジネスオンラインって再考

                                        会話が見える! 世界最速の「リアルタイム字幕」にびっくり
                                      • NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics

                                        「情報学」は私たちが生活する社会をどう変え、未来にどのような価値を生み出すのか。国立情報学研究所(NII)の広報誌「NII Today」は、情報学研究の最先端をみなさまに分かりやすくお伝えします。 NII Today 国立情報学研究所ニュース 国立情報学研究所ニュース 学術情報センターニュース 学術情報センターニュース

                                          NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics
                                        • 開店2カ月でリピーター比率25%の「ITレストラン」

                                          慶応義塾大学に近い東京都港区芝に、開店2カ月にもかかわらず、早くもリピーター比率が25%に達した高級和食レストランがある。店の名は、「瑞宝」。今年8月7日にオープン。口コミだけで顧客層を拡大した。オープンからの2カ月で最大11回来た顧客もいるという。 見た目では分からないが、瑞宝は「ITレストラン」という顔を持つ。店内のバックヤードにはサーバーラックが2本。飲食店としての業務の多くをIT(情報技術)で支援する。客席も含め無線LANが整備されている。 瑞宝では、雰囲気を損なわないよう、店員は携帯情報端末やメモを使わない。その代わり、「音声CRMシステム」を活用。店員は顧客から「薄味が好き」「ネギが苦手」といった好みを聞き出し、バックヤードに戻ってからマイクに向かって聞き出した内容をしゃべる。音声認識ソフトを通してテキストデータとして記録。この内容は厨房のパソコン画面に表示され、調理のための情

                                            開店2カ月でリピーター比率25%の「ITレストラン」
                                          • 口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場

                                            あるメロディを口ずさんでいるが、その曲のタイトルを知らなかったり思い出せずにいらいらしたことはないだろうか?そんな人のために、10秒以内に知りたい曲のタイトルを教えてくれるという新しいウェブサイト「Midomi」が登場した。 米国時間1月26日にベータ版の運用を開始したMidomiでは、ユーザーが歌ったり、口ずさんだり、口笛を吹いて楽曲を検索できる。検索結果には、商用で提供されている楽曲のほか、他のユーザーが録音した楽曲も含まれている。ユーザーは、検索結果のうち自分の音声とマッチする部分のみを聞くこともできる。 このほかにも、楽曲のタイトルやアーティスト名を使った検索も利用できる。同システムはスペルミスをしても認識する。 Midomiを開発および提供するMelodisは、200万以上のデジタル楽曲のライセンスを取得しており、ユーザーはこれを購入できる。また、ユーザーから集めた曲も1万200

                                              口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場
                                            • フリーの iOS 向け音声認識/音声合成ライブラリ『OpenEars』の使い方 - その後のその後

                                              OpenEars は Politepix 社より提供されているフリーの iOS 向け音声認識/音声合成(Text to Speech, TTS)ライブラリです。 OpenEars 話した言葉を認識したり、入力した文字列を読み上げたり(mac の say コマンドみたいなもの)することができます。 試してみたところ超簡単に使えたので、自分のアプリに OpenEars を導入する方法を紹介します。 音声合成の導入方法 フレームワーク追加、ヘッダインポートといった一般的なライブラリの導入手順をのぞけば、基本的にはメソッドを1つ呼ぶだけで導入できます。 1. フレームワークをプロジェクトに追加 解凍したフォルダ配下にあるFrameworkフォルダごとプロジェクトに追加します。フォルダには OpenEars.framework、Slt.framework ほか、言語モデルや辞書が入っています。 また

                                                フリーの iOS 向け音声認識/音声合成ライブラリ『OpenEars』の使い方 - その後のその後
                                              • Google Homeを英会話の無料トレーニング教材にしてみる - プロクラシスト

                                                こんにちは、ほけきよです。 我が家に、Google Home Miniが届きました!*1 Google Home Mini 友人がプレゼントしてくれたものです。スマートスピーカー、プレゼントに最適だと思うんですよ。 新しくて、興味はあるけど、よくわからないし、自分では最後のひと押し踏み込めない。 けれど、あればかなり楽しいです。 この辺はAmazonのAlexaとかも一緒かな? もらってかなり嬉しかったですし、使ってみて更に感謝が深まった商品でした。 で、こいつの効果的な活用法を考えて見たのですが、 英語の練習に使えないかなと思って、色々試行錯誤しています。 今回は、スマートスピーカーの使用例の一つとして、参考にしてみてください。 Google Home Miniの設定 設定の仕方 利用例 気温や時刻を聞く アラームをセットする ニュースを聞く ゲームをする 英語学習用アプリ まとめ Go

                                                  Google Homeを英会話の無料トレーニング教材にしてみる - プロクラシスト
                                                • http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html

                                                  • 【レビュー】 夢の「音声自動書き起こし」はもうすぐ実現!? Microsoftの「Video Indexer」を試す ~動画・録音の音声を自動でテキスト化し翻訳も

                                                      【レビュー】 夢の「音声自動書き起こし」はもうすぐ実現!? Microsoftの「Video Indexer」を試す ~動画・録音の音声を自動でテキスト化し翻訳も
                                                    • 「あれやって」主人のくせ予測する家電 アマゾンが着手:朝日新聞デジタル

                                                      デジタルトレンド・チェック! 「あれ、やっといてくれる?」と家の中で話しかけると、人工知能(AI)につながったスピーカーが「わかりました」と答えて用事を済ませてくれる。「あれ」は「テレビ番組の視聴予約」かも知れないし、「足りない日用品の注文」かも知れません。人が話すあいまいな言葉の文脈を解釈し、その意味を理解して、具体的に実行する──米アマゾン・ドット・コムが描いているのはそういう未来です。それは5~10年程度の近い時期になる可能性もあります。 同社は20日(現地時間)、本社のある米シアトルで発表会を開催しました(写真1、2)。題材は、AIを利用した音声アシスタント「Alexa(アレクサ)」の関連製品です。音声で操作するスマートスピーカー「Echo(エコー)」シリーズが主軸で、日本でも昨年秋から発売されています。今回はそのEchoシリーズがリニューアルし、新しいモデルになりました。 しかし

                                                        「あれやって」主人のくせ予測する家電 アマゾンが着手:朝日新聞デジタル
                                                      • TechCrunch

                                                        Everyone more or less agrees that 2023 is going to be effectively written off in VC-land, as the feeding frenzy of the last few years leaves everyone exhausted, valuations flattened or crashed, and ex

                                                          TechCrunch
                                                        • Start | 和歌山大学メディアインテリジェンス研究室

                                                          和歌山大学メディアインテリジェンス研究室(西村竜一研究室)† 本研究室では、音声や画像、動画、自然言語、センサなどの「メディア」を活用した認識・理解の知的技術によって、人と人、人と機械の協働を豊かなものにするための教育・研究を行います。 2019年度から活動している研究室です。 本研究室の学部生は、システム工学部 メディアデザインメジャーに所属しています。大学院生の所属は、システム工学研究科 知的モデリングクラスタです。 なお、本研究室は、西村が所属(担当)するデータ・インテリジェンス教育研究部門及び学生自主創造支援部門(クリエ)とも協働することで教育・研究活動を進めています。 今後は、社会インフォマティクス学環の学生の受入も行う予定です。 ↑ お知らせ† 2023/12/9 大学院生(M2)の日田さんが国立研究開発法人情報通信研究機構(NICT)の研究員みなさまと共著で発表した『複数話者

                                                          • AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に

                                                            AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に Amazon Lexを利用することで、「すべてのデベロッパーがAmazon Alexaに採用されている深層学習技術と同じ技術を利用できる」(Amazon Lexの説明文から)とされています。 Amazon Lexは、自動音声認識による音声からテキストへの変換機能と、テキストの内容からその意図を認識する自然言語理解機能を備えています。 つまり、電話やオンライン会議などを経由して日本語の音声をAmazon Lexに入力すると、いわゆる文字起こしのようにその内容をテキストに変換してくれます。 そしてこの音声から変換されたテキストや、Slackなどのテキストチャットなどで入力されたテキストの内容から、Amazon Lexはその意図などを理解し、会話の中から必要な

                                                              AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に
                                                            • Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog

                                                              はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ

                                                                Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
                                                              • [速報]「Amazon AI」として、画像認識/テキスト音声変換/音声認識と自然言語理解の3つを発表。AWS re:Invent 2016

                                                                Amazon Web Servicesは、ラスベガスで開幕した同社のイベント「AWS re:Invent 2016」で、「Amazon AI」傘下のサービスとして、画像認識、テキスト音声変換、音声認識と自然言語理解の3つを発表しました。

                                                                  [速報]「Amazon AI」として、画像認識/テキスト音声変換/音声認識と自然言語理解の3つを発表。AWS re:Invent 2016
                                                                • Amazonのハードウェア史上最大のヒット商品になったスピーカー型音声アシスタント「Amazon Echo」誕生秘話

                                                                  話しかけるとすぐに応答し、まるで人間と会話していると錯覚するほど流ちょうな言葉で返答してくれるスピーカータイプの音声アシスタント端末「Amazon Echo」は、英語圏では大ヒット商品になっています。Amazonのカスタマーレビューで3人に2人は☆5つを付けるほど高い満足度を生みだし、Amazonの次の10億ドル(約1100億円)ビジネスになるとも言われるEchoの開発秘話について、Amazon幹部が明らかにしています。 The inside story of how Amazon created Echo - Business Insider http://www.businessinsider.com/the-inside-story-of-how-amazon-created-echo-2016-4 Apmazon幹部のデイブ・リンプ氏はBusiness Insiderの取材に対して

                                                                    Amazonのハードウェア史上最大のヒット商品になったスピーカー型音声アシスタント「Amazon Echo」誕生秘話
                                                                  • サムスン製テレビが会話に聞き耳? 音声認識機能に注意喚起

                                                                    ニューヨーク(CNNMoney) サムスン製テレビの前では発言に気を付けた方がいい。テレビの前で話した言葉はすべて傍受され、インターネットを介して送信されている――。音声でテレビを操作できる「スマートTV」について、韓国サムスン電子がそんな内容の告知を掲載した。 この告知は同社のスマートTVのプライバシーポリシーに掲載された。「私的な会話や重要な情報を含め、言葉を発すればその情報がデータとして傍受され、音声認識機能を通じて第三者に送信されますのでご注意ください」と呼びかける内容。 サムスンによれば、テレビを音声で操作するためには、発話内容を第三者に送信して音声を文字に変換する必要がある。同社はさらに、この機能を改善する必要があるかどうか見極めるための調査目的でも音声内容を収集しているという。 第三者の社名や、その会社が音声データを録音しているかどうかについて、サムスンから返答はなかった。

                                                                      サムスン製テレビが会話に聞き耳? 音声認識機能に注意喚起
                                                                    • 音声認識入門!Web Speech APIを使いChromeブラウザを音声操作するWebアプリ開発術を公開! - paiza times

                                                                      どうも、まさとらん(@0310lan)です。 みなさんは、音声認識を活用していますか? 例えば、iOSの「Siri」と会話してみたり、Androidなら「OK Google」と喋って検索した経験があるのではないでしょうか? 今回は、このような音声認識を利用し、PCのChromeブラウザに喋りかけることで動作するサンプルデモのチュートリアルをご紹介しようと思います! ■音声認識に必要なAPIとは? まず最初に必要なのが、自分の「声」を音声として認識してくれるAPIなのですが、実はPCのChromeブラウザであれば今すぐJavaScriptから利用できるようになっています。 Web Speech API:ブラウザ対応状況 「Web Speech API」を使うことで、特別なツールをインストールしたり、余計なライブラリを読み込む必要は無いわけです。 ちなみに、このAPIには大きく分けて「音声認識

                                                                        音声認識入門!Web Speech APIを使いChromeブラウザを音声操作するWebアプリ開発術を公開! - paiza times
                                                                      • 音声認識のしくみ

                                                                        音声認識を紹介するページ とにかくここでは、 だらだらと「音声認識」というモノを紹介します。 全体が(ほぼ)このページ一枚に収まっています。 ところどころにリンクがありますが、 そのリンク先には、 難しい話やこぼれ話みたいなものがちょこちょことあります。 ところで、話を簡単にするために、 ちょっと嘘を混ぜています。 そうでないと、ものすごく複雑な話になるので。 音声認識ってなにさ 簡単に言ってしまえば、 人間が喋った声を機械が文字に直すことです。 図で描くとこんな感じです。 左側が音声波形(つまり、声を図に表している)で、 右側がそれをひらがなに直したものです。 左側の音声波形を少し詳しく見てみる 人間は耳で音を聞きますが、 機械はマイクで音を聞きます。 そして、マイクで収録された音をそのまま表示させると、 下のような感じになります。 横軸が時刻で、縦軸が振幅です。 音声というのは、ようす

                                                                        • [速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開

                                                                          [速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開 GitHubは、年次イベント「GitHub Universe 2022」の基調講演で、音声によるGitHubの操作やコーディングを可能にする実験的機能「Hey, GitHub!」をプレビュー公開しました。 'Hey, GitHub!' is an experiment from the GitHub Next team that aims to reduce the need for a keyboard by enabling voice-based interaction with GitHub Copilot. Sign up now to join the waitlist: https://t.co/4YOSuA6cUr — GitHub (@github

                                                                            [速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開
                                                                          • سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر

                                                                            این لیست نهایی بهترین سایت های شرط بندی در این تجارت است. ما هر یک از این سایت ها را تحت یک روند دقیق بررسی قرار داده ایم، و همه آنها امتیازات بالایی را در معیارهای اصلی کسب کرده اند. شما می توانید در هر یک از این سایت های شرط بندی ثبت نام کرده و مطمئن باشید که آنها سابقه طولانی در پرداخت سریع، رفتار عادلانه با مشتری و ایمن نگه داشتن اطلاعات شما دارند. ”بیشتربخوانید” متخصصان نقد و بررسی ما همگی در

                                                                              سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر
                                                                            • 「お尻洗って」と、ウォシュレットに話しかける時代が来た #CES2024

                                                                              「お尻洗って」と、ウォシュレットに話しかける時代が来た2024.01.19 08:006,460 Florence Ion - Gizmodo US [原文] ( 湯木進悟 ) これぞベスト機能では? ウォシュレットが登場したとき、その新感覚に驚いたことを覚えている人もいるでしょう。いまではすっかりトイレの標準機能になっていますけど、今年の「CES 2024」では、意外なる新機能がデビューを果たしていましたよ。 音声認識でコントロール可能にそもそも当たり前のように、ウォシュレットのボタンを指でタッチしていますけど、もし一切なににも触れずコントロールできたら、衛生面でも最高だったり? Kohlerは、そんな願いをかなえる「PureWash Bidet Seat」を発表しました。 Image: Kohlerなんと音声認識アシスタントとなる、AmazonのAlexaまたはGoogle Assis

                                                                                「お尻洗って」と、ウォシュレットに話しかける時代が来た #CES2024
                                                                              • 自動文字起こしもできる!Speechnotesがスゴイ!

                                                                                情報管理LOGの@yoshinonです。 このところ自動で文字起こしというのが、自分の中で流行っているのですが、一長一短それぞれあるのですよね。その中でも、2月に記事にした「Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ」という記事が大きな反響があり驚きました。皆さんきっと同じ悩みを持っているのでしょうね。 今回は、前回のGoogleドキュメントを用いた文字起こしよりも、さらにもう少しワンランク上の自動化ができるぞ!というSpeechnotesについてご紹介します。 2月に書いた「Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ」という記事が、割とバズり、様々なところで取り上げていただきました。ありがたいことです。 Bookmarklet: instantly generate a Card for any web pa

                                                                                  自動文字起こしもできる!Speechnotesがスゴイ!
                                                                                • 誰でも手軽にNTTドコモのサービスのような機能を持つアプリが作れる ~「docomo Developer support」の概要とAPIコンソール

                                                                                  はじめに 第1回目の本稿は、「docomo Developer support」の概要と、手軽に機能が試せるAPIコンソールの使い方を解説しましょう(本稿は、2014年11月19日時点の最新情報に基づいております)。 対象読者 JavaとEclipseを用いたAndroidアプリの開発で、基本的な知識がある方を対象とします。 「docomo Developer support」とは 「docomo Developer support」は、NTTドコモが開発者向けに情報を提供しているサイトで、2013年11月11日に開設されています。このサイトでは、ハッカソンなどのイベント情報も提供されていますが、メインとなるのは、さまざまな開発に活用できるAPIやツールの情報です。 APIとは「Application Programming Interface」の略で、あるプログラムの機能を外部のアプリケ

                                                                                    誰でも手軽にNTTドコモのサービスのような機能を持つアプリが作れる ~「docomo Developer support」の概要とAPIコンソール