[6ページ] 音声認識の人気記事 2137件

201 - 240 件 / 2137件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声認識の検索結果201 - 240 件 / 2137件

ペンタックス音声合成ソフトウェア
- 138 users
- voice.pentax.jp
- 暮らし
- 2008/03/21
ペンタックスの「VoiceText（ボイステキスト）」は、コーパスベース方式の音声合成により、人間の声に近い自然な音質の合成音声を提供します。VoiceTextで作成した、音声を是非ご視聴ください。下記のをクリックしますと音声が再生されます。
- 音声合成
- ソフトウェア
- webサービス
- 音声
- technology
- software
- 技術
- サービス
- ツール
- 素材
Amazon Alexaの基礎知識 | DevelopersIO
- 138 users
- dev.classmethod.jp
- テクノロジー
- 2017/01/25
はじめに 1月ももうすぐ終わりそうですが、僕にとってこれが2017年一発目のブログ記事となります。 2017年はAmazon Alexaが激アツだと確信したのですが、概要は把握していたものの、きちんと情報をキャッチアップ出来ていなかったため、改めてAmazon Alexaについて学びました。基礎知識 Amazon Alexaとは、Amazonが提供する、クラウドベースの音声認識サービスです。Alexaに対応したデバイスが認識した音声はクラウドサービスに送信されます。クラウドサービスは音声をテキスト変換し、そのテキストを処理し、処理結果をデバイスに返して音声として再生されます。 Alexaが登場したのは2014年11月、Amazon Echoとして発表されました。発表時にはAmazon Echoの機能のように報道されていましたが、その後Amazon EchoはAlexaファミリーを構成する
- alexa
- Amazon
- 音声認識
- AWS
- あとで読む
- AI
アップル、Siriの日本語版を2012年に提供開始する予定
- 137 users
- www.gizmodo.jp
- 暮らし
- 2011/10/14
アップルが、2012年からSiriの日本語を含む5ヶ国語（中国語・韓国語・イタリア語・スペイン語）での追加提供を開始すると公式FAQで掲載しています。昨日iPhone 4Sを手に入れてSiriを使ってみたばかりですが、英語で使うのは難しいと感じてたばかりでした...。日本語で使えるようになるのは嬉しいですね。［Apple - Siri - Frequently Asked Questions via : ringo-sanco］（大野恭希）
- Siri
- iPhone
- apple
- iPhone4S
- iOS
- iPhone
- GIZMODO
- app
さようならCortana──Copilot登場でMicrosoftがサポート終了へ
- 135 users
- www.itmedia.co.jp
- テクノロジー
- 2023/06/04
米MicrosoftはサポートページでWindowsでのCortanaのサポート終了を告知した。「2023年後半以降、WindowsではスタンドアロンアプリとしてCortanaはサポートされなくなります」となっている。 2014年に「Windows Phone 8.1」の新機能としてデビューしたCortanaは、米Appleの「Siri」対抗の音声アシスタントと目されていた。その後、Windows 10のタスクバーで利用できるようになったが、Windows 11ではタスクバーから消えていた。 Microsoftが5月に開催したBuild 2023で発表した「Windows Copilot」は、Cortanaよりはるかに高機能なアシスタントなので、Cortanaの役目が終了になっても当然だろう。 MicrosoftはCortanaのWindowsでのサポート終了時期について具体的にはまだ発表
Engadget | Technology News & Reviews
- 133 users
- www.engadget.com
- エンタメ
- 2014/04/16
Pick up the 9th-gen iPad with two years of AppleCare+ for only $298
「スマートスピーカーの誤反応」はどれくらい起こる？　100時間テストした結果
- 133 users
- www.itmedia.co.jp
- テクノロジー
- 2018/05/04
「スマートスピーカーの誤反応」はどれくらい起こる？　100時間テストした結果：山口真弘のスマートスピーカー暮らし（1/3 ページ）スマートスピーカーやその関連デバイスについて、試行錯誤を繰り返しつつ、機能をバリバリ使えるようになる（予定）までの過程を、時系列でお届けする本連載。今回はスマートスピーカーがテレビの音声でどれだけ誤反応を起こすか、約100時間にわたってテストを行った。スマートスピーカーは音声でコントロールするだけに、コマンドではない音声に誤反応することは少なからずある。特にテレビのように音声が絶えず流れ続けている環境では、思わぬときに反応してしまったという経験がある方も少なくないだろう。筆者自身、こうした現象には何度か遭遇しており、どのスマートスピーカーで起こりやすいかは感覚的に把握しているが、まとまった時間をかけて、かつ複数の製品を同一環境で測定したことはなかった。今
クラウドの音声認識APIで、ライターにとって実用的な「文字起こしサービス」は作れるのか？
- 133 users
- www.publickey1.jp
- テクノロジー
- 2017/09/27
文章を書く仕事をしている多くのライターが苦手にしている作業のひとつに、かつて「テープ起こし」と呼ばれ、いまは「文字起こし」と呼ばれるものがあります。これは取材やインタビューを行う際に録音したものを聞き返して、逐一正確に文字にしていく作業なのですが、とにかく単調で集中力が必要です。僕はこの作業が苦手ですぐ集中力が切れてしまうので、たとえば60分のインタビューの文字起こしをしようとすると、だいたいその3倍以上の時間がかかることを覚悟しなければなりません。ある日、たまたま後輩と一緒にインタビューの仕事をしているときに、後輩が僕にこう言いました「新野さん、もし文字起こしを自動でやってくれるソフトがあったら僕は100万円出してもいいですよ」と。まったく同感でした。この先ずっと、必要な時にいつでも機械がその場で自動的に文字起こしをしてくれるのなら、100万円ぐらい払ってもいい（僕もたまにクラウド
- 音声認識
- API
- 文字起こし
- Alexa
- machinelearning
- Publickey
- 仕事
- サービス
- あとで読む
- google
音声認識ソフトを使ってキーボードより速くプログラムをコーディングする実例
- 133 users
- gigazine.net
- テクノロジー
- 2013/08/16
By Gray 音声認識で文字入力する技術は古くからありますが、まだまだ実用にはほど遠いという印象を持っている場合の方が多いはず。しかし、音声認識入力でキーボードよりも速くプログラミングすることは可能であることが判明しました。 Using Voice to Code Faster than Keyboard http://ergoemacs.org/emacs/using_voice_to_code.html このムービーはプログラミング言語「Python」の世界会議Python Conference 2013におけるプレゼンテーションで撮影されたもので、キーボードによるタイピングよりも速く音声認識入力によりプログラムがコーディングされていく様子がよく分かります。 Using Python to Code by Voice - YouTube 音声入力によるプログラムコーディングの様子をプ
Pythonで音声信号処理 - 人工知能に関する断創録
- 131 users
- aidiary.hatenablog.com
- 政治と経済
- 2011/05/14
今年の目標（2011/1/1）の1つに音声認識技術の深耕というのを立ててます。いきなり音声認識をやるのは知識不足でかなり大変だということが分かったので、まずは音声のいろんな性質や信号処理の技術を一つ一つ試しながら習得していくことにしました。音声信号処理ではよくMatlabが使われるようなのですが、 Matlabは高くて買えない（フリーのOctaveってのもあります）すでに使っているPython、Rと文法が似ていて混乱するというわけでMatlabはやめてPythonを使います。SciPyにフーリエ変換の機能があったのでたぶん同じようなことができるでしょう。Pythonのいろんな音声関係のライブラリなんかも紹介できればと思います。当面の目標は、簡単な類似楽曲検索システムを作ることです。その後は、いろんなツール（HTKなど）を駆使して音声認識システムを作りたいと思ってます。このページは
- python
- 音声処理
- 音声認識
- 信号処理
- sound
- programming
- DSP
- 音声
- デジタル信号処理
- 音
音の良いポッドキャストを録音するために ― Turing Complete FMの収録テクニック｜Rui Ueyama
- 131 users
- note.com/ruiu
- テクノロジー
- 2018/04/24
僕は最近Turing Complete FMというポッドキャストを運営しているのですが、その収録のためにポッドキャスト録音テクニックを結構研究しました。ここではそのノウハウをシェアしようと思います。音がよくて聞きやすいポッドキャストの収録に役立ててもらえると幸いです。はじめにポッドキャストでは音質は死活的に重要です。音質の大切さは強調してしすぎることはないと思うのですが、この点は甘く見られがちなようです。音の悪い録音を何十分も聞くのは耳が辛くて不必要にストレスがかかります。よいコンテンツを届けたいのなら、音質という、コンテンツ以前の問題は解決しておくべきです。良い音質のポッドキャストを作成するためには、良い音質で録音する必要があります。良い録音から良い出力を作るのは簡単ですが、悪い録音から良い出力を作るのは、どんなにポストプロダクションを工夫してもほとんど不可能です。悪い音で録音してし
- podcast
- 録音
- audio
- マイク
- 音声
- テクニック
- あとで読む
- サウンド
- 音
初音ミクとも簡単に対話できる「MMDAgent」、その詳細を聞いてきた
- 126 users
- www.itmedia.co.jp
- 暮らし
- 2010/10/07
初音ミクなどのMMDと音声で対話できるようにするオープンソースツール「MMDAgent」を開発している名古屋工業大学のチームに、対話システムの作り方から、Sinsyの今後についても答えてもらった。ニコニコ動画で初音ミクなどのMMD（MikuMikuDance）キャラクターと音声で対話できるシステム「MMDAgent」を発表した名古屋工業大学が、CEATEC会場でデモを行っている。開発を担当した名古屋工業大学国際音声技術研究所の徳田恵一教授、李晃伸准教授、大浦圭一郎特任助教に話を聞いた。 MMDAgentはこう記述する ITmedia　デモを見せてもらいましたが、最初の質問の回答が出る前に別の質問をしてもうまく対応できるんですね。徳田教授　音声対話システムでは割り込みができず、命令が終わるまでじっと待っていなければならないものが多いのですが、MMDAgentは音声認識エンジンも自分たちで
- vocaloid
- 初音ミク
- MikuMikuDance
- 技術
- MMDAgent
- MMD
- インタビュー
- interview
- technology
- ITmedia
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
- 124 users
- dev.classmethod.jp
- テクノロジー
- 2022/09/23
こんちには。データアナリティクス事業本部機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…？と思っていたのですが… ですが… … … … おお！？(上記はGitHubにあるWER: Word Error Rateのグラフです) これは！？これは結構良さげな数値を出している！？(たぶん) ってことで元音声屋さんとしては、これは試すしかない！ということで動かしてみました！(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試
- 音声認識
- AI
- whisper
- あとで読む
- 機械学習
- OpenAI
- python
- 音声
- api
無料なのにココまでできる！音声認識アプリを使ったテキストおこし（基本編） | ライフハッカー・ジャパン
- 123 users
- www.lifehacker.jp
- 暮らし
- 2011/07/18
デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール
- 音声認識
- iphone
- iPhone
- アプリ
- スマートフォン
- iphoneアプリ
- ocr
- app
- 無料
- あとでみる
AppleのSiri搭載ホームスピーカー「HomePod」が登場、日本での発売時期は未定
- 122 users
- gigazine.net
- テクノロジー
- 2017/06/06
「Siriベースの音声認識端末」として開発がウワサされていた端末が、WWDC 2017の中で発表されました。発表されたSiri搭載のホームスピーカーの名称は「HomePod」で、iTunesやiPodなどで音楽に革命をもたらしてきたAppleによる「家の中での新しい音楽のかたち」を示す端末となっています。 Apple Events - WWDC Keynote, June 2017 - Apple https://www.apple.com/apple-events/june-2017/ 6つ目の発表は…… 「Apple×音楽」について。 AppleはこれまでiTunesやiPodなどで音楽に革命を起こしてきましたが…… 次は「家庭での音楽」に革命を起こします。家庭用スピーカーとしてはGoogle HomeやAmazon Alexaなどがありますが…… これらを超越したホームスピーカーを
- Apple
- スピーカー
- Home
- HomePod
- あとで読む
- 音楽
- music
OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
- 122 users
- inoccu.com
- テクノロジー
- 2022/09/26
OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は
- python
- whisper
- あとで読む
- mac
- AI
- インストール
- github
TechCrunch
- 119 users
- jp.techcrunch.com
- テクノロジー
- 2016/01/18
Identity and access giant Okta said a hacker broke into its customer support ticket system and stole sensitive files that can be used to break into the networks of Okta’s customers. Okta chief s
- ホログラム
- gatebox
- あとで読む
- ロボット
- VR
- gadget
- hologram
- 音声認識
- 3D
- ゲーム
iPhone 3G Sに触った！日本語音声コントロールのレスポンスに感動
- 118 users
- www.itmedia.co.jp
- 暮らし
- 2009/06/09
iPhone 3G Sに触った！日本語音声コントロールのレスポンスに感動：WWDC 2009現地リポート（1/2 ページ） Worldwide Developers Conference 2009（WWDC 2009）の基調講演で最大の目玉といえば、カメラ機能の強化と大幅なスピードアップを実現した新型iPhone「iPhone 3G S」だ。もっとも、このiPhone 3G S、フィル・シラー上級副社長による基調講演中も、スライドには表示されたものの、実機が出てくることはなかった。アメリカでは約10日後に発売されるというのに、本当にきちんと動いているのだろうか。この疑問は、WWDC 2009基調講演の直後に行われたグループインタビューセッションで氷解した――筆者は幸運にもグループの中で、ただ1人、このiPhone 3G Sを音声操作する幸運に恵まれた。そのときの模様をお伝えしよう。なお
- apple
- iPhone
- WWDC
- iPhone 3G S
- 林信行
- mobile
- mac
- 携帯電話
- review
- 音声認識
会話が見える！　世界最速の「リアルタイム字幕」にびっくり
- 117 users
- www.itmedia.co.jp
- テクノロジー
- 2018/02/28
会話が見える！　世界最速の「リアルタイム字幕」にびっくり：水曜インタビュー劇場（瞬時公演）（1/5 ページ）「UDトーク」というアプリをご存じだろうか。目の前の会話が次々に字幕になるサービスだが、その仕組みはどうなっているのか？　アプリを開発した青木秀仁さんに聞いたところ……。 2月某日、幕張メッセ（千葉市）。記事のネタを探すために、記者はとあるセミナーを聴講していたところ、大きなモニターに釘付けとなった。モニターには、登壇者の発言がリアルタイムで文字になって映し出されていたのだ。「ITmedia ビジネスオンラインって最高ね」と発言すると、瞬時に「ITmedia ビジネスオンラインって最高ね」と表示される。それだけではない。日本語の横で、英語のスペルも次々に並んでいたのだ。よーく見ると、ところどころで“おかしな日本語”も登場する。例えば、「ITmedia ビジネスオンラインって再考
NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics
- 116 users
- www.nii.ac.jp
- テクノロジー
- 2012/06/18
「情報学」は私たちが生活する社会をどう変え、未来にどのような価値を生み出すのか。国立情報学研究所（NII）の広報誌「NII Today」は、情報学研究の最先端をみなさまに分かりやすくお伝えします。 NII Today 国立情報学研究所ニュース国立情報学研究所ニュース学術情報センターニュース学術情報センターニュース
- NII
- 音声合成
- book
- あとで読む
- 学術情報
- 研究
- 音声認識
- 情報
- ebook
開店2カ月でリピーター比率25％の「ITレストラン」
- 116 users
- xtech.nikkei.com
- 暮らし
- 2006/10/16
慶応義塾大学に近い東京都港区芝に、開店2カ月にもかかわらず、早くもリピーター比率が25％に達した高級和食レストランがある。店の名は、「瑞宝」。今年8月7日にオープン。口コミだけで顧客層を拡大した。オープンからの2カ月で最大11回来た顧客もいるという。見た目では分からないが、瑞宝は「ITレストラン」という顔を持つ。店内のバックヤードにはサーバーラックが2本。飲食店としての業務の多くをIT（情報技術）で支援する。客席も含め無線LANが整備されている。瑞宝では、雰囲気を損なわないよう、店員は携帯情報端末やメモを使わない。その代わり、「音声CRMシステム」を活用。店員は顧客から「薄味が好き」「ネギが苦手」といった好みを聞き出し、バックヤードに戻ってからマイクに向かって聞き出した内容をしゃべる。音声認識ソフトを通してテキストデータとして記録。この内容は厨房のパソコン画面に表示され、調理のための情
- IT
- CRM
- business
- ビジネス
- マーケティング
- 食
- これはすごい
- restaurant
- レストラン
- Marketing
口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場
- 115 users
- japan.cnet.com
- 暮らし
- 2007/01/29
あるメロディを口ずさんでいるが、その曲のタイトルを知らなかったり思い出せずにいらいらしたことはないだろうか？そんな人のために、10秒以内に知りたい曲のタイトルを教えてくれるという新しいウェブサイト「Midomi」が登場した。米国時間1月26日にベータ版の運用を開始したMidomiでは、ユーザーが歌ったり、口ずさんだり、口笛を吹いて楽曲を検索できる。検索結果には、商用で提供されている楽曲のほか、他のユーザーが録音した楽曲も含まれている。ユーザーは、検索結果のうち自分の音声とマッチする部分のみを聞くこともできる。このほかにも、楽曲のタイトルやアーティスト名を使った検索も利用できる。同システムはスペルミスをしても認識する。 Midomiを開発および提供するMelodisは、200万以上のデジタル楽曲のライセンスを取得しており、ユーザーはこれを購入できる。また、ユーザーから集めた曲も1万200
- search
- music
- 検索
- 音声認識
- 音楽
- webサービス
- web
- サービス
- webservice
- cnet
フリーの iOS 向け音声認識／音声合成ライブラリ『OpenEars』の使い方 - その後のその後
- 115 users
- shu223.hatenablog.com
- テクノロジー
- 2013/08/10
OpenEars は Politepix 社より提供されているフリーの iOS 向け音声認識／音声合成（Text to Speech, TTS）ライブラリです。 OpenEars 話した言葉を認識したり、入力した文字列を読み上げたり（mac の say コマンドみたいなもの）することができます。試してみたところ超簡単に使えたので、自分のアプリに OpenEars を導入する方法を紹介します。音声合成の導入方法フレームワーク追加、ヘッダインポートといった一般的なライブラリの導入手順をのぞけば、基本的にはメソッドを1つ呼ぶだけで導入できます。 1. フレームワークをプロジェクトに追加解凍したフォルダ配下にあるFrameworkフォルダごとプロジェクトに追加します。フォルダには OpenEars.framework、Slt.framework ほか、言語モデルや辞書が入っています。また
- iOS
- 音声認識
- Objective-C
- 音声合成
- library
- iphone
- 開発
- フレームワーク
- framework
- ライブラリ
Google Homeを英会話の無料トレーニング教材にしてみる - プロクラシスト
- 114 users
- www.procrasist.com
- テクノロジー
- 2018/01/18
こんにちは、ほけきよです。我が家に、Google Home Miniが届きました！*1 Google Home Mini 友人がプレゼントしてくれたものです。スマートスピーカー、プレゼントに最適だと思うんですよ。新しくて、興味はあるけど、よくわからないし、自分では最後のひと押し踏み込めない。けれど、あればかなり楽しいです。この辺はAmazonのAlexaとかも一緒かな？もらってかなり嬉しかったですし、使ってみて更に感謝が深まった商品でした。で、こいつの効果的な活用法を考えて見たのですが、英語の練習に使えないかなと思って、色々試行錯誤しています。今回は、スマートスピーカーの使用例の一つとして、参考にしてみてください。 Google Home Miniの設定設定の仕方利用例気温や時刻を聞くアラームをセットするニュースを聞くゲームをする英語学習用アプリまとめ Go
http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html
- 114 users
- hil.t.u-tokyo.ac.jp/~galatea
- 暮らし
- 2005/02/25
- 音声合成
- 音声認識
- voice
- opensource
- オープンソース
- software
- Speech
- library
- Agent
- oss
【レビュー】夢の「音声自動書き起こし」はもうすぐ実現!? Microsoftの「Video Indexer」を試す～動画・録音の音声を自動でテキスト化し翻訳も
- 113 users
- pc.watch.impress.co.jp
- テクノロジー
- 2017/12/13
- Microsoft
- 音声認識
- AI
- webサービス
- 技術
- technology
- 動画
- 仕事
- トレンド
- 人工知能
「あれやって」主人のくせ予測する家電　アマゾンが着手：朝日新聞デジタル
- 112 users
- www.asahi.com
- 世の中
- 2018/09/23
デジタルトレンド・チェック！　「あれ、やっといてくれる？」と家の中で話しかけると、人工知能（ＡＩ）につながったスピーカーが「わかりました」と答えて用事を済ませてくれる。「あれ」は「テレビ番組の視聴予約」かも知れないし、「足りない日用品の注文」かも知れません。人が話すあいまいな言葉の文脈を解釈し、その意味を理解して、具体的に実行する──米アマゾン・ドット・コムが描いているのはそういう未来です。それは５～１０年程度の近い時期になる可能性もあります。同社は２０日（現地時間）、本社のある米シアトルで発表会を開催しました（写真１、２）。題材は、ＡＩを利用した音声アシスタント「Ａｌｅｘａ（アレクサ）」の関連製品です。音声で操作するスマートスピーカー「Ｅｃｈｏ（エコー）」シリーズが主軸で、日本でも昨年秋から発売されています。今回はそのＥｃｈｏシリーズがリニューアルし、新しいモデルになりました。しかし
TechCrunch
- 112 users
- jp.techcrunch.com
- テクノロジー
- 2014/03/11
Everyone more or less agrees that 2023 is going to be effectively written off in VC-land, as the feeding frenzy of the last few years leaves everyone exhausted, valuations flattened or crashed, and ex
- iOS
- iPhone
- iOS 7
- apple
- Siri
- アップデート
Start | 和歌山大学メディアインテリジェンス研究室
- 112 users
- w3voice.jp
- 暮らし
- 2007/04/10
和歌山大学メディアインテリジェンス研究室（西村竜一研究室）† 本研究室では、音声や画像、動画、自然言語、センサなどの「メディア」を活用した認識・理解の知的技術によって、人と人、人と機械の協働を豊かなものにするための教育・研究を行います。 2019年度から活動している研究室です。本研究室の学部生は、システム工学部メディアデザインメジャーに所属しています。大学院生の所属は、システム工学研究科知的モデリングクラスタです。なお、本研究室は、西村が所属（担当）するデータ・インテリジェンス教育研究部門及び学生自主創造支援部門（クリエ）とも協働することで教育・研究活動を進めています。今後は、社会インフォマティクス学環の学生の受入も行う予定です。 ↑ お知らせ† 2023/12/9 大学院生（M2）の日田さんが国立研究開発法人情報通信研究機構（NICT）の研究員みなさまと共著で発表した『複数話者
- 音声認識
- voice
- javascript
- 音声合成
- service
- 音声
- webサービス
- 研究
- 録音
- java
AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に
- 111 users
- www.publickey1.jp
- テクノロジー
- 2021/04/07
AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に Amazon Lexを利用することで、「すべてのデベロッパーがAmazon Alexaに採用されている深層学習技術と同じ技術を利用できる」（Amazon Lexの説明文から）とされています。 Amazon Lexは、自動音声認識による音声からテキストへの変換機能と、テキストの内容からその意図を認識する自然言語理解機能を備えています。つまり、電話やオンライン会議などを経由して日本語の音声をAmazon Lexに入力すると、いわゆる文字起こしのようにその内容をテキストに変換してくれます。そしてこの音声から変換されたテキストや、Slackなどのテキストチャットなどで入力されたテキストの内容から、Amazon Lexはその意図などを理解し、会話の中から必要な
- 音声認識
- あとで読む
- aws
- amazon
- alexa
- 日本語
- 機械学習
- ダジャレ
Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
- 111 users
- mizchi.hatenablog.com
- テクノロジー
- 2017/09/04
はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ
- google
- 音声認識
- 文字起こし
- Mizchi
- API
- あとで読む
- 音声
- voice
- document
- 仕事
［速報］「Amazon AI」として、画像認識／テキスト音声変換／音声認識と自然言語理解の3つを発表。AWS re:Invent 2016
- 108 users
- www.publickey1.jp
- テクノロジー
- 2016/12/01
Amazon Web Servicesは、ラスベガスで開幕した同社のイベント「AWS re:Invent 2016」で、「Amazon AI」傘下のサービスとして、画像認識、テキスト音声変換、音声認識と自然言語理解の3つを発表しました。
Amazonのハードウェア史上最大のヒット商品になったスピーカー型音声アシスタント「Amazon Echo」誕生秘話
- 108 users
- gigazine.net
- テクノロジー
- 2016/04/05
話しかけるとすぐに応答し、まるで人間と会話していると錯覚するほど流ちょうな言葉で返答してくれるスピーカータイプの音声アシスタント端末「Amazon Echo」は、英語圏では大ヒット商品になっています。Amazonのカスタマーレビューで3人に2人は☆5つを付けるほど高い満足度を生みだし、Amazonの次の10億ドル(約1100億円)ビジネスになるとも言われるEchoの開発秘話について、Amazon幹部が明らかにしています。 The inside story of how Amazon created Echo - Business Insider http://www.businessinsider.com/the-inside-story-of-how-amazon-created-echo-2016-4 Apmazon幹部のデイブ・リンプ氏はBusiness Insiderの取材に対して
- amazon
- 音声認識
- ハードウェア
- Echo
- 技術
- あとで読む
- 家電
サムスン製テレビが会話に聞き耳？　音声認識機能に注意喚起
- 105 users
- www.cnn.co.jp
- テクノロジー
- 2015/02/10
ニューヨーク（ＣＮＮＭｏｎｅｙ）サムスン製テレビの前では発言に気を付けた方がいい。テレビの前で話した言葉はすべて傍受され、インターネットを介して送信されている――。音声でテレビを操作できる「スマートＴＶ」について、韓国サムスン電子がそんな内容の告知を掲載した。この告知は同社のスマートＴＶのプライバシーポリシーに掲載された。「私的な会話や重要な情報を含め、言葉を発すればその情報がデータとして傍受され、音声認識機能を通じて第三者に送信されますのでご注意ください」と呼びかける内容。サムスンによれば、テレビを音声で操作するためには、発話内容を第三者に送信して音声を文字に変換する必要がある。同社はさらに、この機能を改善する必要があるかどうか見極めるための調査目的でも音声内容を収集しているという。第三者の社名や、その会社が音声データを録音しているかどうかについて、サムスンから返答はなかった。
- 家電
- privacy
- サムスン
- security
- プライバシー
- テレビ
- TV
- セキュリティ
- Samsung
- CNN
音声認識入門！Web Speech APIを使いChromeブラウザを音声操作するWebアプリ開発術を公開！ - paiza times
- 104 users
- paiza.hatenablog.com
- テクノロジー
- 2016/07/05
どうも、まさとらん（@0310lan）です。みなさんは、音声認識を活用していますか？例えば、iOSの「Siri」と会話してみたり、Androidなら「OK Google」と喋って検索した経験があるのではないでしょうか？今回は、このような音声認識を利用し、PCのChromeブラウザに喋りかけることで動作するサンプルデモのチュートリアルをご紹介しようと思います！ ■音声認識に必要なAPIとは？まず最初に必要なのが、自分の「声」を音声として認識してくれるAPIなのですが、実はPCのChromeブラウザであれば今すぐJavaScriptから利用できるようになっています。 Web Speech API：ブラウザ対応状況「Web Speech API」を使うことで、特別なツールをインストールしたり、余計なライブラリを読み込む必要は無いわけです。ちなみに、このAPIには大きく分けて「音声認識
- 音声認識
- API
- javascript
- chrome
- プログラミング
- google
- 機械学習
- HTML5
- あとで読む
音声認識のしくみ
- 104 users
- recognition.web.fc2.com
- おもしろ
- 2006/01/30
音声認識を紹介するページとにかくここでは、だらだらと「音声認識」というモノを紹介します。全体が（ほぼ）このページ一枚に収まっています。ところどころにリンクがありますが、そのリンク先には、難しい話やこぼれ話みたいなものがちょこちょことあります。ところで、話を簡単にするために、ちょっと嘘を混ぜています。そうでないと、ものすごく複雑な話になるので。音声認識ってなにさ簡単に言ってしまえば、人間が喋った声を機械が文字に直すことです。図で描くとこんな感じです。左側が音声波形（つまり、声を図に表している）で、右側がそれをひらがなに直したものです。左側の音声波形を少し詳しく見てみる人間は耳で音を聞きますが、機械はマイクで音を聞きます。そして、マイクで収録された音をそのまま表示させると、下のような感じになります。横軸が時刻で、縦軸が振幅です。音声というのは、ようす
- 音声認識
- 研究
- SpeechRecognition
- algorithm
- 音声
- 資料
- technology
- speech
- まとめ
［速報］「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開
- 103 users
- www.publickey1.jp
- テクノロジー
- 2022/11/10
［速報］「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開 GitHubは、年次イベント「GitHub Universe 2022」の基調講演で、音声によるGitHubの操作やコーディングを可能にする実験的機能「Hey, GitHub!」をプレビュー公開しました。 'Hey, GitHub!' is an experiment from the GitHub Next team that aims to reduce the need for a keyboard by enabling voice-based interaction with GitHub Copilot. Sign up now to join the waitlist: https://t.co/4YOSuA6cUr — GitHub (@github
سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر
- 103 users
- shabetter.net
- 暮らし
- 2009/10/14
این لیست نهایی بهترین سایت های شرط بندی در این تجارت است. ما هر یک از این سایت ها را تحت یک روند دقیق بررسی قرار داده ایم، و همه آنها امتیازات بالایی را در معیارهای اصلی کسب کرده اند. شما می توانید در هر یک از این سایت های شرط بندی ثبت نام کرده و مطمئن باشید که آنها سابقه طولانی در پرداخت سریع، رفتار عادلانه با مشتری و ایمن نگه داشتن اطلاعات شما دارند. ”بیشتربخوانید” متخصصان نقد و بررسی ما همگی در
｢お尻洗って｣と、ウォシュレットに話しかける時代が来た #CES2024
- 103 users
- www.gizmodo.jp
- テクノロジー
- 2024/01/19
｢お尻洗って｣と、ウォシュレットに話しかける時代が来た2024.01.19 08:006,460 Florence Ion - Gizmodo US ［原文］（湯木進悟）これぞベスト機能では？ウォシュレットが登場したとき、その新感覚に驚いたことを覚えている人もいるでしょう。いまではすっかりトイレの標準機能になっていますけど、今年の｢CES 2024｣では、意外なる新機能がデビューを果たしていましたよ。音声認識でコントロール可能にそもそも当たり前のように、ウォシュレットのボタンを指でタッチしていますけど、もし一切なににも触れずコントロールできたら、衛生面でも最高だったり？ Kohlerは、そんな願いをかなえる｢PureWash Bidet Seat｣を発表しました。 Image: Kohlerなんと音声認識アシスタントとなる、AmazonのAlexaまたはGoogle Assis
自動文字起こしもできる！Speechnotesがスゴイ！
- 102 users
- hokoxjouhou.blog105.fc2.com
- テクノロジー
- 2018/04/03
情報管理LOGの@yoshinonです。このところ自動で文字起こしというのが、自分の中で流行っているのですが、一長一短それぞれあるのですよね。その中でも、２月に記事にした「Windowsでも自動文字起こしができる！議事録はGoogleドキュメントに任せろ」という記事が大きな反響があり驚きました。皆さんきっと同じ悩みを持っているのでしょうね。今回は、前回のGoogleドキュメントを用いた文字起こしよりも、さらにもう少しワンランク上の自動化ができるぞ！というSpeechnotesについてご紹介します。２月に書いた「Windowsでも自動文字起こしができる！議事録はGoogleドキュメントに任せろ」という記事が、割とバズり、様々なところで取り上げていただきました。ありがたいことです。 Bookmarklet: instantly generate a Card for any web pa
誰でも手軽にNTTドコモのサービスのような機能を持つアプリが作れる～「docomo Developer support」の概要とAPIコンソール
- 102 users
- codezine.jp
- テクノロジー
- 2014/11/21
はじめに第1回目の本稿は、「docomo Developer support」の概要と、手軽に機能が試せるAPIコンソールの使い方を解説しましょう（本稿は、2014年11月19日時点の最新情報に基づいております）。対象読者 JavaとEclipseを用いたAndroidアプリの開発で、基本的な知識がある方を対象とします。「docomo Developer support」とは「docomo Developer support」は、NTTドコモが開発者向けに情報を提供しているサイトで、2013年11月11日に開設されています。このサイトでは、ハッカソンなどのイベント情報も提供されていますが、メインとなるのは、さまざまな開発に活用できるAPIやツールの情報です。 APIとは「Application Programming Interface」の略で、あるプログラムの機能を外部のアプリケ
- API
- DoCoMo
- android
- API特集
- アプリ
- IoT
- Android開発
- 音声認識
- WebAPI
- ドコモ