この記事には広告を含む場合があります。 記事内で紹介する商品を購入することで、当サイトに売り上げの一部が還元されることがあります。
Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. Googleの新アプリが凄すぎる。リアルタイム文字変換の精度がエグいGoogleの音声文字変換のAndroidアプリ「Live Transcribe」がすごいのです。YouTubeなどの音源までをも機械学習で取り込み、字幕の精度をあげている同社。今後の展開は、Gmail、Google Driveなどを運営するG Suiteと一緒にビジネス展開もありえるかも…!?
米Burger Kingが「OK Google、ワッパーって何?」という音声を流すテレビCMを放映し、音声アシスタント「Google Home」がこれに反応してWikipediaの「ワッパー」の説明を読み上げていたが、数時間後には反応しなくなった。 「OK Google、ワッパーって何?」──。米ファストフードチェーンBurger Kingが4月12日(現地時間)のゴールデンタイムにこう話すテレビCMを放映した。米The Vergeなど複数の米メディアによると、米Googleの音声認識アシスタント端末「Google Home」やスマートフォンの「Google Assistant」がこの音声に反応し、Wikipediaの「ワッパー」についての説明を読み上げたという。 ワッパー(Whopper)は、もともとは非常に大きなもの、という意味だが、Burger Kingの人気メニューの1つであるハン
昨今話題になっている音声認識デバイス。一番身近なところでは、iPhoneのSiriやアンドロイドに搭載された会話認識機能が思い浮かぶ。昨年に大ヒットした、話しかけて操作するAmazonの人工知能スピーカー『エコー(Echo)』もその一つだ。エコーに話しかければ、搭載されたAI「アレクサ(Alexa)」が情報を処理。ネット検索はもちろん、天気予報を聞いたり、アラームをセットしたり、音楽を再生させたりできる。その上、「アマゾンの商品を注文する」という機能まであるから驚きだ。しかし最近では、このエコーで思わぬハプニングが起きている。 ことの発端はアメリカのダラスに住む6歳の女の子がアマゾンエコーに「ドールハウスとクッキーを買って」とお願いしたことだ。数日後、約160ドル(約1万8千円)相当のドールハウスと2kgにもなる大量のクッキーが家へ配達されて、女の子の母親はびっくり。結果、届いた高価なドー
すべてはドライバーの安全のために。 iOS 8からの新機能でホームボタンを長押ししなくても「Hey Siri」と言えばSiriが起動するようになりましたが、その機能をうまく使った広告です。 日本では違法にもなっている運転中のながらスマホ。まだまだ徹底されていないようでスマホを触っている間の交通事故はなくなりません。そこでトヨタが考えたのがこちらの広告です。 ラジオから「Hey Siri. Please turn airplane mode on. (Siri、機内モードをオンにして)」と流れてくるんですね。このCMが流れると、iPhoneを使っているドライバーは自動的に機内モードになってしまうんです。 このCMはスウェーデンで朝と夕方の通勤ラッシュ時間に流れるようですが、もっと広まれば世界で事故が少なくなるかもしれません。トヨタからのSirious(シリアス)なメッセージでした(Siriだ
不特定話者認識フレーズのカスタム登録について 当方で販売中の音声認識ボード(型式:SR-MOD100C)では32語の特定話者フレーズ(特定の人の声のみ認識できるフレーズ)が登録できます。また、あらかじめ25語の不特定話者フレーズ(誰の声でも認識できるフレーズ)が登録されています。特定話者フレーズはお客様自身でフレーズの登録ができます。(特定話者フレーズはSDフレーズといいます。 不特定話者フレーズ(SIフレーズといいます)は誰が発声しても認識するフレーズです。SIフレーズはお客様ご自身では登録できません。本サービスでは、SIフレーズをSR-MOD100C本体に無償で8フレーズまで登録できるサービスです。(9フレーズ以上は有償となり、最大24フレーズまで登録できます。) このサービスを利用してSIフレーズを登録すると、話者が誰であってもその発話内容を認識できるようになります。 SIフレーズは
The error was detected while processing this request. Be sure of followings: The CGI script does exist. The permission of CGI script is 755. The Perl path in CGI script is #!/usr/local/bin/perl. CGIスクリプトの呼び出し中にエラーが発生しました。 下記の点をご確認ください。 ・CGIスクリプトが存在すること。 ・CGIスクリプトのパーミッションが755であること。 ・CGIスクリプトのperlのパスが #!/usr/local/bin/perl であること。
はじめに 最近は音声認識による家電操作などがCMでも流れている。 自分でもとりあえず音声認識してWebが操作できるものが作りたい! と思い立ち、作ってみた。 とはいえ、先人の人が既に作り方を公開していらっしゃるので そちらを参考に気が付いた点だけ補足していきます。 用意したもの 今回用意したものは以下のとおり RaspberryPi(Model A) SDカード(32GB) PLANEX GW-USNano2 Logitech, Inc. QuickCam Pro 4000 スピーカー microUSBケーブル USB AC電源アダプター miniUSBケーブル Web表示用PC 音声入力(USBマイク設定) 認識させるための音声を拾うために音声入力の設定をします。 こちらが参考になります。 Raspberry Piで音声認識 - 猫ぱーんち! Devel/電子工作/RaspberryPi
参考サイト。 Devel/電子工作/RaspberryPi/日本語音声認識 - cubic9.com http://www.orsx.net/blog/archives/4938 USBマイクの設定 USBオーディオの使用優先度を確認する。 $ cat /proc/asound/modulessnd_bcm2835は内蔵オーディオで、snd_usb_audioはUSBオーディオのようです。 0 snd_bcm2835 1 snd_usb_audioUSBオーディオの優先度を上げる。 $ sudo nano /etc/modprobe.d/alsa-base.confsnd-usb-audioのindexを-2から0に変更する。 options snd-usb-audio index=0Raspberry Piを再起動する。 sudo shutdown -r nowUSBオーディオの使用優先
最近、スマホ制御や音声制御できる家電が話題になっているで低価格かつ比較的簡単に構築できるか試してみました。 iRemoconなど便利な製品も出ているのに何故自作かといいますと。。。 失礼ながらこの製品がお高いのと、将来的な機能拡張を考えると圧倒的に自作に分があると考えたからです。 簡単な解説動画を制作してみました 達成目標 スマホ等からリモートで操作できること 音声だけで何も触れずに操作できること なるべく低価格で構築すること なるべく単純なスクリプトで実装すること 自宅サーバを構築しているような感覚で構築できること ハードウエア Raspberry Pi Type B USB接続 赤外線リモコンキット GW-USValue-EZ(無線LAN子機) TEMPer V23.5(温度計) MM-MCUSB21BK(マイク) MS-UP201BK(スピーカー) U2H-EG4SWH(セルフパワ
$ julius -nostrip -C `brew --prefix julius-dictation-kit`/share/main.jconf -C `brew --prefix julius-dictation-kit`/share/am-gmm.jconf ### read waveform input STAT: AD-in thread created <<< please speak >>>Warning: strip: sample 0-4095 is invalid, stripped Warning: strip: sample 0-4095 is invalid, stripped Warning: strip: sample 0-4095 is invalid, stripped Warning: strip: sample 0-4095 is invalid,
2011年10月31日02:27 by kosuken 音声認識エンジンjuliusをLionで試してみた カテゴリmac音・音響 専攻は音響学です。どうもこんにちは 先日バイト先で、前職で音声認識サービスを扱っていたというTさんからjuliusなる音声認識エンジンを教えてもらいました。以前からそういったものがあることは一応小耳に挟んではいたのですが、実際に目の前でデモを見せてもらうとちょっとした感動がありましたんで、自分でもインストールしてここで皆さんに紹介したいと思います。 さて、juliusに何が出来るかと言うと、所謂音声認識です。 具体的にどういう処理をしているかはドキュメントもソースコードもまだちゃんとは追ってないので詳しくは言えませんが、恐らく「音声を入力して、信号処理をして、最終的には辞書ファイルに登録された語とのマッチングをテキストベースで行なっている」と考えればそう遠くは
音声認識ソフトであるjuliusをMBAにインストールした。バージョンとしては2013年9月4日現在最新のjulius4.2.3になる。 環境によってたまにハマる場合もあるみたいだけど、基本的にはMacOS 10.8でMountain Lionの場合は PortAudio入れる Julius入れる(--with-mictype=portaudioする) DictationKit入れる だけで動くはず。もちろん詳しく使うには自分で辞書データ用意したり色々いじったりする必要あるけど。なんでPortAudioなのかというと、OS X標準のCoreAudioが使えないから(これはもしかしたら解決されてるかもしれない)。そこらへんの話は前のブログ1で書いた。まぁともかく入れば良いし、この分野では(恐らく)枯れてるPortAudio使えばそんなに困らないからそうしてる。 INSTALL んで、さっそく
前提 OS X用のパッケージ管理ツール Homebrew がインストールされている必要があります。 インストール方法はこちらを参照。 インストール デフォルトのHomebrewリポジトリにJuliusは含まれていないので homebrew-nlp をtapします。
----------------------- System Information end ----------------------- Notice for feature extraction (01), ************************************************************* * Cepstral mean normalization for real-time decoding: * * NOTICE: The first input may not be recognized, since * * no initial mean is available on startup. * ************************************************************* Stat: adin_
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く