タグ

音声認識に関するhecomiのブックマーク (8)

  • メル周波数ケプストラム(MFCC) - Miyazawa’s Pukiwiki 公開版

    スペクトラム(spectrum)とは † 音声や地震波などの周期性のある信号は、どれだけ複雑な信号であっても、単純な波に分解できる(フーリエの定理) 単純な波...単一の周波数と振幅をもつ正弦波、余弦波 上記の定理に従って、ある信号の周波数成分と振幅の成分を抽出したものが、周波数スペクトラム(スペクトル)です*1。 スペクトラムの求め方(MATLABによる説明) 以下のような複雑な波を考えます。 MATLABで上の波を生成するには、以下のコードを実行 time = 0 : 1 / 8820 : 0.05; sinwav_1 = 1.2 * sin(2 * pi * 130 * time); coswav_1 = 0.9 * cos(2 * pi * 200 * time); sinwav_2 = 1.8 * sin(2 * pi * 260 * time); coswav_2 = 1.4

  • heyheytower

    Pic.1 Any.do でのToDoリストの様子 目次 目的 概要 方法 ToDoアプリの選定 タスク管理ソフト "Any.do" と Slack を連動する方法 未処理タスクのリマインド実行の実装 まとめ 目的 以前のエントリ家庭内の情報共有(Slack, Trello, IFTTT, HUBOT, Zaim, MyThings) - heyheytowerで家庭内の情報共有についてまとめておりました。 今回 Alexa Echo Plus を購入したので、Alexa の "買い物リスト"、"やることリスト" と自分の定期タスク管理を連動したく、ToDoアプリ選定・Slack*1 連動を目的としました。 概要 エントリでは下記の調査・実施を行った。 Alexa の "買い物リスト"、"やることリスト" と連動できるToDoアプリの選定(Any.do一択でした) タスク管理ソフト "A

    heyheytower
    hecomi
    hecomi 2012/11/30
    OpenHRI ってこんなこと出来たのか…
  • Kinect for Windows SDK beta で遊んでみた 〜 Kinectで音声認識した英語を日本語に翻訳する 〜 #shibuya_ni - Natural Software

    最近KinectでSpeechを使った音声認識の情報がぽろぽろ出始めたので少しやってみました。 Speechサンプルの動作に必要なファイル Speech サンプル (x86 のみ)を動作させるには、次の3つをインストールする必要があります。これらをインストールしてSpeechサンプルが動作すること(red,blue,greenの声を認識すること)を確認してください。 Microsoft Speech Platform - Server Runtime, バージョン 10.2 (x86 エディション)(英語) Microsoft Speech Platform - Software Development Kit, バージョン 10.2 (x86 エディション)(英語) Kinect for Windows Runtime Language Pack, バージョン 0.9(Kinect fo

    Kinect for Windows SDK beta で遊んでみた 〜 Kinectで音声認識した英語を日本語に翻訳する 〜 #shibuya_ni - Natural Software
  • 音声認識の誤認識フィルタとしての機械学習

    えんいー\e 6/6 4/6 5/6 2/6 1/6 3/6 Regexp Assemble for PHP 未来の部屋 jubatus や cabochaの勝手 yumリポジトリ 新潟アクセス修飾子 自己紹介 sexyhook テスト用の接合部の作成 なのは完売 とある関数のバトルプログラム perlの魔術的ライブラリ Regexp AssembleをPHPに移植。 正規表現を機械的に作成する。 音声認識を利用して 家電制御を制御する 未来の部屋 11月ぐらいに 勝手yumサイト作りました。 2コマンドだけで、 インストールできます。 こんばんは

    音声認識の誤認識フィルタとしての機械学習
  • 音声認識リモコン作ってみた - 無能日記

    ■ はじめに "引越ししたので未来なお部屋を作ってみた。"(http://d.hatena.ne.jp/rti7743/20120104/1325668680) に触発されて、音声認識リモコンをつくってみた。 tx-50が放置ぎみだったので、せっかくなのでmeegoの勉強もかねてやってみました。 デモ動画 ニコニコ動画: http://www.nicovideo.jp/watch/sm17331743 youtube: http://youtu.be/6aj0XceO5fo ■ 技術的な話 今回はMeeGoに慣れるのに時間がかかった。というか結局最後まで慣れなかった。 TX-50にMeego入れて動かすまでは http://blog.livedoor.jp/furikku9310/archives/52213664.html ここら辺にまとまっててさっくり行きました。ありがとうございます。

  • Evernote Blog � Blog Archive � New updates to Web and Windows

    에버노트에 뭐가 새로워요?에버노트에서 무슨 일이 일어나고 있는지 궁금하신가요? 아래의 기사들을 확인하여 우리가 작업 중인 흥미로운 것들을 모두 볼 수 있습니다. 새로운 소식레거시 버전 Evernote 앱 사용 중지2024년 3월 26일, 저희는 레거시 버전 Evernote 앱에 작별을 고합니다. v10 이전의 Evernote 경험을 단일화하면 보안 수준을 크게 높이고 더 빠른 개발을 위해 더 많은 자원을 투입할 수 있습니다. 더 읽기 14가지 주요 기능이 이제 모든 사용자에게 제공됩니다이 중요한 Evernote 기능들은 검색, 첨부 관리, 노트 액세스 등 핵심적인 제품 성능을 높여줍니다. 이제 누구나 그 기능을 사용해 Evernote의 잠재성을 최대한 활용할 수 있습니다.

    Evernote Blog � Blog Archive � New updates to Web and Windows
  • 音声認識+測距センサー - 猫ぱーんち!

    音声リモコンのトリガーとして、赤外線の測距センサーを使ってみました。 ブレッドボードのサイドについてるのがそれで、シャープのセンサーSHARP 2Y0A21です。1000円弱くらい。ちょっと高い。 回路は前回のリモコンの受信送信のやつからセンサーと動作インジケータ用のLEDがついて、あと少し修正も入れています。 2013.12.23 回路図修正(Ir-LEDの直列抵抗値変更) ソフトは、Arduinoのスケッチ(lemon_squash)、ホスト側のサーバ(lemon_squashd)、リモコンコマンド送信アプリ(lemon_corn)、音声認識アプリ(lemon_pie)とを下図左の構成で作りました。 どれだけ意味があるかわかりませんが一応全部githubに置いてます。一発動かしただけなのでまだソース汚いかもしれないです。 https://github.com/penkoba/lemon

    音声認識+測距センサー - 猫ぱーんち!
  • 音声認識のしくみ

    音声認識を紹介するページ とにかくここでは、 だらだらと「音声認識」というモノを紹介します。 全体が(ほぼ)このページ一枚に収まっています。 ところどころにリンクがありますが、 そのリンク先には、 難しい話やこぼれ話みたいなものがちょこちょことあります。 ところで、話を簡単にするために、 ちょっと嘘を混ぜています。 そうでないと、ものすごく複雑な話になるので。 音声認識ってなにさ 簡単に言ってしまえば、 人間が喋った声を機械が文字に直すことです。 図で描くとこんな感じです。 左側が音声波形(つまり、声を図に表している)で、 右側がそれをひらがなに直したものです。 左側の音声波形を少し詳しく見てみる 人間は耳で音を聞きますが、 機械はマイクで音を聞きます。 そして、マイクで収録された音をそのまま表示させると、 下のような感じになります。 横軸が時刻で、縦軸が振幅です。 音声というのは、ようす

  • 1