タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

音声認識に関するchezouのブックマーク (4)

  • 音声認識でかつてNNがHMMに敗北した状況まとめ

    音声認識を長年研究されている @akinori_ito 先生が、2000年以前に起こったNNとHMMの競争の流れについてツイートしてくださいました。

    音声認識でかつてNNがHMMに敗北した状況まとめ
  • ルールベースjuliusの誤認識対策にSVMを利用してみよう - お前の血は何色だ!! 4

    前回やったことの続きです。 ルールベースの音声認識をjuliusでやったときに過剰にマッチしまくる問題への対策です。 前回、juliusのクセを観察し、独自のスコアリングをやりました。 多少は誤認識に強くなったのですが、それでも人と人が会話や議論するような短文のやり取りにさらされると、やっぱり誤認識してしまいます。 SVM もう、これは単純なパラメータの閾値では無理です。 ある閾値がそれを超えたら捨てるなどの単純な話ではないのです。 複数のパラメータが複雑に絡み合った世界です。 それをニンゲンの手で観察し、推論していては時間が膨大にかかってしまいます。 人間でやると大変なことは、機械にやらせましょう。 と、いうわけで、機械学習です。 今回は、機会学習の中からSVMを利用します。 SVMは精度もさることながら、学習速度はやや問題があるものの、判別は高速ですし、何よりライブラリが比較的揃ってお

    ルールベースjuliusの誤認識対策にSVMを利用してみよう - お前の血は何色だ!! 4
  • 引越ししたので未来なお部屋を作ってみた。 - お前の血は何色だ!! 4

    年の瀬に引越ししたので、部屋の再構築を行った。 コンセプトは快適に引き篭もれる未来の部屋。 その紹介をしたいと思う。 図面 一部省略の図面、古い建物なのでちょっと広い。 10m2 * 2部屋ぐらい。 何度か検討を繰り返してこの形式に落ち着いた。 カーテンを100インチのディスプレイにしてみた カーテンレールに100インチのスクリーンを釣り下げてみた。 カーテンが支えられるんだから、100インチのスクリーンぐらい支えられるだろうという発想。 カーテンレールに入れるのにLANケーブル用のマーカータイを使ってみた。 束ねれば結構強固である。 スクリーンの後ろは黒塗りされているので裏写りはないと思うけど、念のための裏写り防止のためと、昼間でも投影できるように暗室を作りたかったので、暗室用のブラックカーテンを後ろに引いている。 プロジェクターはNECの NP-U310WJD 短焦点プロジェクターを使

    引越ししたので未来なお部屋を作ってみた。 - お前の血は何色だ!! 4
    chezou
    chezou 2012/01/06
    音声認識って個人でほいほい作れる時代になったのね。後でソースよもう。大手家電メーカが10年たってもできない事を個人でできちゃう時代なのね。考えさせられるわ
  • ニコニコ動画やYouTubeの音声をテキスト化する「PodCastle」 | スラド IT

    産総研は、インターネット上の動画音声データを対象とした音声全文検索・書き起こしサービス「PodCastle」を一般公開し、音声情報検索技術の実証実験を開始した(プレスリリース)。 音声認識技術によって動画音声データをテキスト化し、誤りをユーザーに訂正してもらうことで認識結果だけでなく認識精度も向上していくというもの。産総研では2008年から日語のポッドキャストを対象とした音声全文検索サービスを公開し、ユーザーの協力により認識精度が向上することを実証していた。今回はポッドキャストに加えてニコニコ動画、YouTube、Ustreamに対応し、日語と英語音声認識および検索が可能となっている。 実際の認識例を見ると、報道系などについては比較的精度良くテキスト化できているが、トーク番組などのバラエティ系はあまり精度が高くないように見受けられる。ユーザーの訂正により、認識精度はどれぐらい向上する

    chezou
    chezou 2011/10/15
    産総研の後藤さん頑張ってるなー
  • 1