タグ

音声認識と感情認識に関するDrunkarのブックマーク (1)

  • openSMILEを使ってみる

    論文を調べていたらinterspeech2009で感情認識のChallengeが行われていた。 そこで、使われているのがopenSMILEという特徴量抽出用のプログラム。 いろいろな音声認識音楽認識、などなどで用いられる特徴量ががっつり計算できる上にWEKA用のarffでも書き出せるようにしているらしい。 というか、2009年でも一つの音声ファイルに対して384次元の特徴ベクトルを計算してくれる。 2010年用だと1000超えてたり、なんかすごいことになってる気もする。 ちなみに、binで落としてもlinux/windows両方の実行ファイルが入ってるのでそちらが楽ではある。 SSE対応や64bit対応もしてるし。 でも、やっぱりソースからコンパイルしてみたい。 コンパイルはbookを見るとスクリプト一発だぜーと書いてあるような気がしたのだが、よく見たら細かい手順が書いてあった。 ダウン

    openSMILEを使ってみる
  • 1