エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
音声認識のドメイン適応のために最適なデータセットを抽出する方法
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
音声認識のドメイン適応のために最適なデータセットを抽出する方法
こんにちは、音声認識技術の研究開発を担当している篠原です。 この記事では、音声認識モデルのドメイン... こんにちは、音声認識技術の研究開発を担当している篠原です。 この記事では、音声認識モデルのドメイン適応のために最適なデータセットを抽出する技術について紹介します。汎用データセットから目的ドメインのデータセットを擬似的に生成できるため、特定用途向けのカスタムモデルの構築(ドメイン適応)を低コストで実現できます。 なお本技術は、米国カーネギーメロン大学の渡部晋治准教授との共同研究を通して考案したものです。詳細については、国際会議 ASRU 2023(IEEE Automatic Speech Recognition and Understanding Workshop 2023)で発表していますので、興味がある方はぜひ論文 [1] もご覧ください。 はじめに 音声認識とは? 音声認識は入力された音声をテキストに変換する技術です。たとえば、スマートフォンでの音声によるウェブ検索などで使われていま