民生用音声端末における音声認識技術の向上
従来のアルゴリズムと比較して、音声認識の精度が90%以上であることを示す研究。
背景雑音や残響、エコー、話者からの距離など、多くの要因が ASR システムの性能に影響します。
以下の研究は、これらの課題を論じ、音声および音声認識デバイスのために、より正確で明瞭なASRパフォーマンスを生み出すソリューションを検討するものである。Kardomeの音声認識強化技術が業界の標準的なアルゴリズムを凌駕していることを示しています。
我々は、最も静かな環境から最も騒々しい環境まで、様々な環境におけるASRパフォーマンスを調査することで、Wake Word誤検出率と応答精度率を測定しています。
この研究では、次のような性能指標を調べています。