自動車における複数話者による音声認識品質への影響について
バックグラウンドノイズや複数の人が会話をしていると、車内での音声認識品質が低下します。Kardome社の位置情報に基づいた信号分離ソフトウェアがどのようにノイズをカットするかについての研究をお読みください。
1980年代半ば、ビュイックは新型高級セダン「リビエラ」に、9インチスクリーンを備えた「エンターテインメント」と「インフォメーション」の融合システムを発表した。しかし、残念ながらこの未来的な豪華さは定着しなかった。
20年経った今、車載インフォテイメントは、お客様が新車を購入する際に最も重要な要素の一つとなってい ます。
現在、各メーカーはエコノミーカーに、複数の音声による作業を可能にする高度なインフォテイメントシステムを搭載しています。
音声対話は、コネクテッドカーのインフォテインメントシステムが果たす最も重要な機能の一つです。私たちは、ハンズフリーで電話をかけたり、道案内や予約、音楽再生などのタスクを行うために、音声対話を利用しています。
私たちは最終的に、音声対話を使って車を操作し、さらには運転するようになるでしょう。したがって、車内での使用は、音声アシスタント導入の重要な推進力となります。
ハンズフリー通話を考慮すると、多くのインフォテインメントシステムの音声品質は許容範囲内です。さらに、すべてとは言わないまでも、大部分のシステムは、ロードノイズがあっても、国際電気通信連合(ITU)の P.1100規格に準拠しています。
しかし、以前の記事「車内での音声認識 - VUIの実験的研究」でも述べたように、車内では道路や風などのバックグラウンドノイズが音声認識品質を低下させ、音声アシスタントの性能に悪影響を与えます。
さらに、複数の人が話していると、音声認識の品質にも影響を与えます。
音声・振動解析のグローバルリーダーであるHEAD Acoustics, GmbHと共同で、車内でのハンズフリーテレフォニーの音声品質を、複数人が同時に話すユースケースに焦点を当てて解析しました。
また、0km/hから120km/hまでの速度で、音声認識率のテストと音声品質の分析を行いました。調査は、ルノー・メガーヌGRAND TOURの既存のインフォテイメントシステムを用いて行いました。
この2段階の研究では、Kardome社の位置情報に基づく音源分離技術が、既存の車載ハンズフリーテレフォニー(HFT)や音声認識システムを上回ることが示されました。
この研究の全文を読むには、以下に登録してください。