音声の確実な認識

スピーチエンハンサー

KardomeのAIによる信号分離とノイズ低減技術は、静かな環境から混沌とした環境まで、あらゆる音響環境でシームレスな音声認識体験を可能にします。

ASRエンジンの音声強調技術
仕組み

Kardomeによるデバイスの音声ユーザーインターフェース改善方法についてご紹介します。

Kardomeと他のオーディオフロントエンドソリューションとの決定的な違いは、弊社技術が位置情報に基づいて音声信号をクラスタリングしていることです。

Kardomeの音源分離ソフトウェアでは、どのような環境においても、各人があたかも自分一人だけが話しているかのように扱われます。これは、ビームフォーミングのような指向性技術とは対照的で、屋内や閉じた環境では性能が限定されます。

Kardomeの革新的な音声ユーザーインターフェース技術により、音響環境の悪い場所でもクリアで分かりやすいコマンドを機器に伝えることができるようになりました。 

ボイスユーザインタフェース性能
コア技術

VUIとASRの性能

ASRが音響音声信号を正確に翻訳する能力は、ASRへの入力信号の明瞭度に依存します。そのため、ノイズ除去、エコー除去、音源分離などのコンポーネントがVUIに追加され、ASRに到達する前に取得した信号を強化します。

Kardomeのコアテクノロジーには、音声分離、エコーキャンセル、ノイズリダクションのモジュールが含まれ、騒音下および複数のスピーカーがある環境でも信頼できるASRパフォーマンスを実現します。

いつでも、どこでも、ユーザーを理解する

進化したボイスエンハンスメント

電話会議中に同僚があなたを理解するのに苦労したことが何度かありますか?

オフィス環境には通常、主な話者の他に複数の音源が存在します。音の干渉により、ユーザーの発話が聞き取れなくなり、重要な会議や業務に悪影響を及ぼします。

Kardomeの技術により、ASRエンジンはいつでもどこでもユーザーを理解することができるようになる。Kardomeは、通常ビームフォーミング技術の性能を妨げる音響的に厳しい条件下で、干渉信号を最大30 ᑑまで軽減することができる。

会議用音声認識の強化