音声ユーザーインターフェースの潜在能力を発揮するためには、私たちが対話する機械が人間レベルの音響環境に対する理解を必要とします。

機械に人間レベルの聴覚を与える

音声ユーザーインターフェースの潜在能力を発揮するためには、私たちが対話する機械が人間レベルの音響環境に対する理解を必要とします。

ダニエル・チェルカスキー博士
ダニエル・チェルカスキー博士
CEO、共同設立者
ニュース

目次

正確な音声認識を得るためには、多くの課題があります。バックグラウンドノイズ、複数の人の会話、その他多くの技術的な課題があります。人工知能が発達し、機械が人間のように話しかけてくるようになった今日でも、1つだけ欠けていることがあります:これらの機械は人間のように音声を聞き、処理することができません。機械は人間のように音声を聞き、処理することができないのです。そのために必要なのが「空間聴覚」です。

カルドームでは、機械が私たちと同じように音を聞くことを可能にするために、この点に取り組んできました。誰が話しているのか、部屋のどこにいるのか、そして何を言っているのか理解できるようにするのです。機械が人間のように聞き取ることを可能にする、私たちの空間聴覚技術について、ぜひお読みください。

空間認識技術とは?

人間は直感的に周囲の音風景を理解し、自分にとって必要不可欠な音に集中し、それ以外のものを無視することができます。 

音は耳を通り、脳に電気信号を送ります。脳はその信号を音に変換し、目を閉じていても、騒がしい環境でも、理解し、ある程度はイメージすることができます。この過程を空間聴覚といいます。 

音声ユーザーインターフェースの潜在能力を発揮するためには、私たちが対話する機械が人間レベルの音響環境に対する理解を必要とします。

一方、部屋や乗り物のような閉じた環境では、複数の音声を含むエコーなどのノイズが機械の聴覚を妨げ、音源を識別することができない。 

音声ユーザーインターフェースの潜在能力を発揮するためには、私たちが対話する機械が、その音響環境を人間レベルで理解する必要があります。音声対応機器は、周囲の音響環境を理解し、正しく分析するために空間的な聴覚を必要とします。Kardomeはこの能力を機械に提供します。

Kardomeの空間認識技術とは?

屋内や閉じた環境では、音は視線だけでなく、あらゆる反射面にぶつかり、他の声も含めて耳やマイクに跳ね返ってきます。残念ながら、この残響と呼ばれる現象が、現在の機器では話し手の声を正確に理解することを妨げています。 

Kardomeの空間音響分析アルゴリズムと革新的なスピーチAIモデルは、残響を活用し、干渉ノイズを排除して、比類のない精度で目的の音声に焦点を当てます。その結果、Kardomeはどんなサウンドスケープでも、誰が話しているか、どこから話しているか、何を言っているかを把握することができます。

Kardomeを使用できるデバイスは?

Kardomeの空間ヒアリング技術は、オフィス、家庭、車など、あらゆる音声対応機器での音声認識を向上させます。

さらに、メタバースが私たちのコミュニケーションの重要な一部となる中、Kardomeの空間聴覚技術は、複合現実感やバーチャルリアリティ環境で使用される音声対応デバイスに正確な音声認識を提供することができます。

お問い合わせ・ご予約 KardomeによるVUIデバイスの改善についてご説明します。