自動車における音声アシスタント技術の課題と、多様な運転状況における安全性と正確性を向上させるための高度なAIソリューションの必要性を探る。

自動車におけるAIは、より安全で、より効率的で、より幸せな運転を実現するソリューションなのか?

自動車における音声アシスタント技術の課題と、多様な運転状況における安全性と正確性を向上させるための高度なAIソリューションの必要性を探る。

ローラ・テイト
ローラ・テイト
VPマーケティング

目次

自動車産業におけるAIの役割

人工知能(AI)はCES 2025において、特に自動車と輸送分野で大きな存在感を示した。エヌビディアのジェンセン・フアン最高経営責任者(CEO)は基調講演でAIの可能性を強調し、AIと高度なコンピューティングが自動車についての考え方や設計をどのように再構築するかを強調した。

AIを搭載した自動車技術の流入は、重要な問題を提起している。これらの技術革新は本当にドライバーの安全性を高め、ユーザー体験を合理化し、移動効率を最適化できるのか、それとも単なる派手なギミックなのか。AIは、バックグラウンドノイズに対抗する正確な音声認識、同時発話、希望する音声ソースの正確な位置特定を実現することで、ドライバーやOEMが直面する現在の課題に真に対処できるのだろうか。 

個人的な逸話

以前はサンタクルーズからサンフランシスコまで76マイルを2~3時間かけて運転していた。長時間のドライブは疲れ、スピード違反切符を切られ、道に迷うこともあった。今日、テクノロジーはこのドライブの経験を向上させてはいない。

私の車のインフォテインメント・システムは音声ナビゲーションのためにiPhoneに接続するが、私の車のアシスタント(7年前のもの)は時代遅れで効果がない。私のiPhoneの音声アシスタントであるSiriは、しばしば私の声を聞き取れなかったり、誤解したり、間違った結果を出したりするので、私は携帯電話を窓から投げ捨てたくなる。Siriが私の声を聞き取るのに苦労するのは、マイクからの距離とロードノイズのせいだ。言語モデルにも問題があり、インフォテインメント・システムを手動で操作しなければならない。Googleマップは、Siriが私の指示を理解すれば、ほとんどの場合ナビゲーションに役立つ。

音声AIのパフォーマンスの低さは特別な問題ではない

私だけの問題ではない。自動車における音声技術の問題は、長い間研究され、文書化されてきた。The Autopian』誌の最近の記事では、こうしたシステムはしばしば応答時間の遅さ、コマンドの誤解、機能の制限に悩まされ、従来のコントロールよりも効率が悪いことが強調されている。  

現在のテクノロジーに対するこのような不満を考えると、CESで展示されたAIイノベーションが、私や多くのドライバーが遭遇する問題のいくつかに対処できるのかどうかが気になる。そうかもしれない。 

有望なAI駆動技術

現代モービスのホログラフィック・ウィンドシールド・ディスプレイ| Credit: Hyundai Mobis

CESで目にしたAI駆動技術の中には、空想的で気が散るようなものもあった。ボッシュのドライバー誤進入警告システムや、疲労に関連する事故を減らすためにドライバーの注意をモニターするSeeing Machinesのドライバー・モニタリング技術など、役に立ちそうなものもあった。さらに、BMWのパノラミックiDriveや現代モービスのホログラフィック・ウィンドシールド・ディスプレイは、ドライバーに明確かつ安全に情報を提供することを意図している。  

米国道路安全保険協会の研究者たちは、ドライバーの安全にとって重要なのは、視覚ディスプレイによる注意散漫を抑えることだと述べている。しかし、上級研究員のイアン・レーガンはAPニュースに対し、重要な情報を視線上に維持すること、例えば、インフォテインメント・スクリーンを見下ろしたり見渡したりして道順を確認する必要がないことに将来性を感じていると語った。これはBMWのUI/UX開発責任者ステファン・デュラハがAPニュースに語ったものだ。同社のパノラミックiDriveの 目標は、最も重要な情報を車のフロントガラス下部に映し出すことで、注意散漫を最小限に抑えることだった。 

AIと音声アシストの課題

しかし、AIがナビゲーションやエンターテインメント、フロントガラスやダッシュボード上の情報表示、あるいは注意喚起のために活用され、音声アシスタント(携帯電話であれ、自動車に統合されているものであれ)が私の要求を聞き取り、理解し、正確に応答できるようになるのかどうかという疑問が残る。 

この技術によって、繰り返し話したり、大声を出したり、携帯電話に目をやったり、車のインターフェイスを操作したりする必要がなくなる。

私と同僚がCESで経験したことに基づけば、答えはノーだろう。 

当社のエンジニアの一人が、ある高級車ブランドで人気の音声アシスタントのデモに参加した。デモの間、アシスタントは静かな車内で質問に答え、パーソナライズされた応答をしました。しかし、後部座席の乗員を理解することができなかった。もしバックグラウンドノイズやクロストークがあった場合、前席の乗員を理解できたかどうかは疑問だ。この経験は特別なものではない。 

問題の解決

OEMとティア1サプライヤーは、音声認識能力の低さや音声アシスタントの不正確な結果に対処するため、多様な環境下で音声を理解できる高度なAI技術を統合することを優先しなければならない。これには、バックグラウンドノイズや複数のスピーカーが存在する場合でもコマンドを正確に解釈できるよう、音声認識システムの明瞭性と精度を高めることも含まれる。 

Kardomeのような大手AI企業と協力することで、OEMは車内の様々な場所からユーザーの音声入力を分離し、理解することができる強固なソリューションを開発することができる。 

さらに、継続的なユーザーテストとフィードバックのループを確立して、これらのシステムを継続的に改良し、実際の運転状況に合わせて確実に進化させる必要がある。OEMは、信頼性とユーザー中心の設計に注力することで、消費者の全体的な運転体験と安全性を大幅に向上させることができる。

解決策空間聴覚AI技術

Kardome Mobilityは、空間聴覚AI技術を使って、最大6人の声を探し出し、分離し、識別する。

幸いなことに、カルドームの空間聴覚AI技術には、このような問題を解決する方法がある。この革新的な音声AIソリューションは、最前列であろうと3列後ろであろうと、相手の位置を特定し、分離し、相手の言っていることを理解することができる。今年のCESでの車内デモンストレーションで披露されたように、音楽や重なり合う会話の中でもこれを実現することができる。

その証拠が物語っている:Kardomeのソリューションは、Kardomeの能力を欠く他の評判の良い会社の既存のASR技術と組み合わされ、アジア最大の自動車メーカーの1社によって、今年何百万台もの自動車に搭載される予定である。

最後に一言

自動車業界はAIを活用した進歩に沸いているが、その成功はドライバーが直面する日々の課題に対処できるかどうかにかかっている。安全性の向上や運転体験の改善に有望な技術もあるが、音声認識システムに根強い不満があることから、より洗練されたソリューションの必要性が浮き彫りになっている。 

カルドームの空間聴覚AI技術は画期的なもので、単に派手な機能を追加するだけでなく、自動車との関わり方を根本的に変革するものであることを実証している。AIが進化を続ける中、テクノロジーが運転体験を真に補完し、より安全で効率的な、そして少し幸せなものにする未来が望まれている。 


カルドーム・モビリティのケーススタディのダウンロードはこちらから。