音声で操作できるスマートテレビやセットトップボックスの人気が急速に高まっていることが、今後の成長を後押しします。しかし、メーカーやOEMが優れたVUI技術に積極的に投資しない場合、音声認識性能の低さがさらなる普及を阻害する可能性があります。

音声で操作するスマートTVの問題点

音声で操作できるスマートテレビやセットトップボックスの人気が急速に高まっていることが、今後の成長を後押しします。しかし、メーカーやOEMが優れたVUI技術に積極的に投資しない場合、音声認識性能の低さがさらなる普及を阻害する可能性があります。

ローラ・テイト
ローラ・テイト
VPマーケティング
技術

目次

音声で操作できるスマートテレビやセットトップボックスの人気が急速に高まっていることが、今後の成長を後押しします。しかし、メーカーやOEMが優れたVUI技術に積極的に投資しない場合、音声認識性能の低さがさらなる普及を阻害する可能性があります。

近年、スマートフォンやスピーカーに搭載されている音声アシスタントの利用が増加していますが、今回のパンデミックは、消費者が音声操作可能なスマートテレビをより広く採用することに拍車をかけています。Syntiant社の調査によると、アメリカ人の半数以上が、家電製品やテレビ/リモコンなどのスマートデバイスには音声操作が必須であると回答しています。 

ジュニパー・リサーチ社によると、スマートテレビの音声制御による支出は、2024年までに5億ドルに達する見込みです。スマートテレビにおける音声アシスタントの利用拡大は、これらの機器が文脈に依存した販売ポータルや情報・制御システムになりつつあることを反映しています。 

また、音声制御が大きく発展した分野として、セットトップボックス(STB)があります。STBは時代遅れと思われるかもしれませんが、多くの人がアナログテレビに放送を流すための機器として愛用しています。2027年にはSTBの世界需要が 3億4110万 台に達するという調査結果もあります。

しかし、アプリ間の互換性の問題、周囲の騒音や残響による音声認識の悪さ、1つの部屋に複数のユーザーがいる場合の混乱など、音声制御機器のメーカーやOEMにはまだ課題があります。

スマートテレビの音声認識の問題点

自動音声認識(ASR)エンジンまたは音声認識システム は、あなたが話す内容を理解してテキストに変換するコンピュータです。音声認識は、誰が話しているのかを識別することで、体験をパーソナライズします。音声認識はコンシューマーエレクトロニクスにとって大きな進歩ですが、この技術は多くの点でまだ未熟です。

スマートテレビは、家電製品の中でも比較的新しい製品であるため、いくつかの問題点があり、使い勝手が良くないと言われています。しかし、メーカーやOEMはこれらの問題を認識しており、今後の製品モデルで解決しようとしています。

スマートテレビに有益な音声認識システムを構築するためには、テレビメーカーは、そもそも音声認識をどのように使いたいのか、どのような問題を解決しようとしているのかを考える必要があります。そして、ユーザーエクスペリエンス(UX)を意識したソリューションの開発に着手する必要があります。

"ASRシステムは頻繁に誤った転写を行い、元のクエリを壊してしまうため、ユーザーはリクエストを変更するか、完全に放棄しなければならない。"

音声コントロールは、時間の経過とともにユビキタスになっていきます。ですから、ユーザーが音声インターフェースのパワーユーザーになるまでの過程に関わらず、家の中で快適に使えることが重要です。

スマートテレビは、直感的で会話のように使えるものでなければなりません。人が画面上で興味のあるものを見た瞬間から、リモコンやテレビに話しかけてそれを操作するまでの摩擦を減らすことができます。

さらに、人が音声コマンドを発する瞬間には、十分に静かであるか、話しているのが自分だけであるかを気にする必要はありません。テレビのASRシステムは、たとえおしゃべりや笑い声が絶えない混雑した部屋にいても、誰が何を話しているのかを聞き取る必要があります。

大きな可能性を秘めているにもかかわらず、声で操作するテレビはまだ実現していません。

音声認識性能の低さがセットトップボックス体験に与える影響

音声認識の悪さは、セットトップボックスのメーカーにとっても課題となっている。セットトップボックス は、テレビがデジタルテレビ(DTV)の放送を受信し、デコードすることを可能にします。アナログテレビを持っている視聴者がデジタル放送を受信するには、Roku、Broadcom、PaceなどのSTBを使用する必要がある。

多くの人にとって、セットトップボックスはテレビを操作するための主要な手段となっています。ストリーミングビデオやアプリなどの新しい機能が追加されたことで、ユーザーはこれまで以上にセットトップボックスを操作する時間が増えており、音声認識の不備による不満も増えています。

リバーブは、スマートデバイスの音声認識につきもののバックグラウンドノイズや信号の干渉に加えて、STBにも悪影響を与えます。テレビの視聴者は、セットトップボックスをテレビの隅やキャビネット、あるいは背後など、目に触れないところに置いています。そのため、人が音声で指示を出すと、信号が何度も反響する「残響」によって、セットトップボックスへの信号伝送が乱れてしまうのです。 

音声認識がうまくいかない場合の影響は?

Yelling at Your TV:ASRシステムは頻繁に不正確な転写を行い、元の質問を壊してしまうため、ユーザーは要求を修正したり、完全に放棄したりしなければならない」と述べています。

スマートテレビの明瞭な音声認識のためのソリューション

スマートテレビにおける正確な音声認識の重大な問題を解決するためには、背景雑音を低減し、残響を除去し、話している人を正しく認識する音声ユーザーインターフェース技術が必要です。

また、スマートテレビにおける理想的な音声認識ソリューションは、スマートスピーカーに "Hey Google, turn on my Samsung TV "と尋ねるような、複数のステップを必要としないものです。

テレビメーカーの中には、アップルやグーグルなどのテクノロジー企業と提携しているところもありますが、これらの大手音声会社は、いまだに音声認識結果の悪さを解決できずにいます。 

スマートテレビのための次世代の音声コントロール

音声コントロールは、人々のスマートテレビの使い方を変えようとしています。もちろん、すでに一部のテレビでは音声操作が可能ですが、私たちが話していることを理解し、意味のある方法で反応してくれる世代のデバイスの話です。

革新的なテレビメーカーは、このことを念頭に置いて、次世代のインターフェイスを構築する必要があります。例えば、将来のスマートテレビには、シームレスな音声認識システムが搭載され、別のリモコンを使う必要がなくなります。


Kardomeがどのようにして既存のテレビやセットトップボックスの音声認識機能を向上させるか、あるいは私たちのVUI技術を最初から統合するかをご覧ください。

デモを予約する