Kardomeの1年を振り返る。音声技術で未知なる世界へ
Kardomeは、この1年の成果をお伝えしたいと思います。私たちは、ボイス・ユーザー・インターフェース(VUI)技術で大きな進歩を遂げましたが、この機会に、音声技術の最先端にいることの意味を考えてみたいと思います。それは、私たちのミッションです。
Kardome社のミッションは、音声認識技術を進化させ、人々のコミュニケーション、接続、機械との相互作用、そしてお互いの関係を変えることです。
そのためには、私たちと同じようにイノベーションに情熱を持った素晴らしい人々や組織とパートナーシップを築く必要があります。私たちはこの1年間、私たちの哲学を共有する主要組織のキーパーソンとの関係構築に取り組んできました。
また、VUI技術を拡大し、ボイス ID、3Dオーディオ解析、ドメイン特化型ASRなどを追加しました。これらの新技術により、家電、自動車、企業などの分野で、優れた音声および音声認識を提供していきます。
ここでは、新製品である「Spatial Listening Software Suite」や、この1年で達成した特筆すべき成果、そして「Voice First for All」というミッションを達成するために結んだ新たなパートナーシップについてご紹介します。
Kardome社の空間試聴ソフトの紹介
今年、私たちは「Spatial Listening Software Suite」を発表しました。Spatial Listeningは、家電、自動車、企業のハードウェア開発者が、以下のような次世代音声認識デバイスを作ることを可能にします。
- 誰が話しているかわかる(音声認識)
- どこにあるのか(3Dオーディオ解析)
- 相手が言っていること(ドメイン固有の自動音声認識[ASR])。
このような優れた音声認識能力は、最も困難な音声環境でも実現されます。また、エッジベースの技術を用いたスペースリスニングにより、ユーザーのプライバシー、即時性、自立性を維持します。
新製品の「Spatial Listening Software Suite」を実際に使ってみた様子をご紹介します。
KardomeのVUIを推進するための新たなパートナーシップの構築
私たちは、主要なテクノロジー企業といくつかの新しいパートナーシップを結び、今後数年間でKardomeの音声テクノロジーを拡大する道を切り開きました。
ルノー・グループやヒュンダイなどの自動車業界、インテルやヤンデックスなどの大手ハイテク企業からノウルズなどの老舗オーディオソリューション企業まで、Kardome社はスマートデバイス向けの優れた音声認識を実現する道を切り開いています。
また、Kardome社は、ヨーロッパ最大のスタートアップ&テックイベントであるViva Tech、第19回上海国際工業自動化・ロボット展、フロリダで開催されたSelf-Service Innovation Summitなどでも、その音声技術を紹介しました。
注目のメンションと受賞歴
Kardomeは、 Reinhold Cohn Group Startup Competitionにおいて、160社以上のスタートアップ企業の中から 1位を獲得するなど、目覚ましい成果を上げています。
ラインホールド・コーン・グループは、グローバル企業と革新的なスタートアップ企業を結びつけることで、さまざまな課題を解決するスケーラブルな技術ソリューションを発見することを目的に、毎年スタートアップ・コンペティションを開催しています。
Kardome社は、AIによるソースセパレーションとノイズリダクション技術により、あらゆる環境下で正確でリアルタイムな音声コマンド入力と音声出力を実現した点が評価され、第1位となりました。
Kardome社は、Huawei Moving Audio Tech Forward Challengeでも優勝しました。このチャレンジでは、オーディオのキャプチャと送信、オーディオの保護と再生、オーディオコンテンツのレンダリングとユーザーや環境への適合を行うための革新的なハードウェアまたはソフトウェア技術ソリューションを提供することが求められました。
Kardomeは、音声アシスタント、音声認識デバイス、音声テキストアプリケーションなどのVUIデバイスのオーディオ品質と音声の明瞭度を向上させる技術で、この課題に取り組みました。
さらに、「Startup Pill」は、Kardomeを「30 Quality Real-Time Startups To Look Out For In 2021」の1つに挙げています。
CEO/共同設立者のDani Cherkasskyからのメッセージ
Kardome社では、人間が機械と対話する際に最も自然で効率的な方法は、人間同士の対話であると考えています。
音声インターフェースが何十年も前から存在しているにもかかわらず、ヒューマンマシンインタラクションはいまだに主に手で操作(ボタンを押す)されているという課題があります。では、なぜ音声技術はタッチ操作やインターフェースに比べて遅れをとっているのでしょうか。
その理由は主に2つあり、既存の最先端のVUIは騒音下ではうまく機能せず、また煩雑である。
現在、VUIには大きく分けて2種類あります。
音声アシスタント
まず、AmazonやGoogle、Appleなどのクラウドサービス事業者が提供する有名な音声アシスタントがあります。
これらの音声ベースのデバイスは、検索、ナビゲーション、およびストリーミングに最適です。
しかし、「窓を開ける」「テレビの音量を調節する」といった機能的なインターフェースに音声アシスタントを採用すると、非常に面倒な2ステップのリクエストになってしまいます。例えば、"ねえアレクサ、リビングにあるハイセンスのテレビの音量を下げて"。
このような煩雑なインターフェースでは、お客様との接点はほとんどありません。
カスタムVUI
次に広く使われているVUIは、自動車やテレビなどのスマートデバイスメーカーが構築し、エッジシステムと統合したものです。
このようなインターフェイスは、通常、既製の部品を使って作られますが、それらは部分的にしか組み合わされません。その結果、これらのVUIは、環境が比較的静かなときにしか顧客にサービスを提供できない。
ボイスファーストの使命を果たすために
私たちKardomeは、VUIの課題を解決するために、人間レベルの音声理解を機械に持たせることが使命だと考えました。そして、その目標を達成するために、非常に優秀な音声AI専門家のチームを結成し、独自の空間聴取技術を開発しました。
Kardomeのエッジベースの空間聴取技術は、VUIの最も困難な問題に取り組み、あらゆる環境で、誰が、どこで、何について話しているのかを機械が理解できるようにします。KardomeのSpatial Listening Suiteは、ユーザーにプライバシー、即時性、および独立性を与えます。
カルドメの未来はどうなる?
Kardomeにとって、私たちの目標は、音声技術の最先端にいることです。それは何を意味しているのでしょうか?それは、誰もやっていないことをやるということです。つまり、他にはない音声ユーザーインターフェース技術を創造するということです。
私たちは、人々が声を使って機器を操作したり、情報を得たり、家族や同僚とビデオ/オーディオプラットフォーム上で交流することを容易にしたいと考えています。
新しいSpatial Listening Software Suite、新たなパートナーシップなど、今後もエキサイティングな展開を予定しており、新年以降もVoice Technologyを新たな高みへと導いていきます。