CEVA、Inc。は、インテリジェントなクラウドベースのサービスとエッジデバイスの主要なヒューマンインターフェイスとして急速に拡大している音声の使用を対象としたニューラルネットワークベースの音声認識テクノロジーであるWhisPro™を発表しました。 WhisProは、常にリッスンするマルチトリガーフレーズテクノロジーであり、新しいスマートフォン、スマートスピーカー、Bluetooth®イヤフォン、その他の音声対応デバイスのユーザーが、Amazon Alexa、Googleアシスタント、BaiduDuerOSなどのクラウドベースの音声アシスタントサービスとやり取りできるようにします。その他。 CEVAは、自動車、スマートホーム、エンタープライズなど、さまざまなユースケースとエンドマーケットの音声制御を可能にするトリガーフレーズカスタマイズサービスを顧客に提供します。
WhisProは、CEVAのClearVoxフロントエンド音声処理ソフトウェアテクノロジーと連携して動作し、音声認識用の堅牢なCEVADSPベースのハードウェアおよびソフトウェアソリューションを顧客に提供します。音声前処理とニューラルネットワークアルゴリズムのこの全体的な統合により、最小限のコンピューティングリソースと電力を消費しながら、95%を超える高い認識率が実現します。このテクノロジーは、ニアフィールドとファーフィールドの両方のユースケースで、ノイズの多い環境でも回復力を示します。 WhisProテクノロジーは、クラウドバックアップを必要とせずにエッジデバイス上でローカルに動作するため、ユーザーのプライバシーを維持し、最小限の遅延で瞬時の応答を提供します。
CEVAの最高技術責任者であるErezBar-Nivは、次のようにコメントしています。「音声は、インテリジェントデバイス革命に最適なヒューマンインターフェイスに急速になりましたが、実装するのに最も複雑なテクノロジーの1つです。 WhisProの設計では、低電力DSPコアと、社内のノイズリダクションおよびエコーキャンセレーションアルゴリズムを活用して、コスト効率が高く、高精度で、ノイズに耐性のある完全な音声認識テクノロジーをお客様に提供しています。エッジおよびクラウドベースの音声アシスタントサービスをサポートし、顧客が独自のトリガーフレーズを実装してデバイスを制御できるようにします。」
音声AIテクノロジーに基づいており、エッジデバイス用に特別に最適化されている、WhisProのスケーラブルなリカレントニューラルネットワークテクノロジーは、複数のトリガーフレーズを同時に認識することができます。WhisPro SDKitは、WhisProテクノロジーをシステムに統合およびテストするためのガイドラインとツールをお客様に提供します。WhisProは、顧客の要求に応じて、キーワードと複数の言語の複数の発音をサポートします。英語は現在利用可能で、北京語はまもなく利用可能になります。
WhisProは、CEVA-TeakLite-4、CEVA-X2、およびCEVA-BX DSPのお客様専用に、本日ライセンスを取得でき、主要なTier1音声アシスタントサービスに準拠しています。詳細については、https://www.ceva-dsp.com/product/ceva-whispro/をご覧ください。