离线语音控制解决方案

参数

采样率 16kHz
位深度 16-bit
拾音范围 5m @ 360°
指令数量 100+
支持语言数 21
能耗 5V 103mA
识别率 噪声环境下95%

应用

  • 智能音箱
  • 智能电视
  • 智能家居网关
  • 智能会议屏幕

方案背景

在现代智能设备和物联网(IoT)应用的快速发展中,语音交互已成为用户体验的重要组成部分。用户对智能设备的期望不仅限于基本的语音命令识别,还包括远距离的精准识别、多语言支持以及在嘈杂环境中的稳定性能。为满足这些需求,先进的语音处理技术和高效的关键词识别(KWS)解决方案变得至关重要。

方案概要

PXU316-Voice 是一种将双麦克风前端音频处理(Audio Front-End,AFE)与 关键词识别(Keyword Spotting,KWS) AI 模型相结合的解决方案。得益于高性能的双麦克风前端音频算法,它可以支持 5 米以内的唤醒命令,并支持打断(Barge-in)功能。PXU316-Voice可通过本地AI 模型识别多种语言,最多可分辨 100 条语音命令。此外,它还能通过 USB Type-C 为用户产品中的语音识别(ASR)提供优化的清晰语音信号。

方案特性

5mpickup

远场拾音

利用双麦算法实现5m 内360°远场拾音。

i18n

多语言关键词识别

本地离线KWS 模型至多支持21 种语言,识别准确度高达95%,指令集可定制。

应用场景

PXU316-Voice可以应用于多种智能语音交互设备,包括但不限于智能家居设备、智能音箱、智能家电等消费电子产品,也可应用于智慧医疗、智能驾驶系统等领域。

PXU316-VOICE_Block_Diagram_W_2160px

用于智能会议屏幕的KWS 语音控制示例

技术文档

软件下载

联系我们