方案背景
在现代智能设备和物联网(IoT)应用的快速发展中,语音交互已成为用户体验的重要组成部分。用户对智能设备的期望不仅限于基本的语音命令识别,还包括远距离的精准识别、多语言支持以及在嘈杂环境中的稳定性能。为满足这些需求,先进的语音处理技术和高效的关键词识别(KWS)解决方案变得至关重要。
方案概要
PXU316-Voice 是一种将双麦克风前端音频处理(Audio Front-End,AFE)与 关键词识别(Keyword Spotting,KWS) AI 模型相结合的解决方案。得益于高性能的双麦克风前端音频算法,它可以支持 5 米以内的唤醒命令,并支持打断(Barge-in)功能。PXU316-Voice可通过本地AI 模型识别多种语言,最多可分辨 100 条语音命令。此外,它还能通过 USB Type-C 为用户产品中的语音识别(ASR)提供优化的清晰语音信号。
方案特性
远场拾音
利用双麦算法实现5m 内360°远场拾音。
多语言关键词识别
本地离线KWS 模型至多支持21 种语言,识别准确度高达95%,指令集可定制。
应用场景
PXU316-Voice可以应用于多种智能语音交互设备,包括但不限于智能家居设备、智能音箱、智能家电等消费电子产品,也可应用于智慧医疗、智能驾驶系统等领域。
用于智能会议屏幕的KWS 语音控制示例