音频/语音用户接口(VUI)是未来人机交互的一个重要的新兴趋势,将越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域,这涉及语音触发、识别、处理技术,同时设计人员还面临如何提高能效的挑战。针对本地和云端,安森美半导体都有相应的VUI方案,提供先进的语音触发、识别、处理、控制等功能,具备出色的计算能力和能效,确保卓越的用户体验。
VUI架构及分类
图1是基于麦克风阵列的高级语音接口架构,本地处理需要进行说话人跟踪、语音增强,其中涉及波束成形、唤醒词检测、声源定位、降噪、语音检测等技术,云端方案则涉及自然语言处理。其后,指令还需通过音频播放功能播放出来,同时需进行回声消除。
图1:基于麦克风阵列的高级语音接口架构
本地VUI以预存的词或句为识别单位,说话人可以是特定用户也可以是非特定用户,而云端VUI基于人工智能进行语义理解和语音合成,说话人是非特定用户。本地VUI通过蓝牙联接网络,而云端VUI通常通过WiFi联接。本地VUI的功耗和信息泄露的风险相对更低,云端VUI具有更高的识别率和扩展性。相对而言,本地VUI比云端VUI的功耗低。设计人员可根据特定应用需求决定是用本地VUI方案还是云端VUI方案。
本地VUI方案
根据本地VUI方案的特点,它必须能进行双向语音通信,能识别非特定用户语音,支持充足的指令和多种语言,可灵活扩展,最好把波束成形和降噪等技术集成到单个芯片上以降低成本和减小占位。如安森美半导体的单芯片方案LC823450,含双Cortex-M3核,集成数字信号处理(DSP)用作语音前端处理,SRAM提供1656k字节内存,无需配备辅助内存芯片,含两个数字麦克风I/F接口、两个数模转换器,包括回音消除、降噪等先进功能,具备极高扩展性、小占位,功耗超低,若结合生态系统合作伙伴的语音控制技术如Sensory的TrulyHandsfree,支持唤醒词和语音命令的定制,适用于家居自动化和音乐播放的语音交互。
图2所示为本地VUI方案的一个示例应用框图及评估板。采用安森美半导体的超低功耗音频处理单芯片LC82345X、麦克风预放大器FAN3852、低压降稳压器(LDO)NCP170、同步PWM开关降压稳压器NCP3170、单声道音频功率放大器NCP2823。安森美半导体凭借在电源管理的经验和专知,使这方案实现超低功耗,这是此方案与其他竞争对手方案相比的一个优势。现有的方案虽然未集成WiFi、蓝牙双模的模块,但安森美半导体已收购了WiFi领袖Quantenna,已具备相关技术,未来会考虑将WiFi模块也集成进去。
图2:语音控制应用框图及评估板
云端VUI方案
从应用场景来看,云端VUI除了进行语义理解和语音合成,还可推送各种服务,如智能语音助手除了可播放音乐、讲故事,还支持智能零售,如打车、叫外卖等。当前云端VUI的一个痛点是工作频率较高,需外接存储器和闪存,耗电量大,物料单(BoM)成本高。安森美半导体的音频DSP系统单芯片(SoC)LC823455方案很好地解决了这些痛点问题,集成4M RAM,无需外部存储,除了CPU核外还含波束成形、降噪、回音消除功能,集成预实现的音频硬件(模数转换器、数模转换器及功放),降低BoM成本,因降低时钟频率从而提供功耗优化的MCU,功耗超低,提供稳定的联接和极高扩展性,宽广的封装阵容支持各种音频产品,如音乐播放器、录音器、智能家电、WiFi/蓝牙音箱等。
图3所示为智能音箱参考设计框图,此参考设计基于LC823455,有4个ONA101V和1个ONA40功放,含USB-C PD源/汲接口,支持Strata平台,设计人员只需将此评估板插入装有Strata的电脑,即可自动识别并开始下载相关的所有文档及配套资料,包括原理图、布板、测试报告、用户指南等,同时出现图形用户界面(GUI),显示所有相关参数和选项供工程师开始评估,帮助加快和简化开发。此参考设计目前支持亚马逊Alexa语音服务,安森美半导体也在同中国国内一些语音服务商接洽,未来也会支持国内语音助手。这方案最显著的一个优势也是超低功耗,经过将其与竞争对手方案的功耗进行测试,安森美半导体的方案功耗约为竞争对手方案功耗的一半。
图3:智能音箱参考设计框图
安森美半导体的移动及智能音箱音频技术/知识产权
安森美半导体具备丰富的知识产权支持移动及智能音箱的设计开发,包括音频处理系统、D类功放、麦克风预放大、高性能音频开关,提供具竞争力的优势助力设计人员设计出具竞争优势的产品。
在音频处理系统方面的竞争优势包括小的PCB占位、高度集成的SoC(CPU+DSP+音频)、集成ARM Cortex-M3双核、专有的32位DSP。
在D类功放方面,支持小于10 W、10W至30 W,针对大于30 W的应用仅提供样品。其中小于10 W的功放尺寸小,采用模拟输入,10W至30W的功放支持数字接口,提供最佳的动态范围、增益误差漂移。
对于麦克风预放大,安森美半导体的方案采用最小的标准间距WLCSP封装将模拟音频转换为数字音频,支持不同的传感器接口。
音频开关方面,安森美半导体提供最小阻抗/面积的耗尽型开关。
周边技术:USB Type-C和D类功放
USB Type-C使每个端口都能成为电源、数据、视频或音频端口,大大地方便了用户,将越来越多地用于各种电子应用,如语音交互。安森美半导体提供完整的USB Type-C方案阵容支持音频应用的开发,包括供电、复用音频信号、信号开关、接口保护等,具有最小的占位、超低静态功耗,集成丰富的保护功能。
智能音箱等新兴音频应用对功放的要求越来越高,安森美半导体针对性地开发出了一系列10 W以上功率等级的D类功放产品线,结合陶瓷封装技术、CMOS电路技术及可针对不同应用定制的功率MOSFET技术,提供低热阻、高频互联、高功率密度、低噪声(《70 uV)、低总谐波失真(THD《0.03%)等优势。以ONA101V为例,这是一款单通道数字输入D类功放,动态范围105 dB,带喇叭采样数字输出功能,该功能实时采样所驱动喇叭的电压和电流,可使用微控制器上运行的算法来计算喇叭特性。这些参数可用于计算喇叭电阻、回响、温度等。根据这些值,可以创建算法来执行一系列任务,从而实现喇叭保护、范围扩展等功能。
总结
语音交互正日渐流行,语音识别和自然语言处理技术是VUI的基础,安森美半导体提供本地VUI方案和云端VUI方案,集成波束成形、回音消除、降噪等先进的语音处理技术、超低功耗电源管理及USB Type-C、D类功放等周边器件,并携手生态链合作伙伴,大大降低BoM成本,同时具备出色的计算能力和超低功耗,提供极佳的用户体验。