中国电子技术网

设为首页 网站地图 加入收藏

 
 

为电视遥控器增加低功耗语音识别技术

关键词:电视遥控器 语音识别技术 嵌入式处理器

时间:2020-09-03 11:15:28      来源:网络

虚拟助理被集成到家中更多的设备中,亚马逊最近宣布,它将为Alexa推出包括耳塞、眼镜和戒指在内的多种新型设备,为消费者提供更多获取信息的途径。在这些新的语音产品中反复出现的主题是无线和免提的,可轻松地连接到手机或其他主机上,并聆听指令。其内部技术是一个支持无线连接的蓝牙射频芯片组和运行唤醒字引擎(WWE)的专用嵌入式处理器来识别语音命令。

虚拟助理被集成到家中更多的设备中,亚马逊最近宣布,它将为Alexa推出包括耳塞、眼镜和戒指在内的多种新型设备,为消费者提供更多获取信息的途径。在这些新的语音产品中反复出现的主题是无线和免提的,可轻松地连接到手机或其他主机上,并聆听指令。其内部技术是一个支持无线连接的蓝牙射频芯片组和运行唤醒字引擎(WWE)的专用嵌入式处理器来识别语音命令。

这种趋势的另一个例子是,每一台新的平板电视、机顶盒和媒体播放器都配备了遥控器,他们也将很快完全无线和免提。当然,当你想要语音控制的时候,很多人仍然会使用旧的红外视线遥控模式或者按键对话,但这些都很快就过时了。用户需要一个能无缝响应命令的设备,而不是像对讲机那样必须按住通话键的设备。与最近亚马逊的电子产品浪潮类似,下一代电视遥控器将是无线和免提的。

然而,遥控设计也带来了一些独特的挑战。例如,遥控器通常不可充电;它们通常使用标准的AA电池。遥控器不仅需要在嘈杂的环境中表现良好,而且需要在距离你身体3到9英尺的地方,还可以将信息以无线方式即时传输到主机设备上(如电视)。

此外,消费者更喜欢使用不需要频换更换的耐用电池,从本质上讲,遥控器的性能必须像亚马逊Echo Dot一样,但同时功耗还要比入耳式耳机更少。

设计功能强大、高效节能的遥控器是一个挑战,需要创新的蓝牙解决方案和音频处理解决方案,因为其中每一个改进都会延长电池寿命。

使用蓝牙5.0/LE解决了传统红外的几个问题。首先,蓝牙是一个符合标准的解决方案,因此设备很容易与现有的蓝牙设备进行通信。此外,蓝牙5.0/LE提供了与WiFi设备相当的传输范围,这非常适合语音遥控器。传统的蓝牙解决方案已经针对手机和笔记本电脑进行了优化,这些手机和笔记本电脑的电池容量更大,而且蓝牙的功耗也没有那么大。

Atmosic公司的创新解决方案,可以显著降低5倍功耗,与竞争解决方案相比,电池寿命可延长3至5倍。


 

除了极低功耗的蓝牙设计外,还可以使用一个二次唤醒接收器,该接收器功耗可以更低(比标准接收器低20到50倍),使整个蓝牙SoC进入深度睡眠状态;该设备可以通过另一台主机的特殊模式唤醒。我们不会在这里详细介绍这项技术,因为它只适用于少量的专用遥控器。

第三种低功耗技术是利用能量收集来获取射频无线能量以延长电池寿命。许多家庭和建筑物都有大量的射频能量(通常在ISM波段),当遥控器放在桌子上时,可以采集这些能量。根据能量水平,一个装置可以获得几十微瓦的能量。最终目标是在可能的情况下替代电池电源,将电池的寿命延长到几年,而目前遥控器的寿命只有6到9个月。对于工业和特殊用途的遥控器,还可以使用其他能源技术,如太阳能、热能和运动能量收集。

如前所述,要实现真正的免提操作,遥控器必须同时像智能扬声器一样工作,但也要像入耳式耳机一样节能。像QuickLogic这样的公司已经开发出高度优化、超低功耗的配套器件来配合蓝牙芯片组来应对这一挑战。

蓝牙连接的语音遥控器基本上有三种模式:待机模式、唤醒词检测模式和数据传输模式,功耗也是逐步增加。

在待机状态下,蓝牙和伴生芯片处于休眠状态,等待周围环境中的一些唤醒词。实现这一点最节能的方法之一是使用Vesper的麦克风唤醒声音功能,该功能仅消耗10µA,等待环境声超过预先配置的阈值。在一个典型的起居室用例中,系统在80%的时间内处于这种模式。

一旦达到阈值水平,就会从麦克风触发一个中断,并唤醒伴随芯片;此时进入唤醒字检测模式。伴随芯片的MCU可以启动并运行WWE一段时间,以检测关键字是否被说出。第三方解决方案(如Retune DSP的VoiceSpot WWE)可以在Cortex-M4上运行,只需使用一个麦克风,无需使用多麦克风自适应波束形成的计算密集型解决方案,而多麦克风自适应波束形成通常是中场(3到9英尺)语音识别所需的。

除了明显的节省处理器资源外,从系统中减少每一个麦克风还可节省400至650µA(有功功率)。如果检测到唤醒字,它会中断并唤醒蓝牙芯片进入数据传输模式。这是必要的,因为在唤醒字之后的用户字需要以脉冲编码调制(PCM)或压缩数据的形式传送到主机(如电视)。

如果没有检测到唤醒字,系统将恢复到初始待机模式。一些配套芯片,如QuickLogic的芯片,有专用的低功耗声音检测(LPSD)硬件,以降低唤醒字检测模式中使用的平均系统功率。例如,有些风扇声音有一个高分贝声压,但显然不是讲话。LPSD硬件有足够的智能来感知这一点,并忽略声音,以避免不必要地运行WWE额外功耗。

蓝牙5.0/LE非常适合数据传输模式,因为它可以在低功耗的按需数据包中传输数据。一个理想的伴侣应该有足够的存储空间和处理能力,以便在将语音数据发送到蓝牙设备之前对其进行压缩,一个典型的例子是运行Opus音频编码器。

本文作者:

Scott Haylock:QuickLogic的产品营销总监。他拥有超过20年的片上系统经验,并拥有密歇根州立大学的学士学位。

Srinivas Pattamatta:Atmosic Technologies业务开发的副总裁。他在无线和其他通信技术方面也有超过20年的经验。获得俄勒冈州立大学电气工程硕士学位和圣克拉拉大学工商管理硕士学位。

  • 分享到:

 

猜你喜欢

  • 主 题:ADI电能计量方案:新一代直流表、三相电表和S级电能表
  • 时 间:2025.01.14
  • 公 司:ADI&DigiKey