小体积超低功耗语音唤醒耳机方案——帝思DSPG D4P

随着AI的普及,越来越多人使用智能语音控制,从智能音箱慢慢开始延伸到智能耳机领域。目前市场的大部分耳机还是以手动唤醒语音助手为主,主要问题还是在语音检测方面功耗和开发难度问题,。本方案将为大家介绍一套开发难度小且功耗低的语音唤醒方案——DBMD4P + QCC3044,该方案在头戴耳机和运动型耳机上都适用。

首先介绍一下这款DBMD4P的公司——DSP Group,它是家庭和办公室的集成通信无线芯片产品全球领先的提供商。DSPg提供软件半导体系统产品和参考设计,使ODM、 DEM、 消费电子产品制造商和服务提供商能够经济高效地开发,快速实现市场创收的新产品。该公司处于半导体创新的前沿并实现卓越运营超过二十年,提供了一个广泛的无线芯片集成组合DEC/ CAT-iq、DECT ULE、Wi - Fi、PSTN、BoneTone智能语音增强和噪声消除器、视频和VoIP技术。 DSPg使集成的声音、音频、视频和数据连接不同消费者和商业产品,包括连接多媒体屏幕、移动设备、家庭安全自动化、无线电话、网络电话系统和家庭网关。利用行业领先的经验和专业知识,DSPg集团与CE制造商和服务提供商合作来塑造未来家庭和办公室的集成通信。

DBMD系列凭着极高的性价比,至今已向全球提供超一亿颗芯片,国内外各大智能语音引擎(如谷歌,亚马逊,思必驰,出门问问等)都已有成熟算法方案在DBMD系列芯片上运行。从支持AI的TWS耳机到支持语音的智能家居,再到物联网,安防,手机,平板电脑和笔记本电脑中,DSPg的身影无处不在。

其中DBMD4P是一款适用于电池供电设备(如手机,IoT,可穿戴设备等)的超低功耗语音和传感器数据处理器。这处理器可实现各种应用,例如语音触发(VT)、语音验证(VA)、语音命令(VC)、传感器数据处理和均衡器功能。DBMD4P是基于TeakLite-III™DSP @ 100MHz架构的处理器,具备与系统中其他设备(例如应用处理器(AP),编解码器,麦克风和传感器)进行通信所需的接口(如TDM,I2c,SPI,Uart等),加上已有的成熟算法,可为客户快速开发出想要的功能。

QCC3044大家应该也很熟悉,这是高通推出的新一代双声道蓝牙芯片,采用最新的BT5.2蓝牙标准,具备24bit DSP处理能力,这必然会带有有高通优秀的Aptx HD编码。同时这款芯片内置了flash,减少了外围器件成本和采购flash的压力。稳定的平台赋能,卓越的音乐品质,强悍的电源管理,丰富的功能接口和产业公认的低功耗是这套方案的不二之选,搭配DSPg的芯片可谓强强联合。

 

方案实现:

D4p和QCC3044主要引脚连接:

   DBMD_INT:

       当D4P检测到有较大幅度声音变化时,就会启动识别引擎去识别这声音是否为唤醒词,如果识别是唤醒词,就通过这个引脚把AP唤醒,再进入语音传输模式(Audio Buffering)。

   RSTN:

       该引脚为D4P的复位脚,在每次烧录FW之前,都需要下拉该引脚一段时间。

   WAKEUP:

       该引脚为AP唤醒D4P的引脚,当D4P进入Hibernate时,只能通过该引脚唤醒。

   SPI(或I2C、Uart):

       这组引脚用于AP与D4P之间的数据交互(如FW文件传输,配置和控制指令)。在D4P进入语音传输模式时(Audio Buffering),AP会通过SPI(或I2C、Uart)读取拾取的语音指令数据做进一步的语音指令识别。

 

程序控制:

       先了解D4p的5种工作模式,如下图:

   Idle:Boot Firmware之后,系统会在idle模式,这个状态主要用于配置参数,为接下来的模式做准备

   Audio Buffering:该模式是将声音都放到buffer中,让AP去提取使用

   Detection:在该模式下,系统用较低的功耗检测环境声音,当有明显声音波动时,系统进入语音识别状态,识别成功后,进入声音传输状态

   Sleep:该模式关闭ADC采集和处理, 保留与AP通讯能力

   Hibernate:系统关闭处理功能,AP无法通讯,只有AP用IO唤醒才能恢复到Idle模式

   Microphone:该模式用于debug,mic声音数据直接通过uart输出

根据这几个模式,在QCC3044中加入对应的处理

  1. QCC3044开机时,对D4P复位并烧录FW文件(Idle模式)
  2. 配置D4P参数,并进入Sleep或Hibernate模式
  3. QCC3044接收到用户指示,唤醒并控制D4P开启语音检测模式(Detection模式)
  4. D4P检测唤醒词,唤醒QCC3044做语音识别(Audio Buffering模式)

 

设计要点:

  1. Boot模式选择:D4P支持多种boot模式,若需要独立启动可从flash加载程序;若从AP加载程序,可从Uart、SPI或I2C选一种加载,方便不同主控端选择。加载时芯片会自动识别当前通讯协议,从而自动选择对应的通讯方式。大致流程如下:
  2. Mic设计:mic输入是差分信号,所以振幅比较低,设计时需要将mic的线路平行并尽可能靠近。Mic到D4p之间需要保持相同的距离和相同的阻抗。Mic的滤波电容应靠近mic,而其他部分则尽可能靠近D4p端。
  3. 实体mic之间的距离越大越好,这样有助于算法做beam forming
  4. Uart引脚需要预留出来,调算法和debug时候都需要用到
  5. Reset引脚是必须要接上的,D4p每次烧Firmware之前都需要拉低reset一下
  6. Uart通讯时,D4p会自动识别比特率,但在此之前需要发送16个0进行同步

                                                                                                                                      

       此外这个设计的连接方式同样适用于其他蓝牙、WiFi、ARM等应用平台。如要做通话降噪应用,D4P也提供了I2S接口,可将处理后的音频数据传入AP端。

如需购买AIT QCC3044开发板,请点击链接进入大大购平台购买

https://www.wpgdadago.com/getAdDetailPage?AdId=311&Catg=C&ItemId=6233497

 

场景应用图

sceneryUrl

展示版照片

frontUrl

方案方块图

funcUrl

核心技术优势

 低功耗(搭配Vesper mic在监听状态下功耗为110uA),可编程DSP处理器;  超低功耗架构,通过时钟控制和模式切换实现多种功率模式;  丰富的接口集;体积小巧,适用于移动设备;  具备多种与AP的通讯的接口,以及内置的模数转换器(ADC),常用作语音唤醒。

方案规格

D4P硬件规格:  88-pin QFN 10mm X 10mm X 0.2mm  36-ball WLCSP 2.34mm X 2.21mm X 0.45mm  一路高速率从I2C,速率高达3.4Mbps,两路主I2C,速率高达1Mbps  两路Uart接口,速率高达6 Mbps  两路TDM接口,兼容PCM和I2S接口  一路SPI,支持主或从模式,速率高达15.4 Mbps  20个GPIO,10个可配置中断  两个32bit计时器,其中一个为WDT(Watchdog timer)  两路DM数字mic接口,支持连接3个数字mic  低功耗ADC,70dB SNR  864KB RAM:  紧耦合存储器 (ITCM): 64 KB  数据紧耦合存储器 (DTCM): 384 KB (3个128KB的分区)  指令缓存: 32 KB  AHB RAM (可缓存区): 384 KB (其中Boot ROM: 16KB) QCC3044硬件规格:  90-ball 5.6 mm x 5.9 mm x 1.0mm, 0.5 mm pitch VFBGA  蓝牙5.2规格、DSP最高频率120MHz  支持I2C/SPI/UART/I2S/SPDIF/USB2.0/Line out接口  支持双声道输出  支持ANC、TWM  支持aptX, aptX HD, aptX Low Latency,aptx adaptive, SBC, AAC音频解码

技术文档

类型标题档案
软件Schematics