小體積超低功耗語音喚醒耳機方案——帝思DSPG D4P

隨著AI的普及,越來越多人使用智能語音控制,從智能音箱慢慢開始延伸到智能耳機領域。目前市場的大部分耳機還是以手動喚醒語音助手為主,主要問題還是在語音檢測方面功耗和開發難度問題,。本方案將為大家介紹一套開發難度小且功耗低的語音喚醒方案——DBMD4P + QCC3044,該方案在頭戴耳機和運動型耳機上都適用。

首先介紹一下這款DBMD4P的公司——DSP Group,它是家庭和辦公室的集成通信無線晶片產品全球領先的提供商。DSPg提供軟體半導體系統產品和參考設計,使ODM、 DEM、 消費電子產品製造商和服務提供商能夠經濟高效地開發,快速實現市場創收的新產品。該公司處於半導體創新的前沿並實現卓越運營超過二十年,提供了一個廣泛的無線晶片集成組合DEC/ CAT-iq、DECT ULE、Wi - Fi、PSTN、BoneTone智能語音增強和噪聲消除器、視頻和VoIP技術。 DSPg使集成的聲音、音頻、視頻和數據連接不同消費者和商業產品,包括連接多媒體螢幕、移動設備、家庭安全自動化、無線電話、網絡電話系統和家庭網關。利用行業領先的經驗和專業知識,DSPg集團與CE製造商和服務提供商合作來塑造未來家庭和辦公室的集成通信。

DBMD系列憑著極高的性價比,至今已向全球提供超一億顆晶片,國內外各大智能語音引擎(如谷歌,亞馬遜,思必馳,出門問問等)都已有成熟算法方案在DBMD系列晶片上運行。從支持AI的TWS耳機到支持語音的智能家居,再到物聯網,安防,手機,平板電腦和筆記本電腦中,DSPg的身影無處不在。

其中DBMD4P是一款適用於電池供電設備(如手機,IoT,可穿戴設備等)的超低功耗語音和傳感器數據處理器。這處理器可實現各種應用,例如語音觸發(VT)、語音驗證(VA)、語音命令(VC)、傳感器數據處理和均衡器功能。DBMD4P是基於TeakLite-III™DSP 架構的處理器,具備與系統中其他設備(例如應用處理器(AP),編解碼器,麥克風和傳感器)進行通信所需的接口(如TDM,I2c,SPI,Uart等),加上已有的成熟算法,可為客戶快速開發出想要的功能。

QCC3044大家應該也很熟悉,這是高通推出的新一代雙聲道藍牙晶片,採用最新的BT5.2藍牙標準,具備24bit DSP處理能力,這必然會帶有有高通優秀的Aptx HD編碼。同時這款晶片內置了flash,減少了外圍器件成本和採購flash的壓力。穩定的平台賦能,卓越的音樂品質,強悍的電源管理,豐富的功能接口和產業公認的低功耗是這套方案的不二之選,搭配DSPg的晶片可謂強強聯合。

 

方案實現:

D4p和QCC3044主要引腳連接:

   DBMD_INT:

       當D4P檢測到有較大幅度聲音變化時,就會啟動識別引擎去識別這聲音是否為喚醒詞,如果識別是喚醒詞,就通過這個引腳把AP喚醒,再進入語音傳輸模式(Audio Buffering)。

   RSTN:

       該引腳為D4P的復位腳,在每次燒錄FW之前,都需要下拉該引腳一段時間。

   WAKEUP:

       該引腳為AP喚醒D4P的引腳,當D4P進入Hibernate時,只能通過該引腳喚醒。

   SPI(或I2C、Uart):

       這組引腳用於AP與D4P之間的數據交互(如FW文件傳輸,配置和控制指令)。在D4P進入語音傳輸模式時(Audio Buffering),AP會通過SPI(或I2C、Uart)讀取拾取的語音指令數據做進一步的語音指令識別。

 

程序控制:

       先了解D4p的5種工作模式,如下圖:

   Idle:Boot Firmware之後,系統會在idle模式,這個狀態主要用於配置參數,為接下來的模式做準備

   Audio Buffering:該模式是將聲音都放到buffer中,讓AP去提取使用

   Detection:在該模式下,系統用較低的功耗檢測環境聲音,當有明顯聲音波動時,系統進入語音識別狀態,識別成功後,進入聲音傳輸狀態

   Sleep:該模式關閉ADC採集和處理, 保留與AP通訊能力

   Hibernate:系統關閉處理功能,AP無法通訊,只有AP用IO喚醒才能恢復到Idle模式

   Microphone:該模式用於debug,mic聲音數據直接通過uart輸出

根據這幾個模式,在QCC3044中加入對應的處理

  1. QCC3044開機時,對D4P復位並燒錄FW文件(Idle模式)
  2. 配置D4P參數,並進入Sleep或Hibernate模式
  3. QCC3044接收到用戶指示,喚醒並控制D4P開啟語音檢測模式(Detection模式)
  4. D4P檢測喚醒詞,喚醒QCC3044做語音識別(Audio Buffering模式)

 

設計要點:

  1. Boot模式選擇:D4P支持多種boot模式,若需要獨立啟動可從flash加載程序;若從AP加載程序,可從Uart、SPI或I2C選一種加載,方便不同主控端選擇。加載時晶片會自動識別當前通訊協議,從而自動選擇對應的通訊方式。大致流程如下:
  2. Mic設計:mic輸入是差分信號,所以振幅比較低,設計時需要將mic的線路平行並儘可能靠近。Mic到D4p之間需要保持相同的距離和相同的阻抗。Mic的濾波電容應靠近mic,而其他部分則儘可能靠近D4p端。
  3. 實體mic之間的距離越大越好,這樣有助於算法做beam forming
  4. Uart引腳需要預留出來,調算法和debug時候都需要用到
  5. Reset引腳是必須要接上的,D4p每次燒Firmware之前都需要拉低reset一下
  6. Uart通訊時,D4p會自動識別比特率,但在此之前需要發送16個0進行同步

                                                                                                                                      

       此外這個設計的連接方式同樣適用於其他藍牙、WiFi、ARM等應用平台。如要做通話降噪應用,D4P也提供了I2S接口,可將處理後的音頻數據傳入AP端。

如需購買AIT QCC3044開發板,請點擊鏈接進入大大購平台購買

https://www.wpgdadago.com/getAdDetailPage?AdId=311&Catg=C&ItemId=6233497

 

►場景應用圖

►展示板照片

►方案方塊圖

►核心技術優勢

 低功耗(搭配Vesper mic在監聽狀態下功耗為110uA),可編程DSP處理器;  超低功耗架構,通過時鐘控制和模式切換實現多種功率模式;  豐富的接口集;體積小巧,適用於移動設備;  具備多種與AP的通訊的接口,以及內置的模數轉換器(ADC),常用作語音喚醒。

►方案規格

D4P硬體規格:  88-pin QFN 10mm X 10mm X 0.2mm  36-ball WLCSP 2.34mm X 2.21mm X 0.45mm  一路高速率從I2C,速率高達3.4Mbps,兩路主I2C,速率高達1Mbps  兩路Uart接口,速率高達6 Mbps  兩路TDM接口,兼容PCM和I2S接口  一路SPI,支持主或從模式,速率高達15.4 Mbps  20個GPIO,10個可配置中斷  兩個32bit計時器,其中一個為WDT(Watchdog timer)  兩路DM數字mic接口,支持連接3個數字mic  低功耗ADC,70dB SNR QCC3044硬體規格:  90-ball 5.6 mm x 5.9 mm x 1.0mm, 0.5 mm pitch VFBGA  藍牙5.2規格、DSP最高頻率120MHz  支持I2C/SPI/UART/I2S/SPDIF/USB2.0/Line out接口  支持雙聲道輸出  支持ANC、TWM  支持aptX, aptX HD, aptX Low Latency,aptx adaptive, SBC, AAC音頻解碼

技術文檔

類型標題檔案
硬件Schematics