1. 出門問問是一家算法公司,擁有全套自主研發的語音交互8大關鍵技術:


■多達8個麥克風陣列的信號處理算法
■自研回聲消除、聲源定位,波束成形、去混響、噪聲抑制等核心算法用於遠場語音交互場景

■語音識別:採用業界領先的TDNN-F模型垂直領域最精確的中文識別
■熱詞喚醒:低功耗優化、可定製熱詞、多熱詞;採用RNN+DNN兩步驗證
■語音合成:端到端語音合成技術

■手勢識別
■全自動睡眠檢測
■主動運動姿態識別,游泳檢測等
■運動教練: 自動識別和記錄健身動作
■跌倒檢測: 適配老年人和兒童的雙重模式

■統計式模型:谷歌的BERT模型
■自然語言理解:理解近100個垂直領域和高達13個維度的複雜查詢
■多輪對話:垂直領域的多輪對話,例如導航、音樂、電話等等
■知識圖譜:實現5000萬實體與20億實體關係連結

■熱詞喚醒和多命令詞識別
■自研針對可穿戴設備的高清語音信號處理算法
■結合雙麥克風波束成形算法和骨傳導融合算法
■實現在耳機上24小時離線交互
■垂直搜索:自研垂直搜尋引擎,接入100+第三方生態
■主動搜索和智能推送:基於可穿戴、家居、車載不同場景數據和用戶畫像的智能推送
2. QCC3020的功能架構圖如下:

內置120MHZ Qualcomm Kalimba audio DSP;
外掛可編程QSPI Flash;
支持2MIC模擬/數字;
支持SPI/I2C/UART,I2S輸入;
Aptx,Aptx_HD,Aptx LL;
支持低功耗模式;
支持充電管理模式;
支持ClassD,ClassAB輸出;
支持Sink和earbud工程設計;
VFBGA-90pin, 5.5*5.5mm封裝;
3. D4基本性能介紹
- 超低功耗可編程DSP處理器;
- 支持第三方算法;
- 豐富的接口:SPI/I2C/UART/I2S;
- 體積小:Wlcsp36封裝,2*2.4mm;
- 適用於藍牙耳機音箱等領域;
- 集成2路ADC模數轉換;
- 3路模擬MIC輸入,或者3路數字MIC輸入。
D4代碼加載啟動,支持多種接口,各種接口速率如下:
SPI up to 15.4Mbps,優先推薦選擇;
I2C up to 3Mpbs;
UART up to 6Mbps;
D4的 1MIC通話功耗如下:
休眠模式:70uA
1MIC低功耗模式:0.8mA;
1MIC通話降噪模式:3.3mA;
數字MIC支持採樣率:8,16,22.5,32,44.1,48K,16Bit/24Bit;
4. 產品原理圖整體設計如下:
5. 產品PCB layout設計細節注意:
QCC3020的電源和地是很關鍵的地方,所以PCB走線優先考慮晶片的電源和GND的完整性,再到晶振/RF/信號;信號線儘量遠離電源和干擾源,RF天線預留足夠的空間和乾淨的GND;

QCC3020信號層走線細節:內層信號GND包裹,相鄰層有完整的GND隔離,減少層與層間信號的互相干擾;

D4電源和MIC模擬信號再TOP走線細節:MIC的走線遠離電源線,使用GND線包裹,TOP層的GND也需要保證完整性;

D4信號層走線儘量有GND包裹,儘量減少和電源的並行,模擬信號線和數字信號線分開,最好成組出線,減少干擾;

6. 產品通話調試,搭建的調試硬體環境如下:
QCC系列調試底板+QCC3020+D4模塊搭建實際調試環境;

7. QCC3020代碼整改和D4降噪算法移植
QCC3020基本代碼系統初始化:

QCC3020的通訊SPI口初始化:

問問算法在D4晶片初始化加載:

D4通過UART錄音,加載出門問問算法前後測試效果圖:
