1. 出门问问是一家算法公司,拥有全套自主研发的语音交互8大关键技术:


■多达8个麦克风阵列的信号处理算法
■自研回声消除、声源定位,波束成形、去混响、噪声抑制等核心算法用于远场语音交互场景

■语音识别:采用业界领先的TDNN-F模型垂直领域最精确的中文识别
■热词唤醒:低功耗优化、可定制热词、多热词;采用RNN+DNN两步验证
■语音合成:端到端语音合成技术

■手势识别
■全自动睡眠检测
■主动运动姿态识别,游泳检测等
■运动教练: 自动识别和记录健身动作
■跌倒检测: 适配老年人和儿童的双重模式

■统计式模型:谷歌的BERT模型
■自然语言理解:理解近100个垂直领域和高达13个维度的复杂查询
■多轮对话:垂直领域的多轮对话,例如导航、音乐、电话等等
■知识图谱:实现5000万实体与20亿实体关系连结

■热词唤醒和多命令词识别
■自研针对可穿戴设备的高清语音信号处理算法
■结合双麦克风波束成形算法和骨传导融合算法
■实现在耳机上24小时离线交互
■垂直搜索:自研垂直搜索引擎,接入100+第三方生态
■主动搜索和智能推送:基于可穿戴、家居、车载不同场景数据和用户画像的智能推送
2. QCC3020的功能架构图如下:

内置120MHZ Qualcomm Kalimba audio DSP;
外挂可编程QSPI Flash;
支持2MIC模拟/数字;
支持SPI/I2C/UART,I2S输入;
Aptx,Aptx_HD,Aptx LL;
支持低功耗模式;
支持充电管理模式;
支持ClassD,ClassAB输出;
支持Sink和earbud工程设计;
VFBGA-90pin, 5.5*5.5mm封装;
3. D4基本性能介绍
- 超低功耗可编程DSP处理器;
- 支持第三方算法;
- 丰富的接口:SPI/I2C/UART/I2S;
- 体积小:Wlcsp36封装,2*2.4mm;
- 适用于蓝牙耳机音箱等领域;
- 集成2路ADC模数转换;
- 3路模拟MIC输入,或者3路数字MIC输入。
D4代码加载启动,支持多种接口,各种接口速率如下:
SPI up to 15.4Mbps,优先推荐选择;
I2C up to 3Mpbs;
UART up to 6Mbps;
D4的 1MIC通话功耗如下:
休眠模式:70uA
1MIC低功耗模式:0.8mA;
1MIC通话降噪模式:3.3mA;
数字MIC支持采样率:8,16,22.5,32,44.1,48K,16Bit/24Bit;
4. 产品原理图整体设计如下:
5. 产品PCB layout设计细节注意:
QCC3020的电源和地是很关键的地方,所以PCB走线优先考虑芯片的电源和GND的完整性,再到晶振/RF/信号;信号线尽量远离电源和干扰源,RF天线预留足够的空间和干净的GND;

QCC3020信号层走线细节:内层信号GND包裹,相邻层有完整的GND隔离,减少层与层间信号的互相干扰;

D4电源和MIC模拟信号再TOP走线细节:MIC的走线远离电源线,使用GND线包裹,TOP层的GND也需要保证完整性;

D4信号层走线尽量有GND包裹,尽量减少和电源的并行,模拟信号线和数字信号线分开,最好成组出线,减少干扰;

6. 产品通话调试,搭建的调试硬件环境如下:
QCC系列调试底板+QCC3020+D4模块搭建实际调试环境;

7. QCC3020代码整改和D4降噪算法移植
QCC3020基本代码系统初始化:

QCC3020的通讯SPI口初始化:

问问算法在D4芯片初始化加载:

D4通过UART录音,加载出门问问算法前后测试效果图:
