NXP RT106S -(3) Dspotter 語音調教測試

一.介紹

Local Voice Commands 與市面上的智慧音箱、你我手機裡頭的語音助理不同,可以不需要透過網路即可執行語音命令,除了在應用上帶來些許便利性,也保障了使用者的隱私安全;與高成本的 MPU 架構不同,只需透過賽微科技    (Cyberon) 提供的 DSpotter 搭配 NXP i.MX RT106S MCU 即可實現 Local Voice Commands。
i.MX RT106S 專案提供 Automatic Speech Recognition (ASR) 及 Audio Front End (AFE) 幫助語音辨識準確率及基礎抗噪能力,將語音資料進行上述處理後,再經由 DSpotter 進行語音辨識。
當語音命令配置完成後,可使用 Cyberon 提供的工具 Online test tool 及 Offline test tool 進行測試, 針對工具上操作配置進行說明

 

二.DSpotter Online test tool

1.當語音命令建立完成後可使用 DSpotter Online test tool 工具透過電腦端的麥克風收音進行測試,藉此確認語音命令狀態,測試以每個分頁為 Group 進行測試。
   命令配置完成,點選 Save Project 後再點選 Online Test 則可以開啟 Online test tool。

2.在此介面下點選 Recording Device 可選擇電腦端的收音設備。

3.選擇完畢後點選 Start,此時可以進行命令測試,Hey NXP可看到在中間視窗有相對應的分數 Confi. 、SG Diff、Cmd Energy
 

Confi :
即 Confidence 此分數代表語音模型與測試音源相似程度,建議平均 50 分以上
SG Diff :
即 SG Difference 此分數代表音源和非指令的差距 (Silence/Garbage),建議平均 30 分以上
Cmd Energy :
此像分數代表音源能量大小,此項目僅供參考聲音大小。

三.DSpotter Offline test tool

1.當所有命令調校完成後可透過 DSpotter Offline test tool 進行長時間測試,可先預錄長時間音源透過 Offline test tool 可在短時間確認觸發命令情形,根據使用情境不同可用來測試多個語音命令的觸發率,或非語音命令的檔案誤觸發率,如透過預錄 24HR TV 音源用以測試在環境噪音下,是否容易誤觸發命令,藉此調整相關參數。在 DSpotter 介面中先點選 Save Project 後再點選 Offline Test 即可開啟  DSpotter Offline test tool
 

2.下圖為 DSpotter 介面,點選 Load Wave 可載入預錄的音檔,此處須注意需為 wave 格式音檔。


3.載入完成後,會如下圖跑出 Hit (命令觸發次數) 資訊並標示在音源幾秒偵測到命令,並顯示相關分數。
 

4.在測試時可選擇下圖框選處可在測試時加入系統的噪音 (Office Noise, Babble Nosie, Cybcar Noise) 或者自行客製的噪音 (User Noise),格式同樣為 wave 格式,藉此確認命令設計上在不同環境下的觸發率。


5.DSpotter offline test tool 可一次載入多個 wav 音源檔案,比如錄製不同人的語音命令,藉此測試在不同口音下命令的設計是否可以達到需求,在載入多個語音命令。
要一次載入多個語音需要先製作腳本檔案,使用 txt 將音源檔的路徑標示如下並存檔



6.在存檔位置將該檔案副檔名修改為 *spt 即可



7.在 DSpotter 中點選 Load Script,選擇剛剛創建的 *.spt 檔案,DSpotter 將會根據配置的路徑載入對應的 wav 檔案並顯示相對應的測試結果


 

8.結果如下所示, Offline test tool 會將對應的音源檔載入並顯示該音源的命令觸發次數。

 

四.參考資料

★博文內容均由個人提供,與平台無關,如有違法或侵權,請與網站管理員聯繫。

★文明上網,請理性發言。內容一周內被舉報5次,發文人進小黑屋喔~

評論