基於意法半導體Arm Cortex-M7 MCU STM32H743 的語音辨識解決方案

意法半導體SL-VUI-CLOUD-01是將AVS for AWS IoT Services® 集成到智能設備中的經濟高效方式,可以實現基於自然語言理解的最先進的語音控制,因此用戶將享受到目標物聯網終端產品的增強體驗。

能夠與 Amazon Alexa® 交談並控制智能家居設備,獲得幫助,聽新聞、查看天氣預報、播放音樂等。

該軟件包實現了音頻前端、亞馬遜喚醒詞、音頻播放和亞馬遜Alexa通信協議軟件。

SDK 僅在內部存儲器上運行,提供最大的集成度和成本效益的解決方案。

SL-VUI-CLOUD-01 採用模塊化方法構建,可輕鬆進行原型設計和調試,並輕鬆適應特定的麥克風間距、用戶界面和音頻輸出要求。 

該方案包括一個帶有 STM32H743 微控制器和經過認證的 Wi-Fi 模塊的主板,以及一個帶有兩個間隔 36 毫米的高質量 MP23DB01HP mems 麥克風和一個 FDA903D 45W 音頻放大器的子板。 一個 8 Ω 揚聲器,支持本地和基於雲端的語音用戶界面。

這種符合亞馬遜標準的解決方案允許將 Alexa Voice 服務快速集成到嵌入式設備中。

主要演算法流程圖如下,    詳細資訊可參考附檔(在微控制器上語音命令識別的混合量化)
 
原廠網頁連結:

SL-VUI-CLOUD-01 - Cost-effective and highly integrated AWS IoT qualified Alexa Voice Service design - STMicroelectronics

相關軟體網頁:STM32本地語音使用者介面擴展包

X-CUBE-LocalVUI - STM32 Local voice user interface expansion package - STMicroelectronics

X-CUBE-LocalVUI 基於音訊捕獲和語音辨識實現本地語音辨識用戶介面。它集成了Sensory TrulyHandsfree™(THF)和Sensory TrulyNatural™(TNL)軟體。

音訊捕獲基於STM32外設和中間件。它展示了如何通過SAI從板式麥克風捕獲音訊。

範例應用程式附帶預設語音辨識模型,使用者可以使用特定的模型輕鬆更新它們。對於示例,可以使用感官語音中心Web工具定義特定模型。

可以移植到其他一些STM32微控制器和電路板上。

感官語音中心 |感官 (sensory.com)

►場景應用圖

意法半導體

►展示板照片

意法半導體

►方案方塊圖

意法半導體

►核心技術優勢

高性能STM32H7單片機 這款高度集成的 MCU 具有 ARM Cortex-M7 內核的性能和快閃記憶體容量,可管理基於雲的高端語音 UI 功能,包括快速喚醒詞檢測、高級音訊前端 (AFE) 以及經濟高效的 LQFP 100 引腳封裝上的完整連接堆疊,無需額外的外設或記憶體要求。 亞馬遜完全合格的軟體參考設計 適用於 AWS IoT 的 Amazon AVS 的合格軟體功能齊全且免費,但 Alexa 喚醒詞元件的評估版本除外,該版本要求在最終產品中獲得亞馬遜許可。 高品質 MP23DB01HP 微機電系統麥克風 超緊湊、低功耗、全向數位MEMS麥克風由電容式感測元件和具有立體聲操作能力的IC介面組成。該元件在性能模式下具有非常高的AOP,靈敏度範圍為±1 dB,在所有工作模式下都具有高SNR 強大的 FDA903D 音訊放大器 這款具有I45S輸入的高效2 W單橋D類放大器包括一個高性能D/A轉換器,具有高性能輸出MOSFET。 通過批量< 10 美元的 POS BOM 實現最大的整合度和成本效益

►方案規格

STM32H753VIT6E 高性能 MCU,帶 2 MB 嵌入式閃存、1 Mb 嵌入式 SRAM 和具有成本效益的 LQFP 封裝 • 2.4 GHz Wi-Fi 子系統和 Murata 1DX 模塊在旁路模式下使用 耦合到 ISSI IS25LP016D 2 MBytes NOR 閃存 • 3 個 MP23DB01HP MEMS 麥克風,間距為 36 和 30 mm • FDA903D D 類數字輸入汽車音頻放大器 • 8 歐姆揚聲器 • 4 個 RGB LED 和 4 個簡單 LED • 操縱桿、重置和用戶按鈕 • 高模塊化母/子板 • 36x65 mm² 小尺寸,簡單且經濟高效的 PCB 設計 •亞馬遜認證的聲學遠場和嘈雜環境支援 •本地喚醒詞檢測 •音訊輸出和無線升級

技術文檔

類型標題檔案
硬件Datasheet/User manual/Bom
硬件Keypart