聯詠NT9852X AI 系列(一) Caffe模擬軟體實作介紹

Caffe深度學習框架的全稱是Convolutional Architecture for Fast Feature Embedding,Caffe最初設計只針對圖像資料集(Dataset),所以Caffe應用於電腦視覺(Computer Vision)領域比較多,例如人臉辨識、圖像分類(Image Classification)、物件偵測(Object Detection)等,相對於語音或時間序列的資料集,則沒那麼豐富。

聯詠Novatek NT9852x系列是高整合度的AI推論(inference)SoC,可應用於邊緣運算(Edge Computing) IP-CAM的解決方案。此平台提供的Novatek AI Tool,讓開發者可直接先在PC端模擬Caffe深度學習預測的精準度,不必把Caffe模型置入開發板端執行後,才能得知測試結果,可大大加速深度學習的開發效率。

原廠提供的Caffe模型(Model)或許無法滿足每位開發者的應用需求,假設開發者在網路找到其他CNN模型,想測試此Caffe模型是否適合在Novatek NT9852x執行推論預測,此時Novatek AI Tool就是一個很好的模擬工具。

如下圖,舉例從AWS下載已經訓練過的SqueezeNet模型(精簡化輕量級卷積神經網路,適用於硬體條件有限的嵌入式設備)。



下載得到的Caffemodel(模型權重文件)和Prototxt(模型描述文件),放入PC端的Novatek AI Tool模擬軟體。

嘗試額外增加下圖反白的21~50張作為訓練資料集(Training Dataset),測試能否提升預測結果的準確度。



模擬測試下圖的黑色巴士。



SqueezeNet模型的訓練資料集增加30張後,發現模擬測試報告的score由0.573上升到0.574。



Novatek AI Tool可在PC端反覆訓練模型是否收斂到滿意的準確度,最後再放到EVB板端跑實際的效果,減少重覆轉換Caffe模型為推論平台的格式,再放到板端執行推論的時間。

★博文內容均由個人提供,與平台無關,如有違法或侵權,請與網站管理員聯繫。

★博文作者未開放評論功能