聯詠NT9852X AI 系列(一) Caffe模擬軟體實作介紹

關鍵字 :聯詠 Novatek AI Caffe 深度學習 Deep Learning

Caffe深度學習框架的全稱是Convolutional Architecture for Fast Feature Embedding，Caffe最初設計只針對圖像資料集(Dataset)，所以Caffe應用於電腦視覺(Computer Vision)領域比較多，例如人臉辨識、圖像分類(Image Classification)、物件偵測(Object Detection)等，相對於語音或時間序列的資料集，則沒那麼豐富。

聯詠Novatek NT9852x系列是高整合度的AI推論(inference)SoC，可應用於邊緣運算(Edge Computing) IP-CAM的解決方案。此平台提供的Novatek AI Tool，讓開發者可直接先在PC端模擬Caffe深度學習預測的精準度，不必把Caffe模型置入開發板端執行後，才能得知測試結果，可大大加速深度學習的開發效率。

原廠提供的Caffe模型(Model)或許無法滿足每位開發者的應用需求，假設開發者在網路找到其他CNN模型，想測試此Caffe模型是否適合在Novatek NT9852x執行推論預測，此時Novatek AI Tool就是一個很好的模擬工具。

如下圖，舉例從AWS下載已經訓練過的SqueezeNet模型(精簡化輕量級卷積神經網路，適用於硬體條件有限的嵌入式設備)。

下載得到的Caffemodel(模型權重文件)和Prototxt(模型描述文件)，放入PC端的Novatek AI Tool模擬軟體。

嘗試額外增加下圖反白的21~50張作為訓練資料集(Training Dataset)，測試能否提升預測結果的準確度。

模擬測試下圖的黑色巴士。

SqueezeNet模型的訓練資料集增加30張後，發現模擬測試報告的score由0.573上升到0.574。

Novatek AI Tool可在PC端反覆訓練模型是否收斂到滿意的準確度，最後再放到EVB板端跑實際的效果，減少重覆轉換Caffe模型為推論平台的格式，再放到板端執行推論的時間。

<<延伸閱讀>>

IQ實驗室介紹
聯詠NT98528鏡頭畸變校正
Qualcomm FastCV 系列(一) 介紹
Qualcomm FastCV 系列(二) 開發環境架設
Qualcomm FastCV 系列(三) 角點偵測
基於 Qualcomm APQ8053 + GPS 之 ADAS 深度學習辨識方案
基於Qualcomm APQ8053實現邊緣運算(Edge Computing)
Thundercomm TurboX D845 Development Kit開箱文
基於Socionext Miranda之影像識別追蹤行人(Object Tracking) ADAS方案

★博文內容均由個人提供，與平台無關，如有違法或侵權，請與網站管理員聯繫。

★博文作者未開放評論功能