經濟型 AI 視覺處理器 RV1103 系列規格差異解析

關鍵字 :RockChipAI1103機器視覺演算法

暨2022年推出的RV1103, 瑞芯微於今年2024年針對RV1103規格再推出內建不同記憶體大小的RV1103B系列產品, 加上原本的RV1103 總共有四個型號

RV1103G1, RV1103BG1, RV1103BG2, RV1103BG3(G3 暫定可能不推廣).

除了內建DDR 大小的差異, 本文將把這四個型號的RV1103的其他的差異整理並做詳細說明.

規格相同的部分

CPU :

CPU 相同都是ARM Cortex-A7, 最高頻率為1.2GHz

MCU :

偕同處理器都是 : RISC-V 的MCU


Video output:

顯示輸出介面(Video out ) 使用使用SPI 介面的MCU 屏.

VOP :

可以支援最大螢幕解析度320x240

RGA :

都有支援RGA (Raster Graphic Acceleration) 2D 圖像處理加速器.

Ethernet:

網路介面為1組10/100 MAC RMII 內建PHY.

SDIO :

SDIO 介面相容於 SDIO3.0,資料寬度4bit. 可接WiFi chip 或是當作SD 卡介面.

Flash 介面支援 : SPI Nor/Nand Flash/eMMC 4.51 4bit 資料寬度

USB:

USB介面 為一組 USB2.0 OTG

SPI :

SPI 介面僅有一組控制器但支援兩個CS, 可用來做影像輸出接MCU 屏.

 

規格差異的部分

NPU :

0.5Tops 算力

RV1103 支援 int8/16

RV1103B 只支援 int8

DDR : 

RV1103 只有 512Mb(64MB)DDR2 可以選擇

RV1103B 有3種DDR 可以選擇

RV1103BG1 512Mb(64MB)DDR2

RV1103BG2 1Gb(128MB)DDR3L

RV1103BG3 2Gb(256MB)DDR3L

 

ISP : 

ISP 處理能力有些微的不同

RV1103 4M

RV1103BG1 4M

RV1103BG2 5M

RV1103BG2 4K15fps

 

Video in :

RV1103 影像輸入介面為 2x2lane MIPI CSI DPHY 1.5Gbps Rx 跟LVDS, 可以接MIPI/LVDS camera 或是來自其他IC 的 MIPI CSI Tx/LVDS訊號, 可以拆分2x2lane 支援雙攝像頭或是合併為4lane使用.

RV1103B 只有支援MIPI CSI 介面, 同樣可以拆分2x2lane 支援雙攝像頭.

Encoder :

RV1103編碼器支援最大4M30

RV1103B 編碼器支援最大4M15

(RV1103 系列都沒有解碼器)

IVE :

RV1103B 取消了IVE (Intelligent Video Engine) 圖形分析加速模塊

Audio codec : 

RV1103有2個ADC, 1個DAC
RV1103B 的ADC/DAC 各只有一個.

RTC :

RV1103B 內建了 RTC, RV1103 則沒有內建RTC.

 

GPIO :

RV1103 有45個GPIO

RV1103B 只有37個GPIO

I2C :

RV1103 有3組I2C 控制器.

RV1103B有5組I2C 控制器.



PWM:

RV1103 有11組PWM.

RV1103B有3組PWM.

UART :

RV1103 有4組UART.

RV1103B有3組UART.

Package :

包裝樣式跟大小都是QFN88 (Body: 9mm x 9mm pitch 0.35)

但RV1103 跟 RV1103B 腳位配置不同, 所以沒有Pin to Pin

Application 部分RV1103B不支援AOV, RV1103 才有支援AOV.

RV1103推薦應用 :

RV1103 有著啟動速度快, 低功耗等特色.

OS 採用Linux + RTOS 方案, 首幀可以在100ms 以內收幀.

在300ms 完成AI 檢測, 運行4M15fps功耗只有230mW 非常適合經濟型AI 攝像頭的應用, 其他特色還有

 低照度時攝影效果好 :

RK運動物體清晰度表現更好,無拖影和透的現象,輪廓更清晰,顏色表現更好

RK整體畫面曝光更合理, RK暗區雜訊水準更小, 支援RK AI 演算法RKIVA

智慧視頻分析(IVA: Intelligence Video Analysis)演算法SDK主要面向IPC、NVR、智慧門鈴、機器人、視訊會議等機器視覺方向提供一系列智慧分析演算法。

 

支援 RK AUDIO 演算法 : 

AI-音訊 AI-NR

功能:AI-NR可以準確識別人聲,對雜訊進行有效的抑制,有效減少外界雜訊的干擾

應用:錄音、雙向通話

 

支援 AI-音訊 聲音事件檢測 : 

功能:感知所處的聲音場景,識別出各個聲源分類,檢測連續音訊流中有無出現目標聲音事件。

最大延遲:哭聲檢測/警報檢測 2s,玻璃破碎檢測 0.6s

單次檢測正確率:哭聲檢測/警報檢測 > 99%,玻璃破碎檢測 > 90%

 

AI-音訊 嘯叫抑制、特定雜訊抑制 : 

功能:抑制由於揚聲器和麥克風之間的正回饋產生的聲學嘯叫

應用:近距離APP直播、對講

可消除特定的噪音

     辦公室場景(鍵盤聲、空調聲、走動聲等)

     戶外場景(鳴笛聲、風聲等)

 

AI-音訊 語音喚醒、關鍵字識別 : 

語音喚醒:在設備中預置喚醒詞,當使用者發出該語音指令時,設備便從休眠狀態中被喚醒

關鍵字識別:檢測音訊流中的單詞或短語並作出指定回應,大大提升了人機交互的效率。

語音喚醒:
支援中英文喚醒,支援定制

平均喚醒率 > 95%

 

關鍵字識別:

支援數十至數百個關鍵字(取決於網路大小)

平均識別率 > 95%

                                                         
                                                                                                     Block Diagram

  Block Diagram

★博文內容參考自 網站,與平台無關,如有違法或侵權,請與網站管理員聯繫。

★文明上網,請理性發言。內容一周內被舉報5次,發文人進小黑屋喔~

參考來源

ROCKCHIP: https://www.rock-chips.com/

評論