寒武纪 MLU270上測試Pytorch模型

關鍵字 :Cambricon 寒武纪 MLU270 推理加速卡

准备工作

參照《Cambricon_MLU270运行环境搭建》準備好SDK和安装環境

启动容器

请勿使用SDK中自带的Pytorch docker image，在build过程中可能会报错。已请Cambricon技术更新相关文档，当前最新的pytorch docker image位于如下地址：

链接：https://pan.baidu.com/s/1OmewvbhvWMOxv9tdZr0MzA

提取码：556w

加载image，命令行执行：$sudo docker load < pytorch-image-0.14.1.tar

查看刚刚加载的image：sudo docker images

启动容器：基于镜像 pytorch-image-0.14.1.tar 启动一个容器，并映射相关工作目录，脚本內容如下

进入docker后，首先需要激活环境：

source /torch/venv3/pytorch/bin/activate

再进入目录：

cd /torch/examples/online/mask-rcnn/

执行build_mask-rcnn.sh

直接执行run.sh是跑不了的，需要量化，再运行。

模型量化

export TORCH_HOME='/torch/examples/online/mask-rcnn'

export COCO_PATH_PYTORCH='/home/Cambricon-MLU270/datasets'

python test_mask-rcnn.py --min-image-size 800 --mlu false --jit false --image_number 4 --batch_size 1 --half_input 0 --coco_path $COCO_PATH_PYTORCH --quantization true --quantized_mode 1 --ann_dir $COCO_PATH_PYTORCH/COCO --dump false --core_number 16 MODEL.DEVICE cpu

COCO_PATH_PYTORCH目录如下：

TORCH_HOME目录如下：

origin/checkpoints/mask_rcnn.pth

如果没有这个目录下的文件，在下载的该image对应目录下有原始mask_rcnn.pth，可以如下手动创建：

mkdir -p /torch/examples/online/mask-rcnn/origin/checkpoints

cp /home/Cambricon-MLU270/mask_rcnn.pth /torch/examples/online/mask-rcnn/origin/checkpoints

TORCH_HOME指定当前目录，这里用来找原始的pth的。

COCO_PATH_PYTORCH 是datasets目录

执行上面的量化脚本后：

会在当前目录下看到一个mask_rcnn.pth文件。

Online推理

创建一个目录存放生成的pth:

mkdir -p /torch/examples/online/mask-rcnn/online/checkpoints

cp /home/Cambricon-MLU270/mask_rcnn.pth /torch/examples/online/mask-rcnn/online/checkpoints

export TORCH_HOME='/torch/examples/online/mask-rcnn'

export COCO_PATH_PYTORCH='/home/Cambricon-MLU270/datasets'

python test_mask-rcnn.py --min-image-size 800 --mlu true --jit true --image_number 4 --batch_size 1 --half_input 0 --coco_path $COCO_PATH_PYTORCH --quantization false --quantized_mode 1 --ann_dir $COCO_PATH_PYTORCH/COCO --dump false --core_number 16 MODEL.DEVICE mlu

Offline推理

在online模型中，运行在线代码时候，mlu会把pth模型读入，模型实际上已经在mlu的内存上了，pytorch上我们实现了把离线模型保存的功能。

export TORCH_HOME='/torch/examples/online/mask-rcnn'

export COCO_PATH_PYTORCH='/home/Cambricon-MLU270/datasets'

修改test_mask-rcnn.py中内容如下：

表示模型生成，后缀是 cambricon的就是离线模型。

寒武纪 MLU270上測試Pytorch模型

評論