English | 简体中文

通过TVM在 Arm(R) Cortex(R)-M55 CPU 上运行 PaddleOCR文本能识别模型

此文件夹包含如何使用 TVM 在 Cortex(R)-M55 CPU 上运行 PaddleOCR 模型的示例。

依赖

本demo运行在TVM提供的docker环境上，在该环境中已经安装好的必须的软件

在非docker环境中，需要手动安装如下依赖项:

软件可通过安装脚本一键安装
python 依赖
bash
```
pip install -r ./requirements.txt
```
TVM
- 从源码安装(Install from Source) 从源码安装时，需要设置如下字段
  - set(USE_CMSISNN ON)
  - set(USE_MICRO ON)
  - set(USE_LLVM ON)
- 从TLCPack 安装(TLCPack)

安装完成后需要更新环境变量，以软件安装地址为/opt/arm为例：

bash

export PATH=/opt/arm/FVP_Corstone_SSE-300/models/Linux64_GCC-6.4:/opt/arm/cmake/bin:$PATH

运行demo

使用如下命令可以一键运行demo

bash

./run_demo.sh

如果 Ethos(TM)-U 平台或 CMSIS 没有安装在 /opt/arm/ethosu 中，可通过参数进行设置，例如：

bash

./run_demo.sh --cmsis_path /home/tvm-user/cmsis \
--ethosu_platform_path /home/tvm-user/ethosu/core_platform

./run_demo.sh脚本会执行如下步骤:

下载 PaddleOCR 文字识别模型
使用tvm将PaddleOCR 文字识别模型编译为 Cortex(R)-M55 CPU 和 CMSIS-NN 后端的可执行文件
创建一个包含输入图像数据的头文件inputs.c
创建一个包含输出tensor大小的头文件outputs.c
编译可执行程序
运行程序
输出图片上的文字和置信度

使用自己的图片

替换 run_demo.sh 中140行处的图片地址即可

使用自己的模型

替换 run_demo.sh 中130行处的模型地址即可

模型描述

在这个demo中，我们使用的模型是基于PP-OCRv3的英文识别模型。由于Arm(R) Cortex(R)-M55 CPU不支持rnn算子，我们在PP-OCRv3原始文本识别模型的基础上进行适配，最终模型大小为2.7M。

PP-OCRv3是PaddleOCR发布的PP-OCR系列模型的第三个版本，该系列模型具有以下特点：

超轻量级OCR系统：检测（3.6M）+方向分类器（1.4M）+识别（12M）=17.0M。
支持80多种多语言识别模型，包括英文、中文、法文、德文、阿拉伯文、韩文、日文等。
支持竖排文本识别，长文本识别。

README Ch

通过TVM在 Arm(R) Cortex(R)-M55 CPU 上运行 PaddleOCR文 本能识别模型

依赖

运行demo

使用自己的图片

使用自己的模型

模型描述

通过TVM在 Arm(R) Cortex(R)-M55 CPU 上运行 PaddleOCR文本能识别模型