瑞芯微RV1126B OCR文字识别：CTPN+CRNN技术详解

1. OCR文字识别简介

文字识别也是图像领域一个常见问题。然而，对于自然场景图像，首先要定位图像中的文字位置，然后才能进行文字的识别。所以一般包含两个步骤：

文字检测：解决的问题是哪里有文字，文字的范围有多少。

文字识别：对定位好的文字区域进行识别，主要解决的问题是每个文字是什么，将图像中的文字区域进转化为字符信息。

我们的OCR算法是基于CTPN+CRNN设计的。CTPN是一种文字检测算法，能有效的检测出复杂场景的横向分布的文字，是目前比较好的文字检测算法。CRNN算法主要用于端到端地对不定长的文本序列进行识别，不用先对单个文字进行切割，而是将文本识别转化为时序依赖的序列学习问题，就是基于图像的序列识别。

基于EASY-EAI-Nano-TB硬件主板的运行效率：

2. 快速上手

2.1 开发环境准备

如果您初次阅读此文档，请阅读《入门指南/开发环境准备/Easy-Eai编译环境准备与更新》，并按照其相关的操作，进行编译环境的部署。

在PC端Ubuntu系统中执行run脚本，进入EASY-EAI编译环境，具体如下所示。

cd ~/develop_environment
./run.sh

2.2 源码下载

在EASY-EAI编译环境下创建存放源码仓库的管理目录：

cd /opt
mkdir EASY-EAI-Toolkit
cd EASY-EAI-Toolkit

通过git工具，在管理目录内克隆远程仓库

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-1126B.git

注：

* 此处可能会因网络原因造成卡顿，请耐心等待。

* 如果实在要在gitHub网页上下载，也要把整个仓库下载下来，不能单独下载本实例对应的目录。

2.3 模型部署

要完成算法Demo的执行，需要先下载OCR算法模型。

百度网盘链接为：https://pan.baidu.com/s/1imI86u1O9xH6T6V_0k2jxw?pwd=1234 （提取码：1234 ）。

同时需要把下载的OCR算法模型复制粘贴到Release/目录：

2.4 例程编译

进入到对应的例程目录执行编译操作，具体命令如下所示：

cd EASY-EAI-Toolkit-1126B/Demos/algorithm-ocr/
./build.sh cpres

注：

* 由于依赖库部署在板卡上，因此交叉编译过程中必须保持/mnt挂载。

* 若build.sh脚本带有cpres参数，则会把Release/目录下的所有资源都拷贝到开发板上。

2.5 例程运行及效果
通过串口调试或ssh调试，进入板卡后台，定位到例程部署的位置，如下所示：
cd /userdata/Demo/algorithm-ocr/
运行例程命令如下所示：
sudo ./test-ocr test.jpg
在EASY-EAI编译环境可以取回测试图片:
cp /mnt/userdata/Demo/algorithm-ocr/result.jpg .
结果图片如下所示：
API的详细说明，以及API的调用（本例程源码），详细信息见下方说明。
3. OCR文字识别API说明
3.1 引用方式
为方便客户在本地工程中直接调用我们的EASY EAI api库，此处列出工程中需要链接的库以及头文件等，方便用户直接添加。
3.2 OCR检测初始化函数
设置OCR检测初始化函数原型如下所示。
int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);
具体介绍如下所示。
3.3 OCR检测运行函数
设置OCR检测运行原型如下所示。
int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);
具体介绍如下所示。
3.4 OCR检测释放函数
设置OCR检测释放原型如下所示。
int ocr_det_release(rknn_app_context_t* app_ctx);
具体介绍如下所示。
3.5 OCR识别初始化函数
OCR识别初始化函数原型如下所示。
int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);
具体介绍如下所示。
3.6 OCR识别运行函数
OCR识别运行函数原型如下所示。
int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);
具体介绍如下所示。
3.7 OCR识别释放函数
OCR识别释放函数原型如下所示。
int ocr_rec_release(rknn_app_context_t* app_ctx);
具体介绍如下所示。
4. OCR检测算法例程
例程目录为Demos/algorithm-ocr/test-ocr.cpp，操作流程如下。
#include #include #include #include"ocr.h" using namespace cv; using namespace std; #define INDENT " " #define THRESHOLD 0.3 // pixel score threshold #define BOX_THRESHOLD 0.9 // box score threshold #define USE_DILATION false // whether to do dilation, true or false #define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type int main(int argc, char **argv) { if (argc != 2) { printf("%s \n", argv[0]); return -1; } /* 参数初始化 */ const char *img_path = argv[1]; Mat input_image, rgb_img; input_image = imread(img_path); if (input_image.empty()) { cout