记得应该是16年的时候,从一个公开课看到了关于OCR方面的内容,里面讲到了通过OpenCV对身份证号码区域的剪裁以及使用Tess-Two进行文字识别,实现了对身份证号码的识别功能。
断断续续看了点关于OpenCV的资料,感觉不是这个专业的真难看懂,各种公式各种名词。今天主要用于做个记录,那个一直碎碎念的东西终于完成了!
原理
我理解的原理(除去文字识别):
对图片进行降噪以及二值化,凸显内容区域
对图片进行轮廓检测
对轮廓结果进行分析
剪裁指定区域
代码实现
本文采用VS2017实现,代码如下:
#include "stdafx.h"
#include "idocr.h"