一、简介
什么是 OCR 技术?
OCR 英文全称是 Optical Character Recognition,中文叫做光学字
符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读
取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字
识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成
熟了,并且在商业中已经有很多落地项目了。
OCR 技术的分类:
一.按主题划分:手写体识别和印刷体识别。
1.印刷体大多都是规则的字体,技术上的难点是,在印刷过程中字体
很可能变得断裂或者墨水粘连,使得 OCR 识别异常困难。当然这些
都可以通过一些图像处理的技术帮他尽可能的还原,进而提高识别率。
总的来说,单纯的印刷体识别在业界已经能做到很不错了,但说 100%
识别是肯定不可能的,但是说识别得不错那是没毛病。
2.手写体识别一直是 OCR 界一直想攻克的难关,但是时至今天,识别
难度还是很大。为什么手写体识别这么难识别?因为人类手写的字往
往带有个人特色,每个人写字的风格基本不一样,虽然人类可以读懂
你写的文字,但是机器缺很难。印刷体一般都比较规则,字体都基本
就那几十种,机器学习这几十种字体并不是一件难事,但是手写体,
每个人都有一种字体的话,那机器该学习多少字体啊?这就是难度所
在。