没有合适的资源?快使用搜索试试~ 我知道了~
人工智能-图像处理-异常文档图像处理的关键技术研究与实现.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 171 浏览量
2022-07-06
05:28:44
上传
评论
收藏 690KB PDF 举报
温馨提示
试读
51页
人工智能-图像处理-异常文档图像处理的关键技术研究与实现.pdf
资源推荐
资源详情
资源评论
I
摘 要
伴随着计算机技术的不断发展,基于数字图像处理以及图像模式识别技术的应用
也随之延伸到诸多方面。文档的电子化管理已成为文档管理的发展趋势,因而研究纸
质文档资料的电子化处理、文档图像信息的提取所涉及的相关技术,有着十分重要的
现实意义。
论述了数字图像的应用现状及发展方向,并对图像的分析、增强、复原和压缩等
基本的数字图像处理方法进行了描述。归纳了模式识别技术的应用和技术本身的发展
现状。在此基础上进一步论述了文档图像的标记识别过程以及文档图像的倾斜校正,
包括识别对象的概念、标记识别所完成的工作、倾斜文档图像校正的原理与几种常用
的方法。
纸质文档在形成文档图像时可能存在一定的倾斜,分析了文档图像倾斜校正的原
理,提出了一种基于 Hough 变换的快速的文档图像倾斜校正方法,该方法利用文档
图像中存在水平直线的特征,引入窗口的思想,较好地解决了文档图像处理中的倾斜
校正问题。围绕某些异常文档图像的相关信息成像效果不佳的问题,论述了这类异常
文档图像特征提取的两种常用方法。
针对计算机网上阅卷这一特定应用的需求,论述了异常答题卡图像的处理过程,
包括异常答题卡图像的分类与提取,异常答题卡图像的预处理,以及异常答题卡图像
的识别过程,并对相关技术的具体应用以及一些算法做了详细的论述。利用模板定位
的方法,给出了一种快速而精确的边缘检测算法,实现了目标的精确定位。
实际运用效果表明,所研究的异常文档图像处理技术不但可实现异常文档图像的
处理,而且提高了异常文档图像识别的速度与精度,具有较为广泛的应用价值。
关键词:文档图像;倾斜校正;窗口;模板;边缘检测
II
Abstract
As computer science and multimedia technology are developing fast, multimedia
digital image has become more popular. As a result, digital image processing and image
pattern recognition extend to various areas gradually and are being improved and
developed continually. Managed the paper document by computer becoming more and
more popular. Document image processing and feature extraction from document image
has become the focus of current research.
This paper introduces the current status and future direction of digital image
application, and discusses several methods such as image enhancement, analysis,
restoration and compression. It also introduces application of pattern recognition,
especially image pattern recognition. Discuss the process of mark recognition and skew
adjustment in document image processing.
Analysis the theory of skew adjustment of document image, proposes a fast skew
adjustment algorithm for document image. Researches the characteristic of horizontal line
in document images, introduces the moving windows, resolve the problem perfectly. In
order to extract information from some exceptional document image, discuss two method
for characteristic extraction.
Aim at the application of network testing, discuss the exceptional test paper
processing, which include the sort of exceptional test paper, the pretreatment of
exceptional test paper, the recognition of exceptional test paper. At the same time, a precise
and fast algorithm for edge detection based on template is given out, which can satisfy with
the requests of extracting information very well.
In practice, when extracting the information from exceptional document image, the
technologies which given in paper can assure us that the extracted information is nicety.
The application foreground of these technologies is very extensive.
Key words: Document Image; Skew Adjustment; Windows; Template; Edge Detection
III
目 录
摘 要 ................................................................................................................. I
Abstract ............................................................................................................. II
1 绪论
1.1 课题研究背景.......................................................................................... (1)
1.2 数字图像处理与图像模式识别发展现状 ............................................. (2)
1.3 课题研究的意义、内容和目标 ............................................................. (6)
2 相关技术基础
2.1 文档图像的生成 ..................................................................................... (7)
2.2 文档图像的识别 ..................................................................................... (9)
2.3 倾斜文档图像的校正 ........................................................................... (13)
2.4 小结 ........................................................................................................ (17)
3 异常文档图像处理相关技术
3.1 异常文档图像的特征 ........................................................................... (18)
3.2 基于 Hough 变换的异常文档图像倾斜校正 ...................................... (18)
3.3 异常文档图像的特征提取 ................................................................... (24)
3.4 小结 ........................................................................................................ (26)
4 一类特定异常文档图像的处理
4.1 概述 ........................................................................................................ (27)
4.2 异常答题卡图像的分类与提取 ........................................................... (27)
4.3 异常答题卡图像的预处理 ................................................................... (29)
IV
4.4 异常答题卡图像的识别 ....................................................................... (31)
4.5 小结 ........................................................................................................ (40)
5 结束语
5.1 已完成的工作........................................................................................ (41)
5.2 下一步的工作........................................................................................ (41)
致 谢 ........................................................................................................... (43)
参考文献 ....................................................................................................... (44)
1
1 绪论
1.1 课题研究背景
公元 105 年,中国的蔡伦发明了造纸术,为纸张取代竹帛开辟了前景,为文化的
传播创造了有利的条件,随着造纸术在世界范围内的推广使用,极大地推动了人类社
会文明的发展。直到今天,大量的信息仍然是记录在纸质文档上,纸质文档具有不便
于长期保存、检索和修改的缺点
[1]
。随着信息时代的来临,数字信息资源成为人类最
重要的资源,越来越成为国家政治、经济、社会和文化活动所依赖的信息基础设施,
是各国强化综合国力竞争的战略财富。将纸质文档信息转换为数字信息,我国政府对
此亦是十分重视。文档的电子化、数字化处理已成发展趋势。进入 20 世纪 90 年代,
随着计算机网络和多媒体技术的发展,人类开始步入无纸化时代。纸质文档(例如报
告、文件、报纸、书籍、杂志、信件、票据和考试答题卡等)的数量并没有因此而减
少,反而还在不断的增加。手工处理这些文档不但费时费力,还容易出错,需要利用
计算机对文档进行自动处理,将纸质文档信息转换为计算机能存取的符号方式表达
(以下称为文档图像处理)。文档图像处理主要包括对文档进行版面理解
[2]
和光学字
符识别 OCR
[3]
(Optical Character Recognition)两大部分。据估计,世界上每年花费
在将纸质文档信息手工录入到计算机的费用超过 2500 亿美元
[4]
。
如何将浩如烟海、与日俱增的大量文档制作成为便于检索、传输、保存和携带的
电子文档,实现办公自动化,已成为一个急待解决的问题。自 20 世纪 80 年代以来,
文档图像处理成为模式识别和人工智能研究领域的热点。其目的是解决文档信息的高
速、有效、方便、自动地输入到计算机的问题,文档图像处理涉及到机器视觉、图像
处理、人工智能、模式识别、自然语言理解等学科,这些学科中的一些新的原理和方
法在文档图像处理中得到了应用,文档图像处理是一门介于基础理论研究和应用研究
之间的综合性学科
[5-9]
。由于文档图像版面理解研究的不足,大多数的纸质文档仍然
采用手工录入的方式输入到计算机。目前,文档图像处理的研究方向主要是文档图像
剩余50页未读,继续阅读
资源评论
programyp
- 粉丝: 88
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 人脸检测-使用OpenCV实现的动漫+漫画人脸检测算法-附项目源码-优质项目实战.zip
- 道路贴图,材质材料免费
- 58234458141025
- 人脸检测-基于OpenCV+Node.js+WebSockets实现的实时人脸检测应用-附项目源码-优质项目实战.zip
- 一些常见的MySQL死锁案例-mysql-deadlocks-master(源代码+案例+图解说明)
- UE4动画烘焙器-ue4.27
- 新建文件夹.zip
- 1103a2a791bbd96ea98021062e327495b1c422e32fb27e0c2d6404b1bd74b692.gif
- 同城相亲交友php小程序
- stm32f103实现的按键FIFO
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功