论文研究-维吾尔文扫描页的倾斜校正.pdf

所需积分/C币:9 2019-07-22 20:19:35 1.35MB .PDF
收藏 收藏
举报

为了方便维文图像的切分和识别工作, 提出将基于凸多边形的最小面积外接矩形法和基线拟合法相结合的检测和校正图像方法。首先提取边缘像素生成凸多边形, 利用基于凸多边形的最小面积外接矩形法实现初步的倾斜校正, 再根据维文沿基线书写的特点, 将图像细化后采用基线拟合的方法完成维文文本的精确校正。实验结果表明, 该方法能够精确地检测出文本图像的倾斜角并校正, 是行之有效的方法。
第5期 唐群群,等:维吾尔文扫描页的倾斜校正 1553 根据倾角的大小来进行选择和校正 表1基线拟合法和最小面积外接矩形法的对比结果 N∑x2-(∑x1)2 倾斜角/基线合法最小面积矩形法‖斜角/基线合法最小面积矩形法 (4) U.250.24784 N∑yx1-∑x1∑y N∑x2-(∑x1)2 0.80.8065820.853756 1.5 -1.0459971.407669 0.9435931.055124 1.918671 最后倾斜角θ= arctanα,当图像的每一个文木行运算完, 5.363397 46747 得到M个方向1,62,…,O,页面的方向为01c=∑"0/M 最大绝对误差 用θc并釆用双线性插值法对整个面进行校正。 5.0806U2 最小绝对误差0.001770.046773 图4是截取的部分拟合基线效果图。从图中可以看出,拟 0.180231均误差值(-1,1)0.0202570.066398 合得到的线是沿着维文字符基线方向的,因为维文字符的像素 0 0.55585l-0.4C8081 点都是沿基线上下分布的,具有很强方向性。 Hough变换法是常用的方法,为了说明木文方法的效果, 与传统的Iogh变换法进行∫对比,如表2所示。 山4A 表2本文方法与Houh法的对比结果 心2 倾斜角/°Hg变换法本文方法恒斜角/。Hmgh变换法本文方法 6.0 图3部分细化图 图4部分拟合基线图 4.0 3.827135 1.9-1.786670 这个方法精度较高,但是也存在局限性。本文文本行间距 2.8 2.9 2.807841 9.2 262413 约12~15个像素,旋转1倾斜16个像素,文本行分割不开,所 1.61.478325最大绝对误差0.30.07512 以系统会先使用最小外接矩形法进行·次校正,再利用基线拟 8 .80.806582最小绝对误差0.0 合的方法对文本进行精确校正。 0.176339平均误差值0.130.0250332 0.0 0.099788 1.3维文扫描页倾斜校正过程 表2将本文的方法与传统的 Hough方法进行了个对比,传 1)将256色灰度图用大沣阀值(Ou)法将图像二值化。统的Hgh方法最小误差为0,最大误差为0.3,平均误差为 b)从左往右、从上到下扫描图像,记录图像每行的第一个 黑像素;从右往左类似,记录遇到的第一个前景点。 0.13.而本文方法最小误差为0.000212,最大误差为 c)将记录的前景点生成凸边形,用最小面积外接矩形法0.075423,平均误差为0.0250332。可见,本文方法将最小面积 外接矩形法与基线拟合法相结合,在拟合前先将图像细化,这 得到倾斜角。 d)当偭斜角θ∈(-1,1)度时,利用水平投影得到文本行 样发挥了各种方法的优势,弥补了各种方法的缺陷,既可以增 数和每文本行的起始位置及高度,将每文本行细化,采用大倾斜角检测范围,又提高了精度。 图5(a)为倾斜的原始灰度图,(b)为二值化后校正的 基线拟合的方法得到倾斜角度,并使用双线性插值法对页面进 页面。 行校正,否则转c)。 E-H nLif IJL s L.LsU 为-y e)先用最小面积外接矩形法对图像进行一次校正,再使 cLay uls L儿 u 用基线拟合的方法对图像进一步的精确校正。 14;x1沙1: 2实验结果及讨论 s+ LH la4 vss t4 I 为了验证本文方法,在lne1Cure2 uad CPU Q9500@ 2.83GHz、1.85GB内存、 Windows XP操作系统、VC++6.0的 +is uy c-nt yLSL latI 山心、 环境下利用OpenⅤ视觉算法库完成程序的编写。本文的维 55x5山5 文图像分辨率是300D,图像大小大致为950×2500像素,因 ssL_U bala t Liu 为实际现实中扫描图像的倾斜角一般在(-5,5)度范围内,所 以本文的测试大多是在此范围内进行。为了说明该方法各自 (a)倾斜页面 (b校止后的页面 的优势及局限,将其中·幅校正后的图像作为基准佟,对其旋 图5文本页面校正效果 转不同角度,用最小面积外接矩形法与基线拟合法进行了对比 测试,如表1所示。 3结束语 表1的图像大多倾角是在(-1,1)角度范围.基线拟合法 平均误差值为0.020257,而最小面积外接矩形法平均误差值 本文提出了将基于凸多边形的最小面积外接矩形法和基 为0.066398,可以看出在(-1,1)内,基线拟合法检测精度比线拟合法相结合的检测和校正图像的方法。这两个方法有其 最小面积外接矩形法高,但是超过这个范圄,由于文本行未能各自的优势和局限性。最小面积外接矩形法是将边缘像素点 分割开,精度就大大下降,甚至给岀错误结果,如傾斜角为生成凸边形,抆岀凸边形的最小面积外接矩形,其能够检测范 1.5时,基线拟合测出5.36°。而最小面积外接矩形法测试范围比较大的倾斜角,但是精度不是很高;基线拟合是利用维文 围比较大,所以本文会先使用最小面积外接矩形法测出倾角,宇符书写的特殊性——沿基线连笔书写,先将(下转第157页) 第5期 侯金鑫,等:改进 Closed form solution方法进行前景物体运动模糊抠图 1557 两组实际运动模糊图像进行抠图的结果。从两组真实图像抠运动模糊抠图中取得很好的效果。不足之处是局部梯度统计 图结果屮可以看出, Closed_ Form Solution方法对运动模糊图像特征在进行运动方向和大小仁计时并不能保证完全佔计准确 抠图在细节上眀显有缺失,使得抠图结果存在较为严重的不连使得抠图在有些部分也不能取得十分满意的效果。下一步研 续现象,特別是在些受到背景严重干扰的地方不连续表现得究的方向是将抠图得到的运动前景进行大模糊,得到清晰的原 更为明显。而用本文改进的 Closed form solution方法对运动始图像。 模糊图像能够提取出更连续清昕的前景图像。表1中对一些参考文献: 严重受到背景干扰的局部小区域的抠图效果过行了对比,在局[1] PORTER T, DLFF T. Compositing digital images[J]. Computer 部放大对比图像中,上边小区域图像表示原有C! osed form s Graphics,1984,18(3):253-260 lution方法得到的局郡运动模糊区域效果,下边小区域图像表「2 SUN Jian, JIA Jia-ya. TANGC K,eat. Poisson matting[ C1//Proc 示本文方法得到的抠图效果。从表中也可以看出,本文方法在 f ACM SIGGRAPh. New york. ACm Press 2004 315-321 连续性、清晰性以及准确性上相对原有方法效果更好。 [3 CHUANG Y, CURLESS B, SALESIN D, el al. A Bayesian apprACh to digital matting C| //Proc of IEEE Conference on Computer Vision and Pattern Recognition. 2001: 264-271 [4 L.FVIN A, T. ISCHINSKI D, WEISS Y. A closed form solution to nal (a)仿真图像(b) Trimap() Closed form(d)本文算法(e)原始透明度 ural image matting. I. IEEE Trans on Pattern Aualysis and Ma chine Intelligence, 2008, 30(2): 228-242 [5 LEVIN A, RAV-ACHA A, LISCHINSKI D. Spectral matting[J] IEEE Trans on Pattern Aualysis and Machine Intelligence 2008,30(10):6991712 [6 LEE P G, WL Y. Ll matting[ C]//Proe of the 17th IEEE Interna- 脚部图像(g) Closed form(h)本文算法()原始透明度 图4改进算法前后仿真实验对比 tional Conference on Image Processing. 2010: 4665-4668 表1两组真实运动模糊图像报图 I LEE P G, WU Y. Nonlocal matting[ C]//Proc of IEEE Conference 本文算法 on Computer Vision and Pattern Recognition. 2011: 2193-2200 原始图像 L8 DAI S, WU Y. Motion from blur C//Proe of IEEE Conference on Computer Vision and Patlern Recognition. 2008: 1-8 局部放大 对比 Closed form [9]甘明刚,陈杰,刘劲,等.一种基于三帧差分和边缘信息的运动目 Solution 标检测方法[J].也子与信息学报,2010,32(4):894-897 [10] CHRISTODOULOU L, KASPARIS T, MARQUES O. Advanced sta 4结束语 tistical and adaptive threshold techniques for moving object detection and segmentation[ C]//Proe of the 17th IEEE International Confer- 本文提出了一种改进的 Closed form solution方法用于运 ence on Digital Signal Processing. 2011: 1-6 动模糊图像抠图。相对于原有方法,本文方法利用运动模糊产「 SHAN QI, XIONG Wei, JIA Jia-yo. Rotational motion deblurring of a 生过程中透明度平滑连续的特点,在原有方法的基础上增加了 rigid object from a single image[C]//Proc of the 11th IEEE Interna 项平滑约束项,使得对于运动模糊物体提取能够获得更为平 limnal Conference on Computer Vision. 2007: 1-8 滑和真实的图像。平滑约束项主要通过结合运动模糊图像局「121 LIU Ren-ting, LI Zhao-rong, JIA Jia-ya. Image partial blur detection 部梯度统计特征,将运动方向和运动大小这兩个运动参数作为 and classification[ C]//Proc of IEEE Conference on Computer Vision 平滑项的方向和权車信息规整化为约束项,使得平滑约束项在 n Pallern Recognition. 2008. 1-8 (上接第1553页)图像细化后用最小二乘法来拟合基线得到倾5]孙楠,刘志文一和改进的中文文档图像倾斜检测方法[J]计算 斜角,其在小角度范围精度较高,但是在未能正确切分文本行 机仿真,2006,23(9):184-187 的情况下会得出错误的结果。所以,本文将两者结合,得出图[6S4 AFABAKHSH R, KHADIVI S. Document skew detection using min 像的倾斜角并校正。实验证明,此方法精度高,对于偭斜的维 imllrm-area bounding rer lIngle[ C]//Proc of IEF.F. Internalional Co- 文文本能得到较好的校正效果。下一步的工作是将拟合基线 ference on Information Technology. Washington DC: IEEE Computer cociety,2000:253-258 法用在维文字符切分工作中。 [7程鹏飞,闫浩文,韩振辉.一个求解多边形最小面积外接矩形的 参考文献: 算法[J.工程图学学报,2008,29(1):122-126 [1]张顺利,李卫斌,吉军,基于投影的文档图像倾斜校王方法[J.计[8岳宁,段会川.新的文本图像倾斜检测及校正算法[J.计算机工 算机工程与应用,2010,46(3):166-168. 程与没计,2007,28(23):5671-5673 2」阿里木江·亚森,哈力木拉提·买买提.维吾尔文联机手写汉别「9刘云飞.脱机手写体汉字识别中细化,特征提取和相似字识别 的预处理与特征提取[D].乌鲁入齐:新疆大学,2010 LD」.长沙:湖南人学,2006. 「3]周冠纬,平西建,栏娟,基于改进 Hough变諛的文本图像倾斜校正[I0]陈波,王加俊,吴陈.基于页面前景和最小二乘法的倾斜校正 方法[J].计算机应用,2007,27(7):52-57 「J1.计算机工程,2007,15(33);202-204 L4」李晓,袁保社.印刷体维吾尔文识别系统预处理硏究LD」.乌鲁木ll何西,李云峰,朱庆生.彩色文档阏像的倾斜自动校正算法 齐:新疆大学,2012 [J].中国图象图形学报,2006,11(13):367-370

...展开详情
试读 4P 论文研究-维吾尔文扫描页的倾斜校正.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    • 至尊王者

      成功上传501个资源即可获取
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    论文研究-维吾尔文扫描页的倾斜校正.pdf 9积分/C币 立即下载
    1/4
    论文研究-维吾尔文扫描页的倾斜校正.pdf第1页
    论文研究-维吾尔文扫描页的倾斜校正.pdf第2页

    试读已结束,剩余2页未读...

    9积分/C币 立即下载 >