论文研究-基于颜色边缘与SVM的图像文本定位.pdf

所需积分/C币:10 2019-07-22 22:43:11 145KB .PDF
14
收藏 收藏
举报

提出了一种将颜色边缘与SVM相结合的文本定位与提取的方法。首先根据文本的颜色边缘特征进行粗筛选,获得文本候选区;然后使用SVM分类器进行文本与非文本分类,实现文本区域定位与提取。实验表明,该方法取得了良好的效果。
第3期 许剑峰等:基于颜色边缘与SVM的图像文定位 157 ECx y=mExi Edu( x yix+(-1))yh (16)些误报,所以最后还要对标注了文木块的候选文区进行一 (4)计算E的像素平均值7h对E进行一值化,得到一条列的分析。对于误判或误报,般表现为孤立的块,因此可 边缘图BE 以很快排除。 1,E(x y>Thr BE(x, Y) (17)3试验结果与讨论 O,E(x y>Thr BE中数值为1的点就是边缘点。 木文提出的算法对200帧,每帧320×240像素大小的 (5)过滤BE中一些比较孤立的边象点。因为这些点一般MPEG彩色视频帧图像和150幅不同大小的JPG彩色图像进 不会属」文木,如果保留将会影响后面的文本区域檢测。考慮行了测试,正确检测率达到95.3%漏检率为4.7%,误检率为 到图像或视频帧中的清晰文本高度都接近或超过10个像素,2.7% 因此对BE中的边缘点进行邻域边缘点统计,计算以该点为中 心的11×11邻域窗口中的其他边缘点的个数。BE中以(xy4结束语 为中心的邻域边缘点累计 X+5y+5 本文提出一种在彩色图像和视频帧中提取文宇区域的算 ECx y) BE(, y-1 18)法,利用文本区域垂直颜色边缘密度大的特性,检测山侯选文 如果NE(xy)小于6,则把BE(Xy)置为0 本区域,并用SMM分类器对候选文本区域进行验证。本文算 通过对边缘图BE进行水平投影和乖直投影,可以检测出法具有准确率高,遗漏率低的优点 候选文本区域出来。 参考文献 (1)水平投影。本文只考虑至少两个字符的文行,因此[1]Asmt, T Kanade. Video skimming and Characteri zation Though 对B进行水平技影,灯果一条水平线上的边缘点小于4,则把 the Combination df Image and Language Understanding[ c]. IEEE 这行的边缘点去除。对投影值大于等于4的水平线进行归并, Intemational Workshop on Cantent-based Access of Image and video 得到一些水平带,然后进行高度验证,高度小于六个像素的水 Database, 1998. 61-70 平带,一般不会是文区域,将被去除。剩下的有效水平带可[2 a k Jain,Byu. Automatic Text Locain in Images and video 能包含一行或者多行文本,必须通过垂直投影再进行分割。 Frames ]]. Pattern Recogni tin 1998, 31(12): 2055-2076 (2)平直投影。对水平带进行乖直投影,设水平带高度为 [3 VWu, R Manmatha, E M Riseman. Finding text in Images C] Proceedings of the 2nd a Cm Internationa Conference on Digital Li H,则如果水平方向上超过2H列的投影为0,则在此处将水平 branes,1997,23-26 带进行分割。这样水平带就被分割成一些候选文本区域。 4] Chen Xiang-rong, Zhang Hongjiang Text Area Detection from video (3)对这些候选文本区城重复上述的水平和垂直投影分 Frames[ C]. Proceedings of the 2nd IEEE Pacific Rim Conference on 割,直到不能再分为止 Multimedia: Advances in Multimedia Information Processing 得到的侯选文本区域有可能是虚假文本区域,因此再通过 2001.22-228. sM分类器进行排除。对每个文本候选区应用上述的SM[5张学工.关于统计学习理论与支持向量机[].自动化学报, 方法进行文本标注。将每个候选区图像分割为若干10×10的 2000,26(1):32-42. 图像子块,提取其特征向量作为输入,应用SN。进行文本检作者简介 训,找到所有的文本块并进行标注。对文本候选区进行分析验许剑峰(1978-),男,博士生,主要研究方向为计算机图像处理及模式 证,最后确定真正的文本区域。由于嗓声的影响炇图像的复杂识别;黎绍发(1945-),教授,博导,主要研究方向为计算机图像处理及 性,某些图像子块可能被误判为文本;另外,SM也会产生 模式识别。 (上接第154页)分别是CT图像和MRI图像,图2(c),图2(d),参考文献 图2(e分别是用系数比较的融合方法融合的图像,均包含了两[1] ladi mr costas. Gradient-based Multiresolution Image Fusion[] 匾源图的信息,它们的轮廓模糊,细节较少,图2(f)是木文算法 IEEE Transactions on Image Processing, 2004, 13(2): 228-236 融合的图像。从图2(f的融合结果可以看出,与其他图相比采[2]郑林韩崇昭基于方向可调滤波器的含噪图像融合算法[].西 安交通大学学报,200236(12):1236-1239 用本文算法得到的融合图像是一幅含噪声少、细节清晰的图像 [3]杨朝霞,逯峰.图像梯度与散度计算及在边缘提取中的应用[〕] 从融合结果可以看到,本文方法在较好消除图像嗓声的同 中山大学学报,2002,41(6):6-9. 时,完好地保存了各嘔源图中的特征,得到了全局清晰的融合[4]陆宏波,施惠昌.基于小波变换的图像融合方法[J].电子工程 图像,从而达到图像增强的日的。与其他融合方法相比,本算 师,2001,27(5):54-57 [5]刘贵喜,赵曙光.基于梯度塔形分解的多传感器图像融合[]. 法具有更好的效果。表1客观数据统计也说明了这一点,融合 光电子·激光,2001,12(3):293-296 图像包含的信息量,图像平均梯度和信噪比这些数据都有了较6]蒲恬,方庆基于对比度的多分辨图像融合[]].电子学报,200 人的提升,说明算法较好地提高了图像质量。 28(12):116-118 表1客观数据统计 [刀吴颖谦,方涛.一种基于小波分析和人眼视觉特性的图像增强方 法[].数据采集与处理,2003,18(1):17-21 平均 「派(a)4,159 26.893 5.29 0.3878 作者简介 源图(b) 5.2091 48.2892 0.088398 吕晓琪(1963-),男,教授,博士,主要研究方向为医学信息处理;张宝 合图像(f 5.601 50.2201 11.0302 0.0687 华(1981-),男,硕士生,主要研究方向为数字信号处理。

...展开详情
试读 3P 论文研究-基于颜色边缘与SVM的图像文本定位.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
weixin_39841856 如果觉得有用,不妨留言支持一下
2019-07-22
  • 至尊王者

    成功上传501个资源即可获取
关注 私信 TA的资源
上传资源赚积分or赚钱
    最新推荐
    论文研究-基于颜色边缘与SVM的图像文本定位.pdf 10积分/C币 立即下载
    1/3
    论文研究-基于颜色边缘与SVM的图像文本定位.pdf第1页

    试读结束, 可继续阅读

    10积分/C币 立即下载 >