双向特征融合的快速精确任意形状文本检测.docx
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
文本检测在现代智能系统中扮演着关键角色,特别是在智能交通、可穿戴设备和视觉辅助等领域。传统的文本检测方法,如基于滑动窗口和联通组件的方法,由于依赖人工设计的特征和文本先验信息,存在精度低、速度慢的问题。随着深度学习的发展,这些问题得到了显著改善。 早期的深度学习方法,如利用MSER获取候选组件和训练字符分类器生成文本显著性图,仍然部分依赖人工特征。随着目标检测和语义分割技术的进步,当前的文本检测方法主要分为基于分割和基于回归两大类。基于分割的方法,如像素级标签生成,通过链接分析定位文本,虽然提高了准确性,但处理复杂,耗时较长。例如,文献[6]和[2]分别提出了新的文本表示和曲形文本处理方法,而文献[7]通过最小到最大分割图扩展获取文本区域,但效率较低。文献[8]则结合Mask R-CNN提出了文本上下文模块和重评分机制,以减少假阳性。另一方面,基于回归的方法,如Textboxes++和[11],通过预测预置框或像素点的偏移来检测文本,速度快但对长文本和曲形文本的处理仍有不足。 本文提出的解决方案旨在克服这些局限性,通过Feature Pyramid Network (FPN)生成多尺度特征图,构建两个平行分支:整体文本区域预测和缩小文本区域预测。然后,引入双向特征融合模块来整合这两个分支的特征,以增强文本语义表示。这一创新策略可以快速准确地重建中心分割图,减少了后处理的计算负担,同时保持高精度。在SCUT-CTW1500, Total-Text和MSRA-TD500数据集上的实验结果显示,该方法分别达到了83.5%, 85.7%, 85.9%的F综合指标,检测速度分别达到15.2, 16, 17.1FPS,成功实现了精度与速度的平衡。 模型构建阶段,使用ResNet进行特征提取,并通过FPN进行特征融合。ResNet中的可变形卷积增强了模型对复杂形状的适应性。提取的特征图经过两个分支处理后,通过双向特征融合模块产生强表征的特征图p5和p6,分别用于预测完整和缩小的文本区域。缩小的文本区域图经过特定的重建算法后处理,生成最终的检测结果。 本文的贡献在于:1)提出了一种快速重建文本实例的方法,减少了后处理的计算需求;2)设计了双向特征融合模块,优化了文本特征的融合;3)在多个数据集上表现出优异的检测性能和实时性,展示了深度学习在任意形状文本检测上的潜力。这种方法对于提高复杂场景下文本检测的准确性和效率具有重要意义。
剩余13页未读,继续阅读
- 粉丝: 4437
- 资源: 1万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 小组作业4开关电源设计要求-新.docx
- 技术资料分享fat文件系统原理很好的技术资料.zip
- C#进销存仓库管理系统源码 BS进销存源码数据库 SQL2008源码类型 WebForm
- 技术资料分享FAT文件系统的组织结构很好的技术资料.zip
- 技术资料分享FATFS文件系统的移植很好的技术资料.zip
- 技术资料分享FatFs使用说明-基于SmartARMCortexM3-1700很好的技术资料.zip
- 技术资料分享FATFS浅谈很好的技术资料.zip
- 技术资料分享Fatfs经典资料很好的技术资料.zip
- 技术资料分享FAT32文件系统详解很好的技术资料.zip
- 技术资料分享FAT32简单教材很好的技术资料.zip