# 手写文字擦除第1名方案,水印智能消除赛第1名方案
手写文字擦除第1名,水印智能消除赛第1名方案
比赛连接:[手写文字擦除](https://aistudio.baidu.com/aistudio/competition/detail/129/0/introduction)
比赛连接:[水印智能消除赛](https://aistudio.baidu.com/aistudio/competition/detail/209/0/introduction)
## 一、赛题背景
对比赛给定的带有手写痕迹的试卷图片进行处理,擦除相关的笔,还原图片原本的样子
![](https://ai-studio-static-online.cdn.bcebos.com/af2816877d054080987de1f47679fa656e5f498fd39744f5a9f94cc6c5a4fb9d)
## 二、数据分析
**数据划分**:使用1000张做为训练集,81张作为验证集。
官方提供了训练集1081对,测试集A、B各200张。包含以下几个特征:
1.图像分辨率普遍较大
2.手写字包含红黑蓝多种颜色,印刷字基本为黑色
3.手写字除了正常文字外,还包含手画的线段、图案等内容
4.试卷上的污渍、脏点也属于需要去除的内容
5.手写字和印刷字存在重叠
**mask**:根据原始图片和标签图像的差值来生成mask数据
计算RGB通道的平均差值
平均差值在20以上的设为 1
平均差值在20以下的设为 差值/20
![](https://ai-studio-static-online.cdn.bcebos.com/255b0b9dd6e8426fae2d9f01c6bd17229fd4dbb37a5741539ba8d8ea87fd10f3)
## 三、模型设计
网络模型,是基于开源的EraseNet,然后整体改成了Paddle版本。同时也尝试了最新的PERT:一种基于区域的迭代场景文字擦除网络。基于对比实验,发现ErastNet,在本批次数据集上效果更好。从网络结构图上可以直观的看出ErastNet是多分支以及多阶段网络其中包括mask生成分支和两阶段图像生成分支。此外整个网络也都是基于多尺度结构。在损失函数上,原版的ErastNet使用了感知损失以及GAN损失。两个损失函数,是为了生成更加逼真的背景。但是本赛题任务的背景都是纯白,这两个损失是不需要的,可以直接去除。此外,由于ErastNet网络是由多尺度网络组成,结合去摩尔纹比赛的经验,我把ErastNet网络的Refinement替换成了去摩尔纹比赛使用的多尺度网络
双模型融合:
模型一:erasenet去掉判别器部分,仅保留生成器
![](https://ai-studio-static-online.cdn.bcebos.com/7546d26870a44fce9b5f118b8fc8e8501b7f4ed1e807468ebece4c9d21209ac0)
模型二:erasenet二阶段网络使用基于Non-Local的深度编解码结构
![](https://ai-studio-static-online.cdn.bcebos.com/67f2b22dca8a491cad844354f2ba81601190f4bda4e44524a115b8c715bedbfb)
## 四、训练细节
**训练数据:**
增强仅使用横向翻转和小角度旋转,保留文字的先验
随机crop成512x512的patch进行训练
**训练分为两阶段:**
第一阶段损失函数为dice_loss + l1 loss
第二阶段损失函数只保留l1 loss
## 五、测试细节
测试trick:
**分块测试**,把图像切分为512x512的小块进行预测,保持和训练一致
**交错分块测试**,测试图像增加镜像padding,且分块时边缘包含重复部分,每次预测仅保留每块预测结果的中心部分,这么做的原因是图像边缘信息较少,预测效果要差于中心部分
测试时对**测试**数据使用了横向的镜像**增强**
测试时将两个**模型**的预测结果进行**融合**
## 六、上分策略
![](https://ai-studio-static-online.cdn.bcebos.com/88dd53709c1f47aca80f9ce63e344e8494c44c59b9534367b7aa4b5b0034caad)
## 七、其他
data:定义数据加载
loss:定义损失函数
model:定义网络模型
compute_mask.py:生成mask文件
test.py: 测试脚本
train.py: 训练脚本
代码运行:
1.指定数据文件夹
2.运行sh train.sh 生成mask并开始训练
3.指定测试文件夹和模型路径,执行sh test.sh开始测试
## 预训练模型
https://aistudio.baidu.com/aistudio/projectdetail/3439691
运行项目,下载预训练模型,同时可以进行在线测试。
没有合适的资源?快使用搜索试试~ 我知道了~
手写文字擦除第1名方案python源码+数据.zip
共30个文件
py:22个
sh:3个
readme:2个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 199 浏览量
2024-04-12
15:38:43
上传
评论
收藏 93KB ZIP 举报
温馨提示
手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 手写文字擦除第1名方案python源码+数据.zip 【资源说明】 1、该资源内项目代码都是经过测试运行成功,功能正常的情况下才上传的,请放心下载使用。 2、适用人群:主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用,具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习,也可作为大作业、课程设计、毕设项目、初期项目立项演示等,欢迎下载,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
手写文字擦除第1名方案python源码+数据.zip (30个子文件)
projectcode30312
utils.py 4KB
loss
Loss.py 3KB
PSNRLoss.py 2KB
losses.py 887B
data
dataloader.py 5KB
predict.py 4KB
compute_mask.py 1KB
test.sh 210B
ckpt_convert
ema.py 3KB
说明文档.txt 219B
nafa_archv1.py 17KB
convert_onnx.py 5KB
readme 1B
BiSeNetV2.py 13KB
ckpt_convert.py 2KB
train.sh 239B
zip.sh 71B
models
sa_gan.py 9KB
non_local.py 9KB
sa_aidr.py 9KB
networks.py 2KB
readme 1B
idr.py 5KB
Model.py 8KB
discriminator.py 2KB
train.py 6KB
test.py 5KB
submit_dehw.zip 60KB
README.md 4KB
gauss.py 2KB
共 30 条
- 1
资源评论
龙年行大运
- 粉丝: 1071
- 资源: 3853
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 永磁同步电机的参数辨识源码,完整的CCS工程,已经在工程项目上验证通过,辨识精度非常高 1、参数辨识源码在src-foc文件夹
- 增程式电动汽车基于工况的自适应ECMS能量管理策略(matlab的m程序)
- Fluent电弧,激光,熔滴一体模拟 UDF包括高斯旋转体热源、双椭球热源(未使用)、VOF梯度计算、反冲压力、磁场力、表面张
- C#全自动多线程上位机源码编程 0,纯源代码 1,替代传统plc搭载的触摸屏 2,工控屏幕一体机直接和plc通信 3,功能
- 基于三有源桥的模型预测控制仿真,可以独立控制输出侧两个端口的电压或者电流,动态响应快,也可以扩展至四有源桥电路
- VIENNA维也纳拓扑,三相整流simulink仿真:采用电压电流双闭环控制,电压外环采用PI控制,电流内环采用bang ban
- 永磁同步电机改进超螺旋滑模观测器无位置传感器控制 采用一种改进的超螺旋滑模观测器永磁同步电机无位置传感器控制,该观测器在传统ST
- comsol仿真模拟气液两相化学吸收CO2(氢氧化钠溶液NaOH和MEA溶液吸收CO2) 此案例为文献复现
- 内有cpar文件和simulink文件,并有演示操作视频,carsim+simulink联合仿真实实现道超车, 包含道决策,路径
- Comsol锂枝晶 相场法构建锂枝晶模型,单枝晶,多枝晶定向生长,三种物理场耦合,相场,浓度,电势? 拿到手就能用,适合新手入门
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功