# huiwei_chinese_OCR
2019年华为汉字书法大赛
# 说明
汉字书法多场景识别,使用了两步策略:先检测在识别。
## 参考代码
检测部分使用了两种方案:
1.EAST:[ESAT](https://github.com/argman/EAST)
EAST在实际使用中,由于比赛方提供的数据是竖向排版且文字长度,大小不一,并且有136张图片字体倾斜严重。并不能很好的切合本次数据集。效果一般。
2.Faster-Rcnn:[Faster-Rcnn](https://github.com/roytseng-tw/Detectron.pytorch)
Faster-Rcnn在实际使用中,整体的检测效果比EAST更好。具体配置可以查看config文件。
3.识别,使用CRNN:[CRNN](https://github.com/Sierkinhane/crnn_chinese_characters_rec)
由于在比赛方要求不能使用预训练模型,故没有使用densent那个版本的ocr。在改动以后,效果还不错。
## 改进
### 1.EAST:
1.基础网络VGG-->Resnet_v1_101<br>
2.通过数据尺度统计,加入多尺度训练<br>
3.对网络输出部分,引入残差信息<br>
4.输出部分,借鉴FPN思想,但是需要在本地生成对应尺度的图片及label。对硬件要求较高。<br>
### 2.Faster-Rcnn:
1.通过数据分析,重新设计anchor:[0.5,1,2] 改为[0.1,0.5,1]
2.Roi polling改为Roi Align
3.随机多尺度训练
4.FPN算法
5.多尺度测试
### 3.CRNN:
1.基础网络:VGG-->VGG19+BN
2.修改基础网络的maxpooling,是网络的输出更长:512*1*5-->512*1*41,以适应数据集横向较长,特征较多的情况
3.RNN部分的LSTM未改动。
4.数据分析后,数据分布(14,1320),故设置了多尺度训练的策略。
## 数据增强
数据增强很重要!!!
本次使用了:GaussianBlur,sharpen,Affine,GaussianNoise,Add,Multiply,contrastNorm-alization,PiecwiseAffine
## 数据格式
比赛方提供的数据中,文字方向是竖直排版的,与常见的水平文字不同,所以在识别是需要先把数据选择90度。
检测时,数据格式为img/img1.jpg, img1.txt, img2.jpg,img2.txt即:每个图片以及对应的文字和文字框信息。
# 具体配置信息,详见参考代码。
务必结合参考代码一起使用。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 2019年华为汉字书法大赛参赛源码+学习说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
2019年华为汉字书法大赛参赛源码+学习说明.zip (125个子文件)
11 1B
c 1B
cl 1B
cl 1B
config 1B
clipper.cpp 139KB
adaptor.cpp 2KB
da 1B
detect 1B
detect 1B
fo 1B
cast.h 85KB
pybind11.h 82KB
numpy.h 64KB
pytypes.h 50KB
common.h 39KB
eigen.h 29KB
class_support.h 23KB
stl_bind.h 20KB
attr.h 18KB
stl.h 13KB
operators.h 8KB
descr.h 8KB
embed.h 7KB
chrono.h 6KB
lanms.h 6KB
buffer_info.h 4KB
eval.h 4KB
functional.h 3KB
options.h 2KB
complex.h 2KB
typeid.h 1KB
clipper.hpp 15KB
img_calligraphy_00003_bg.jpg 18KB
img_calligraphy_00002_bg.jpg 8KB
l 1B
m 1B
m 1B
Makefile 365B
README.md 2KB
p 1B
pro 1B
icdar.py 34KB
alphabets.py 27KB
alphabets.py 27KB
alphabets0.py 20KB
multigpu_train_1.py 13KB
multigpu_train.py 11KB
crnn_main.py 10KB
vgg19_crnn_attention.py 9KB
train_split.py 9KB
model_muti_out.py 8KB
eval.py 8KB
model_muti_in.py 7KB
model.py 7KB
analysis_dataset.py 7KB
run_demo_server.py 7KB
crnn.py 6KB
utils.py 6KB
crnn_attention.py 5KB
labelme2coco_ocr.py 5KB
generator.py 4KB
data_util.py 4KB
dataset.py 4KB
tolmdb.py 3KB
csv2txt.py 3KB
orinage_tolmdb.py 3KB
ocr_data_process.py 2KB
ocr_data_process.py 2KB
test.py 2KB
setup.py 2KB
ocr_data_process.py 2KB
transforms.py 2KB
locality_aware_nms.py 2KB
make_alphabet.py 1KB
preprocessing.py 1KB
make_alphabet.py 1KB
combine.py 920B
combine.py 873B
combine.py 845B
params.py 809B
convert_to_txt.py 752B
train_test_split.py 591B
__init__.py 572B
to_dictionary.py 556B
train_test_split.py 512B
read.py 308B
__main__.py 245B
py 1B
py 1B
alphabets.cpython-36.pyc 27KB
icdar.cpython-36.pyc 20KB
alphabets.cpython-35.pyc 20KB
vgg19_crnn_attention.cpython-36.pyc 7KB
model_muti_out.cpython-36.pyc 5KB
crnn.cpython-36.pyc 5KB
utils.cpython-35.pyc 5KB
dataset.cpython-35.pyc 5KB
model_muti_in.cpython-36.pyc 5KB
utils.cpython-36.pyc 5KB
共 125 条
- 1
- 2
资源评论
土豆片片
- 粉丝: 1567
- 资源: 5642
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功