2019年华为汉字书法大赛参赛源码+学习说明.zip资源-CSDN文库

共125个文件

py：48个

h：21个

pyc：20个

版权申诉

大学生竞赛

源码

学习资料

187 浏览量 2024-01-14 18:04:53 上传评论收藏 397KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

2019年华为汉字书法大赛参赛源码+学习说明.zip （125个子文件）

11 1B

c 1B

cl 1B

config 1B

clipper.cpp 139KB

adaptor.cpp 2KB

da 1B

detect 1B

fo 1B

cast.h 85KB

pybind11.h 82KB

numpy.h 64KB

pytypes.h 50KB

common.h 39KB

eigen.h 29KB

class_support.h 23KB

stl_bind.h 20KB

attr.h 18KB

stl.h 13KB

operators.h 8KB

descr.h 8KB

embed.h 7KB

chrono.h 6KB

lanms.h 6KB

buffer_info.h 4KB

eval.h 4KB

functional.h 3KB

options.h 2KB

complex.h 2KB

typeid.h 1KB

clipper.hpp 15KB

img_calligraphy_00003_bg.jpg 18KB

img_calligraphy_00002_bg.jpg 8KB

l 1B

m 1B

Makefile 365B

README.md 2KB

p 1B

pro 1B

icdar.py 34KB

alphabets.py 27KB

alphabets0.py 20KB

multigpu_train_1.py 13KB

multigpu_train.py 11KB

crnn_main.py 10KB

vgg19_crnn_attention.py 9KB

train_split.py 9KB

model_muti_out.py 8KB

eval.py 8KB

model_muti_in.py 7KB

model.py 7KB

analysis_dataset.py 7KB

run_demo_server.py 7KB

crnn.py 6KB

utils.py 6KB

crnn_attention.py 5KB

labelme2coco_ocr.py 5KB

generator.py 4KB

data_util.py 4KB

dataset.py 4KB

tolmdb.py 3KB

csv2txt.py 3KB

orinage_tolmdb.py 3KB

ocr_data_process.py 2KB

test.py 2KB

setup.py 2KB

ocr_data_process.py 2KB

transforms.py 2KB

locality_aware_nms.py 2KB

make_alphabet.py 1KB

preprocessing.py 1KB

make_alphabet.py 1KB

combine.py 920B

combine.py 873B

combine.py 845B

params.py 809B

convert_to_txt.py 752B

train_test_split.py 591B

__init__.py 572B

to_dictionary.py 556B

train_test_split.py 512B

read.py 308B

__main__.py 245B

py 1B

alphabets.cpython-36.pyc 27KB

icdar.cpython-36.pyc 20KB

alphabets.cpython-35.pyc 20KB

vgg19_crnn_attention.cpython-36.pyc 7KB

model_muti_out.cpython-36.pyc 5KB

crnn.cpython-36.pyc 5KB

utils.cpython-35.pyc 5KB

dataset.cpython-35.pyc 5KB

model_muti_in.cpython-36.pyc 5KB

utils.cpython-36.pyc 5KB

共 125 条

# huiwei_chinese_OCR 2019年华为汉字书法大赛 # 说明汉字书法多场景识别，使用了两步策略：先检测在识别。 ## 参考代码检测部分使用了两种方案： 1.EAST：[ESAT](https://github.com/argman/EAST) EAST在实际使用中，由于比赛方提供的数据是竖向排版且文字长度，大小不一，并且有136张图片字体倾斜严重。并不能很好的切合本次数据集。效果一般。 2.Faster-Rcnn:[Faster-Rcnn](https://github.com/roytseng-tw/Detectron.pytorch) Faster-Rcnn在实际使用中，整体的检测效果比EAST更好。具体配置可以查看config文件。 3.识别，使用CRNN：[CRNN](https://github.com/Sierkinhane/crnn_chinese_characters_rec) 由于在比赛方要求不能使用预训练模型，故没有使用densent那个版本的ocr。在改动以后，效果还不错。 ## 改进 ### 1.EAST： 1.基础网络VGG-->Resnet_v1_101<br> 2.通过数据尺度统计，加入多尺度训练<br> 3.对网络输出部分，引入残差信息<br> 4.输出部分，借鉴FPN思想，但是需要在本地生成对应尺度的图片及label。对硬件要求较高。<br> ### 2.Faster-Rcnn: 1.通过数据分析，重新设计anchor:[0.5,1,2] 改为[0.1,0.5,1] 2.Roi polling改为Roi Align 3.随机多尺度训练 4.FPN算法 5.多尺度测试 ### 3.CRNN: 1.基础网络：VGG-->VGG19+BN 2.修改基础网络的maxpooling，是网络的输出更长：512*1*5-->512*1*41,以适应数据集横向较长，特征较多的情况 3.RNN部分的LSTM未改动。 4.数据分析后，数据分布(14,1320),故设置了多尺度训练的策略。 ## 数据增强数据增强很重要！！！本次使用了：GaussianBlur，sharpen，Affine，GaussianNoise，Add，Multiply，contrastNorm-alization，PiecwiseAffine ## 数据格式比赛方提供的数据中，文字方向是竖直排版的，与常见的水平文字不同，所以在识别是需要先把数据选择90度。检测时，数据格式为img/img1.jpg, img1.txt, img2.jpg,img2.txt即：每个图片以及对应的文字和文字框信息。 # 具体配置信息，详见参考代码。务必结合参考代码一起使用。

评论收藏

内容反馈

版权申诉