chinese_ocr-master.zip资源-CSDN文库

共157个文件

py：52个

pyc：41个

jpg：22个

文本识别

Chinese

ocr

基于tensorflow

需积分: 50 67 浏览量 2020-04-06 15:03:02 上传评论 1 收藏 87.52MB ZIP 举报

《基于CTPN + DenseNet + CTC的端到端中文OCR技术详解》在现代信息技术领域，光学字符识别（Optical Character Recognition, OCR）技术扮演着至关重要的角色，尤其是在中文文本处理方面。本文将深入探讨一个名为“chinese_ocr-master”的项目，该项目在Windows 10操作系统上利用TensorFlow和Keras框架实现了一种端到端的中文OCR系统。这个系统综合运用了Character Region Awareness for Text Detection (CTPN)、DenseNet以及Connectionist Temporal Classification (CTC)等先进技术，旨在高效准确地识别中文文本。一、CTPN（Character Region Awareness for Text Detection） CTPN是由Yao et al.提出的用于文本检测的深度学习模型。该模型采用卷积神经网络（CNN），并引入了序列标注的概念，以识别图像中的文字区域。CTPN通过VGG16作为基础网络，结合多尺度特征检测，实现了对文本行和字符的精确定位，为后续的字符识别阶段提供了高质量的候选区域。二、DenseNet DenseNet是由Huang等人提出的深度学习架构，其核心在于密集连接（Dense Connections）。每个层不仅接收前一层的输出，还接收所有前面层的输出，大大减少了梯度消失的问题。在中文OCR任务中，DenseNet的这种特性有助于信息的传递和特征的融合，提高了模型的识别精度。三、CTC（Connectionist Temporal Classification） CTC是Graves等人提出的一种适用于序列到序列学习的损失函数，特别适合处理不定长输入和输出的任务，如语音识别和OCR。在CTC中，模型无需预先知道输入序列与输出序列的对应关系，只需学习概率分布即可。在中文OCR中，CTC能够处理不同长度的文本行，解决了字符之间的空格问题，使得模型可以直接从连续的像素数据预测出文本序列。四、TensorFlow与Keras的结合 TensorFlow是由Google开发的开源机器学习库，以其强大的计算能力和灵活性深受开发者喜爱。Keras则是一个高级神经网络API，构建在TensorFlow之上，简化了模型构建和训练过程。在这个项目中，Keras被用来快速构建和优化模型，而TensorFlow则负责后台的计算和分布式训练，两者相辅相成，为实现高效的端到端中文OCR提供了便利。五、项目结构与流程在“chinese_ocr-master”项目中，主要包括数据预处理、模型训练、评估和应用等部分。需要收集和标注大量的中文文本图像作为训练数据；接着，使用Keras构建并训练结合CTPN、DenseNet和CTC的模型；训练完成后，对新的图像进行预测，输出识别的文本。整个流程展示了深度学习在OCR领域的强大应用能力。总结，这个“chinese_ocr-master”项目是深度学习技术在中文OCR领域的成功实践，通过CTPN的文本检测、DenseNet的特征提取以及CTC的序列解码，实现了高效准确的中文字符识别。对于有兴趣深入了解或应用中文OCR技术的人来说，这是一个极具价值的参考资源。

资源推荐

资源详情

资源评论

收起资源包目录

chinese_ocr-master.zip （157个子文件）

cython_nms.c 413KB

bbox.c 374KB

gpu_nms.c 285KB

checkpoint 121B

gpu_nms.cpp 285KB

nms_kernel.cu 5KB

VGGnet_fast_rcnn_iter_50000.ckpt.data-00000-of-00001 68.26MB

cython_nms.cp36-win_amd64.exp 679B

bbox.cp36-win_amd64.exp 649B

.gitignore 148B

.gitkeep 0B

weights_densenet.h5 18.92MB

gpu_nms.hpp 146B

VGGnet_fast_rcnn_iter_50000.ckpt.index 2KB

demo.jpg 1.06MB

005.jpg 691KB

006.jpg 460KB

demo_detect.jpg 400KB

005.jpg 382KB

009.jpg 354KB

006.jpg 273KB

004.jpg 259KB

009.jpg 238KB

004.jpg 227KB

001.jpg 206KB

003.jpg 174KB

008.jpg 170KB

007.jpg 160KB

001.jpg 157KB

demo_rec.jpg 144KB

008.jpg 121KB

007.jpg 77KB

003.jpg 61KB

002.jpg 49KB

002.jpg 22KB

1.jpg 6KB

cython_nms.cp36-win_amd64.lib 2KB

bbox.cp36-win_amd64.lib 2KB

LICENSE 11KB

README.md 4KB

README.md 2KB

VGGnet_fast_rcnn_iter_50000.ckpt.meta 634KB

VGG_imagenet.npy 0B

cython_nms.obj 492KB

bbox.obj 453KB

3.png 135KB

010.png 67KB

3.png 63KB

2.png 47KB

010.png 13KB

network.py 18KB

keys.py 17KB

anchor_target_layer_tf.py 13KB

pascal_voc.py 10KB

config.py 10KB

train.py 9KB

minibatch.py 8KB

proposal_layer_tf.py 7KB

ToVoc.py 7KB

train.py 6KB

roidb.py 6KB

imdb.py 5KB

text_proposal_connector_oriented.py 4KB

split_label.py 4KB

demo.py 4KB

setup.py 4KB

text_detect.py 3KB

VGGnet_train.py 3KB

text_proposal_graph_builder.py 3KB

densenet.py 3KB

boxes_grid.py 3KB

ocr.py 3KB

bbox_transform.py 3KB

layer.py 3KB

text_proposal_connector.py 2KB

detectors.py 2KB

VGGnet_test.py 2KB

test.py 2KB

model.py 2KB

blob.py 1KB

train_net.py 1KB

generate_anchors.py 1KB

ds_utils.py 1KB

other.py 1KB

factory.py 841B

demo.py 818B

__init__.py 554B

timer.py 552B

setup_cpu.py 471B

factory.py 467B

nms_wrapper.py 439B

text_connect_cfg.py 381B

__init__.py 176B

__init__.py 98B

__init__.py 86B

__init__.py 73B

__init__.py 24B

__init__.py 19B

共 157 条

评论收藏

内容反馈

chl00chl

粉丝: 0
资源: 1

chinese_ocr-master.zip

chineseocr-master.zip

ChinaOCR-master.zip

ChineseOCR.zip

chineseocr

chineseocr_lite-master.zip

DevExpressLocalizedResources-2020.1-zh-Hans 中文语言包

DevExpressLocalizedResources-16.1.14-2016.1-zh-Hans.zip 中文包

grafana-chinese

DevExpressLocalizedResources-2018.1-zh-Hans 中文语言包

DevExpress Localized Resources 16.1

android-ocr-master.zip

ocr_annotation-master.zip

chinese_dictionary-master.zip

addressable-asset-system-chinese-manual-master.zip

mybatis-generator-core-chinese-annotation-1.3.5-master.zip

honghaozhou-SynthText_Chinese_version-master.zip

tesseract-master。zip

AIResourceIndex-master.zip

tesseract-master.zip

基于chineseocr_lite和cocoNLP封装的身份证和营业执照文字信息提取服务.zip

ChineseOcr安装文档.docx

Tesseract-OCR.zip 包含有中文识别器(chi_sim.traineddata)

chineseocr:yolo3 + ocr

CRNN_CTC_OCR models.rar

OCR_DataSet-master_OCR_

darknet-master_darknet_迷鹿框架v3下_

IDCardOCR_China, 基于tesseract，实现摄像头扫描识别中国二代身份证.zip

IntelliJ-IDEA-Chinese-master.zip

echarts3-chinese-map-drill-down-master.zip

chinese-helper-master.zip

最新资源