PPOCR源码，百度识别中文开源代码_wired_table

共564个文件

py：122个

jpg：117个

md：64个

需积分: 50 81 浏览量 2020-10-23 14:53:42 上传评论收藏 55.59MB RAR 举报

PPOCR，全称为“Precision-Recall Oriented Chinese Character Recognition”，是由百度公司开发的一款用于中文字符识别的深度学习框架。这个开源项目的核心是利用深度学习技术，特别是卷积神经网络（CNN）和循环神经网络（RNN）来实现对中文文字的高精度识别。在本文中，我们将深入探讨PPOCR的技术细节、工作原理以及如何使用PaddleOCR这一配套工具进行实践操作。 1. 技术背景与目标： PPOCR的目标是提高中文字符的识别准确率和鲁棒性，以适应各种复杂场景下的文字检测和识别任务。这包括了图像中的手写文字、印刷文字以及各种字体和大小的文字。通过开源PPOCR，百度希望推动中文OCR领域的研究和应用，为开发者提供一个强大且灵活的工具。 2. 模型架构： PPOCR通常由两部分组成：文字检测（Text Detection）和文字识别（Text Recognition）。对于检测部分，通常采用如YOLO（You Only Look Once）、EAST（Efficient Attention for Scene Text）等模型来定位文字区域。识别部分则使用序列模型，如CRNN（Connectionist Recurrent Neural Network）、ASTER（Attentional Sequence to Sequence for End-to-End Text Recognition）等，将定位出的文字框内的字符序列化。 3. PaddleOCR： PaddleOCR是百度开发的一个基于PaddlePaddle深度学习框架的OCR工具包。它包含了多种预训练模型，支持多种语言的文本检测和识别，包括PPOCR。PaddleOCR的特点在于轻量级、高性能以及易于使用。它的轻量化模型，如DB（DenseBox）检测器和MobileOCR识别器，可以在手机、嵌入式设备等低功耗平台上高效运行。 4. 使用PaddleOCR：要使用PaddleOCR进行中文字符识别，首先需要安装PaddlePaddle框架和PaddleOCR库。然后，你可以通过简单的API调用来运行预训练模型进行检测和识别。例如，使用`tools/infer.py`脚本，提供待识别图片的路径，就能得到文字检测和识别的结果。 5. 自定义训练： PaddleOCR还提供了自定义训练的功能，允许用户根据自己的数据集调整和训练模型。你需要准备标注好的训练数据，按照PaddleOCR的数据格式要求进行组织，然后配置相应的训练参数，最后启动训练脚本进行模型优化。 6. 进阶应用：除了基本的文字识别，PPOCR还可以扩展到更复杂的场景，如表格识别、证件信息提取等。通过模型的组合和改进，可以实现更高级别的文字理解和应用。总结来说，PPOCR是百度为中文字符识别贡献的开源解决方案，结合PaddleOCR工具，开发者可以快速构建自己的OCR系统，服务于各种应用场景，如智能办公、自动驾驶、图像分析等。同时，PPOCR的开源性质也促进了社区的交流和进步，推动了OCR技术的不断发展。

资源推荐

资源详情

资源评论

收起资源包目录

PPOCR源码，百度识别中文开源代码（564个子文件）

gradlew.bat 2KB

ocr_db_crnn.cc 14KB

db_post_process.cc 9KB

crnn_process.cc 4KB

cls_process.cc 1KB

clipper.cpp 139KB

clipper.cpp 135KB

ocr_clipper.cpp 134KB

ocr_db_post_process.cpp 11KB

ocr_db_post_process.cpp 10KB

postprocess_op.cpp 9KB

ocr_ppredictor.cpp 8KB

ocr_rec.cpp 7KB

ocr_crnn_process.cpp 5KB

native.cpp 4KB

ocr_det.cpp 4KB

preprocess_op.cpp 4KB

ocr_cls.cpp 4KB

main.cpp 3KB

preprocess.cpp 3KB

ppredictor.cpp 2KB

config.cpp 2KB

utility.cpp 2KB

adaptor.cpp 2KB

ocr_cls_process.cpp 1KB

predictor_input.cpp 793B

predictor_output.cpp 638B

Dockerfile 2KB

Dockerfile 1KB

.DS_Store 6KB

.gitignore 270B

.gitignore 90B

.gitignore 11B

.gitignore 7B

build.gradle 3KB

build.gradle 558B

settings.gradle 15B

gradlew 5KB

cast.h 85KB

pybind11.h 82KB

numpy.h 64KB

pytypes.h 50KB

common.h 39KB

eigen.h 29KB

class_support.h 23KB

stl_bind.h 20KB

attr.h 18KB

clipper.h 15KB

stl.h 13KB

operators.h 8KB

descr.h 8KB

embed.h 7KB

chrono.h 6KB

lanms.h 6KB

native.h 5KB

buffer_info.h 4KB

eval.h 4KB

ocr_det.h 3KB

functional.h 3KB

config.h 3KB

ocr_ppredictor.h 3KB

ocr_rec.h 3KB

postprocess_op.h 3KB

ocr_cls.h 2KB

options.h 2KB

timer.h 2KB

db_post_process.h 2KB

complex.h 2KB

preprocess_op.h 2KB

ppredictor.h 1KB

typeid.h 1KB

utility.h 1KB

crnn_process.h 1KB

common.h 1KB

predictor_output.h 947B

cls_process.h 905B

ocr_cls_process.h 798B

Helpers.h 695B

predictor_input.h 596B

ocr_crnn_process.h 498B

ocr_crnn_process.h 479B

preprocess.h 413B

ocr_db_post_process.h 402B

BoxLayer.h 383B

ocr_db_post_process.h 355B

OcrData.h 342B

AppDelegate.h 295B

ViewController.h 234B

.clang_format.hook 353B

ocr_clipper.hpp 15KB

clipper.hpp 15KB

MANIFEST.in 268B

gradle-wrapper.jar 53KB

MainActivity.java 19KB

Predictor.java 13KB

SettingsActivity.java 11KB

Utils.java 5KB

共 564 条

评论收藏

内容反馈

huxizhong2017

粉丝: 3
资源: 96

PPOCR源码，百度识别中文开源代码

百度OCR-身份证图片识别源码

.net版本语音识别实例源码,语音识别开源代码,C#

.net版本语音识别实例源码,语音识别开源代码,C#源码.zip

基于百度开源PaddleOCR本地离线识别,通用识别度极高

百度图片识别源码.rar

人脸识别开源SDK源码

国外开源OCR源码

C# 百度文字识别Demo 源码

小程序源码 51旅游 (代码源)

虹膜识别开源代码

智云全能API接口源码 接口源代码全开源.rar

PPOCR 字符识别快速教程

小程序源码 百度小说 (代码+截图)

二代paddle-ocr光学文字识别模型部署完整源码+说明.zip

国外开源plc源码

Java项目HTTPDNSLib开源源码 Java项目HTTPDNSLib开源源码

图像识别源码程序

pp-ocrv2 python openvino部署代码

百度OCR识别.zip

PHPresolver-开源

使用Java开发的OCR程序 根据图像识别转换成中文

python基于端到端的声纹识别系统源码.zip

java_011 java 人脸识别完整源代码

百度AI图像主体识别

文字识别OCR半自动标注工具PPOCRLabel打包的exe程序

PaddleOCR生成的vs工程文件.zip

【PaddlePaddle】Java demo测试

基于STM32的数字字符识别.zip

基于stm32的字符识别（卡在内存上了）

在Android设备上使用PaddleMobile图像分类的demo

最新资源

智云全能API接口源码接口源代码全开源.rar

小程序源码百度小说 (代码+截图)

使用Java开发的OCR程序根据图像识别转换成中文