## 基于pytorch的OCR库
这里会有这个项目的代码详解和我的一些ocr经验和心得,我会慢慢更新,有兴趣可以看看,希望可以帮到新接触ocr的童鞋[CSDN博客](https://blog.csdn.net/fxwfxw7037681/category_10419715.html)
***
最近跟新:
- 2021.03.26 更新CRNN 训练效果,代码整理后上传
- 2021.03.06 更新CRNN backbone resnet 和 mobilev3 以及配置文件
- 2020.12.22 更新CRNN+CTCLoss+CenterLoss训练
- 2020.09.18 更新文本检测说明文档
- 2020.09.12 更新DB,pse,pan,sast,crnn训练测试代码和预训练模型
***
目前已完成:
- [x] DBnet [论文链接](https://arxiv.org/abs/1911.08947)
- [x] PSEnet [论文链接](https://arxiv.org/abs/1903.12473)
- [x] PANnet [论文链接](https://arxiv.org/pdf/1908.05900.pdf)
- [x] SASTnet [论文链接](https://arxiv.org/abs/1908.05498)
- [x] CRNN [论文链接](https://arxiv.org/abs/1507.05717)
***
接下来计划:
- [x] 模型转onnx及调用测试
- [x] 模型压缩(剪枝)
- [ ] 模型压缩(量化)
- [x] 模型蒸馏
- [x] tensorrt部署
- [ ] 训练通用化ocr模型
- [ ] 结合chinese_lite进行部署
- [ ] 手机端部署
***
### crnn模型效果(实验中)
使用 MJSynth(MJ) 和 SynthText(ST) 训练,以batchsize=512训练,在以下数据集上测试:
| 模型 |迭代次数| CUTE80 | IC03_867 |IC13_1015|IC13_857|IC15_1811|IC15_2077|IIIT5k_3000|SVT|SVTP|mean|
|-|-|-|-|-|-|-|-|-|-|-|-|
| resnet34+lstm+ctc |120000| 82.98| 91.92|90.93|91.59|73.10|67.98|90.16|85.16|78.29|83.56|
| mobilev3_large+lstm+ctc | 210000| 73.61| 92.50|90.34|91.59|74.82|68.89|87.56|83.46|77.20|82.21|
| mobilev3_small+lstm+ctc | 210000| 66.31| 90.77|88.76|91.13|73.66|69.52|88.80|84.54|72.24|80.64|
***
### 检测模型效果(实验中)
训练只在ICDAR2015文本检测公开数据集上,算法效果如下:
|模型|骨干网络|precision|recall|Hmean|下载链接|
|-|-|-|-|-|-|
|DB|ResNet50_7*7|85.88%|79.10%|82.35%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|DB|ResNet50_3*3|86.51%|80.59%|83.44%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|DB|MobileNetV3|82.89%|75.83%|79.20%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|SAST|ResNet50_7*7|85.72%|78.38%|81.89%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|SAST|ResNet50_3*3|86.67%|76.74%|81.40%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|PSE|ResNet50_7*7|84.10%|80.01%|82.01%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|PSE|ResNet50_3*3|82.56%|78.91%|80.69%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|PAN|ResNet18_7*7|81.80%|77.08%|79.37%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
|PAN|ResNet18_3*3|83.78%|75.15%|79.23%|[下载链接](https://pan.baidu.com/s/1zONYFPsS3szaf5BHeQh5ZA)(code:fxw6)|
***
### 模型压缩剪枝效果
这里使用mobilev3作为backbone,在icdar2015上测试结果,未压缩模型初始大小为2.4M.
1. 对backbone进行压缩
|模型|pruned method|ratio|model size(M)|precision|recall|Hmean
|-|-|-|-|-|-|-|
|DB|no|0|2.4|84.04%|75.34%|79.46%|
|DB|backbone|0.5|1.9|83.74%|73.18%|78.10%|
|DB|backbone|0.6|1.58|84.46%|69.90%|76.50%|
2. 对整个模型进行压缩
|模型|pruned method|ratio|model size(M)|precision|recall|Hmean|
|-|-|-|-|-|-|-|
|DB|no|0|2.4|85.70%|74.77%|79.86%|
|DB|total|0.6|1.42|82.97%|75.10%|78.84%|
|DB|total|0.65|1.15|85.14%|72.84%|78.51%|
***
### 模型蒸馏
|模型|teacher|student|model size(M)|precision|recall|Hmean|improve(%)|
|-|-|-|-|-|-|-|-|
|DB|no|mobilev3|2.4|85.70%|74.77%|79.86%|-|
|DB|resnet50|mobilev3|2.4|86.37%|77.22%|81.54%|1.68|
|DB|no|mobilev3|1.42|82.97%|75.10%|78.84%|-|
|DB|resnet50|mobilev3|1.42|85.88%|76.16%|80.73%|1.89|
|DB|no|mobilev3|1.15|85.14%|72.84%|78.51%|-|
|DB|resnet50|mobilev3|1.15|85.60%|74.72%|79.79%|1.28|
***
### 文档教程
- [文本检测](./doc/md/文本检测训练文档.md)
- [文本识别](./doc/md/文本识别训练文档.md)
- [pytorch转onnx](./doc/md/pytorch_to_onnx.md)
- [onnx转tensorrt](./doc/md/onnx_to_tensorrt.md)
- [模型剪枝](./doc/md/模型剪枝.md)
- [模型蒸馏](./doc/md/模型蒸馏.md)
***
### 文本检测效果
<img src="./doc/show/ocr1.jpg" width=600 height=600 />
<img src="./doc/show/ocr2.jpg" width=600 height=600 />
***
### 有问题及交流加微信
微信号:-fxwispig-
***
### 参考
- https://github.com/PaddlePaddle/PaddleOCR
- https://github.com/whai362/PSENet
- https://github.com/whai362/pan_pp.pytorch
- https://github.com/WenmuZhou/PAN.pytorch
- https://github.com/xiaolai-sqlai/mobilenetv3
- https://github.com/BADBADBADBOY/DBnet-lite.pytorch
- https://github.com/BADBADBADBOY/Psenet_v2
- https://github.com/BADBADBADBOY/pse-lite.pytorch
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【项目资源】: 包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】: 所有源码都经过严格测试,可以直接运行。 功能在确认正常工作后才上传。 【适用人群】: 适用于希望学习不同技术领域的小白或进阶学习者。 可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】: 项目具有较高的学习借鉴价值,也可直接拿来修改复刻。 对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】: 有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 鼓励下载和使用,并欢迎大家互相学习,共同进步。
资源推荐
资源详情
资源评论
收起资源包目录
基于pytorch的ocr算法库,包括 psenet, pan, dbnet, sast , crnn.zip (296个子文件)
clipper.cpp 134KB
clipper.cpp 134KB
clipper.cpp 134KB
cppdbprocess.cpp 11KB
pixelmerge.cpp 11KB
adaptor.cpp 2KB
.gitignore 11B
pybind11.h 91KB
pybind11.h 91KB
cast.h 87KB
cast.h 87KB
cast.h 85KB
pybind11.h 82KB
numpy.h 64KB
numpy.h 64KB
numpy.h 64KB
pytypes.h 55KB
pytypes.h 55KB
pytypes.h 50KB
common.h 39KB
common.h 36KB
common.h 36KB
eigen.h 29KB
eigen.h 28KB
eigen.h 28KB
class.h 24KB
class.h 24KB
class_support.h 23KB
class_support.h 23KB
class_support.h 23KB
stl_bind.h 21KB
stl_bind.h 21KB
stl_bind.h 20KB
attr.h 19KB
attr.h 19KB
attr.h 18KB
init.h 16KB
init.h 16KB
clipper.h 15KB
stl.h 14KB
stl.h 14KB
internals.h 13KB
internals.h 13KB
stl.h 13KB
operators.h 9KB
operators.h 9KB
operators.h 8KB
embed.h 8KB
embed.h 8KB
descr.h 8KB
descr.h 8KB
descr.h 8KB
embed.h 7KB
chrono.h 6KB
chrono.h 6KB
chrono.h 6KB
lanms.h 6KB
lanms.h 6KB
iostream.h 5KB
iostream.h 5KB
buffer_info.h 4KB
buffer_info.h 4KB
buffer_info.h 4KB
eval.h 4KB
eval.h 4KB
eval.h 4KB
descr.h 3KB
descr.h 3KB
functional.h 3KB
functional.h 3KB
functional.h 3KB
postprocess_op.h 3KB
options.h 2KB
options.h 2KB
options.h 2KB
complex.h 2KB
complex.h 2KB
complex.h 2KB
typeid.h 1KB
typeid.h 1KB
typeid.h 1KB
typeid.h 1KB
typeid.h 1KB
common.h 120B
common.h 120B
clipper.hpp 15KB
clipper.hpp 15KB
clipper.hpp 15KB
ocr1.jpg 232KB
ocr.jpg 193KB
ocr2.jpg 47KB
Makefile 384B
Makefile 380B
Makefile 365B
README.md 5KB
文本检测训练文档.md 3KB
onnx_to_tensorrt.md 2KB
模型剪枝.md 1KB
文本识别训练文档.md 1KB
pytorch_to_onnx.md 1KB
共 296 条
- 1
- 2
- 3
资源评论
妄北y
- 粉丝: 2w+
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C#开发Bartender模板打印WPF 1. 电脑上安装对应打印机的驱动 2. 安装Bartender软件,必须安装,不然无法打印 3. 使用Bartender制作打印模板
- 基于Python+LSTM的文本情感分析系统源码+全部资料(高分项目)
- 自测使用,使用eclipse运行
- c语言简单圣诞树图案代码
- C#winform 千万级数据读写操作处理.zip(sqllite\sql)
- C# 远程写入文件接口.zip
- Mentor常规设置及物料BOM导出操作指南
- 基于一种低通滤波反电势观测器的永磁同步电机无感FOC 采用的反电势观测器相比传统的SMO、龙伯格等反电势观测方法,在算法结构上更加简单,参数调节容易,只有一个参数 1.提供算法对应的参考文献和仿真模
- 船舶检测27-YOLO(v5至v11)、COCO数据集合集.rar
- dthfyjfuygugugg
- 遥感图像分割 UDD6城市无人机数据集.zip
- C# winform-Modbus协议扫码上位机.zip
- 基于Python+LSTM的文本情感分析系统源码(95分以上大作业)
- 基于自抗扰控制器ADRC的永磁同步电机FOC 1.转速环采用ADRC,和传统PI进行对比来分析ADRC控制性能的优越性 对ADRC中的ESO进行改进,进一步提高了ADRC性能 2.提供算法对应的参
- 铁片排列机sw18可编辑全套技术开发资料100%好用.zip
- C# WPF西门子200SMART拉力测试上位机.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功