# CRNN-Pytorch 记录CRNN的学习
CRNN是2015年提出的一种,端对端的,场景文字识别方法,它采用CNN与RNN的结合来进行学习。它相对于其他算法主要有以下两个特点:
1. 端对端训练,直接输入图片给出结果,而不是把多个训练好的模型进行组合来识别
2. 不需要对图片中的文字进行分割就可以进行识别,可以适应任意长度的序列
CRNN具体的网络结构如下:
注意:为了与论文保持一致,本文的宽高结构均用**宽 × 高**来表示,三维张量格式为**宽 × 高 × 通道数**
*其中k表示卷积核大小(kernel_size),s表示步长(stride),p表示填充(padding_size)*
| Type | Configurations | Output Size |
| :----------------: | :--------------------------: | :---------------: |
| Input | W × 32 gray-scale image | W × 32 × 1 |
| Convolution | #maps:64, k:3 × 3, s:1, p:1 | W × 32 × 64 |
| MaxPooling | Window:2 × 2, s:2 | W/2 × 16 × 64 |
| Convolution | #maps:128, k:3 × 3, s:1, p:1 | W/2 × 16 × 128 |
| MaxPooling | Window:2 × 2, s:2 | W/4 × 8 × 128 |
| Convolution | #maps:256, k:3 × 3, s:1, p:1 | W/4 × 8 × 256 |
| Convolution | #maps:256, k:3 × 3, s:1, p:1 | W/4 × 8 × 256 |
| MaxPooling | Window:1 × 2, s:2 | W/4 × 4 × 256 |
| Convolution | #maps:512, k:3 × 3, s:1, p:1 | W/4 × 4 × 512 |
| BatchNormalization | - | W/4 × 4 × 512 |
| Convolution | #maps:512, k:3 × 3, s:1, p:1 | W/4 × 4 × 512 |
| BatchNormalization | - | W/4 × 4 × 512 |
| MaxPooling | Window:1 × 2, s:2 | W/4 × 2 × 512 |
| Convolution | #maps:512, k:2 × 2, s:1, p:0 | W/4-1 × 1 × 512 |
| Map-to-Sequence | - | W/4-1 × 512 |
| Bidirectional-LSTM | #hidden units:256 | W/4-1 × 256 |
| Bidirectional-LSTM | #hidden units:256 | W/4-1 × label_num |
| Transcription | - | str |
### 卷积
从上表的配置可以看出,卷积层很像VGG-11。不同的地方主要有两个:
1. 增加了批归一化层
2. 池化层的大小从正方形变成了长方形
加入批归一化层可以加快训练。而用高为2宽为1的长方形更容易获取窄长英文字母的特征,这样更容易区分像i和l这样的字母。
参考
- https://github.com/ypwhs/captcha_break
- https://github.com/luoqianlin/deep-learning-demo
- https://github.com/zhaobomin/crnn.pytorch-ocr-train
风信子的猫Redamancy
- 粉丝: 1w+
- 资源: 50
最新资源
- 2009-2023年沪深北证上市公司A股华证ESG评级和得分汇总-最新出炉.zip
- 2009-2023年一季度更新的上市公司华证ESG评级及得分数据-最新出炉.zip
- 2010-2019年地级市商业信用环境数据大揭秘-最新出炉.zip
- 2009年首都大学生成长追踪调查(CSDPS)基线调查数据-最新出炉.zip
- 2010-2020年债券信用利差数据-最新出炉.zip
- 2010-2020年省级工业“三废”排放量数据汇总-最新出炉.zip
- 2010-2021年33家银行绿色信贷余额数据(平安等银行)-最新出炉.zip
- 2010-2021年全国31个省份农业保险数据(含保险深度、密度等多维度)-最新出炉.zip
- 2010-2021年全国各省碳排放和农业碳排放数据合集-最新出炉.zip
- 2010-2021年和讯网上市公司社会责任评分一级指标(2022.7.14原始爬取更新)-最新出炉.zip
- 2010-2021年上市银行风险承担ZSCORE指标计算数据与Stata代码(更新)-最新出炉.zip
- 2010-2021年我国商业银行数字化转型指数(战略、业务、管理)面板数据-最新出炉.zip
- 2010-2021年上市公司和讯网社会责任评级CSR(各分项评级)-最新出炉.zip
- 2010-2024年全国296个地级市房价数据汇总-最新出炉.zip
- 2010-2021年中国商业银行数字化转型指数面板数据(Excel或Stata版)-最新出炉.zip
- 2010-2023.7全国31省份、直辖市专利侵权结案面板数据-最新出炉.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
- 1
- 2
- 3
- 4
- 5
前往页