没有合适的资源?快使用搜索试试~ 我知道了~
seq2seq-layout-analysis:基于send2seq的end2end布局分析
共21个文件
py:11个
pyc:2个
json:2个
需积分: 33 2 下载量 177 浏览量
2021-03-19
20:38:10
上传
评论
收藏 1.7MB ZIP 举报
温馨提示
票据类版面分析算法 当前OCR之后的版本面分析工作大家都是规则编写的,本人也遭受规则之苦,看到ocr输出的一大堆文字和坐标就头皮发麻。一个基于seq2seq的端到端版面分析算法,希望能够帮到各位ocrer。 思路:通过有监督方式训练句向量,然后通过seq2seq的方式学习box类别 链接: : 使用方法 准备数据 首先利用自己的OCR算法,将票据图片文字识别出来 将结果存入labelme临时json 使用labelme在groupid里标注所需要提取的box类别 将标注数据放入数据对应的train和test文件夹下 数据样例参考data / train / 1.json 修改config.py其中5个参数,其余可根据情况调试 self.class_char # 标签列表(对应groupid) self.max_text_len = 20 #
资源推荐
资源详情
资源评论
收起资源包目录
seq2seq-layout-analysis-main.zip (21个子文件)
seq2seq-layout-analysis-main
weight
stoi.npy 3KB
rnn.pt 270KB
s2s.pt 1.15MB
embed.npy 99KB
models
__pycache__
TextRNN.cpython-37.pyc 1KB
Seq2Seq.cpython-37.pyc 3KB
TextRNN.py 1KB
Seq2Seq.py 4KB
processing.py 2KB
data
train
1.json 204KB
test
1.json 204KB
rnn_train.py 5KB
rnn_w2v.py 1KB
rnn_infer.py 2KB
requirements.txt 33B
s2s_dataset.py 4KB
config.py 2KB
README.md 1KB
s2s_train.py 4KB
infer.py 2KB
rnn_dataset.py 2KB
共 21 条
- 1
资源评论
嘿嗨呵呵
- 粉丝: 33
- 资源: 4496
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功