主要是做文档类图像的版面分析。模型来源:PaddleOCR 版面分析
具体来说,就是分析给定的文档类别图像(论文截图等),定位其中类别和位置,如标题、段落、表格和图片等各个部分。
目前支持三种类别的版面分析模型:中文、英文和表格版面分析模型,具体可参见下面表格:
模型类型 模型名称 模型大小 支持种类
表格 layout_table.onnx 7.06M table
英文 layout_publaynet.onnx 7.06M text title list table figure
中文 layout_cdla.onnx 7.07M text title figure figure_caption table table_caption
header footer reference equation
模型下载地址为:百度网盘 | Google Drive
使用方式
pip安装
由于模型较小,预先将中文版面分析模型(layout_cdla.onnx)打包进了whl包内,如果做中文版面分析,可直接安装使用
$ pip install rapid-layout.whl