没有合适的资源?快使用搜索试试~ 我知道了~
Python整理滴滴行程单PDF文档数据并导出到Excel.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 163 浏览量
2022-10-30
09:06:05
上传
评论
收藏 27KB DOCX 举报
温馨提示
试读
4页
。。。
资源推荐
资源详情
资源评论
Python 整理滴滴行程单 PDF 文档数据并导出到 Excel
## Usage
### 安装依赖
```
pip install XlsxWriter
pip install pdfminer3k
```
### 运行
```
python3 pdf2xlsx.py # --path(可选参数, pdf 文件路径,默认为当前目录)
```
# -*- encoding:utf8 -*-
"""
author@wxcf45321
"""
import re
import time
import xlsxwriter
import logging
from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpr
eter
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LAParams, LTTextBox, LTTextLine
logging.propagate = False
logging.getLogger().setLevel(logging.ERROR)
读取文件夹中所有
pdf
文档
#
doc = PDFDocument()
parse.set_document(doc)
doc.set_parser(parse)
doc.initialize('')
resmgr = PDFResourceManager()
laparams = LAParams()
laparams.char_margin = 1.0
laparams.word_margin = 1.0
device = PDFPageAggregator(resmgr, laparams=laparams)
interpreter = PDFPageInterpreter(resmgr, device)
资源评论
G11176593
- 粉丝: 6670
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功