covid19-pdf-parser:冲绳县官方案件公布的PDF解析器-源码

所需积分/C币:5 2021-03-06 15:37:03 151.43MB ZIP
6
收藏 收藏
举报

冲绳COVID-19案例PDF解析器 关于 该工具将从下载最新的PDF并将其转换为csv文件。 重要通知 :warning_selector: ! 此输出结果不能直接用作原始数据 ! :warning_selector: 由于提取的数据依赖于PDF格式,因此此分析器可能会由于表格边界不完整而丢失PDF文档中的某些数据。 在实施到您的项目之前,请检查原始数据。 有一份输出报告供参考 ./data/report.txt 需要工具 $ pip install requests BeautifulSoup4 pdfplumber pandas pypdf2 fpdf2 如何 执行转换器 从冲绳县政府自动下载PDF并预处理PDF文件 $ python3 auto_dl_process.py [output] ./pdf/processed_latest.pdf 解析处理的PDF并生成CSV文件 $ python3 auto_parser.py [o

...展开详情
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
covid19-pdf-parser:冲绳县官方案件公布的PDF解析器-源码 5积分/C币 立即下载
1/0