# BaiduWenkuSpider_flaskWeb
以web server形式实现对百度文库文档以pdf形式原格式下载
如果觉得可以的话,可以点个**🌟**哦
(**当前爬取方式可能已经不支持,仅提供flask开发参考**)
## 前言
首先,这是根据
[https://github.com/M010K/BaiduWenkuSpider](https://github.com/M010K/BaiduWenkuSpider)
的项目进行一点修改得到的基于flask框架的python web项目,
可以对百度文库的文档转换为pdf格式进行下载
**[博客地址](https://www.upstudy.top/index.php/archives/21/)**
## 如何使用?
#### 一、下载项目zip包,或者直接用git获取
**$ git clone https://github.com/ChangeWeDer/BaiduWenkuSpider_flaskWeb**
#### 二、安装依赖
项目使用的依赖有
1. requests
2. chardet
3. bs4
4. Pillow
5. pdfkit
6. flask
7. imgkit
8. img2pdf
cd到项目文件夹中使用命令,直接一键安装
**pip install -r requirements.txt**
#### 三、安装wkhtmltopdf工具
[官网下载地址](https://wkhtmltopdf.org/downloads.html)
下载后按当前系统
配置环境变量即可
**window:**
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200421234401464.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mzg3ODMzMg==,size_16,color_FFFFFF,t_70)
**Centos:**
[https://blog.csdn.net/LookingTomorrow/article/details/93513457](https://blog.csdn.net/LookingTomorrow/article/details/93513457)
#### 四、直接运行GetAll.py文件,访问http://127.0.0.1:5000/post 即可(运行在服务器端则访问IP:5000/post)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200421234635967.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mzg3ODMzMg==,size_16,color_FFFFFF,t_70)
ps:ppt格式的文档不支持预览
#### 五、Github源码下载地址
[https://github.com/ChangeWeDer/BaiduWenkuSpider_flaskWeb](https://github.com/ChangeWeDer/BaiduWenkuSpider_flaskWeb)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 基于Python+Flask框架 爬取文库可视化系统设计与实-毕业设计源码+使用文档(高分优秀项目).zip基于Python+Flask框架 爬取文库可视化系统设计与实-毕业设计源码+使用文档(高分优秀项目).zip基于Python+Flask框架 爬取文库可视化系统设计与实-毕业设计源码+使用文档(高分优秀项目).zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕设项目、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 3、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于Python+Flask框架 爬取百度文库的python web 项目-毕业设计源码+使用文档(高分优秀项目).zip (9个子文件)
BaiduWenkuSpider_flaskWeb-master
GetAll.py 29KB
GetTxt.py 4KB
templates
post.html 2KB
GetPpt.py 5KB
requirements.txt 55B
static
loading.gif 77KB
css
style.css 2KB
README.md 2KB
171265889347208773632.zip 416B
共 9 条
- 1
资源评论
不走小道
- 粉丝: 3210
- 资源: 5120
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功