# python_baike_spider
1.爬取百度百科
2.爬取百度词典
###推荐使用ide PyCharm
## 环境
python3
### 依赖
pip install beautifulsoup4
### 运行
python.exe spider_main.py
如果爬取不了,则百度修改了页面,根据页面修改爬取规则
没有合适的资源?快使用搜索试试~ 我知道了~
用python实现一个百度百科的爬虫工具
共37个文件
py:14个
pyc:7个
mp3:5个
需积分: 50 35 下载量 115 浏览量
2017-09-06
16:06:06
上传
评论 1
收藏 76KB ZIP 举报
温馨提示
用python实现个一个百度百科爬虫工具,运行环境为python3,程序可以直接运行,简单实用,方便初学者学习的爬虫代码。
资源推荐
资源详情
资源评论
收起资源包目录
python百度百科爬虫.zip (37个子文件)
python百度百科爬虫
.gitignore 5B
README.md 271B
baike_spider
html_parser.py 1KB
html_downloader.py 272B
output.html 56KB
__pycache__
__init__.cpython-36.pyc 159B
html_downloader.cpython-36.pyc 596B
html_parser.cpython-36.pyc 1KB
html_outputer.cpython-36.pyc 1KB
url_manager.cpython-36.pyc 1KB
html_outputer.py 839B
__init__.py 0B
spider_main.py 1KB
url_manager.py 634B
test
test_urllib2.py 682B
test_ps4.py 789B
readme.md 32B
__init__.py 0B
dict_spider
voice
a4.mp3 4KB
a2.mp3 6KB
a3.mp3 7KB
a1.mp3 6KB
a.mp3 4KB
html_parser.py 5KB
test.py 931B
html_downloader.py 2KB
img
1471327793.jpg 5KB
1491306994.jpg 5KB
__pycache__
html_downloader.cpython-36.pyc 2KB
html_parser.cpython-36.pyc 2KB
test1.py 2KB
spider_main.py 1KB
.idea
python_baike_spider-master.iml 398B
workspace.xml 42KB
vcs.xml 180B
misc.xml 257B
modules.xml 304B
共 37 条
- 1
资源评论
i_wanna_rock
- 粉丝: 8
- 资源: 13
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 奶酪单词-串词成文-2024-06-28-20:50:16.pdf
- Matlab图像处理-基于小波变换的数字图像水印嵌入和提取算法(GUI界面)
- Metadata录屏demo啊
- AppDesigner语音滤波器设计-IIR、IIR、维纳滤波、卡尔曼滤波、自适应滤波
- Python程序设计复习资料
- 高分项目,基于STM32开发的STM32F103RC的电子相册,内含原理图+PCB源文件+程序源码及制作
- YOLOv5深度解析:新一代目标检测算法的突破与应用
- 基于Springboot的小区物业管理系统(有报告) Javaee项目,springboot项目
- 搜索引擎 PHP源码 免费开源
- springboot“闲一品”零食交易平台(源码+lw+ppt+演示视频).rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功