# python_baike_spider
1.爬取百度百科
2.爬取百度词典
###推荐使用ide PyCharm
## 环境
python3
### 依赖
pip install beautifulsoup4
### 运行
python.exe spider_main.py
如果爬取不了,则百度修改了页面,根据页面修改爬取规则
没有合适的资源?快使用搜索试试~ 我知道了~
用python实现一个百度百科的爬虫工具
共37个文件
py:14个
pyc:7个
mp3:5个
需积分: 50 33 下载量 24 浏览量
2017-09-06
16:06:06
上传
评论 1
收藏 76KB ZIP 举报
温馨提示
用python实现个一个百度百科爬虫工具,运行环境为python3,程序可以直接运行,简单实用,方便初学者学习的爬虫代码。
资源推荐
资源详情
资源评论
收起资源包目录
python百度百科爬虫.zip (37个子文件)
python百度百科爬虫
.gitignore 5B
README.md 271B
baike_spider
html_parser.py 1KB
html_downloader.py 272B
output.html 56KB
__pycache__
__init__.cpython-36.pyc 159B
html_downloader.cpython-36.pyc 596B
html_parser.cpython-36.pyc 1KB
html_outputer.cpython-36.pyc 1KB
url_manager.cpython-36.pyc 1KB
html_outputer.py 839B
__init__.py 0B
spider_main.py 1KB
url_manager.py 634B
test
test_urllib2.py 682B
test_ps4.py 789B
readme.md 32B
__init__.py 0B
dict_spider
voice
a4.mp3 4KB
a2.mp3 6KB
a3.mp3 7KB
a1.mp3 6KB
a.mp3 4KB
html_parser.py 5KB
test.py 931B
html_downloader.py 2KB
img
1471327793.jpg 5KB
1491306994.jpg 5KB
__pycache__
html_downloader.cpython-36.pyc 2KB
html_parser.cpython-36.pyc 2KB
test1.py 2KB
spider_main.py 1KB
.idea
python_baike_spider-master.iml 398B
workspace.xml 42KB
vcs.xml 180B
misc.xml 257B
modules.xml 304B
共 37 条
- 1
资源评论
i_wanna_rock
- 粉丝: 8
- 资源: 13
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功