没有合适的资源?快使用搜索试试~ 我知道了~
python爬虫mac版本猪精原创
共30个文件
py:12个
xml:5个
md:3个
5星 · 超过95%的资源 需积分: 45 2 下载量 90 浏览量
2020-01-02
20:02:31
上传
评论 1
收藏 273KB ZIP 举报
温馨提示
python mac版爬虫 - 豆瓣电视爬虫案例 ### xpath和lxml - xpath - 一门从html中提取数据的语言 - xpath语法 - xpath helper插件:帮助我们从`elements`中定位数据 - 1. 选择节点(标签) - `/html/head/meta` :能够选中html下的head下的所有的meta标签 - 2. `//` :能够从任意节点开始选择 - `//li` :当前页面上的所有的li标签 - `/html/head//link` :head下的所有的link标签 - 3. `@符号的用途` - 选择具体某个元素:`//div[@class='feed']/ul/li` - 选择class='feed'的div下的ul下的li - `a/@href` :选择a的href的值 - 4. 获取文本: - `/a/text()` :获取a下的文本 - `/a//text()` :获取a下的所有的文本 - 5. 点前 - `./a` 当前节点下的a标签 - lxml - 安装:pip install lxml - 使用 ```pthon from lxml import etree element = etree.HTML("html字符串") element.xpath("") ```
资源推荐
资源详情
资源评论
收起资源包目录
code.zip (30个子文件)
code
code
07_try_json.py 649B
10_qiubaispider.py 2KB
01_testpycharm.py 0B
douban.txt 24KB
douban.json 122KB
renren2.html 45KB
qiubai.txt 55KB
06_try_json.py 622B
04_try_login2.py 1KB
renren3.html 45KB
08_douban_spider.py 1KB
01_try_requests.py 379B
.idea
code.iml 471B
workspace.xml 37KB
misc.xml 4KB
modules.xml 260B
inspectionProfiles
Project_Default.xml 19KB
markdown-navigator
profiles_settings.xml 104B
renren1.html 45KB
03_try_login1.py 989B
05_try_login3.py 720B
09_try_lxml.py 1KB
parse.py 999B
02_try_request_post.py 482B
第一部分.md 3KB
第三部分.pdf 53KB
第二部分.md 2KB
第二部分.pdf 61KB
第三部分.md 3KB
第一部分.pdf 64KB
共 30 条
- 1
资源评论
- 牛站长2023-07-25这个文件提供了一个清晰简洁的指南,可以帮助你快速掌握python爬虫技术。
- 张景淇2023-07-25作者通过简洁明了的语言,把复杂的爬虫原理和操作步骤解释得很透彻。
- kdbshi2023-07-25对于初学者来说,这份文件会是一个不错的开始,能够帮助他们成功入门python爬虫。
- 那你干哈2023-07-25这份文件给出了在mac版本中实施爬虫的可行方法,为mac用户提供了很多方便。
- 王向庄2023-07-25文件中提供的示例代码很实用,并且作者还补充了一些常见问题的解决方法,很贴心。
明铭嘞
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功