Python爬虫基础（2）——BeautifulSoup(解析数据，提取数据)_第2关:BeautifulSoup解析网页资源-CSDN文库

5星 · 超过95%的资源 160 浏览量 2021-01-20 03:12:17 上传评论 2 收藏 392KB PDF 举报

资源详情

资源评论

资源推荐

Python爬虫基础（爬虫基础（2）） —— BeautifulSoup(解析数据，提取数据解析数据，提取数据)

获取网页源代码：

import requests

#调用requests库

res=requests.get('URL')

#URL是网页链接

html=res.text

#把res的内容以媳妇穿的形式返回

print('响应状态码：',res.status_code)

#检查请求是否正确响应

print(html)

#输出网页源代码

爬虫的四个步骤就是：

第零步：获取数据用到的是requests库，用这个库来解决数据获取问题

第一步：BeautifulSoup

用来解析和提取网页中的数据

解析数据：我们平时使用浏览器上网，浏览器会把服务器返回的HTML源代码翻译为我们能看懂的样子，之后才能在网页上做各种操作。而在爬虫

中，也要使用能读懂html的工具，才能提取到想要的数据。这就是解析数据

提取数据：是指把我们需要的数据从众多数据中挑选出来。

（在我看来我觉得所谓的解析数据就是先把网页源代码进行分析，去看看哪些行是标题，哪些行是属性等等，知道了之后就可以对其进行相关提

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论10

丛乐

2023-06-20

教程内容详细且易懂，非常适合初学者。

内容反馈

weixin_38656364

粉丝: 7
资源: 898

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip