没有合适的资源?快使用搜索试试~ 我知道了~
Python爬虫基础(2) —— BeautifulSoup(解析数据,提取数据)
5星 · 超过95%的资源 5 下载量 160 浏览量
2021-01-20
03:12:17
上传
评论 2
收藏 392KB PDF 举报
温馨提示
试读
4页
获取网页源代码: import requests #调用requests库 res=requests.get('URL') #URL是网页链接 html=res.text #把res的内容以媳妇穿的形式返回 print('响应状态码:',res.status_code) #检查请求是否正确响应 print(html) #输出网页源代码 爬虫的四个步骤就是: 第零步:获取数据用到的是requests库,用这个库来解决数据获取问题 第一步:BeautifulSoup 用来解析和提取网页中的数据 解析数据:我们平时使用浏览器上网,浏览器会把服务器返回的HTML源代码翻译为我们能看懂的样子,之后才能
资源详情
资源评论
资源推荐
Python爬虫基础(爬虫基础(2)) —— BeautifulSoup(解析数据,提取数据解析数据,提取数据)
获取网页源代码:
import requests
#调用requests库
res=requests.get('URL')
#URL是网页链接
html=res.text
#把res的内容以媳妇穿的形式返回
print('响应状态码:',res.status_code)
#检查请求是否正确响应
print(html)
#输出网页源代码
爬虫的四个步骤就是:
第零步:获取数据用到的是requests库,用这个库来解决数据获取问题
第一步:BeautifulSoup
用来解析和提取网页中的数据
解析数据:我们平时使用浏览器上网,浏览器会把服务器返回的HTML源代码翻译为我们能看懂的样子,之后才能在网页上做各种操作。而在爬虫
中,也要使用能读懂html的工具,才能提取到想要的数据。这就是解析数据
提取数据:是指把我们需要的数据从众多数据中挑选出来。
(在我看来我觉得所谓的解析数据就是先把网页源代码进行分析,去看看哪些行是标题,哪些行是属性等等,知道了之后就可以对其进行相关提
weixin_38656364
- 粉丝: 7
- 资源: 898
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于matlab实现车牌识别程序,和论文,自己做的,做毕业设计的可以看看 .rar
- Windows系统下安装与配置Neo4j的步骤
- 基于matlab实现潮流计算和最优潮流计算的程序1,对毕业设计有一定用处.rar
- 基于大数据学习资源推荐系统的设计与实现(部署视频)-kaic.mp4
- 哈工大形式语言和自动机2022期末含答案
- Windows系统下安装与配置Neo4j的步骤
- 哈希算法(Hash Algorithm)是一种将任意长度的二进制数据映射为较短的、固定长度的二进制值的函数.txt
- Windows系统下安装与配置Neo4j的步骤
- 在二叉树或更复杂的树形结构中,先序输出叶结点.txt
- 列出所有祖先结点的概念通常与树形结构或图论中的节点相关.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论10