Python3爬虫发送请求的知识点实例资源-CSDN文库

爬虫

38 浏览量 2020-12-17 07:53:09 上传评论收藏 247KB PDF 举报

资源详情

资源评论

资源推荐

Python3爬虫发送请求的知识点实例爬虫发送请求的知识点实例

使用urllib的request模块，我们可以方便地实现请求的发送并得到响应，本节就来看下它的具体用法。

1. urlopen()

urllib.request模块提供了最基本的构造HTTP请求的方法，利用它可以模拟浏览器的一个请求发起过程，同时它还带有处理授

权验证（authenticaton）、重定向（redirection)、浏览器Cookies以及其他内容。

下面我们来看一下它的强大之处。这里以Python官网为例，我们来把这个网页抓下来：

import urllib.request

response = urllib.request.urlopen('https://www.python.org')

print(response.read().decode('utf-8'))

运行结果如图3-1所示。

这里我们只用了两行代码，便完成了Python官网的抓取，输出了网页的源代码。得到源代码之后呢？我们想要的链接、图片

地址、文本信息不就都可以提取出来了吗？

接下来，看看它返回的到底是什么。利用type()方法输出响应的类型：

import urllib.request

response = urllib.request.urlopen('https://www.python.org')

print(type(response))

输出结果如下：

可以发现，它是一个HTTPResposne类型的对象。它主要包含read()、readinto()、getheader(name)、getheaders()、fileno()

等方法，以及msg、version、status、reason、debuglevel、closed等属性。

得到这个对象之后，我们把它赋值为response变量，然后就可以调用这些方法和属性，得到返回结果的一系列信息了。

例如，调用read()方法可以得到返回的网页内容，调用status属性可以得到返回结果的状态码，如200代表请求成功，404代表

网页未找到等。

下面再通过一个实例来看看：

import urllib.request

response = urllib.request.urlopen('https://www.python.org')

print(response.status)

print(response.getheaders())

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余6页未读，立即下载

评论收藏

内容反馈

weixin_38517212

粉丝: 8
资源: 952

Python3爬虫发送请求的知识点实例

评论0

最新资源

Python3爬虫发送请求的知识点实例

评论0

使用Python爬虫库requests发送请求、传递URL参数、定制headers

房地产网站数据爬虫

Python3模拟curl发送post请求操作示例

Python3多线程爬虫实例讲解代码

Python3处理HTTP请求的实例

Python网络爬虫详解教程 + 知识总结

Python3网络爬虫实战思维导图

10个Python爬虫入门实例-new.docx

python基础知识归纳及实例(全面).zip

10个python爬虫入门实例(小结)

Python3爬虫带上cookie的实例代码

Python3爬虫中识别图形验证码的实例讲解

Python 3网络爬虫开发项目实战_验证码的识别_编程案例解析实例详解课程教程.pdf

python爬虫筛选工作实例讲解

python编写爬虫小程序

Python爬虫 requests库实践

pythonCrawler:python3网络爬虫笔记与实战原始码。记录python爬虫学习全程笔记，参考资料和常见错误，约40个爬取实例与思路解析，涵盖urllib，requests，bs4，jsonpath，re，pytesseract，PIL等常用库的使用

Python3 串口接收与发送16进制数据包的实例

Python3爬虫关于识别点触点选验证码的实例讲解

Python3简单爬虫抓取网页图片代码实例

python利用selenium进行浏览器爬虫

Python使用Srapy框架爬虫模拟登陆并抓取知乎内容

课课家教育-跟着王进老师学开发Python篇：基础入门案例讲解视频教程.docx

最新资源