没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
5页
学习爬虫之前呢,最好要对HTTP协议有了解,我前面有写过几篇关于HTTP协议的文章,建议读者阅读一下,对爬虫帮助很大。 1. requests 库的几个主要方法 方法 说明 requests.request() 构造一个网页请求,支撑以下各方法的基础方法 requests.get() 获取HTML网页的主要方法,对应于HTTP的GET requests.head() 获取HTML网页头信息的主要方法,对应于HTTP的HEAD requests.post() 向HTML页面提交POST请求的方法,对应于HTTP的POST requests.put() 向HTML页面
资源推荐
资源详情
资源评论
Python爬虫入门爬虫入门——Requests库库
学习爬虫之前呢,最好要对HTTP协议有了解,我前面有写过几篇关于HTTP协议的文章,建议读者阅读一下,对爬虫帮
助很大。
1. requests 库的几个主要方法库的几个主要方法
方法方法 说明说明
requests.request() 构造一个网页请求,支撑以下各方法的基础方法
requests.get() 获取HTML网页的主要方法,对应于HTTP的GET
requests.head() 获取HTML网页头信息的主要方法,对应于HTTP的HEAD
requests.post() 向HTML页面提交POST请求的方法,对应于HTTP的POST
requests.put() 向HTML页面提交PUT请求的主要方法,对应于HTTP的PUT
requests.patch() 向HTML页面提交局部修改请求,对应于HTTP的PATCH
requests.delete() 向HTML页面提交删除请求,对应于HTTP的DELETE
最常用的get方法:
requests.get(url,params=None,**kwargs)
url:
params:url中的额外参数,字典或字节流格式,可选字段可选字段。
**kwargs:12个控制访问参数,可选字段可选字段(后面会具体讲解每个参数的含义)
其他几个方法如下:
requests.request(method,url,**kwargs)
requests.post(url,data=None,json=None,**kwargs)
requests.head(url,**kwargs)
requests.put(url,data=None,**kwargs)
requests.patch(url,data=None,**kwargs)
requests.delete(url,**kwargs)
PS:这里要说明一下:
r = requests.request(method='GET', url=url, **kwargs)
r = requests.get(url, **kwargs)
这两句代码的意思完全一样,只是为了方便,做了一层封装而已。
2. Requests中两个重要的对象中两个重要的对象
r = requests.get(url)
r:是一个Response对象对象,一个包含服务器资源的对象,Request对象包含爬虫返回的内容。
.get(url):是一个Request对象对象,构造一个向服务器请求资源的Request。
PS:这两个对象指的就是就是HTTP协议中的请求和响应报文。
常见的Response对象的属性:
属性属性 说明说明
r.status_code HTTP 请求的返回状态,200表示连接成功,404表示失败
r.text HTTP响应内容的字符串形式,即,url对应的页面内容
r.encoding
从HTTP header中猜测的响应内容的编码方式
r.apparent_encoding 从内容中分析出的响应内容编码方式(备选编码方式)
r.content HTTP响应内容的二进制形式
r.headers HTTP响应内容的头部信息
3. **kwargs 控制访问的参数控制访问的参数
**kwargs:控制访问的参数,均为可选项
参数参数 说明说明
params 字典或字节序列,作为参数增加到url中。
data
字典、字节序列或文件对象,作为Request的内容 ,放在url链接对应位置的地方,作为数据来存储
json JSON数据格式,作为Request的内容
资源评论
weixin_38706951
- 粉丝: 4
- 资源: 930
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功