# @author Wu Yang
# @version 1.0
import requests # requests库
import os # os模块提供了非常丰富的方法用来处理文件和目录
import time # time库
import parsel # 匹配字符串格式解析成re,xpath,css的内容
"""
请求网页,更改网页头部信息,防止被识别拦截
使用requests模块中的get()函数来模拟访问并将得到的内容保存在变量response中
将获得的网页内容用文本形式显示出来
"""
url = 'https://www.jdlingyu.com/tag/%e6%b8%85%e6%96%b0%e7%be%8e%e5%a5%b3'
headers = {'User-Agent': 'Mozilla/5.0'}
html = requests.get(url=url, headers=headers).text
"""