"""
* Created with IntelliJ IDEA
* 作者: Liam
* 日期: 2023/12/25
* 时间: 10:55
* 描述: 从网站 http://www.netbian.com 爬取图片并保存到本地
"""
import os
import time
import requests
from pyquery import PyQuery as pq
# 请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 '
'(KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}
# 请求网页 获取源码
def start_request(url):
r = requests.get(url, headers=headers)
# 这个网站页面使用的是GBK编码 这里进行编码转换
r.encoding = 'GBK'
html = r.text
return html
# 解析网页 获取图片
def parse(text):
doc = pq(text)
# 锁定页面中的img标签
images = doc('div.list ul li img').items()
x = 0
for image in images:
# 获取每一张图片的链接
img_url = image.attr('src')
# 获得每张图片的二进制内容
img = requests.get(img_url, headers=headers).content
# 定义要存储图片的路径
path = ".\\image\\" + str(x) + ".jpg"
# 将图片写入指定的目录 写入文件用"wb"
with open(path, 'wb') as f:
f.write(img)
time.sleep(1)
print("正在下载第{}张图片".format(x))
x += 1
print("写入完成")
# 主函数
def main():
url = "http://www.netbian.com"
text = start_request(url)
image_dir = ".\\image\\"
if not os.path.exists(image_dir):
os.makedirs(image_dir)
parse(text)
# 程序入口
if __name__ == "__main__":
main()
Python爬取4K壁纸 课程设计
需积分: 1 69 浏览量
2024-01-06
21:56:05
上传
评论 1
收藏 4.18MB ZIP 举报
海洋之心
- 粉丝: 9w+
- 资源: 91
最新资源
- Qt开发知识、经验总结 包括Qss,数据库,Excel,Model/View等
- IV数据.xlsx
- 一些深度学习中的小例子,适合新手学习使用
- foldcraftlauncher_262944.apk
- 珍藏多年的基于matlab实现潮流计算程序源代码集合,包含多个潮流计算程序.rar
- 使用FPGA实现串-并型乘法器
- 基于matlab实现针对基于双曲线定位的DV-Hop算法中误差误差出一种基于加权双曲线定位的DV-Hop改进算法.rar
- 基于matlab实现由遗传算法开发的整数规划,车辆调度问题.rar
- 电视家7.0(对电视配置要求高).apk
- 免费计算机毕业设计-基于JavaEE的医院病历管理系统设计与实现(包含论文+源码)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈