Python使用xpath实现图片爬取_pythonxpathimg资源-CSDN文库

106 浏览量 2020-09-17 11:24:48 上传评论收藏 50KB PDF 举报

资源推荐

资源详情

资源评论

Python使用使用xpath实现图片爬取实现图片爬取

主要介绍了Python使用xpath实现图片爬取,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定

的参考学习价值,需要的朋友可以参考下

高性能异步爬虫高性能异步爬虫

目的：在爬虫中使用异步实现高性能的数据爬取操作

异步爬虫的方式：异步爬虫的方式：

- 多线程、多进程（不建议）：

好处：可以为相关阻塞的操作单独开启多线程或进程，阻塞操作就可以异步执行;

弊端：无法无限制的开启多线程或多进程。

- 线程池、进程池（适当的使用）：

好处：我们可以降低系统对进程或线程创建和销毁的一个频率，从而很好的降低系统的开销；

弊端：池中线程或进程的数据是有上限的。

代码如下

# _*_ coding:utf-8 _*_

"""

@FileName :6.4k图片解析爬取（异步高性能测试）.py

@CreateTime :2020/8/14 0014 10:01

@Author : Lurker Zhang

@E-mail : 289735192@qq.com

@Desc. :

"""

import requests

from lxml import etree

from setting.config import *

import json

import os

import time

from multiprocessing.dummy import Pool

def main():

# 图片采集源地址

# source_url = 'http://pic.netbian.com/4kmeinv/'

# temp_url = 'http://pic.netbian.com/4kmeinv/index_{}.html'

# source_url = 'http://pic.netbian.com/4kdongman/'

# temp_url = 'http://pic.netbian.com/4kdongman/index_{}.html'

source_url = 'http://pic.netbian.com/4kmingxing/'

temp_url = 'http://pic.netbian.com/4kmingxing/index_{}.html'

# 本此采集前多少页,大于1的整数

page_sum = 136

all_pic_list_url = []

if page_sum == 1:

pic_list_url = source_url

print('开始下载:' + pic_list_url)

all_pic_list_url.append(pic_list_url)

else:

# 先采集第一页

pic_list_url = source_url

# 调用采集单页图片链接的函数

all_pic_list_url.append(pic_list_url)

# 再采集第二页开始后面的页数

for page_num in range(2, page_sum + 1):

pic_list_url = temp_url.format(page_num)

all_pic_list_url.append(pic_list_url)

# 单页图片多线程解析

pool1 = Pool(10)

pool1.map(down_pic, all_pic_list_url)

print('采集完成，本地成功下载{0}张图片,失败{1}张图片。'.format(total_success, total_fail))

# 存储已下载文件名列表：

with open("../depository/mingxing/pic_name_list.json", 'w', encoding='utf-8') as fp:

json.dump(pic_name_list, fp)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

weixin_38715008

粉丝: 5
资源: 1017

Python使用xpath实现图片爬取

python 爬取图片

初学python爬虫，记录一下学习过程，requests xpath os 提取图片并保存本地

python利用xpath爬取贴吧图片

使用python的wallhaven热门图片爬取，运用xpath

Python3爬虫学习-爬取图片批量下载 XPATH

java 实现简单爬虫，爬取图片

python爬虫实战之爬取京东商城实例教程

java爬虫爬取百度图片

python实现爬取百度图片的方法示例

Python实现爬取网站图片并下载

Python：爬取网站图片

爬取网站图片的Python代码

简单实现Python爬取网络图片

python网络爬虫抓取图片

python爬虫 抓取页面图片

python爬取百度图片

Python爬虫实战之爬取网站全部图片

Python爬虫实现百度图片自动下载

Python爬虫实战之爬取网站全部图片三

Python百度批量爬取图片

爬取百度贴吧图片

python-xpath获取html文档的部分内容

Python-使用python爬取mm图片

爬虫_8 xpath的使用 好段子爬取_爬虫_python_

xpath解析案例-4k图片解析爬取.py

Python爬虫爬取图片.zip

Python批量爬取图片并下载

Python爬取煎蛋网图片

最新资源

python爬虫抓取页面图片

爬虫_8 xpath的使用好段子爬取_爬虫_python_