利用python下载数据,下载下来的数据为zip格式,因为有上千个这样的文件,因此便直接在爬虫程序里加入了解压缩zip文件的内容,并且因为数据量较大,为了节省空间,便在解压缩后立即删除该zip文件。
先来介绍解压缩的方法:
import zipfile
filename = '/home/username/work/1.zip'
fz = zipfile.ZipFile(filename, 'r')
for file in fz.namelist():
fz.extract(file, path)
下面是删除文件:
若文件存在,则删除。
import os
if os.path.exi