Python爬取小视频之随机生成浏览器的头部信息Python源码

共1个文件

py：1个

版权申诉

python

74 浏览量 2023-10-23 09:04:52 上传评论收藏 2KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

24 爬取B站小视频之随机生成浏览器的头部信息.zip （1个子文件）

24 爬取B站小视频之随机生成浏览器的头部信息

task_2.py 3KB

import requests # 网络请求模块 import time # 时间模块 import random # 随机模块 import os # 操作系统模块 import re # 正则表达式 from fake_useragent import UserAgent # 导入伪造头部信息的模块 ''' 下载批量下载视频添加动态切换头部信息 ''' # 哔哩哔哩小视频json地址 json_url = 'http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset={page}1&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc' class Crawl(): def get_json(self,json_url): headers = {'User-Agent': UserAgent().random} # 创建随机生成的头部信息 response = requests.get(json_url, headers=headers) # 设置随机生成的头部信息 # 判断请求是否成功 if response.status_code == 200: return response.json() # 返回json信息 else: print('获取json信息的请求没有成功！') #下载视频 def download_video(self,video_url,titlename): headers = {'User-Agent':UserAgent().random} #创建随机生成的头部信息 # 下载视频的网络请求 response = requests.get(video_url, headers=headers, stream=True) if not os.path.exists('video'): # 如果video目录不存在时 os.mkdir('video') # 创建该目录 if response.status_code == 200: # 判断请求是否成功 if os.path.exists('video'): with open('video/'+titlename+'.mp4', 'wb')as f: # 将视频写入指定位置 for data in response.iter_content(chunk_size=1024): # 循环写入，实现一段一段的写 f.write(data) # 写入视频文件 f.flush() # 刷新缓存 print('下载完成！') else: print('视频下载失败！') if __name__ == '__main__': c = Crawl() for page in range(0,10): json = c.get_json(json_url.format(page=page)) # 获取返回的json数据 infos = json['data']['items'] # 信息集 for info in infos: # 遍历信息 title = info['item']['description'] # 视频标题 # 只保留标题中英文、数字与汉字，其它符号会影响写入文件 comp = re.compile('[^A-Z^a-z^0-9^\u4e00-\u9fa5]') title = comp.sub('', title) # 将不符合条件的符号替换为空 video_url = info['item']['video_playurl'] # 视频地址 print(title,video_url) c.download_video(video_url, title) # 下载视频,视频标题作为视频的名字 time.sleep(random.randint(3, 6)) # 随机产生获取json请求的间隔时间

评论收藏

内容反馈

版权申诉