python高德地图+58租房综合分析程序.rar_租房需求分析资源-CSDN文库

共10个文件

xml：3个

doc：2个

py：2个

版权申诉

python

爬虫

5星 · 超过95%的资源 79 浏览量 2021-08-03 17:50:40 上传评论 4 收藏 4.48MB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

高德地图+58租房的程序.rar （10个子文件）

程序配置说明.doc 2.46MB

高德地图+58租房的程序使用说明.doc 2.29MB

golden_map+58rental

index.html 9KB

crawl.py 3KB

web.py 270B

.idea

misc.xml 185B

golden_map+58rental.iml 431B

workspace.xml 12KB

modules.xml 290B

renting.csv 40KB

import requests # 网络请求模块 from bs4 import BeautifulSoup # 网页解析模块 import csv # csv文件模块 def get_html(): # 网址 url = 'https://bj.58.com/wangjing/pinpaigongyu/pn/{page}/?minprice=2000_3000' # 初始化页码 page = 0 # 打开re.csv文件,如果没有就创建一个，并设置写入模式 csv_file = open('renting.csv', 'w', encoding='utf_8_sig', newline='') # 创建writer对象 writer = csv.writer(csv_file, dialect='excel') # 循环所有页面 while True: page += 1 # 抓取目标页面 response = requests.get(url.format(page=page)) response.encoding = 'utf-8' # 设置编码方式 # 创建一个BeautifulSoup对象，获取页面正文 html = BeautifulSoup(response.text, "html.parser") # 获取当前页面的房子信息 house_list = html.select(".list > li") print('正在下载网页', url.format(page=page)) page_a_list = html.find('div',class_='page') # 查看页面中是否有切换页面的按钮 if page_a_list !=None: # 判断存在切换页面的按钮时 page_a_list=page_a_list.select('span') # 查找关于按钮名称的代码 str_page = str(page_a_list) # 将代码转换成字符类型 if '<span>下一页</span>' in str_page: # 判断当前页面是否有“下一页按钮” write_file(house_list,writer) # 如果有就写入数据并继续循环下一页 else: # 否则就写入当前页面的数据，跳出循环 write_file(house_list,writer) # 关闭文件 csv_file.close() break else: # 当前页面没有切换按钮时，写入当前页面数据，跳出循环 write_file(house_list, writer) # 关闭文件 csv_file.close() break def write_file(house_list,writer): # 便利房子信息 for house in house_list: if house != None: # 获取房子标题 house_title = house.find('div', class_='img').img.get('alt') # 对标题进行分隔 house_info_list = house_title.split() # 获取房子位置 house_location = house_info_list[1] # 获取房子链接地址 house_url = house.select("a")[0]["href"] # 写入一行数据 writer.writerow([house_title, house_location, house_url]) get_html()

评论收藏

内容反馈

版权申诉