#通过对每月获得的评论数排序,得到最为热门或者最为糟糕的房源:用top表示热门,用bottom为糟糕
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
pd.set_option('display.max_columns', None)
df = pd.read_csv('listings.csv', index_col=0) # 加载数据,使用第一列为默认索引
# 注意下面这个函数中,concat的方式:把列表内的dataframe组合
feature = ['names', 'minimum_nights', 'price', 'room_type']
label = ['reviews_per_month']
def get_review_tb(data, num): # 获取各区评论数量top/bottom的数量,根据参数
'''获取各区评论数量top/bottom的数量,根据num参数,num为正表示top,为负数表示bottom'''
result = []
groups = data.groupby('neighbourhood')
for x, group in groups:
if num > 0:
result.append(group.sort_values(by='reviews_per_month', ascending=False)[:num])
if num < 0:
result.append(group.sort_values(by='reviews_per_month', ascending=False)[num:])
result = pd.concat(result)
return result
reviews_top10 = get_review_tb(df,10) # 获取各区评论数top10的listing信息
reviews_bottom10 = get_review_tb(df, -10) # 获取各区评论数bottom10的listing信息
print(reviews_top10) #用于输出显示情况
print(reviews_bottom10)
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
python短租数据集分析.zip (26个子文件)
short_rent
listings_detail.csv 123.74MB
area_price_fenxi.py 1000B
数据集中性分析箱线图.jpg 17KB
findtop or bottom.py 1KB
listings.csv 4.69MB
room_location.py 1KB
data_fenxi.py 1KB
neighbourhoods.csv 315B
.idea
misc.xml 307B
short_rent.iml 408B
workspace.xml 32KB
encodings.xml 138B
modules.xml 279B
热度较高和热度较差的房源.jpg 54KB
reviews.csv 3.84MB
各区价格分布.jpg 25KB
房型类型计数.jpg 17KB
房间价格散点图.jpg 41KB
数据集中性分析.jpg 29KB
reviews_detail.csv 45.79MB
zonghe_fenxi.py 1KB
calendar_detail.csv 449.63MB
room_type.py 1011B
各区的房间分布图片.jpg 88KB
area_room_price.py 812B
库文件.png 21KB
共 26 条
- 1
资源评论
JXmantou
- 粉丝: 28
- 资源: 20
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功