python短租数据集分析.zip_短租房数据集资源-CSDN文库

共26个文件

py：7个

jpg：7个

csv：6个

python

短租数据集

Airbnb

需积分: 49 162 浏览量 2020-04-24 13:27:26 上传评论 6 收藏 81.35MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

python短租数据集分析.zip （26个子文件）

short_rent

listings_detail.csv 123.74MB

area_price_fenxi.py 1000B

数据集中性分析箱线图.jpg 17KB

findtop or bottom.py 1KB

listings.csv 4.69MB

room_location.py 1KB

data_fenxi.py 1KB

neighbourhoods.csv 315B

.idea

misc.xml 307B

short_rent.iml 408B

workspace.xml 32KB

encodings.xml 138B

modules.xml 279B

热度较高和热度较差的房源.jpg 54KB

reviews.csv 3.84MB

各区价格分布.jpg 25KB

房型类型计数.jpg 17KB

房间价格散点图.jpg 41KB

数据集中性分析.jpg 29KB

reviews_detail.csv 45.79MB

zonghe_fenxi.py 1KB

calendar_detail.csv 449.63MB

room_type.py 1011B

各区的房间分布图片.jpg 88KB

area_room_price.py 812B

库文件.png 21KB

#通过对每月获得的评论数排序，得到最为热门或者最为糟糕的房源：用top表示热门，用bottom为糟糕 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns pd.set_option('display.max_columns', None) df = pd.read_csv('listings.csv', index_col=0) # 加载数据，使用第一列为默认索引 # 注意下面这个函数中，concat的方式：把列表内的dataframe组合 feature = ['names', 'minimum_nights', 'price', 'room_type'] label = ['reviews_per_month'] def get_review_tb(data, num): # 获取各区评论数量top/bottom的数量，根据参数 '''获取各区评论数量top/bottom的数量，根据num参数,num为正表示top，为负数表示bottom''' result = [] groups = data.groupby('neighbourhood') for x, group in groups: if num > 0: result.append(group.sort_values(by='reviews_per_month', ascending=False)[:num]) if num < 0: result.append(group.sort_values(by='reviews_per_month', ascending=False)[num:]) result = pd.concat(result) return result reviews_top10 = get_review_tb(df,10) # 获取各区评论数top10的listing信息 reviews_bottom10 = get_review_tb(df, -10) # 获取各区评论数bottom10的listing信息 print(reviews_top10) #用于输出显示情况 print(reviews_bottom10)

评论收藏

内容反馈