在这个项目中,我们将探讨一系列与房地产市场分析相关的数据挖掘任务,特别是关注上海市的房价、租金、售租比以及与人口密度、路网密度和餐饮价格的关系。以下是详细的知识点: 1. **数据清洗与整合**: - 使用Python读取"house_rent"和"house_sell"数据集。 - 计算每平方米建筑面积的月租金和房价。 - 删除含有缺失值的记录。 - 按照小区名合并数据,得到约11532条清洗后的记录。 2. **房屋售租比计算与分析**: - 定义售租比为每平方米建筑面积的房价除以每平方米建筑面积的月租金。 - 绘制售租比的直方图和箱型图,分析其分布特征。 - 结论:上海的售租比中位数约为725个月,意味着如果以25岁购房,仅靠租金收入需到85岁才能收回成本。 3. **空间分布与相关性研究**: - 使用QGIS绘制空间格网图,展示房屋每平米均价、每平米租金及售租比的空间分布。 - 使用空间统计方法,按格网对人口密度、路网密度和餐饮价格进行统计并标准化。 - 计算每个网格到上海市中心的距离,市中心坐标为lng-353508.848122,lat-3456140.926976。 - 整理数据并导出为CSV,以便在Python中进一步处理。 - 清洗数据,移除售租比为0的记录。 4. **相关性分析**: - 发现"离市中心距离"与"房屋每平米均价"具有最强相关性。 - "人口密度"和"路网密度"与"房屋每平米均价"呈中等程度相关。 - "餐饮价格"与"房屋每平米均价"的相关性较弱。 - "房屋每平米均价"的离散程度随空间距离变化,市中心附近更离散,远离市中心则收敛。 5. **距离分段相关性分析**: - 使用for循环按10km间隔迭代计算不同距离区间内各指标与房价的相关性。 - 使用bokeh库绘制折线图,观察随距离增加,相关系数的变化。 - 发现"人口密度"、"道路密度"和"离市中心距离"与房价的相关性在远离市中心的地方更明显,20-30km处是明显的分界线,反映了上海的"中心城区-郊区"房价差异。 通过以上步骤,我们可以深入理解上海市房地产市场的空间格局和影响因素。这些分析对于投资者、政策制定者和研究人员了解市场动态、预测未来趋势以及制定相应策略具有重要意义。
- 粉丝: 28
- 资源: 315
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- YOLOv8完整网络结构图详细visio
- LCD1602电子时钟程序
- 西北太平洋热带气旋【灾害风险统计】及【登陆我国次数评估】数据集-1980-2023
- 全球干旱数据集【自校准帕尔默干旱程度指数scPDSI】-190101-202312-0.5x0.5
- 基于Python实现的VAE(变分自编码器)训练算法源代码+使用说明
- 全球干旱数据集【标准化降水蒸发指数SPEI-12】-190101-202312-0.5x0.5
- C语言小游戏-五子棋-详细代码可运行
- 全球干旱数据集【标准化降水蒸发指数SPEI-03】-190101-202312-0.5x0.5
- spring boot aop记录修改前后的值demo
- 全球干旱数据集【标准化降水蒸发指数SPEI-01】-190101-202312-0.5x0.5
评论0