没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示


试读
34页
.研究意义 目前有人在对房屋价格的研究上已经取得了诸多成果,大多数人主要从政治、经济、政策、人口等宏观层面对房屋价格进行了分析,也有少数学者从房屋建筑硬件设施等微观因素展开了研究,也取得了较好的预测效果,但目前这方面还是相对较少。鉴于此,我将根据比赛的数据,构建特征变量集,选取有代表性的特征变量,在已有数据的基础上,对数据进行处理,使用机器学习算法分析房价问题,选择预测模型将其用于预测测试集的房屋价格。 此外,无论是对于监管者还是消费者,是房产中介机构还是房地产开发商,只有深入了解房地产交易市场,才能进行合理监管与规划;高效率推广房源,在能满足购房者需求的前提下科学定价,提高市场竞争优势;有效规避风险,降低不必要的损失等。所以预测房屋价格能为人们在住房购买方面提供更多选择,具有一定的参考作用。 3.题目描述 购房者描述了他们梦想中的房子,他们可能不会从地下室天花板的高度或东西向铁路的距离开始。但这些数据证明,影响价格谈判的因素远大于卧室数量或白色栅栏。题目给出的变量几乎描述了爱荷华州艾姆斯市住宅的各个方面。根据题目所给出的训练集和测试集的数据,分析题目所给的80个变量,预测出测试集中
资源详情
资源评论
资源推荐

课程设计报告
课程名称
Python 数据处理课程设计
项目名称
房屋价格预测
1 / 34

目录
一. 题目背景....................................................................................................................................3
1.选题背景..................................................................................................................................3
2.研究意义..................................................................................................................................3
3.题目描述..................................................................................................................................4
4.选题数据..................................................................................................................................4
二. 现有研究状态............................................................................................................................5
三. 运用的技术手段和方法............................................................................................................7
3.1 EDA(探索性数据分析)..................................................................................................7
3.2 异常值的处理.......................................................................................................................7
3.3 合并训练集和测试集...........................................................................................................8
3.4 删除多余的列.......................................................................................................................8
3.5 缺失值的处理.......................................................................................................................8
3.6 数据类型转换.......................................................................................................................8
3.7 数据对数化处理...................................................................................................................9
3.8 得到数据特征的重要性并做成 DataFrame 形式...............................................................9
3.9 对数据特征重要性数值进行可视化...................................................................................9
3.10 对数据进行合并.................................................................................................................9
3.11 取出处理后的测试集数据...............................................................................................10
3.12 使用机器学习模型对数据进行预测..............................................................................10
四. 数据分析..................................................................................................................................10
4.1 EDA(探索性数据分析)................................................................................................10
4.2 异常值处理.........................................................................................................................11
4.3 合并训练集和测试集.........................................................................................................15
4.4 删除多余的列.....................................................................................................................16
4.5 缺失值处理.........................................................................................................................16
4.6 数据类型转换.....................................................................................................................20
4.7 数据对数化处理.................................................................................................................21
4.8 得到数据特征的重要性并做成 DataFrame 形式.............................................................23
4.9 对数据特征重要性数值进行可视化................................................................................24
4.10 对数据进行合并...............................................................................................................25
4.11 取出处理后的测试集数据...............................................................................................27
4.12 使用机器学习模型对数据进行预测...............................................................................27
4.13 有意义的方面...................................................................................................................29
五. 项目总结..................................................................................................................................31
六. 参考文献..................................................................................................................................33
2 / 34

一. 题目背景
1.选题背景
随着经济的持续发展,房地产行业已经成为了支柱产业,房屋价格不仅直
接影响着居民的生活水平,也间接影响着国家经济的持续、健康、平稳发展,
房屋价格已经成为关系民生的热点问题。房价是否合理,仅仅通过表面观察和
凭空想象是不能回答这些问题的,要通过科学的研究方法才能得出合理的结论。
房屋价格受到很多因素的制约和影响,比如:地理位置、建造房子所用的材料、
住宅风格、住宅类型、有无地下室、有无车库、栅栏的质量、家庭的功能等,
都会对房价产生影响。所以要选取的特征因素应当具有全面性、多样性,选择
与房价密切相关的指标,对数据进行分析、处理,利用机器学习算法研究其对
价格的影响程度,并构建出稳定性好、误差小的价格预测模型,较为准确地预
测出房子的最终价格,从而为政府相关部门宏观调控、房地产开发商以及卖房
或买房者提供科学的定价以及估价依据,更好地推进房屋市场的稳定发展。
2.研究意义
目前有人在对房屋价格的研究上已经取得了诸多成果,大多数人主要从政
治、经济、政策、人口等宏观层面对房屋价格进行了分析,也有少数学者从房
屋建筑硬件设施等微观因素展开了研究,也取得了较好的预测效果,但目前这
3 / 34

方面还是相对较少。鉴于此,我将根据比赛的数据,构建特征变量集,选取有
代表性的特征变量,在已有数据的基础上,对数据进行处理,使用机器学习算
法分析房价问题,选择预测模型将其用于预测测试集的房屋价格。
此外,无论是对于监管者还是消费者,是房产中介机构还是房地产开发商,
只有深入了解房地产交易市场,才能进行合理监管与规划;高效率推广房源,
在能满足购房者需求的前提下科学定价,提高市场竞争优势;有效规避风险,
降低不必要的损失等。所以预测房屋价格能为人们在住房购买方面提供更多选
择,具有一定的参考作用。
3.题目描述
购房者描述了他们梦想中的房子,他们可能不会从地下室天花板的高度或
东西向铁路的距离开始。但这些数据证明,影响价格谈判的因素远大于卧室数
量或白色栅栏。题目给出的变量几乎描述了爱荷华州艾姆斯市住宅的各个方面。
根据题目所给出的训练集和测试集的数据,分析题目所给的 80 个变量,预测出
测试集中 1460 条样本的房价。
4.选题数据
赛题数据由以下两部分构成:
训练集包含 1460 条样本,81 个属性:
4 / 34

测试集包含 1460 条样本,80 个属性:
二. 现有研究状态
一直以来,房价问题是社会各界讨论较多的话题,已有诸多学者从不同视
角探索了影响房价的因素,并取得了一定研究成果。同时也在尝试探索如何构
建更精确的模型去预测房价。
近年来,国内外大多学者以宏观或微观角度为切入点,展开对房价影响因
5 / 34
剩余33页未读,继续阅读
























Nancy-sn
- 粉丝: 385
- 资源: 16
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制

评论0