实验项目 1 房价预测
1、实验目的
1)强化对回归问题的理解
2)掌握回归算法的应用
3)掌握基于正则化损失函数的回归算法
2、实验内容
1)样本数据分析与处理
2)回归算法建模
3)带有正则化的回归模型用于预测
3、实验原理
1)样本数据分析与处理
from sklearn.datasets import fetch_california_housing
house_info=fetch_california_housing() # 获得房屋数据集信息
house_info.feature_names# 房屋数据集的特征名
house_info.target_names # 房屋数据集的标签名
house_info.data # 房屋数据集的特征
house_info.target # 房屋数据集的标签
在这个数据集中,‘MedHouseVal’ 代表每个街区房屋价格的中位数,是机
器学习模型试图预测的“目标”值。数据集包含了多个特征,如街区住户收入中
位 数 ( MedInc )、 房 屋 使 用 年 代 中 位 数 ( HouseAge )、 平 均 房 间 数 目
(AveRooms)、平均卧室数目(AveBedrms)、街区人口(Population)、平均占
用率(AveOccup)、纬度(Latitude)和经度(Longitude)等。这些特征与
‘MedHouseVal’ 一起构成了一个完整的数据集,用于训练模型以预测房屋价
格。通过 python 代码可以自行下载到个人目录下进行实验。
2)回归算法建模及分析
运用带有正则化的回归算法对数据进行建模,选择最好的预测模型。
3)建立(选做)
在 Elastic Net 回归损失函数下进行房价回归预测。