数据分析与可视化应用实训报告
姓 名
学 号
二级学院
专 业
班 级
指导教师
【考核内容】
利用 Pandas 与相关可视化库完成数据的分析、处理与可视化任务,并利用
KNN、决策树、随机森林等算法对数据进行分类或预测。数据选题应具有正面积
极的意义,可从以下大类方向中选取:
· 信息类
· 金融类
· 交通类
· 食品安全类
· 体育类
· 健康信息
· 商品类
评分细则:
· Pandas 完成数据分析的合理性与正确性(20 分)
· 数据预处理的合理性与正确性(20 分)
· 选择合适的模型进行分类或预测(30 分)
· 数据可视化图表的美观性与简洁性(10 分)
· 数据分析观点的创新性(10 分)
· 报告内容的完整性与描述准确度(10 分)
【数据源描述】
描述所处理数据集的结构,字段的含义,记录数。
MSSubClass:标明销售中涉及的住宅类型
MSZoning:标明了销售的一般分区分类
LotFrontage:与房产相连的街道的直线英尺
LotArea:地块大小,以平方英尺为单位
Street:通往房产的道路类型
Alley:通往物业的小巷类型
LotShape:地段形状规整程度
LandContour:房地的平整度
Utilities:可用的公共设施类型
LotConfig:地段配置
LandSlope:土地坡度
Neighborhood:周边地区位置
Condition1:与各种条件相近
Condition2:毗邻各种条件(如果有一个以上的条件)
BldgType:住房类型
HouseStyle:住宅风格
OverallQual:对房屋的整体材料和装修进行评价
OverallCond:房屋的整体状况评分
YearBuilt: 原始建筑日期
RoofStyle:屋顶风格
RoofMatl:屋顶材料
Exterior1st: 房屋的外部覆盖物
Exterior2nd:房屋的外部覆盖物(如果超过一种材料)
MasVnrType:砖石饰面类型
MasVnrArea:砖石饰面的面积,单位为平方英尺
ExterQual:评价外部材料的质量
ExterCond: 评价外部材料等级
Foundation:地基类型
BsmtQual:评估地下室的高度
BsmtCond: 评估地下室的总体状况
BsmtExposure:走道或花园层的墙壁评价
BsmtFinType1:地下室完工面积的评级
BsmtFinSF1:第一类完成的平方英尺
BsmtFinSF2 :地下室完工面积的评级(如果有多种类
型)。
BsmtUnfSF:未完成的地下室面积的平方英尺
TotalBsmtSF: 地下室面积的总平方尺
Heating:暖气类型
【数据处理与分析】
描述数据处理与分析的过程,代码及运行结果截图
加载文件并对其查看空值数量