没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
⼿把⼿
教
你
⽤
Python
做
回
归
模
型
预
测
房
价
⽤
先
进
的
回
归
技
术
做
房
价
数
据
预
测
竞
赛
。
按
照
以
下
步
骤
取
得
成
功
的
Kaggle
参
赛
作
品
:
·
获
得
数
据
·
探
索
数
据
·
特
性
的
创
建
和
⼯
程
化
(
engineeringfeatures
)
以
及
⽬
标
变
量
·
建
⽴
模
型
·
制
作
并
提
交
预
测
01
获
取
数
据
并
创
建
我
们
的
环
境
我
们
需
要
为
此次
竞
争
找
到
数
据
。
对
特
性
和
⼀些
其
他
有
⽤
信
息
的
描
述
包
含
在
⼀个
名
称
为
data_description.txt
的
⽂
件
中
。
(
附
后
)
下
载
数
据
并
将
其
保
存
到
⼀个
⽂
件
夹
中
,
在
这
个
⽂
件
夹
中
,
保
存
所
有
你
需
要
的
⽂
件
。
我
们
先
来
看看
train.csv
数
据
⽂
件
。
在
我
们
训
练
了
模
型
之
后
,
我
们
将
预
测
结
果
存
⼊
test.csv
数
据
⽂
件
。
⾸
先
,
importPandas,
⼀个
很
好
的
⽤
Python
语
⾔
函
数
库
。
接
下
来
,importnumpy
。
我
们
可
以
⽤
Pandas
读
⼊
csv
⽂
件
。
⽤
pd.read_csv()
⽅
法
从
csv
⽂
件
中
创
建
DataFrame
。
让
我
们
看看
数
据
的
⼤
⼩
。
Test
⽂
件
有
80
列
,
train
⽂
件
有
81
列
。
当
然
,
这
是
由
于
前
者
测
试
数
据
不
包
括
最
终
的
销
售
价
格
信
息
。
接
下
来
,
我
们
将
使
⽤
theDataFrame.head()
⽅
法
查
看
。
我
们
应
该
在
我
们
的
⽐
赛
⽂
件
夹
中为
⽐
赛
提
供
数
据
字
典
。
你
也
可
以
在
这
⾥
找
到
。
下
⾯
是
在
数
据
描
述
⽂
件
中
的
⼀些
字
段
:
·SalesPrice
⸺
以
美
元
计
算
的
房
地
产
的
售
价
。
这
是
你
要
预
测
的
⽬
标
变
量
。
·MSSubClass
⸺
房
地
产
建
筑
类
别
·MSZoning
⸺
⼀
般
的
地
区区
分
类
·LotFrontage
⸺
与
房
地
产
相
距
的
街
道
英
尺
距
离
(
?
)
·LotArea-
⽤
平
⽅
英
尺
表
⽰
的
⼤
⼩
·Stret
⸺
所
在
道
路
的
类
型
·Alley-
所
在
巷
通道
的
类
型
·LotShape-----
房
地
产
形
状
的
分
类
·LandContour-----
⼟地
的
平
整
性
·Utilities-----
可
⽤
的
实
⽤
⼯
具
类
型
·LotConfig
⸺
⼤
⼩
配
置
等等
。
⽐
赛
要
求
你
预
测
每
个
家
庭
的
最
终
价
格
。
在
这
⼀
点
上
,
我
们
应
该
开
始
考
虑
我
们
对
艾
姆
斯
、
爱
荷
华
州
(Ames,Iowa,)
住
房
价
格
的
了
解
,
以
及
我
们
在
这
个
数
据
集
中
可
能
看
到
的
东
西
。
从
这
些
数
据
,
我
们
看
到
了
我
们
所
期望
的
特
性
,
YrSold(
房
⼦
的
最
后
出
售
时
间
)
和
SalePrice
。
还
有
⼀些
我
们
可
能
没
有
预
料
到
的
,
⽐
如
,
LandSlope(
建
造
在
屋
顶
上
的
房
屋
的
坡
度
),RoofMatl(
⽤
来
建
造
屋
顶
的
材
料
)
。
稍
后
,
我
们
将
不
得
不
决
定
如
何
处
理
这
些
字
段
和
其
他
特
性
字
段
。
可
以
在
项
⽬
的
探
索
阶
段
进
⾏
⼀些
可
视
化
预
览
⼯
作
,
也
需
要
将
这
些
功
能
导
⼊
到
我
们
的
环
境
中
。
预
览
允
许
我
们
可
视
化
数
据
的
分
布
,
检查
离
群
值
,
查
看
可
能
忽
略
的
其
他
模
式
。
我
们
将
使
⽤
⼀个
流
⾏
的
可
视
化
库
Matplotlib
来
做
这
件
事
。
步
骤
⼆
:
挖掘
数
据
,
特
征
⼯
程
化
挑
战
在
于
预
测
最
终
的
房
屋
出
售
价
格
,
房
屋
出
售
价
格
信
息
存
在
SalePrice
列
中
。
通
常
将
要
预
测
的
值
称
为
⽬
标
变
量
(
targetvariable
)
。
可
以
应
⽤
Series.describe()
获
取
更
多
的
信
息
。
Series.describe()
提
供
了
系
列
(
series
)
的
信
息
,
count
:
系
列
(
series
)
包
含
的
⾏
数
,
mean
:
均
值
,std
:
标
准
差
,
min
:
最
⼩
值
,
max
:
最
⼤
值
。
在
我
们
的
数
据
集
中
房
屋
售
价
均
值
接
近
$180,000
,
⼤
部
分
房
屋
价
格
分
布
在
$130,000~$215,000
范
围
内
。
接
下
来
,
检查
数
据
偏
斜
度
(
skewness
),
并
以
此
来
衡
量
数
据
分
布
的
形
状
。
当
使
⽤
回
归
⽅
法
时
,
如
果
⽬
标
变
量
出
现
偏
斜
,
则
有
必
要
对
⽬
标
变
量
进
⾏
对
数
变
换
(
log-transform
)
。
通过
对
数
变
换
,
可
以
改
善
数
据
的
线
性
度
。
判
断
何
时
进
⾏
对
数
变
换
超
出
了
本
⽂
的
范
围
重
要
的
是
,
由
最
终
模
型
⽣
成
的
预
测
数
据
也
要
经
过
对
数
变
换
,
这
样
便
可
将
预
测
结
果
转
换
为
原
始
形式
。
np.log()
对
数
据
进
⾏
变
换
,
np.exp()
进
⾏
逆
变
换
。
plt.hist()
可
画
出
SalePrice
的
直
⽅
图
,
值
得
注
意
的
是
在
分
布
右
侧
有
较
⻓
的
尾
部
。
这
个
分
布
是
正
向
偏
差
。
现
在
应
⽤
np.log()
对
train.SalePric
进
⾏
变
换
,
然
后
重
新
计
算
偏
斜
率
,
并
重
新
画
图
。
通过
变
换
,
斜
率
更
靠
近
0
值
,
分
布
更
接
近
正
态
分
布
。
已
经
对
⽬
标
变
量
进
⾏
了
对
数
变
换
,
现
在
我
们
再
考
虑
下
数
据
特
征
。
⾸
先
,
选
择
出
数
值
特
征
并
进
⾏
绘
图
。
select_dtypes()
⽅
法
返
回
与
给
定
数
据
类
型
匹
配
的
列
的
集
合
对
数
字
特
征
操
作
(
WorkingwithNumericFeatures
)
Idint64
MSSubClassint64
LotFrontagefloat64
LotAreaint64
OverallQualint64
OverallCondint64
YearBuiltint64
YearRemodAddint64
MasVnrAreafloat64
BsmtFinSF1int64
BsmtFinSF2int64
BsmtUnfSFint64
TotalBsmtSFint64
1stFlrSFint64
剩余21页未读,继续阅读
资源评论
weishaoonly
- 粉丝: 132
- 资源: 1383
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功