没有合适的资源?快使用搜索试试~ 我知道了~
数据预处理概述.pptx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 48 浏览量
2021-10-08
00:00:54
上传
评论
收藏 1.49MB PPTX 举报
温馨提示
试读
64页
数据预处理概述.pptx
资源推荐
资源详情
资源评论
0
5
/
0
1
/
2
0
2
2
4. 数据预处理
0
5
/
0
1
/
2
0
2
2
1
为什么要进行数据挖掘 ?
现实世界的数据是脏的
不完整 : 缺乏属性值,缺乏有意义的属性,或
者只包含了汇总数据
e.g., occupation=“ ”
有噪声 : 包含错误的数据或异常值
e.g., Salary=“-10”
不一致 : 在代码或者名字中存在矛盾或不一致
e.g., Age=“42” Birthday=“03/07/1997”
e.g., Was rating “1,2,3”, now rating “A,
B, C”
e.g., discrepancy between duplicate
records
0
5
/
0
1
/
2
0
2
2
2
为什么数据预处理重要 ?
No quality data, no quality mining results!
Quality decisions must be based on quality
data
e.g., duplicate or missing data may cause incorrect
or even misleading statistics.
Data warehouse needs consistent integration
of quality data
Data extraction, cleaning, and transformation
comprises the majority of the work of building a
data warehouse
0
5
/
0
1
/
2
0
2
2
3
0
5
/
0
1
/
2
0
2
2
4
数据预处
理的主要
内容:
0
5
/
0
1
/
2
0
2
2
数据预处理的主要内容
一、原始数据的表述
二、数据清理
三、数据变换
四、元组的归约
五、属性的归约
0
5
/
0
1
/
2
0
2
2
5
剩余63页未读,继续阅读
资源评论
资料大全
- 粉丝: 14
- 资源: 26万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功