没有合适的资源?快使用搜索试试~ 我知道了~
第2章--认识数据.pdf
需积分: 13 0 下载量 77 浏览量
2022-01-07
00:36:49
上传
评论
收藏 5.32MB PDF 举报
温馨提示
试读
63页
第2章--认识数据.pdf
资源推荐
资源详情
资源评论
Data Mining
认识数据
2021/10/18
宋云胜
sys_sd@126.com
3
Data Mining
目录
1
数据的基本统计描述
数据对象和属性类型
2
数据可视化
3
度量数据的相似性和相异性
4
4
Data Mining
数据对象Data Objects
数据集由数据对象组成。
一个数据对象代表一个实体(entity)。
销售数据库: 顾客, 商品, 销售
医疗数据库:患者
大学数据库: 学生、教授、课程
数据对象又称为样本(sample)、实例
(instance)、数据点、或对象。
数据对象用属性(attribute)描述。
数据行对应数据对象, 列对应属性。
属性
数据对象
5
Data Mining
属性Attributes
属性(attribute)是一个数据字段,表示数据对象的一个特征。
如:
customer _ID, name, address
类型:
标称属性(nominal)
二元属性(binary)
序数属性(ordinal)
数值属性(numeric)
区间标度属性(interval-scaled)
比率标度属性(ratio-scaled)
定性
属性
定量
属性
6
Data Mining
标称属性(nominal attribute)
标称属性(nominal attribute)
属性值是一些符号或者事物的名称。
比如:
头发颜色
= {
黑色,棕色,
灰色
,白色
}或{1,2,3,4}
独热编码(One Hot Encoder)
使用N位状态寄存器来对N个状态进行编码,每个状态只有一位是1,
其余都是零值。
取值没有任何意义
标称属性
二元属性
序数属性
数值属性
剩余62页未读,继续阅读
资源评论
cure_myheart
- 粉丝: 42
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功