没有合适的资源?快使用搜索试试~ 我知道了~
数据挖掘复习大纲答案新新.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 86 浏览量
2023-05-26
13:29:28
上传
评论
收藏 361KB PDF 举报
温馨提示
试读
6页
数据挖掘复习大纲答案新新.pdf
资源推荐
资源详情
资源评论
数据挖掘复习提纲
分值分布
一、 选择题(单选 10 道 20 分多选 5 道 20 分)
二、 填空题(10 道 20 分)
三、 名词解释(5 道 20 分)
四、 解答题(4 道 20 分)
五、 应用题(Apriori 算法 20 分)
1.什么是数据挖掘?
1 答:简单地说,数据挖掘是从大量数据中提取或挖掘知识。
具体地说,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐
含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
2. 什么是数据清理?
2 答:填写缺失的值,平滑噪声数据,识别、删除离群点,解决不一致性
3. 什么是数据仓库?
3 答:是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部
门决策的过程。(最显著特征:数据不易丢失 2 分选择题)
4. 什么是数据集成?
4.数据集成:集成多个数据库、数据立方体或文件
5. 什么是数据变换?
5 答:将数据转换或统一成适合于挖掘的形式。
6. 什么是数据归约?
6 答:得到数据集的压缩表示,它小得多,但可以得到相同或相近的结果
7. 什么是数据集市?
7 答:数据集市包含企业围数据的一个子集,对于特定的用户群是有用的。其围限于选定的
主题。
(是完整的数据仓库的一个逻辑子集,而数据仓库正是由所有的数据集市有机组合而成的)
8.在数据挖掘过程中,耗时最长的步骤是什么?
8.答:数据清理
9. 数据挖掘系统可以根据什么标准进行分类?
9 答:根据挖掘的数据库类型分类 、根据挖掘的知识类型分类、根据挖掘所用的技术分类、
根据应用分类
10. 多维数据模型上的 OLAP 操作包括哪些?
10.答:上卷、 下钻、切片和切块、转轴 / 旋转、其他 OLAP 操作
11. OLAP 服务器类型有哪几种?
11.答:关系 OLAP 服务器(ROLAP)、多维 OLAP 服务器(MOLAP)、混合 OLAP 服务器
(HOLAP)、特殊的 SQL 服务器
12. 数据预处理技术包括哪些? (选择)
12.答:聚集、抽样、维规约、特征子集选择、特征创建、离散化和二元化、变量变换。
13. 形成“脏数据”的原因有哪些?
13. 答:滥用缩写词、数据输入错误、数据中的嵌控制信息、不同的的惯用语、重复记录、
丢失值、拼写变化、不同的计量单位、过时的编码
资源评论
hhappy0123456789
- 粉丝: 61
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功