31.简单地说,数据挖掘就是从 中挖掘 的过程。
32.数据挖掘相关的名称还有 、 、 等。
二、 判断题
( )1. 数据仓库的数据量越大,其应用价值也越大。
( )2. 啤酒与尿布的故事是聚类分析的典型实例。
( )3. 等深分箱法使每个箱子的记录个数相同。
( )4. 数据仓库“粒度”越细,记录数越少。
( )5. 数据立方体由 3 维构成, Z 轴表示事实数据。
( )6. 决策树方法通常用于关联规则挖掘。
( )7. ID3 算法是决策树方法的早期代表。
( )8. C4.5 是一种典型的关联规则挖掘算法。
( )9. 回归分析通常用于挖掘关联规则。
( )10. 人工神经网络特别适合解决多参数大复杂度问题。
( )11. 概念关系分析是文本挖掘所独有的。
( )12. 可信度是对关联规则的准确度的衡量。
( )13. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
( )14. SQL Server 2000 不提供关联规则挖掘算法。
( )15. Clementine 是 IBM 公司的专业级数据挖掘软件。
( )16. 决策树方法特别适合于处理数值型数据。
( )17. 数据仓库的数据为历史数据,从来不需要更新。
( )18. 等宽分箱法使每个箱子的取值区间相同。
( )19. 数据立方体是广义知识发现的方法和技术之一。
( )20. 数据立方体的其中一维用于记录事实数据。
( )21. 决策树通常用于分类与预测。
( )22. Apriori 算法是一种典型的关联规则挖掘算法。
( )23. 支持度是衡量关联规则重要性的一个指标。
( )24. SQL Server 2000 集成了 OLAP,但不具有数据挖掘功能。
( )25. 人工神经网络常用于分类与预测。
三、 名词解释
1. 数据仓库: 是一种新的数据处理体系结构,是面向主题的、集成的、不可更新
的(稳定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提
供所需的集成信息。
2. 孤立点: 指数据库中包含的一些与数据的一般行为或模型不一致的异常数据。
3. OLAP:OLAP 是在OLTP 的基础上发展起来的,以数据仓库为基础的数据分析处
理,是共享多维信息的快速分析,是被专门设计用于支持复杂的分析操作,侧