a)作用:数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合。数据仓库通过数据
清理、变换、继承、装入和定期刷新等方法,从一个或多个数据源收集信息,存放在一个一致的
模式下。数据仓库能够提供大量的、按照实际要求集成的不同主题的数据,通过 OLAP 引擎对其
进行数据挖掘,发现知识。
地位:数据仓库是知识发现过程中不可或缺的一环,它是进行数据挖掘的必要基础。数据仓库能
够提供非冗余的有效数据,这些数据都是面向主题的,因此能够大大提高知识发现的能力和效率。
没有数据仓库,知识发现就没有数据源。
b) 1、数据仓库中海量数据对单列而言数据重复度可能会比较高,对区分度低的属性用b-tree建
立索引存储开销非常大。而bitmap正好适合。
2、b-tree要求查询语句简单,返回结果少。而数据仓库中的复杂查询b-tree往往效率很低。
3、创建b-tree存储的时间复杂度和空间复杂度过高。
c)index on type
评论0