数据仓库技术是为了构建新的分析处理环境而出现的一种数据存储和组织技术,它能够提供决策支持,满足业务处理和分析处理的需求。数据仓库的主要特征是面向主题、数据是集成的、数据是不可更新的、数据是随时间不断变化的。
数据仓库技术的出现是为了解决数据库技术在分析处理方面的不足,数据库系统能够很好的用于事务处理,但它对分析处理的支持一直不能令人满意。因此,人们逐渐认识到直接用事务处理环境来支持决策支持系统(DSS)是行不通的。数据仓库技术正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。
数据仓库的定义是:一种面向分析的环境;一种把相关的各种数据转换成有商业价值的信息的技术。数据仓库理论的创始人W.H.Inmon在其《Building the Data Warehouse》一书中,给出了数据仓库的四个基本特征:面向主题,数据是集成的,数据是不可更新的,数据是随时间不断变化的。
数据仓库的应用主要有三类分析工具可用于决策支持。第一类能够支持涉及分组和聚集查询,并能够对各种复杂的布尔条件、统计函数和时间序列分析提供支持的系统。第二类系统仍为支持传统SQL查询的DBMS,但为了有效地执行OLAP查询而进行了特殊的设计。第三类的分析工具可用于在大量的数据集合中,找到有意义的数据趋势或者模式。
数据仓库的设计也可以理解为面向OLAP的数据库设计。元数据是“关于数据的数据”(RDBMS中的数据字典就是一种元数据)。ODS(Operational Data Store)作为一个中间层次,一方面,它包含企业全局一致的、细节的、当前的或接近当前的数据,另一方面,它又是一个面向主题、集成的数据环境,适合完成日常决策的分析处理。
数据仓库技术的优点是提供了高效的查询处理速度和存储空间的节省。MOLAP提供了比ROLAP更快的查询处理速度,并且要求更少的存储空间。数据仓库技术的应用领域非常广泛,例如商品销售信息、客户记录、信用卡使用记录等。
数据仓库技术是一种非常重要的数据存储和组织技术,它能够提供决策支持,满足业务处理和分析处理的需求。数据仓库的设计和实现需要结合具体的业务需求和数据特点来进行。