元数据解决方案
随着报价系统每年收集和使用的数据飞速增长,数据体量日趋增长,数据形
态多样化且不统一,多种数据源之间的采集、传播和共享遇到困难。元数据管理
作为大数据治理的核心,是有效管理这些数据的基础和前提,在信息化建设中发
挥着重要的作用。如何理解、管理并发挥出元数据的价值,成为迫切的任务。
一、 什么是元数据
元数据(Metadata)是关于数据的数据。元数据是描述数据仓库内数据的结
构和建立方法的数据。可将其按用途的不同分为两类:技术元数据( Technical
Metadata)和业务元数据(Business Metadata)。
1. 技术元数据
技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数
据仓库使用的数据,它主要包括以下信息:
1) 数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据
的定义,以及数据集市的位置和内容。
2) 业务系统、数据仓库和数据集市的体系结构和模式。
3) 汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、
汇总、预定义的查询与报告。
4) 由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分
割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存
取控制)。
2. 业务元数据
业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实
际系统之间的语义层,使业务人员也能够“读懂”数据仓库中的数据。业务元数
据主要包括以下信息: