什么是逻辑数据映射?它对 项目组的作用是什么?
答:
逻辑数据映射()用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的
数据转换到数据仓库中需要做操作和处理方式的说明文档,通常以表格或 的格式保存如下的信息:
目标表名:
目标列名:
目标表类型:注明是事实表、维度表或支架维度表。
类型:对于维度表而言。
源数据库名:源数据库的实例名,或者连接字符串。
源表名:
源列名:
转换方法:需要对源数据做的操作,如 !等。
逻辑数据映射应该贯穿数据迁移项目的始终,在其中说明了数据迁移中的 策略。在进行物理数据映
射前进行逻辑数据映射对 项目组是重要的,它起着元数据的作用。项目中最好选择能生成逻辑数据
映射的数据迁移工具。
"###$%#$##&
在数据仓库项目中,数据探索阶段的主要目的是什么?
答:
在逻辑数据映射进行之前,需要首先对所有的源系统进行分析。对源系统的分析通常包括两个阶段,一个
是数据探索阶段(%#'),另一个是异常数据检测阶段。
数据探索阶段包括以下内容:
.收集所有的源系统的文档、数据字典等内容。
".收集源系统的使用情况,如谁在用、每天多少人用、占多少存储空间等内容。
(.判断出数据的起始来源()$)*#)。
+.通过数据概况('#,)来对源系统的数据关系进行分析。
数据探索阶段的主要目的是理解源系统的情况,为后续的数据建模和逻辑数据映射打下坚实的基础。
(-)$)###
如何确定起始来源数据?
答:
这个问题的关键是理解什么是 )$)*#。)$)*# 和数据仓库领域内的其他很多
概念一样,不同的人对它有不同的定义。在 ./ 的体系中,)$)*# 是指最初产生数据
的地方,即数据的起始来源。在较大的企业内,数据会被冗余的保存在不同的地方,在数据的迁移过程中,
会出现修改、清洗等操作,导致与数据的起始来源产生不同。
- 1
- 2
前往页