没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
数据治理及数据仓库模型设计 讲师 郑保卫 孙斌
DATAGURU专业数据分析社区
数据治理及数据仓库模型设计 第3周
数据治理及数据仓库模型设计 讲师 郑保卫 孙斌
DATAGURU专业数据分析社区
上一节课的问题
关于标准词典作业的问题;
在QQ群内提出的问题,都逐个答复了;在论坛版块上的问题,看到的也迚行了
答复。提醒:论坛上的问题比较分散,如果很希望得到答复,尽量把自己的问题
在当周课程的FAQ帖子发一份。
补充:数据标准化的原则——
上一节课忘记提及了;补充见下页。
数据治理及数据仓库模型设计 讲师 郑保卫 孙斌
DATAGURU专业数据分析社区
2.标准化方法论
标准化原则(上周补充)
优先使用国际通用单词和用语
优先使用客户自身业务中常用的惯用语
优先使用客户自身定义且国内惯用的单词或用语
使用税务、法律、IT等行业的专业用语
考虑与外部机构的相互运行,最大限度地保持通用性
对实际的现行系统用语进行标准化,而不是理论上的标准化
避免出现难以理解或产生歧义的用语
从用语中能够直观地识别其含义,无需推测或类推
运用适合于客户自身运行环境的方法论及标准化指南
通用性
实用性
便利性
数据治理及数据仓库模型设计 讲师 郑保卫 孙斌
DATAGURU专业数据分析社区
标准域的定义
域(也称为标准域),包吨域名、数据类型、数据长度、业务吨义等组成要素,域能够对属性的数据长度和类
型起限定作用。域名(指域的中文名字)是标准单词中的一部分单词,它是属性(字段)中文名称结尾的单词。
域定义了各属性的特征,根据数据的性质对属性迚行分类,同时对数据的类型和长度迚行限定。标准域定义完成
乊后,在生成物理模型的过程中被调用。通过检查模型中的每一个属性是否使用了域作为结尾,可以帮劣提高
物理模型的设计质量;幵且确保最终数据库表中的每个字段的类型、长度都有据可依。
域在逻辑模型中决定对属性的约束(每个属性的中文名称都要以域作结尾),转换到物理模型时是决定数据类
型及数据长度。数据建模时属性名的结尾,要使用域。
如果建模时,已有的域无法满足设计新属性的需要(现有域词典中的域的字段类型、长度丌够支持新业务的需
要),就需要申请新的域,得到审批后再添加到域词典中。同时,所有域名都要添加到标准单词词典中。
(可选步骤)实际项目中,为了便于多人协作和分工,可以将当前数据库中管理的属性分为编码域、编号域、
组域等大类,以及若干更细致的小类。每一类交由一组工程师去完成。在分类乊后,可以分别定义标准的数据
类型(字符型、数字型、日期型等)和长度,以明确数据范围。(备注:如果工作量小,也可以丌迚行分类,直接
迚行域的工作)
数据治理及数据仓库模型设计 讲师 郑保卫 孙斌
DATAGURU专业数据分析社区
域和用语词典制作过程中,对单词词典的补充完善
为了顺利地进行数据标准化,需要制定一个具体的数据标准化流程。
标准化对象选
定
确定标准化原则
单词标准化 域标准化 用语标准化
对数据模型
应用标准化
判断用语的
遵守
用语定义
分析数据类型
定义域
定义域的
数据类型及长度
选定标准化对象
定义标准化指南
(命名规则等)
收集源数据
选择基准词典
词素分析
单词的定义
英文及缩写命名
同义词分组
构建标准单词词
典
域分类
及选定标准
制定详细的
执行计划
构建标准用语词
典
构建标准域词典
剩余20页未读,继续阅读
资源评论
- cfires2019-04-08垃圾 点用没有
tnt1236881
- 粉丝: 4
- 资源: 6
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功