没有合适的资源?快使用搜索试试~ 我知道了~
数据元分析方法与分析过程
需积分: 10 10 下载量 33 浏览量
2010-06-18
18:57:33
上传
评论
收藏 1.33MB DOC 举报
温馨提示
试读
42页
本资源是关于数据标准化方面的内容,用来解决数据冲突、信息孤岛问题,其中介绍了数据元理论及其相关内容。
资源推荐
资源详情
资源评论
目录
引言...................................................................................................................................................3
1、问题的提出........................................................................................................................4
1、1、数据标准化面对的问题..............................................................................................4
1、1、1、数据属性‘名、型、值’的冲突..............................................................................4
数据表名称..............................................................................................................................4
数据项名称..............................................................................................................................4
采气井生产日报......................................................................................................................4
1、1、2、大量的派生数据....................................................................................................5
1、1、3、不同系统信息分类的差异....................................................................................6
1、1、4、历史数据库中的数据............................................................................................7
1、2、数据标准化的正确途经..............................................................................................7
1、2、1、数据库设计中的问题............................................................................................7
1、2、2、数据标准化的核心课题........................................................................................7
2、数据与数据元素................................................................................................................8
2、1、数据..............................................................................................................................8
2、2、数据的基本成份..........................................................................................................8
2、3、数据元素......................................................................................................................9
3、数据元素的标准化框架....................................................................................................9
3、1、数据元的基本概念......................................................................................................9
3、1、1、基本概念................................................................................................................9
3、1、2、数据元的变体与派生..........................................................................................10
3、2、数据元的基本模型....................................................................................................10
3、3、数据元素与其它数据概念的联系............................................................................11
3、4、数据元的基本属性....................................................................................................12
3、4、1、基本属性..............................................................................................................12
3、4、2、属性的常规描述符..............................................................................................12
3、4、3、属性的功能..........................................................................................................12
3、4、4、数据元属性的应用性质......................................................................................13
3、5、数据元的结构化命名................................................................................................13
3、5、1、命名原则..............................................................................................................13
3、5、2、命名约定..............................................................................................................14
3、5、3、应用数据元的名称约定......................................................................................14
4、数据元的分类..................................................................................................................14
4、1、分类模式的概念系统................................................................................................14
4、2、数据元的类型及其关系............................................................................................15
4、3、基于数据元概念的分类............................................................................................16
4、3、1、数据元概念..........................................................................................................16
4、3、2、基本数据元..........................................................................................................16
4、3、3、数据元概念与应用数据元的关系......................................................................16
4、4、基于“对象类”分类.....................................................................................................17
4、5、基于“特性”分类.........................................................................................................19
4、5、1、属性继承基本模式..............................................................................................19
4、5、2、不同分类模式的属性继承..................................................................................20
4、6、基于“表示”的分类.....................................................................................................20
4、6、1、表示的基本数据类型..........................................................................................20
4、6、2、基于“值域”的分类...............................................................................................20
4、6、3、基于“表示形式”的分类.......................................................................................21
4、7、数据元分类的基本性质............................................................................................21
4、7、1、组成成份的分类..................................................................................................21
4、7、2、数据元素的类型..................................................................................................22
4、7、3、基本分类模式......................................................................................................22
4、7、4、分类单元的网状结构..........................................................................................22
4、7、5、关键字与主题词表术语......................................................................................23
4、7、6、基础性数据标准体系..........................................................................................23
4、8、数据元素分类的案例................................................................................................24
5、数据元与元数据注册......................................................................................................25
5、1、数据元的规范定义....................................................................................................25
5、2、数据元素与元数据注册............................................................................................26
5、3、数据元素的语义概念................................................................................................26
5、4、ISO/IEC 11179 核心模型..........................................................................................26
5、5、值域的基本模型........................................................................................................28
5、6、固化的元模型............................................................................................................30
6、数据元的分析方法..........................................................................................................32
6、1、基本业务模式分析....................................................................................................32
6、2、源数据分析................................................................................................................33
6、3、数据元的定义............................................................................................................33
6、3、1、数据元成份的分析与规范..................................................................................33
6、3、2、规范化的数据元..................................................................................................33
6、4、基本数据单元的分析提取........................................................................................34
6、5、数据元的分类规范....................................................................................................35
7、数据元的应用..................................................................................................................35
7、1、数据元的应用特性....................................................................................................35
7、2、信息分类编码体系....................................................................................................35
7、3、参考数据模型............................................................................................................35
7、4、数据模型的优化设计................................................................................................36
7、4、1、面向主题的数据库模型......................................................................................36
7、4、2、系统数据模型的优化..........................................................................................37
7、5、数据元字典................................................................................................................37
7、6、制订数据交换标准....................................................................................................39
后记.................................................................................................................................................39
参考书目.........................................................................................................................................39
附录 A.....................................................................................................................................39
术语定义表............................................................................................................................39
附录 B.....................................................................................................................................41
缩写字母................................................................................................................................41
引言
本文基于ISO/IEC 11179[1-5](V1。0)《 信息技术 数据元的规范与标准化》系列标准、ISO/IEC
11179 [1-3](V2。0)《Information technology--Metadata registries (MDR)》和相应的国家标准的
理解,并在分析、吸收POSC Epicentre及其它一些先进数据模型在数据元应用和数据标准化方面实践的基础
上,结合中国石油行业数据标准化的实际,对石油工业上、中、下游各类数据和公司总部的数据需求,进行数
据元的分析、提取、编目和方法总结后撰写的,具有实用意义。
由于在ISO/IEC 11179--(V 2。0)元数据注册(Metadata registries ——MDR)中属性描述的
是数据元素,它们能够以元数据被注册。因此,本文中的数据元素及其相联系的概念,也是对元数据的定义和
描述。
本文重点从方法论角度,论述数据元的基本概念和知识,并重点介绍如何运用数据元分析方法,制订数据
元标准、优化数据模型设计、实现系统的数据集成与信息共享,提升信息系统的数据标准化的整体水平。
本文是按照以下思路组织的:
(1 ——)问题的提出 在分析现状基础上,提出数据元分析需要解决的问题。
(2 ——)数据与数据元素 从数据基本成份客观性的分析,引出数据元素及其规范的定义和含义,以及数
据元与信息系统中的各类应用环境的数据概念的联系。
(3) ——数据元的标准化框架 数据元是一种结构化的数据单元,数据元之间的结构性特征,又是通过对
数据元属性之间的联系得以实现的。数据元规范由一组属性组成。为使数据元在信息交换中保持一致性,并且
能够在不同的数据管理环境中进行数据比较,数据属性应按一种标准方式进行控制。数据元是一种结构化的数
据,它的组成成分是按照客观事物的自然属性命名定义的,而且在数据元的这些成分之间存在着语义的联系。
(4 ——)数据元的分类 数据元的几个组成部分导致了对分类的需求,这些组分包括:对象类、特性、表
示、值域、数据元概念以及数据元本身。一个分类模式对于分类的对象是一个概念系统。通常,这个分类模式
的内容、范围受主题事件区域(subject matter area)的限制,并为分类模式所复盖。一个特定种类的概念系
统是一个关系系统。
(5 ——)数据元与元数据注册 对数据元素定义的进一步理解的基础上,介绍了元数据的注册方法及其与
数据元属性描述的一致性。并进一步介绍了元数据高层模型和值域的基本模型。
(6 ——)数据元分析 在信息系统的数据需求分析阶段,进行数据元分析的方法和途径。
(7 ——)数据元的应用 数据元分析在信息分类、数据的集成参考模型、数据模型优化设计、数据元字典
以及制订数据交换标准等方面的应用。
1、问题的提出
1、1、数据标准化面对的问题
由于历史的原因,中国石油行业信息系统建设中,一直为数据的标准化问题所困扰:数据
‘ ’属性 名、型、值 的冲突,破坏了数据的完整性和统一性;大量的派生数据及其不规范的属性
定义加剧了这一矛盾;专业内部不同系统之间以及不同专业之间,信息分类与定义的差异,使
得企业的数据集成与信息共享变得十分困难。普遍存在数据冲突、数据垃圾、信息孤岛。
1、1、1、数据属性‘名、型、值’的冲突
(1) 同义异名现象的存在,不同系统之间的数据转换要设计不同的接口 。
示例:
同一油田不同系统内数据‘属性名’的不规范
图1-1
(2)‘值域’冲突
同一数据库内数据的取值范围以及度量单位不统一,影响了数据库的运行质量和效率。
示例: 1)度量单位应是“绝对产量值”。
表 1-1
示例:2)度量单位应是“相对产量值”,可按‘t/d’、 ‘t/mon’、‘t/a’ 统一。
表 1-2
序
号
数据表名称 数据项名称
数
据
类
型
宽度
小
数
位
数
度量
单位
数据项描述
1
采气井生产日报 日产凝析油
N 6 1 t/d
公式:日产液*(1-液体含水率)。
2
采油井生产日报 日产油量
N 6 1 t/d
公式:(日产液*(1-含水率))-日扣油量。
3
生产日报 日产油量
N 7 3 t
4
油田开发热采月报 热采单元年累产油量
N 9 4 10^4t/a
公式:上月热采单元年累产油量+热采单元月
产油量。
5
油气田产能建设月报 年度产油量
N 8 4 10^4t/a
用月产油量计算出来的年度产油量。
序
号
数据表名称 数据项名称
数
据
类
型
宽度
小
数
位
数
度量
单位
数据项描述
1
试油解释成果 日产油量
N 6 2 t/d
引用试油期间稳定日产油量
2
油藏调整方案 设计单元日产油水平
N 6 t/d
设计单元日产油水平
3
油田产能建设年计划 预计当年产油量
N 8 4 10^4t/a
预计当年产油量
4
气田配产配注年计划 预计年产凝析油量
N 6 t
预计年产凝析油量
5
高压物性单次分析数据 日产油量
N 8 2 t
24 小时的产出原油量
6
采油厂年度配产月计划 年配产油量
N 9 4 10^4t
从年初到目前的月配产油量求和
(3) 数据单元定义不规范,数据模型的适应性差。
有的将对象的成分作为数据项名称,而有的数据项实际上是文档记录,计算机不作处理的。
示例 1)在数据库中以对象的成分作为实体的属性名。如:‘铁含量’、‘镍含量’、‘锌含量’等,是矿物成
分与矿物含量的组合。
示例 2)将计算机不作处理的描述性数据,定义为实体属性名。如:设备的技术指标是一种文档资料,
计算机不作任何处理。每一个指标都成为数据实体的属性,结果产生大量的文档资料型的数据项名称,而且被
定义为一种‘数据标准’。
其后果是数据库实体不稳定、数据模型的适应性差,并产生大量的不需要计算机处理的
“数据标准”。
1、1、2、大量的派生数据
因为统计分析或工作计划的需要,对同一个对象作各类统计,并由此派生了大量的新的数
据项名称,又各自定义了相应的值域,加剧了数据属性的冲突。
示例:1)预探、评价项目‘石油储量’现状表
表 1-3
由上表产生了:‘探明石油地质储量’、‘探明石油可采储量’、‘控制石油地质储量’、‘控制石油可采储量’、
‘预测石油地质储量’、‘预测石油可采储量’等以及又派生出的其它有关‘石油储量’的数据项名称。
示例 2)发展规划原油产量表
表 1-4
勘探项目
石油储量
潜在资源量 总资源量
探明储量 控制储量 预测储量
地质 可采 地质 可采 地质 可采
油田公司合计
预
探
阶
段
项目 1
项目 2
项目 3
……
小计
评
价
阶
段
项目 1
项目 2
项目 3
……
小计
项目 滚 1 年——滚 5 年 规划合计
滚 1 年 滚 2 年 滚 3 年 滚 4 年 滚 5 年
原
油
产
量
构
成
1
原油合计
其
中
老区老井
措施增产
老
区
新
井
小计
滚 1 年
滚 2 年
滚 3 年
滚 4 年
滚 5 年
新
区
新
井
小计
滚 1 年
滚 2 年
滚 3 年
滚 4 年
滚 5 年
其
中
合作区块原油产量
轻 烃 产 量
原
油
产
量
构
成
2
常规
其
中
三采
滩海
热采稠油
其
中
转汽驱产量
剩余41页未读,继续阅读
资源评论
Thinkalive
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功