数据模型基本概念及建模方法论 数据模型是指对现实事物的一种抽象表达,以数学方式描述现实世界中的对象、事件和概念,它们之间的关系和约束。数据模型的特征是内容、形式和用途三个方面的体现。内容描述了数据及其之间的关系,形式反映了数据的组织和管理形式,用途则体现在数据仓库系统建设中的数据信息蓝图、业务人员与IT人员沟通的语言和工具等方面。 数据模型可以分为四种类型:概念数据模型(Conceptual Data Model, CDM)、逻辑数据模型(Logical Data Model, LDM)、物理数据模型(Physical Data Model, PDM)和应用数据模型(Application Data Model, ADM)。 概念数据模型(CDM)是从宏观上介绍模型设计思路、范围和内容的模型。它的主要组成元素包括主题、主题间关系、主题中的重要实体、实体间的相互关系、目标与用途圈定、建模的范围划分、建设主题、理清主要业务关系、构造逻辑数据模型的框架等。 逻辑数据模型(LDM)是使用逻辑建模语言定义数据与数据之间的逻辑关系,以图形化的形式反映客户的业务规则。它的设计目标是指导整个数据仓库系统的建设,业务语言是业务人员与技术人员沟通的手段和方法。逻辑数据模型的设计内容包括实体、关系和属性建模方法,是3NF的设计方法。 物理数据模型(PDM)是面向物理实施的具体细节的输入条件,继承于逻辑数据模型,依赖于所选择的数据库,决定于业务需求和性能之间的平衡。物理数据模型的设计内容包括数据库、表和字段、索引需要作非正那么化处理。 应用数据模型(ADM)是满足最终用户对数据的访问和应用系统对数据的存取的模型。它的主要特征是面向Power User和业务人员,与具体的应用相关,多维分析时一般采用星型结构或者雪花状结构的设计方法,是事实表和维度表的组合。 逻辑数据模型和物理数据模型的比较表明,逻辑数据模型包含内容实体、属性表、字段定位记录主键主索引使用名称业务名称物理名称(受限于DBMS),而物理数据模型则是面向物理实施的具体细节的输入条件。 逻辑数据模型在数据仓库中的定位是存储和管理采集答复业务问题、析取清洗条件、剔除家庭关系、加载业务系统、业务系统、业务数据、外部数据、关系数据库管理系统、聚集统计、人工智能、神经网络、多维、可视化、EIS/DSS、电子表、对象语言、开发、企业数据仓库、附属数据集市、业务人员、IT用户、数据导入、知识发现、数据挖掘、信息存取、工具源数据等。 逻辑数据模型的根本术语包括模型结构、第三范式(3NF)结构、星型结构、雪花型结构、模型分类等。实体是指独立型实体、依赖型实体、子类实体、主题域、层面、核心实体、关系实体、特征实体、分类实体等。属性是指描述真实或抽象事物相关联的特征或性质的特征,包括主键、可选键、外键、非键属性、根底名、角色名、鉴别器等。关系是指二元关系、父实体的一个实例严格关系子实体的0、1或多个实例的这种关系是二元关系,基数父、子实体实例的比例,如1:1,1:M等。
剩余49页未读,继续阅读
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~