数据库系统原理是信息技术领域的重要组成部分,它涉及到数据的组织、管理和使用。本复习资料主要涵盖了数据库系统的基本概念、数据描述的各个阶段以及数据抽象的四个级别。
数据管理技术经历了从人工管理、文件系统、数据库到高级数据库的四个阶段。数据库阶段的主要特点是引入了数据模型来表示复杂的数据结构,实现了数据独立性,提供了用户友好的接口,并包含了数据恢复、并发控制、完整性和安全性等数据控制功能,大大增强了系统的灵活性。
数据库(DB)是计算机中用于存储、组织并统一管理相关数据的集合。数据库管理系统(DBMS)作为用户与操作系统之间的桥梁,负责处理数据库的创建、查询、更新以及数据控制。数据库系统(DBS)则是一个包含硬件、软件和数据资源的完整体系,它采用数据库技术,支持多用户对大量关联数据的便捷访问。
数据描述分为概念设计、逻辑设计和物理设计。在概念设计中,实体是可区别的客观事物,实体集是同类实体的集合,属性描述实体的特性,实体标识符(关键码或键)用于唯一标识实体。逻辑设计中,字段或数据项是属性的命名单位,记录是字段的有序集合,文件是记录的集合,关键码用于唯一标识记录。
数据间的联系可以是一对一、一对多或多对多。一对一联系意味着两个实体集中的每个实体最多与另一个实体集中的一个实体相关联。一对多联系中,一个实体集的每个实体可以与另一个实体集中零个或多个实体相关,但反向关系只允许一对一。多对多联系允许两个实体集中的任意数量的实体相互关联。
数据抽象通过数据模型进行,包括概念模型、逻辑模型、外部模型和内部模型。概念模型表达了用户需求,逻辑模型是计算机实现的全局逻辑,外部模型反映了用户使用视角,而内部模型关注数据库的物理实现。数据库设计通常涉及概念设计、逻辑设计和物理设计三个阶段。
常见的概念模型是实体-联系(ER)模型,以ER图形式表示。逻辑模型包括层次模型、网状模型和关系模型。层次模型以树形结构表示实体及其联系,如IBM的IMS系统。网状模型使用有向图表示,如DBTG报告中的数据模型。关系模型,由E.F.Codd提出,是最常见的模型,以二维表格形式表示数据,如目前广泛使用的SQL数据库。
外部模型中的视图(模式)是用户看到的特定数据子集。在数据库系统中,有三级模式:外模式(用户视图)、模式(逻辑视图)和内模式(物理视图),它们分别对应用户接口、数据库的整体逻辑结构和实际存储方式。
复习数据库系统原理应重点关注数据管理技术的发展、数据描述的不同阶段、数据抽象的概念及其层次、数据模型的种类以及数据库设计的过程,这些知识点对于理解和操作数据库至关重要。