没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
第1章 数据库技术基础
1.1 数据库基础知识
1.1.1 信息、数据与数据管理
1.信息
信息是指现实世界事物的存在方式或运动状态的表征,是客观世界在人们头脑中的反映 ,
是可以传播和加以利用的一种知识。信息具有可感知、可存储、可加工、可传递和可再生
等自然属性。信息也是社会各行各业不可或缺的资源,这是它的社会属性。
2.数据
数据是信息的载体,是描述事物的符号记录,信息是数据的内容。描述事物的符号可以
是数字,也可以是文字、图形、声音、语言等。数据有多种表现形式,人们通过数据来认
识世界、了解世界。数据可以经过编码后存入计算机加以处理。
3.数据管理
数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。而数据
的管理是指对数据进行的分类、组织、编码、存储、检索和维护。它是数据处理的中心问
题。
1.1.2 数据管理技术的发展
数据库技术是 20 世纪 60 年代开始兴起的一门信息管理自动化的新兴学科,是数据管
理的产物,随着计算机及其应用的不断发展,数据管理技术经历了人工管理、文件系统、
数据库系统三个阶段。
1. 人工管理阶段
在 20 世纪 50 年代中期以前的计算机主要用于科学计算;而存储方面只有纸带、卡片、
磁带,没有大容量的外存;没有操作系统和数据管理软件;数据处理方式是批处理,数
据的管理是由个人设计和安排的。程序员把数据处理纳入程序设计的过程中,除了编制
程序外,还要考虑到数据的逻辑定义和物理组织,以及数据在计算机存储设备中的物理
存储方式。程序和数据混为一体。人工管理阶段的特点是:
(1) 数据不长期保存在计算机里,用完就删除。
(2) 应用程序管理数据,数据与程序结合在一起。
数据不共享,数据是面向应用的,一组数据对应一个程序
2. 文件系统阶段
文件系统阶段是指 20 世纪 50 年代后期到 20 世纪 60 年代中期这一阶段。由于计算机
硬件有了磁盘、磁鼓等直接存取设备;软件有了操作系统、数据管理软件;计算机应用
扩展到了数据处理方面。这一阶段的特点是:
(1) 数据以文件的形式长期保存在计算机里。
(2) 程序与数据之间有一定的独立性,数据可以共享,一个数据文件可以被多个应用
程序使用。
(3) 数据文件彼此孤立,不能反映数据之间的联系,存在大量的数据冗余。
3. 数据库系统阶段
数据库系统阶段是从 20 世纪 60 年代后期开始的。随着计算机软件与硬件的发展,计
算机用于管理的规模越来越大,文件系统作为数据管理手段已经不能满足应用的需求。
为了解决多用户、多应用程序共享数据的需求,人们开始了对数据组织方法的研究,并
开发了对数据进行统一管理和控制数据管理系统,在计算机领域逐步形成了数据库技术
这一独立的分支,数据库系统阶段的特点是;
(1) 数据结构化。
(2) 数据的共享性高、冗余度低、易扩充。
(3) 数据独立性强。
数据由 DBMS 统一管理和控制。
1.1.3 数据库、数据库管理系统、数据库系统
1. 数据库
通俗地讲,数据库(Data Base)是存放数据的仓库。严格的定义是:数据库是长期存
储在计算机内的、有组织的、可共享的数据集合。这种集合具有如下特点:
(1)数据库中的数据按一定的数据模型组织、描述和存储。
(2)具有较小的冗余度。
(3)具有较高的数据独立性和易扩充性。
(4)为各种用户共享。
2. 数据库管理系统
数据库管理系统(DataBase Management System,简称 DBMS)是位于用户与操作系统之间
的一层数据管理软件,是帮助用户创建、维护和使用数据库的软件系统。数据库管理系统
是数据库系统的一个重要组成部分。数据库管理系统应具有如下功能:
(1) 数 据 定 义 功 能 , 用 户 可 以 通 过 DBMS 提 供 的 数 据 定 义 语 言 ( Data Definition
Language,DDL)方便地对数据库中的对象进行定义。
(2)数据操纵功能,数据库管理系统提供的数据操纵功能,可支持用户通过 DBMS 提供的数
据操纵语言(Data Manipulation Language,DML) 方便地操纵数据库中的数据,实现数据
库中的数据,实现对数据库的基本操作,如增加、删除、修改和查询等。
(3)数据库的运行管理,数据库管理系统统一管理数据库的运行和维护,以保障数据的安全
性、完整性、并发性和故障后的系统恢复。
数据库管理系统是数据库系统的一个重要组成部分。
3. 数据库系统
数据库系统(DataBase System,简称 DBS)是指采用数据库技术的计算机系统,狭义
地讲,是由数据库、数据库管理系统构成的;广义地讲,是由数据库、数据库管理系统及
开发工具、数据库应用程序、数据库管理员和用户组成,如图 1.1 所示。数据库管理员
(DataBase Administrator,简称 DBA)是专门从事数据库的建立、使用和维护等工作的数
据库专业人员,他们在数据库系统中起着非常重要的作用。一般情况下,数据库系统简称
为数据库。
图 1-1 数据库系统构成
1.1.4 数据模型
数据模型是现实世界数据特征的抽象,是现实世界的模拟。数据模型同样是现实世界
中数据和信息在数据库中的抽象与表示。
数据模型应满足三方面的要求:一是能比较真实地模拟现实世界;二是容易为人所理
解;三是便于在计算机中实现。
根据模型应用目的的不同,数据模型可以分为两类:一类是概念模型,它是按用户的
观点来对数据和信息进行抽象,主要用于数据库设计;另一类是结构数据模型,它是按计
算机的观点建模,主要用于 DBMS 的实现。
概念模型是现实世界到信息世界的第一次抽象,用于信息世界的建摸,是数据库设计
人员的重要工具,也是数据库设计人员与用户之间交流的语言。
1. 信息世界的基本概念
(1)实体(Entity)是指客观存在并且可以相互区别的事情。实体可以是具体的人、事、物,
也可以是抽象的概念或联系。例如,一个部门、一名学生、一名教师、一场比赛等都可以
是实体。
(2)属性(Attribute),实体所具有的某一特性称为实体的属性。一个实体可由若干个属性
来描述。例如,职工实体可以用职工编号、姓名、性别、职称、学历、工作时间等属性来
描述,如(1001,张莹,女,副教授,硕士,1968),这些属性组合起来描述了一名职工 。
(3)码(Key),唯一标识实体的属性集称为关键字。例如,职工编号是职工实体的关键字 。
(4)域(Domain),属性的取值范围称为该属性的域。例如,职工实体的性别属性的域为
(男,女)。
(5)实体型(Entity Type),具有相同属性的实体称为同型实体,用实体名及其属性名的集
合来抽象和刻画同类实体,成为实体型。例如,职工(职工编号,姓名,性别,职称,学
历,工作时间)就是一个实体型。
(6)实体集(Entity Set),同型实体的集合称为实体集。例如,全体职工就是一个实体集,
全体学生也是一个实体集。
(7)联系(Relationship),在现实世界中,事物内部及事物之间普遍存在联系,这些联系在
信息世界中表现为实体型内部各属性之间的联系以及实体型之间的联系。两个实体型之间
的联系可以分为三类:
一对一联系(1:1):若对于实体集 A 中的每一个实体,实体集 B 中至多有一个实
体与之联系,反之亦然,则称实体集 A 与实体集 B 具有一对一联系。例如,一个厂长
只在一个工厂任职,一个工厂只有一个厂长,因此厂长与工厂之间具有一对一的联系。
一对多联系(1:n):若对于实体集A中的每一个实体,实体集B中有 n(n≥0)个
实体与之联系,反之,对于实体集 B 中的每一个实体,实体集 A 中至多有一个实体与
之联系,则称实体集 A 与实体集 B 有一对多的联系。例如,一个人可以有多个移动电
话,但一个号码只能卖给一个人,人与移动电话号码之间的联系就是一对多的联系。
多对多联系(n:m):若对于实体集A中的每一个实体,实体集B中有 n(n≥0)个
实体与之联系,反过来,对于实体集 B 中的每一个实体,实体集 A 中也有 m(m≥0)
个实体与之联系,则称实体集 A 与实体集 B 有多对多的联系。例如,一门课程同时可
以供若干个学生选修,而一个学生同时也可以选修若干门课程,课程与学生之间的联
系是多对多的联系。
2. 概念模型的表示方法
概念模型是信息世界比较真实的模拟,容易为人所理解。概念模型应该方便、准确地
表示出信息世界中常用的概念。概念模型的表示方法很多,其中比较著名的是实体-联系方
法(Entity-Relationship),该方法用 E-R 图来描述现实世界的概念模型。
E-R 图提供了表示实体型、属性和联系的方法。
3. 常用的结构数据模型
结构数据模型直接描述数据库中数据的逻辑结构,又称为基本数据模型。目前,常用的
结构数据模型有 4 种,它们是:
层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model)
面向对象模型(Object Oriented Model)
目前关系模型是最重要的一种数据模型。关系数据系统采用关系模型为数据的组织方式 ,
SQL Server 2000 数据库就是基于关系模型建立的。关系模型具有如下优点:
(1) 关系模型建立在严格的数学概念基础上。
(2) 关系模型的概念单一,无论实体还是实体之间的联系都用关系表示,对数据的检索
结果也是关系。
(3) 关系模型的存取路径对用户透明。
1.1.5 数据库系统的体系结构
1. 数据库的三级模式两级映像结构它由外模式、模式和内模式构成。
(1)模式。模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,也是所有用
户的公共数据视图。
模式是数据库数据在逻辑上的视图。一个数据库中有一个模式,它既不涉及细节,也
不涉及应用程序及程序设计语言。定义模式时不仅要定义数据的逻辑结构,也要定义数据
之间的联系,定义与数据有关的安全性、完整性要求。
(2)外模式。外模式又称子模式或用户模式,是模式的子集,是数据的局部逻辑结构,也是
数据库用户看到的数据视图。一个数据库可以有多个外模式,每一个外模式都是为了不同
的应用建立的数据视图。外模式是保证数据安全的一个有力措施,每个用户只能看到和访
问所对应的外模式中的数据,数据库中的其余数据是不可见的。
(3)内模式。内模式也称存储模式,是数据在数据库中的内部表示,即数据的物理结构和存
储方式描述。一个数据库只有一个内模式。
2. 数据库的数据独立性
数据库管理系统在这三级模式中提供了两级映像:
(1)外模式/模式映像。所谓外模式/模式映像,就是存在外模式与模式之间的某种对应关
系,这些映像定义通常包含在外模式的描述中。
(2)模式/内模式映像。所谓模式/内模式映像,就是数据库全局逻辑结构与存储结构之间
的对应关系,简称数据的物理独立性。
1.2 关系数据库
关系数据库是当前信息管理系统中最常用的数据库,关系数据库采用关系模式,应用
关系代数的方法来处理数据库中的数据。本节介绍关系模型、关系数据理论与关系数据库
标准语言。
1.2.1 关系模型
关系模型由三部分组成:数据结构、关系操作、关系的完整性。
1. 关系模型的基本术语
(1)关系模型:(Relational Model):用二维表格结构来表示实体及实体间联系的模型称为
“关系模型”。
(2)属性(Attribute)和值域(Domain):在二维表中的列称为属性,列值称为属性值,属
性值的取值范围称为值域。
(3)关系模式(Relation Schema):在二维表格中,行定义(纪录的型)称为关系模式。
(4)元组(Tuple)与关系:在二维表中的行(纪录的值),称为元组,元组的集合称为关系,
关系模式通常也称为关系。.
(5)关键字(Key)或码:在关系的属性中,能够用来唯一标识元组的属性(或属性组合)
称为关键字或码。关系种田的元组由关键字的值唯一确定,关键字不能为空。例如,教师
表中的教师编号就是关键字。
(6)候选关键字(Candidate Key)或候选码:如果一个关系中,存在着多个属性(或属性的
组合)都能用来唯一标识该关系的元组,这些属性或属性的组合都称为该关系的候选关键
字或候选码。
(7)主关键字(Primary Key)或主码:。
(8)非主属性(Non Primary Attribute)或非码属性:。
(9)外部关键字(Foreign Key)或外键:。
(10)从表与主表:是指以外键相关联的两个表,以外键为主键的表称为主表,外键所在的
表称为从表。
2. 关系模型的数据结构
关系模型的数据结构是一种二维表格结构,在关系模型中现实世界的实体与实体之间
的联系均用二维表格来表示,如图 1.4 所示。
3.关系模型的数据完整性
数据完整性是指关系模型中数据的正确性与一致性。关系模型允许定义三类完整性约
束:实体完整性、参照完整性和用户自定义完整性约束。关系数据库系统提供了对实体完
整性、参照完整性约束的自动支持机制,也就是在插入、修改、删除操作时,数据库系统
剩余63页未读,继续阅读
资源评论
老帽爬新坡
- 粉丝: 83
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功