数据库系统 第2章 关系数据库
2.1 关系数据结构及形式化定义
2.1.1 关系
关系数据库系统是目前使用最广泛的数据库系统
关系数据库系统与非关系数据库系统的区别:
关系系统只有“表”这一种数据结构;
非关系数据库系统还有其他数据结构,以及对这些数据结
构的操作
关系模型
单一的数据结构----关系 现实世界的实体以及实体间的各种联系均用关系来表示
逻辑结构----二维表 从用户角度,关系模型中数据的逻辑结构是一张二维表
建立在集合代数的基础上
相关术语
⒈ 域(Domain) 域是一组具有相同数据类型的值的集合。例:
整数
实数
介于某个取值范围的整数
长度指定长度的字符串集合
{‘男’,‘女’}
……………..
2. 笛卡尔积(Cartesian Product)
域上的一种集合运算
给定一组域D1,D2,…,Dn,这些域中
可以有相同的。
D1,D2,…,Dn的笛卡尔积为:
D1×D2×…×Dn =
{(d1,d2,…,dn)|di∈Di,i=
1,2,…,n}
所有域的所有取值的一个组合
不能重复
元组(Tuple)
笛卡尔积中每一个元素(d1,d2,…,dn)叫作一个n
元组(n-tuple)或简称元组(Tuple)
eg:(张清玫,计算机专业,李勇)、(张清玫,计算机专
业,刘晨)等都是元组
分量(Component)
笛卡尔积元素(d1,d2,…,dn)中的每一个值di叫作
一个分量
eg:张清玫、计算机专业、李勇、刘晨等都是分量
基数(Cardinal number)
若属性Di(i=1,2,…,n)的取值为有限集,其基数为
mi(i=1,2,…,n),则D1×D2×…×Dn的基数M
为:
笛卡尔积的表示方法
笛卡尔积可表示为一个二维表
表中的每行对应一个元组,表中的每列对应一个域
eg:
3. 关系(Relation)
1)关系(Relation)——笛卡尔积的有限子集
D1×D2×…×Dn的子集叫作在域D1,D2,…,Dn上的
关系,表示为
R(D1,D2,…,Dn)
R:关系名
n:关系的目或度(Degree)
2) 元组
关系中的每个元素是关系中的元组,通常用t表示。
3) 单元关系与二元关系
当n=1时,称该关系为单元关系(Unary relation)或一
元关系
当n=2时,称该关系为二元关系(Binary relation)
4) 关系的表示
关系也是一个二维表,表的每行对应一个元组,表的每
列对应一个域
5)属性
关系中不同列可以对应相同的域
为了加以区分,必须对每列起一个名字,称为属性
(Attribute)
n目关系必有n个属性
6) 码
候选码(Candidate key)
若关系中的某一属性组的值能唯一地标识一个元组,而其
子集不能,则称该属性组为候选码。
简单的情况:候选码只包含一个属性
全码(All-key)
最极端的情况:关系模式的所有属性组是这个
关系模式的候选码,称为全码(All-key)
主码
若一个关系有多个候选码,则选定其中一个为主码
(Primary key)
主码不一定是只有一个属性,主码可以由一个或者多个属
性组成。
主码是候选码之一。
主属性
候选码的诸属性称为主属性(Prime attribute)
不包含在任何侯选码中的属性称为非主属性( Non-
Prime attribute)或非码属性(Non-key attribute)
外码
如果一个关系中的一个属性(该属性不能是候选码)是另
外一个关系中的主码则这个属性为外码。
外码的值要么为空,要么为其对应的主码中的一个值。
7) 三类关系
基本关系(基本表或基表) 实际存在的表,是实际存储数据的逻辑表示
查询表 查询结果对应的表
视图表
由基本表或其他视图表导出的表,是虚表,不对应实际存
储的数据
8)基本关系的6条性质
① 列是同质的(Homogeneous) 每一列中的分量是同一类型的数据,来自同一个域
② 不同的列可出自同一个域
其中的每一列称为一个属性
不同的属性要给予不同的属性名
③ 列的顺序无所谓,,列的次序可以任意交换
④ 任意两个元组的候选码不能相同
⑤ 行的顺序无所谓,行的次序可以任意交换
⑥ 分量必须取原子值,即每一个分量必须是不可分的数
据项
这是规范条件中最基本的一条
规范化的关系称为范式(Normal Form,NF)
2.1.2 关系模式
1.什么是关系模式
关系模式(Relation Schema)是型
关系是值
关系模式是对关系的描述
元组集合的结构
属性构成
属性来自的域
属性与域之间的映象关系
元组语义以及完整性约束条件
属性间的数据依赖关系集合
2.定义关系模式
关系模式是对关系的描述——关系模式可以形式化地
表示为:
R(U,D,DOM,F)
R 关系名
U 组成该关系的属性名集合
D 属性组U中属性所来自的域
DOM 属性向域的映象集合
F 属性向域的映像集合,属性间的数据依赖关系集合
关系模式通常可以简记为
R (U) 或 R (A1,A2,…,An)
R: 关系名
A1,A2,…,An : 属性名
注:域名及属性向域的映象常常
直接说明为属性的类型、长度
3. 关系模式与关系
关系模式
对关系的描述
静态的、稳定的
关系
是关系模式在某一时刻的状态或内容
动态的、随时间不断变化的
关系模式和关系往往统称为关系 通过上下文加以区别
2.1.3 关系数据库
在一个给定的应用领域中,关系模式在某一时刻对应的关
系的集合构成一个关系数据库
关系数据库的型与值
关系数据库的型: 关系数据库模式 对关系数据库的描述。
关系数据库模式包括
若干域的定义
在这些域上定义的若干关系模式
关系数据库的值: 关系模式在某一时刻对应的关系的集
合,简称为关系数据库
2.2 关系操作
常用的关系操作
查询(query):选择select、投影project、连接join、
除divide、并union、交intersection、差except
数据更新:插入、删除、修改
查询的表达能力是其中最主要的部分
选择、投影、并、差、笛卡尔积是5种基本操作
关系操作的特点
集合操作方式:操作的对象和结果都是集合,一次一集合
(set-at-a-time)的方式
而非关系数据模型的数据操作方式称为一次一记录
(record-at-a-time)的方式
关系数据语言的分类
1关系代数(relational algebra )语言
用对关系的运算来表达查询要求
代表:ISBL
2关系演算(relational calculus )语言:用谓词来表达
查询要求
元组关系演算语言
代表:APLHA, QUEL
谓词变元的基本对象是元组变量
域关系演算语言
谓词变元的基本对象是域变量
代表:QBE
3具有关系代数和关系演算双重特点的语言
例如,结构化查询语言(Structured Query
Language,SQL)——是集查询、数据定义语言、数据
操纵语言和数据控制语言于一体的关系数据语言
2.3 关系的完整性 2.3.1 关系的三类完整性约束
2.3.2 实体完整性
实体完整性规则——若属性A是基本关系R的主属性,则
属性A不能取空值
说明:
(1) 实体完整性规则是针对基本关系而言的。一个基本表
通常对应现 实世界的一个实体集。
(2) 现实世界中的实体是可区分的,即它们具有某种唯一
性标识。
(3) 关系模型中以主码作为唯一性标识。
(4) 主码中的属性即主属性不能取空值。主属性取空值,
就说明存在某个不可标识的实体,即存在不可区分的实
体,这与第(2)点相矛盾,因此这个规则称为实体完整
性
2.3.3 参照完整性
定义
设F是基本关系R的一个或一组属性,但不是关系R的码。
如果F与基本关系S的主码Ks相对应,则称F是基本关系R
的外码
基本关系R称为参照关系(Referencing Relation)
基本关系S称为被参照关系(Referenced Relation)或
目标关系(Target Relation)
参照完整性规则
若属性(或属性组)F是基本关系R的外码它与基本关系S
的主码Ks相对应(基本关系R和S不一定是不同的关
系),则对于R中每个元组在F上的值必须为:
或者取空值(F的每个属性值均为空值)
或者等于S中某个元组的主码值
2.3.4 用户定义的完整性
应用领域需要遵循的约束条件,体现了具体领域中的语义
约束
针对某一具体关系数据库的约束条件,反映某一具体应用
所涉及的数据必须满足的语义要求
关系模型应提供定义和检验这类完整性的机制,以便用统
一的系统的方法处理它们,而不要由应用程序承担这一功
能
关系模型必须满足的完整性约束条件,关系的两个不变形
数据操作
2.4 关系代数
关系代数是一种抽象的查询语言,用来对关系的运算进行
查询
关系代数运算分类——按照运算符的不同
5个·基本关系运算:并、差、笛卡尔积、选择、投影
传统的集合运算
并(Union),交∩
R∩S = R –(R-S)
相同的目——属性
笛卡尔积
专门的关系运算
引入几个记号:
t[Ai]——元组t中相应于属性Ai的一个分量
t[A]——t在属性列A上诸分量的集合。
元组的连接(或称元组的串接)
象集Zx
关系运算
选择(又称为限制)——行(元组)选择
选择运算是从关系R中选取使逻辑表达式F为真的元组,
是从行的角度进行的运算
eg:
投影——列运算
投影操作主要是从列的角度进行运算
但投影之后不仅取消了原关系中的某些列,而且还可能取
消某些元组(避免重复行
eg
连接(也称为θ
连接)
——行和列操
作
两类常用连接运算
等值连接(equijoin)——相等-值(不考虑比较的列的
属性)
自然连接(Natural join)——相同属性,有意义的;
同一个东西在不同的关系中
的表示
eg:
自然连接是一种特殊的等值连接
两个关系中进行比较的分量必须是相同的属性组
一般的连接操作是从行的角度进行运
算,而自然连接需要在结果中把重复的
属性列去掉,所以是从行和列的角度进
行运算
自然连接的含义
R和S具有相同的属性组B
其他连接
不等值连接:
外连接
如果把舍弃的元组也保存在结果关系中,而在其他属性上
填空值(Null),这种连接就叫做外连接(OUTER
JOIN)。
左外连接
如果只把左边关系R中要舍弃的元组保留就叫做左外连接
(LEFT OUTER JOIN或LEFT JOIN)
右外连接
如果只把右边关系S中要舍弃的元组保留就叫做右外连接
(RIGHT OUTER JOIN或RIGHT JOIN)。
除
给定关系R (X,Y) 和S (Y,Z),其中X,Y,Z为属性组。
R中的Y与S中的Y可以有不同的属性名,但必须出自相同
的域集。
R与S的除运算得到一个新的关系P(X),
P是R中满足下列条件的元组在 X 属性列上的投影:
元组在X上分量值x的象集Yx包含S在Y上投影的集合
除操作是同时从行和列角度进行运算
eg:R÷S
步骤——
1. 求的是什么属性?投影
2. 满足什么限制条件?选择
3. 从哪张表或那几张表中查找? 自然连接
关系代数表达式 关系代数运算经有限次复合后形成的式子
典型关系代数语言 ISBL(Information System Base Language)
由IBM United Kingdom研究中心研制
用于PRTV(Peterlee Relational Test Vehicle)实验系
统
2.5 关系演算
以数理逻辑中的谓词演算为基础
样例:Student,Course,Student-Course
按谓词变元不同 进行分类
1.元组关系演算:——以元组变量作为谓词变元的基本对
象
元组关系演算语言ALPHA
语句的基本格式—— 操作空间 工作空间名 (表达
式):操作条件
表达式用于指定语句的操作对象
语句:GET、PUT,HOLD,UPDATE,DELETE,DROP
注意:W为工作空间名
检索操作——GET语句
(1)简单检索(即不带条件的检索)
格式:GET 工作空间名(表达式1)
例子
[例1] 查询所有被选修的课程号码。
GET W (SC.Cno)
[例2] 查询所有学生的数据。
GET W (Student)
(2)限定的检索(带条件的检索)
格式:GET 工作空间名(表达式1):操作条件
例子:
[例3]查询信息系(IS)中年龄小于20岁的学生的学号和年龄
GET W (Student.Sno,Student.Sage):
Student.Sdept='IS'∧ Student.Sage<20
(3)带排序的检索
GET 工作空间名(表达式1)[:操作条件]
DOWN/UP 表达式2
DOWN 表达式 降序
UP 表达式 升序
例子:
查询计算机科学系(CS)学生的学号、年龄,结果按年龄降
序排序
GET W (Student.Sno,Student.Sage):
Student.Sdept='CS‘ DOWN Student.Sage
(4)带定额的检索
格式: GET 工作空间名(定额)(表达式1) [:操作条件]
[DOWN/UP 表达式2]
例子
注意:在W后括号中的数量就是指定返回元组的个数。
(5)用元组变量的检索
元组变量的含义
表示可以在某一关系范围内变化(也称为范围变量
Range Variable)
元组变量的用途
① 简化关系名:设一个较短名字的元组变量来代替较长
的关系名。
② 操作条件中使用量词(全称量词、存在量词)时必须
用元组变量。
定义元组变量
格式:RANGE 关系名 变量名
一个关系可以设多个元组变量
(6) 用存在量词的检索
操作条件中使用量词时必须用元组变量
(7)带有多个关系的表达式的检索
(8)用全称量词的检索
(9)用两种量词(全称量词和存在量词)的检索
(10)用蕴函(Implication)的检索
(11)聚集函数
常用聚集函数(Aggregation function)或内部函数
(Build-in function)
更新操作——修改、插入、删除
(1) 修改操作——HOLD-修改-UPDATE
步骤
① 用HOLD语句将要修改的元组从数据库中读到工作空间中——HOLD 工作
空间名(表达式1)[:操作条件 ]
② 用宿主语言修改工作空间中元组的属性
③ 用UPDATE语句将修改后的元组送回数据库中 UPDATE 工作空间名
注意:单纯检索数据用GET语句即可,但为修改数据而读
数据时必须使用HOLD语句,HOLD语句是带上并发控制
的GET语句。
eg:
(2) 插入操作——建立新元组-PUT
步骤
① 用宿主语言在工作空间中建立新元组——格式:PUT
工作空间名 (关系名)
② 用PUT语句把该元组存入指定关系中
PUT语句只对一个关系操作
eg:
(3) 删除操作——HOLD-DELETE
步骤
① 用HOLD语句把要删除的元组从数据库中读到工作空
间中
② 用DELETE语句删除
该元组
格式:DELETE 工作空
间名
eg:
2.域关系演算:——以域变量(元组变量的分量)作为谓
词变元的基本对象
域关系演算语言QBE(Query By Example)
QBE
基于屏幕表格的查询语言
查询要求:以填写表格的方式构造查询
用示例元素(域变量)来表示查询结果可能的情况
查询结果:以表格形式显示
QBE操作框架
查询操作——查询打印符P.
1.简单查询
例1-求信息系全体学生的姓名——操作步骤
(1)用户提出要求;
(2)屏幕显示空白表格;
(3)用户在最左边一栏输入要查询的关系名Student;
(4)系统显示该关系的属性名
(5)用户在上面构造查询要求
(6)屏幕显示查询结果
示例元素 即域变量 一定要加下划线
示例元素是这个域中可能的一个值,它不必是查询结果中
的元素
打印操作符P. 实际上是显示
查询条件
可使用比较运算符>,≥,<,≤,=和≠
其中=可以省略
查询条件不用加下划线。
例子 [例2] 查询全体学生的全部数据
法1:(无查询条件,即查询全部,用打印操作符P.打
印)
法2:
2.条件查询 例子:
3.常见聚集函数:
例子:
4.对查询结果排序
几种排序
升序排序:
对查询结果按某个属性值的升序排序,只需在相应列中填
入“AO.”
降序排序: 按降序排序则填“DO.”
多列排序:
如果按多列排序,用“AO(i).”或“DO(i).”表示,其中
i为排序的优先级,i值越小,优先级越高
例子:
更新操作
1.修改操作——更新操作符U.
“U.”标明所在的行是修改后的新值。
由于主码是不能修改的,所以系统不会混淆要修改的属
性。
操作涉及表达式,必须将操作符“U.”放在关系上
eg:
把200215121学生的年龄改为18岁。
法1:
法2:
码200215121标明要修改的元组。
“U.”标明所在的行是修改后的新值。
由于主码是不能修改的,所以系统不会混淆要修改的属
性。
把200215121学生的年龄增加1岁
将计算机系所有学生的年龄都增加1岁
2.插入操作——插入操作符I. 例子:
3.删除操作——删除操作符D. 例子:
SQL——见第3章
作 者 : @ 十 言 | 来 自 : 知 犀 思 维 导 图
评论0
最新资源