下载  >  课程资源  >  讲义  > 国科大数据库提纲答案

国科大数据库提纲答案 评分:

第 1 章 关系数据库模型和关系运算 要求掌握的基本概念和理论 1. 与网状和层次数据库相比,关系数据库有哪些优点? (1)数据结构单一,不管实体还是实体之间的联系都用关系来表示; (2)建立在严格的数学概念基础上,具有坚实的理论基础; (3)将数据定义和数据操纵统一在一种语言中,使用方便,易学易用。 2. 试述关系模型的完整性规则 答:关系模型的完整性规则包括:实体完整性、参照完整性、用户定义的完整性 。 实体完整性规则是指若属性 A 是基本关系 R 的主属性,则属性 A 不能取空 值。 参照完整性:若属性(或属性组)F 是基本关系 R 的外键,它与基本关系 S 的 主
8.规范化关系模式为BCNF算法 算法42.7 BCNF-DECOMPOSE(R,F) (1)若R∈BCNF,算法终止,p={R (2)若中有R2¢BCNF,即有X→Y且XYcR 而X不是R的键, 分解R为R;R一Y和R2=XY 用R;和R12代替p中的R (3).若D中所们R1∈BCN,输出p,否则转(2)继续进行 分解,直到使所有关系模式都成为BCNF 例8:设R= ABCDE,F={A→B,D→C,AC→D,AE→D, 试生成BCNF的关系模式。 (在所有依赖关系右边没有出现的属性一定是候选键的成员) 解:R的键为AE A→B,而A不是R的键,所以,R不是BCNF 分解R为R1=ACDE,R2=AB R2是BCNF,R1不是BCNF,因为:R2的键为AE R中有D→C而D不是R1的键 分解R1为:R1=CD,R12=ADE, R1,R1 12都是BCNF 则R=R1、R12、R2}为BCN 练习1.R(A,BC),其函数依赖集为F={B→C,AC→B}该关系模式是否第2 范式,并说明理由 练习2:R(A,BC,D),其函数依赖集为F={A→C,AD→B} 该关系模式是否第2范式,并说明理由 练习3.R(A,B,C,其函数依赖集为F={B→C,AC→B};该关系模式是否第3 范式,并说明理由 练习4:R(A,B,C,D),其函数依赖集为F={AB→C C→D};该关系模式是否第3范式并说明理由 练习5:假定一门课只有一个系来开,找出选课关系 clective的键和和基本函数 依赖,它是否是第2范式? 练习6:假定一门课只有一个系开,一个系只有一个地址?该关系中有哪些函数 依赖?该关系的键是什么?是几范式? 1.是第三范式,不是BCNF。主键为AC,非主属性为B,B完全依赖于AC, 而C传递依赖AC。 2.不是主键为AD,非主属性为B和C,对于C,C部分依赖于AD(A->C) 3.是3NF主键为AC,非主属性为B,不存在传递依赖 4不是3NF,是2NF主键为AB,非主属性为CD,D传递依赖与AB?? 5. SNAME、 COURSE→DEPT COURSE→DEPT 不是2NF为1NF。主键为 SNAME COURSE,非主属性为DEPT,DEPT部分依 赖于 COURSE 6 COURSE→DEPT,DEPT→ BUILDING 为第二范式,主键为 COURSE,非主属性为DEPI, BUILDING,存在非主属性的 传递依赖,不符合3NF 7指出下列关系模式是第几范式,并说明理由 1)R(A,BC,其函数依赖集为F={B→C,AC→B}; (2)R(A,BC),其函数依赖集为F-{AB→C}; (3)R(A,B,C),其函数依赖集为F={A→B,A→C} (4)R(A,B,C,D,其函数依赖集为F={A→C,AD→B}; (5)R(A,B,C),其函数依赖集为F={B→C,B→A,A→BC} 7.(1)第三范式,存在主属性的传递依赖,主属性为AC,非主属性B,AC→B →C,不满足BCNF。而满足3NF,即不存在非主属性的传递依赖。 (2)BCNF范式,主属性AB,非主属性C,不存在传递依赖和部分依赖,故为 BCNF范式 (3)BCNF范式,主属性A,非主属性BC,不存在传递依赖和部分依赖,故为 BCNF范式 (4)1NF,主属性AD,非主属性BC,存在非主属性的部分依赖A→C,则为 第一范式。 (5)BCNF范式,主键A(或B),非主属性为BC(或AC),不存在传递依 赖和部分依赖,故为BCNF范式。这里没有传递依赖,虽然A→B→C,但是 由于B→A,这就违背了传递依赖的条件BA 第2章关系数据库设计和数据库管理系统 要求掌握的基本概念和理论 1.试述数据库设计过程,及每个阶段的任务 答:各阶段的设计要点如下 (1)需求分析:准确了解与分析用户需求(包括数据与处理)。 (2)概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具 体DBMS的概念模型。 (3)逻辑结构设计:将概念结构转换为某个DBMS所支持的数据模型,并对其 进行优化。 (4)数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包 括存储结构和存取方法)。 (5)薮据库实施:设计人员运用DBMS提供的数据语言、工具及宿主语言,根 据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库, 并进行试运行。 (6)数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。 这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库 本身,还包括数据库的实施、运行和维护。设计一个完善的数据库应用系统往往 是上述六个阶段的不断反复。 2.什么是数据库的逻辑结构设计?试述其设计步骤 答:数据库的逻辑结构设计就是把概念结构设计阶段设计好的基木E一R图 转换为与选用的DBMS产品所支持的数据模型相符合的逻辑结构。设计步骤为 (1)将概念结构转换为一般的关系、网状、层次模型; (2)将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换 (3)对数据模型进行优化。 3.试述数据库物理设计的内容和步骤。 答:数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖 于给定的DBMS。为一个给定的逻辑数据模型选取一个最适合应用要求的物理 结构,就是数揣库的物理设计的主要内容。数据库的物理设计步骤通常分为两步 (Ⅰ)确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构; (2)对物理结构进行评价,评价的重点是时间效率和空间效率。 4.数据库管理系统的主要功能有哪些? (1)数据库定义 (2)数据操纵 (3)数据库控制 (4)数据库维护 5.数据库管理系统有哪儿部分组成? (1)数据和元数据存储 (2)存储管理器 (3)查询处理器 (4)事务管理器 (5)输入模块-模式修改、査询和修改 6.开发一个数据库管理系统的主要技术难点在哪里?对中国如何尽快开发自己 的数据库管理系统,给出你的建议。 1、综合统 SαL语言将数据定义语言DDL、数据操纵语言DML、数据控制语言DCL 的功能集于一体,语言风格统一,可以独立完成数据库生命周期中的全部活动. 高度非过程化 2.对用户的透明性 用SαL语言进行数据操作时,只要提岀“做什么”,而无需指明“怎么做 3、面向集合的操作方式 SQL语言操作的对象和操作的结果都用关系表小。 4、一科语法,两科使用方式 SQL语言既是自含式语言,又是嵌入式语言。 5、语言简捷,易学易用 完成核心功能只用9个动词,SQL语言接近英语句子。 6、支持三缴模式结构 数据库设计 要求:给出E-R图,将其转换为关系模型、指出转换结果中每个关系的 候选键。 第3-4章分布式数据库和面向对象数据库 要求掌握的基本概念和理论 分布式数据库的有哪些特点? 特点:1.数据是分布的2.数据是逻辑相关的3.结点自治性 2.分布式数据库管理系统有哪几部分组成? 组成:局部数据库管理系统 LDBMS 全局数据库管理系统 GDBMS 全局数据字典GDD; 网终通信管理CN 3.分布式数据库系统能够提供哪些分布透明性?不同透明性对应用程序的编程 有什么影响? 分片透明性:关系如何分片对用户是透明的,指用户不必关心数据是如何分 片的。其应用程序的编写与集中式数据库相同。 位置透明性:用户需知道数据在哪个片段,而不必知道所操作的数据放在哪 个节点。数据在结点间的转移不会影响应用程序。 局部映象透明性:该透明性提供数据到局部数据厍的映象。在编程时不但需 要了解全局关系的分片模式,还需要了解各片段存放的站点。 4.半连接在分布式查询优化中的作用?会计算简单的半连接。 在分布式数据库的查询中半连接的作用:减少传送的数据量,提高查询效率 半连接把笛卡尔乘积和其后的选择运算合并成为连接运算,以避免扫描笛卡尔乘 积的中问结果 求半连接练习 R (A B C) S(B C D)T (D E) 235 356 69 536 359 168 683 6883 38 56 346 596 89 535 416 268 584 求所有可执行的半连接(提示有公共属性才能做半连接 R∝S= (A B C) 235 168 268 S∝R= B C D 683 S∝T= (B 3546 6663 T∝S (D E 1 5.试述事务的概念及事务的4个特性。 事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是 个不可分割的工作单位 事务具有4个特性:原了性( Atomicity)、致性( consistency)、隔离性 ( Isolation)和持续性( Durability)。这4个特性也简称为ACID特性。 原子性:事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都 不做。 一致性:事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状 态 隔离性:一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的 数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。 持续性也称水久性( Permanence),指个事务一旦提交,它对数据库中数据的 改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何景 6.在数据库管理系统中为什么要采用并发控制技术?常用并发控制技术有哪 此? 答:数据库是共享资源,通常有许多个事务同时在运行。当多个事务并发地存取 数据库时就会产生同时读取和/或修改同一数据的情况。若对并发操作不加控制 就可能会存取和存储不正确的数据,破坏数据库的一致性。所以数据库管理系统 必须提供并发控制机制。 封锁技术使组事务的并发执行(即交叉执行)同步,使它等价于这些事务的某 种串行操作 时戳技术也使一组事务的交叉执行同步,但它等价于这些事务的一个特定的串行 操作,即由时戳的时序所确定的一个串行操作执行。 7.什么是两段封锁协议 两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁。 在对仁何数据进行读、写操作之前,首先要申请并获得对该数据的封锁 在释放一个封锁之后,事务不再申请和获得任何其他封锁。 “两段”的含义是,事务分为两个阶段: 第一阶段是获得封锁,也称为扩展阶段。在这阶段,事务可以申请获得任何 数捃项上的任何类型的锁,但是不能释放任何锁。 第二阶段是释敚封锁,也称为收缩阶段。在这阶段,事务释放已经荻得的锁, 但是不能再申请任何锁。 8.数据库恢复的基木技术有哪些? 数据转储和登录日志文件是数据库恢复的基本技术 当系统运行过程中发生故障,利用转储的数据库后备副本和日志文件就可以将数 据库恢复到故障前的某个一致性状态 转储:数据库管理员定期将整个数据库复制到磁带或另一个磁盘上保存 起来的过程 ②日志:保存每一次对数据库进行更新操作的有关信息的文件,由DBMS 自动建立和记录 3)检查点机制:为了便于恢复,在日志中每隔一定时间(如10分钟)写 个检査点,以标识检查点前已经执行完的事务是正确的。检查点记录包括检查 点时刻执行的所有事务的标识以及这些事务最近一个运行记录在日志中的地址。 9.什么是日志文件?为什么要设立日志文件? 日志文件是用来记录事务对数据库的更新操作的文件。 设立日志文件的目的是:进行事务故障恢复;进行系统故障恢复;协助后备 副本进行介质故障恢复。 先写日志文件,即首先把日志记录写到日志文件中,然后写数据库的修改。 10.数据库运行中可能产生的故障有哪几类? 在集中式数据库系统发生的故障,大致可以分以下几类 (1)事务内部的故障;(2)系统故障;(3)介质故障; 在分布数据库运行中,除了上面的三种故障外,还有: (1)信息丢失;(2)网络分割 11.试述实现数据库安全性控制的常川方法和技术。 答:实现数据库安全性控制的常用方法和技术有: (1)用户标识和鉴别:该方法由系统提供一定的方式让用户标识自己的名字或 身份。每次用户要求进入系统时,由系统进行核对,通过鉴定后才提供系统的使 用权。 (2)存取控制:通过川户权限定义和合法权检查确保只有合法权限的用户访问 数据库,所有未被授权的人员无法存取数据 (3)视图机制:为不同的用户定义视图,通过视图机制把要保密的数据对无权 存取的用户隐藏起来,从而自动地对数据提供一定程度的安全保护。 (4)审计:建立审计日志,把用户对数据库的所有操作自动记录下米放入审计 日志中,DBA可以利用审计跟踪的信息,重现导致数据库现有状况的一系列事 件,找出非法存取数据的人、时问和内容等 (5)数据加密:对存储和传输的数据进行加密处理,从而使得不知道解密算法 的人无法获知数据的内容。 12.给出下列名次的含义 对象、类、封装、继承、多态、对象标识、子类、超类。 对象:在面向对象程序中,一切都是对象,从一个数据元素到一个大的文件以及 个数掂结构,一个可执行程序段等都是对象。 类:具有相同特征对象的集合:对象为类中的实例。 继承:继承只有在类按层次排列时才有意义。一个类可以从另一个类中继承其特 征,包括数据和方法 封装:是·种信息隐蔽技术,它把对象的特征和行为隐蔽起来,使得一个对象 在程序中可以作为一个独立的整体使川而不川担心对象的功能受到影响。 多态:表现为同一操作允许有不同的实现细节。 对象标识:每个对象都有一个内部标识符OID,OD在整个系统中是唯一的, 一旦牛成就不能改变。 子类: 子类继承超类的属性和方法。 超类 被继承的类称为超类,也叫做父类, 13.叙述面向对象模型中“对象标识”与关系模型中的“键”的相同点和不同点。 在面向对象数据库系统中,每个对象都有一个内部标识OID,用来标识一个 对象,对象标识在整个系统中是唯一的。 相同点:都是构成数据库操作的基木单位 不同点: “对象标识”可以支持复杂数据类型,而“键”不能很好模拟复杂对象 ②“对象标识”可以支持面向对象的数据模型,“键”构成的数据类型简单, 没有定义抽象数据类型的能力 “对象标识”利用面向对象的思想,将结构与行为统一;“键”导致了 数据的结构与行为完全分离,使数据库中的信息仅能由识别他们的应用程序解释执行 ④“对象标识”可以让查询方便高效;“键”导致了查询实现复杂,连接优 化降低了存取效率 第58章新型数据库 1.叙述key/ value的数据结构。 key/ value的数据结构为:域( Domain)+数据项(Item) 域类似于“表”,但无结构;作用是容纳数据项 数据项用Key定义,所有与一个数据项相关的内容都存储到该数据项中,数 据属性全部是字符串类型。 可以将Key- value数据存储系统理解为面向数据项的系统,所有与一个数据 项相关的内容都存储带该数据项中。在同一个域中存储的数据项可以存在很大的 差异。 由于与数据项相关的内容都存储在一个单独的数据项中,因此要获取一个数 据项的相关内容无需多个表之间的Jion操作 2.Key/ Value数据模式与关系数据库的比较有哪些优点和缺点? Key/ Value的优点: 便于扩展,适于云计算的环境 与应川程序代码的兼容性更好 Key/ Value的缺点: 数据完整性约束转移不应用程序 -月前的很多Key/ Value数据存储系统之间不兼容 在云环境中,很多用户和应用使用同一个系统。为了避免一个进程使 共享环境超载,往往严格限制一个单独的查询所能够产生的全局影响。 3.在数据切分机制中,一致性哈希算法的基本原理是什么?

...展开详情
2018-11-13 上传 大小:624KB
举报 收藏
分享
国科大数据库新技术复习材料2018最新

因为数据库技术涉及内容广泛,本课程使用了比较多的参考书,不同章节使用不同参考书中相关部分,但本课程内容本身自成体系。对以前一点没有学过数据库基本知识的同学,可以从参考书4或其它相关参考书中进一步相关知识。 1.数据库云平台理论与实践 清华大学出版社 2016.1 2. 刘鹏, 云计算(第二版), 电子出版社, 2011.10 3. 何小朝,纵横大数据 ,电子出版社, 2014.5 4. 王珊 萨师煊, 数据库系统概论 高等教育出版社 2009

立即下载
国科大数据库提纲答案

第 1 章 关系数据库模型和关系运算 要求掌握的基本概念和理论 1. 与网状和层次数据库相比,关系数据库有哪些优点? (1)数据结构单一,不管实体还是实体之间的联系都用关系来表示; (2)建立在严格的数学概念基础上,具有坚实的理论基础; (3)将数据定义和数据操纵统一在一种语言中,使用方便,易学易用。 2. 试述关系模型的完整性规则 答:关系模型的完整性规则包括:实体完整性、参照完整性、用户定义的完整性 。 实体完整性规则是指若属性 A 是基本关系 R 的主属性,则属性 A 不能取空 值。 参照完整性:若属性(或属性组)F 是基本关系 R 的外键,它与基本关系 S 的 主

立即下载
国科大数据库第三次大作业

这是中国科学院大学数据库新技术第三次作业,mysql数据库截图提交文件

立即下载
国科大数据库技术第四次作业

国科大数据库技术第四次作业 包含题目和完整答案

立即下载
国科大数据库新技术作业读书报告2018最新版

云计算是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。

立即下载
国科大数据库新技术作业学籍管理系统的设计2018最新版

设计一个学籍管理小系统。系统包含以下信息: 学号、学生姓名、性别、出生日、学生所在系名、学生所在系号、课程名、课程号、课程类型(必修、选修、任选)、学分、任课教师姓名、教师编号、教师职称、教师所属系名、系号、学生所选课程号、学生所选上课教师姓名、选课成绩。

立即下载
国科大数据挖掘期末考试试题

国科大数据挖掘期末考试试题。包含两年试题。每年的试题题型重复率特别高,可以拿往年的试题练手。

立即下载
国科大数据挖掘大作业2018交通拥堵预测

据统计,我国目前百万人口以上的城市中有80%的路段和90%的路口通行能力已经接近极限,特别是北京、上海、深圳等城市,交通拥堵已成为城市问题。不但影响了人的日常生活工作,也严重制约了城市的经济发展和环境状况。所以随着交通拥堵问题的日益严重,能提前预测交通拥堵的程度是具有潜在价值的,这样司机和行人就可以通过预报尽可能地避免交通拥堵带来的不便。

立即下载
国科大数据挖掘刘莹第二次作业

1.Consider the data set shown in Table 1(min_sup = 60%, min_conf=70%). (a)Find all frequent itemsets using Apriori by treating each transaction ID as a market basket. (b)Use the results in part (a) to compute the confidence for the association rules {a, b}{c} and {c}{a, b}. Is confidence a symmetric

立即下载
国科大大数据系统与大规模数据分析18-19春季.rar

随着互联网、社交网络、云计算、物联网、移动计算、大规模科学探测与计算分析等的发展,各种新的数据密集型应用如雨后春笋般涌现。这些新的应用通常具有数据量巨大、数据获取速度更新速度快和/或数据种类丰富繁多等特点,被通称为大数据应用。近年来,产业界和学术界面向不同应用场景推出了多种类型、各具特色的大数据处理系统平台。同时,一大批数据建模与分析的方法被应用于大规模数据处理。一方面,多种大数据处理平台没有统一的标准,设计目标、功能和关键技术也多有不同,对于初学者的学习带来了很大的困难,容易“只见树木不见森林”,难以形成全面的认识。另一方面,大规模数据处理要求选择恰当的算法,适合的大数据平台,才能达到其功能

立即下载
国科大数据挖掘刘莹第一次作业

1.Suppose that a data warehouse consists of four dimensions, date, spectator, location, and game, and two measures, count and charge, where charge is the fare that a spectator pays when watching a game on a given date. Spectators may be students, adults, or seniors, with each category having its own

立即下载
国科大数据挖掘18-19秋季.rar

本课程为计算机软件学科研究生的专业普及课程。主要介绍数据挖掘技术的起源、原理、主要算法、关键技术等。课程包含的主要议题包括:数据挖掘的重要性、特点、应用领域、数据仓库、数据预处理技术、关联规则、分类、预测、聚类、顺序模式、深度学习、大数据挖掘等。

立即下载
国科大软件工程期末考试题库+答案

国科大软件工程期末考试题库+答案,国科大软件工程期末考试题库+答案,期末考试分数90+

立即下载
国科大刘莹数据挖掘第二次作业.pdf

1.Consider the data set shown in Table 1(min_sup = 60%, min_conf=70%). (a) Find all frequent itemsets using Apriori by treating each transaction ID as a market basket. (b) Use the results in part (a) to compute the confidence for the association rules {a, b}{c} and {c}{a, b}. Is confidence a symmet

立即下载
国科大最优控制

国科大最优控制,此ppt作者是中国科学院自动所老师,张亮

立即下载
国科大高级人工智能2016

国科大高级人工智能2016年期末考试卷子,欢迎下载!国科大高级人工智能2016年期末考试卷子

立即下载
国科大算法2016—2018

国科大算法卜东波老师教授的2016 2017考试题和作业题,以及2018年作业题。

立即下载
国科大开题报告Latex模板

中国科学院大学开题报告Latex模板中国科学院大学开题报告Latex模板中国科学院大学开题报告Latex模板中国科学院大学开题报告Latex模板

立即下载
国科大答辩PPT.rar

中国科学院大学答辩PPT模板,内含多种模板可供选择。中国科学院大学答辩PPT模板,内含多种模板可供选择。中国科学院大学答辩PPT模板,内含多种模板可供选择。

立即下载
国科大计算机网络总结.pdf

国科大计算机网络期末考试总结

立即下载