DBS的核心是DBMS,DBMS的核心是DB,DB的核心是数据模型
计算机系统层次结构:硬件、操作系统、数据库管理系统、应用开发工具、应用系统 数据库发展阶段:人工管理阶段、文件系统阶段、数据库系统阶段。从文件系统到数据库系统标着着数据管理技术的飞跃。 数据库系统特点: 数据结构化(数据库系统和文件系统的本质区别) 数据共享性高、冗余度低且易扩充(数据共享可以大大减少数据冗余,节约存储空间,避免数据之间的不相容性和不一致性) 数据独立性高 物理独立性:指用户的应用程序与数据库中数据的物理储存时相互独立的。 逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。 数据的独立性是由数据管理系统提供的二级映像功能来保证的。 数据由数据库管理系统统一管理和控制 数据的安全性保护:是指保护数据以防止不合法使用造成的数据泄密和破坏 数据的完整性检查是指数据的正确性、有效性和相容性 并发控制:当多个用户的并发进程同时存取、修改数据库时,可能会发生相互干扰而得到错误的结果或使得数据库的完整性遭到破坏,因此对对用户的并发操作加以控制和协调 数据库恢复:数据库系统必须具有将数据库从错误状态恢复到某一已知的正确状态的功能。综上所述:
数据库是长期存储在计算机内有组织、大量、可共享的数据集合他可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后进行数据库恢复。
1.2 数据模型
数据模型是对现实世界的抽象模拟,是数据库系统的核心和基础。
第一类:概念模型(信息模型)1.2.1 基本概念
实体(entity):客观存在并可相互区别的事物 属性(attribute):实体所具有的某一特性 码(key):唯一标识实体的属性集 域:属性的取值范围 实体型(entity type):用实体名及其属性名集合来抽象和刻画同类实体。例如学生(学号,姓名,性别,出生年月日,所在院系,入学时间)就是一个实体型 实体集(entity set):同一类型实体的集合。例如,全体学生就是一个实体集 联系(relationship):实体之间的联系通常是指不同实体集之间的联系,实体之间的联系有一对一、一对多和多对多等多种类型概念模型的表示方法:实体-联系方法,该方法用E-R图来描述现实世界的概念模型,E-R方法也称E-R模型。
数据模型的组成要素:数据结构、数据操作和数据的完整性约束条件 数据结构:数据库的组成对象以及对象之间的联系,数据结构是对所描述的对象类型的集合,是对系统静态文件的描述。 数据操纵:对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关操作规则,主要有查询、更新(插入、删除、修改),数据操作是对系统动态特性的描述。 数据的完整性约束条件:一组完整性规则,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,及保证数据的正确、有效和相容。 第二类:逻辑模型和概念模型逻辑模型:层次模型、网状模型、关系模型、面向对象数据模型和对象关系数据模型、半结构化数据模型等(相当于数据结构的逻辑结构)
物理模型:是对数据最底层的抽象(相当于数据结构的存储结构)
1.2.2 层次模型(类似于树结构)
根节点有且只有一个节点没有双亲结点 根以外的其他节点有且只有一个双亲结点基本特点:任何一个给定的记录值只能按其层次路径查看,没有一个子女记录值能够脱离双亲记录值而独立存在。
1.2.3 网状模型
允许一个以上的结点无双亲 可以有多对多1.2.4 关系模型
关系数据库系统采用关系模型作为数据的组织方式
实体完整性和参照完整性是关系数据库的两个不变性
基本概念:
关系(ralation):一个关系对应通常说的一张表 元组(tuple):表中的一行即为一个元组 属性(attribute):表中的一列即为一个属性,给每一个属性起一个名称即为属性名 码(key):表中的某个属性组,它可以唯一确定一个元组 域(domain):域是一组具有相同数据类型的值的集合。即某个属性的取值范围 分量:元组中的一个属性值 关系模式:对关系的描述,一般表示为 关系名(属性1,属性2,···,属性n)关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是不允许表中还有表。
关系的完整性约束条件:实体完整性、参照完整性、用户定义的完整性
关系模型中的数据操作是集合操作,操作对象和操作结果都是关系,关系模型把存取路径向用户屏蔽起来,用户只要指出“干什么”或“找什么”,不必详细说明“怎么干”或“怎么找”。(DBMS详细说明怎么干)
关系模型的优缺点:
优点:
关系模型和格式化模型不同,它是建立在严格的数学概念的基础上的。 关系模型的概念单一 关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员和数据开发建立的工作。缺点:
由于存取路径对用户隐蔽,查询效率往往不如格式化数据模型 为了提高性能,DBMS必须对用户的查询请求进行优化。 1.3 数据库系统的结构 1.3.1数据库系统模式的概念数据模型中有“型”(模式)和“值”(实例),型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。
模式是相对稳定的,而实例是相对变动的。
1.3.2数据库系统的三级模式结构1.模式(schema)(中间层)(一个数据库只有一个模式)
模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图
定义数据的逻辑结构 定义数据之间的联系 定义与数据有关的安全性和完整性要求2.外模式(external schema)(一个数据库有多个外模式)
外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
3.内模式(internal schema)
内模式也称存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
1.3.3 数据库的二级映像功能与数据独立性1、外模式/模式映像(逻辑独立性)
模式描述的全局逻辑结构,外模式描述的数据的局部逻辑结构。
当模式发生改变时,由DBA对外模式/模式映像作出相应的修改,保持外模式不变。因为应用程序是根据外模式编写的,从而保证应用程序不必修改。进而保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
2、模式/内模式映像(物理独立性)
当存储结构发生改变时,由DBA对模式/内模式映像作出相应的修改,保持模式不变,从而保证了应用程序不必修改。进而保证了数据与程序的物理独立性,简称数据的物理独立性。
数据和程序之间的独立性是的数据的定义和描述可以从应用程序中分离出去,由于数据的存取有数据库管理系统管理,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
1.4 数据库系统的组成 硬件平台及数据库 软件 人员 数据库管理员 决定数据库的信息内容和结构 决定数据库的存储结构和存取策略 定义数据库的安全性约束和完整性检查条件 监控数据库的使用与运行 对数据库进行改进、重组、重构 系统分析员和数据库设计人员 应用程序员 用户 偶然用户 简单用户 复杂用户 小结:本章简要介绍了概念模型、组成数据模型的三个要素、和三种主要的数据库模型--层次模型、网状模型、关系模型
还介绍了数据库管理系统内部的系统结构,数据库系统三级模式和两层映像的系统结构保证了数据库系统能够具有较高的逻辑独立性和物理独立性。
最后介绍了数据系统的组成
1 .试述数据、数据库、数据库系统、数据库管理系统的概念。
( l )数据( Data ) :描述事物的符号记录称为数据。 ( 2 )数据库( DataBase ,简称 DB ) :数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。 ( 3 )数据库系统( DataBas 。 Sytem ,简称 DBS ) :数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。 ( 4 )数据库管理系统( DataBase Management sytem ,简称 DBMs ) :数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。 DBMS 的主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。解析 DBMS 是一个大型的复杂的软件系统,是计算机中的基础软件。2 .使用数据库系统有什么好处?
使用数据库系统的好处是由数据库管理系统的特点或优点决定的。使用数据库系统的好处很多, 可以大大提高应用开发的效率,方便用户的使用,减轻数据库系统管理人员维护的负担,等等。 使用数据库系统可以大大提高应用开发的效率。因为在数据库系统中应用程序不必考虑数据的定义、存储和数据存取的具体路径,这些工作都由 DBMS 来完成。(用一个通俗的比喻,使用了 DBMS 就如有了一个好参谋、好助手,许多具体的技术工作都由这个助手来完成。开发人员就可以专注于应用逻辑的设计,而不必为数据管理的许许多多复杂的细节操心。) 还有,当应用逻辑改变,数据的逻辑结构也需要改变时,由于数据库系统提供了数据与程序之间的独立性,数据逻辑结构的改变是 DBA 的责任,开发人员不必修改应用程序,或者只需要修改很少的应用程序,从而既简化了应用程序的编制,又大大减少了应用程序的维护和修改。 使用数据库系统可以减轻数据库系统管理人员维护系统的负担。因为 DBMS 在数据库建立、运用和维护时对数据库进行统一的管理和控制,包括数据的完整性、安全性、多用户并发控制、故障恢复等,都由 DBMS 执行。 总之,使用数据库系统的优点是很多的,既便于数据的集中管理,控制数据冗余,提高数据的利用率和一致性,又有利于应用程序的开发和维护。3 .试述文件系统与数据库系统的区别和联系。
文件系统与数据库系统的区别是:文件系统面向某一应用程序,共享性差,冗余度大,数据独立性差,记录内有结构,整体无结构,由应用程序自己控制。数据库系统面向现实世界,共享性高,冗余度小,具有较高的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据的安全性、完整性、并发控制和恢复能力。
文件系统与数据库系统的联系是:文件系统与数据库系统都是计算机系统中管理数据的软件。解析文件系统是操作系统的重要组成部分;而 DBMS 是独立于操作系统的软件。但是 DBMS 是在操作系统的基础上实现的;数据库中数据的组织和存储是通过操作系统中的文件系统来实现的。
4 .举出适合用文件系统而不是数据库系统的例子;再举出适合用数据库系统的应用例子。答 :
( l )适用于文件系统而不是数据库系统的应用例子:数据的备份、软件或应用程序使用过程中的临时数据存储一般使用文件比较合适。早期功能比较简单、比较固定的应用系统也适合用文件系统。 ( 2 )适用于数据库系统而非文件系统的应用例子目前,几乎所有企业或部门的信息系统都以数据库系统为基础,都使用数据库。例如,一个工厂的管理信息系统(其中会包括许多子系统,如库存管理系统、物资采购系统、作业调度系统、设备管理系统、人事管理系统等),学校的学生管理系统,人事管理系统,图书馆的图书管理系统,等等,都适合用数据库系统。5 .试述数据库系统的特点。
( l )数据结构化数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
( 2 )数据的共享性高,冗余度低,易扩充。
( 3 )数据独立性高数据独立性包括数据的物理独立性和数据的逻辑独立性。数据库管理系统的模式结构和二级映像功能保证了数据库中的数据具有很高的物理独立性和逻辑独立性。
( 4 )数据由 DBMS 统一管理和控制。 DBMS 必须提供统一的数据控制功能,包括数据的安全性保护、数据的完整性检查、并发控制和数据库恢复。
DBMS 数据控制功能包括四个方面:
数据的安全性保护:保护数据以防止不合法的使用造成的数据的泄密和破坏; 数据的完整性检查:将数据控制在有效的范围内,或保证数据之间满足一定的关系; 并发控制:对多用户的并发操作加以控制和协调,保证并发操作的正确性; 数据库恢复:当计算机系统发生硬件故障、软件故障,或者由于操作员的失误以及故意的破坏影响数据库中数据的正确性,甚至造成数据库部分或全部数据的丢失时,能将数据库从错误状态恢复到某一已知的正确状态(亦称为完整状态或一致状态)。数据库是长期存储在计算机内有组织的大量的共享的数据集合,它可以供各种用户共享,具有最小冗余度和较高的数据独立性。 DBMS 在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对系统进行恢复。数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。
6 .数据库管理系统的主要功能有哪些?
( l )数据库定义功能; ( 2 )数据存取功能; ( 3 )数据库运行管理; ( 4 )数据库的建立和维护功能。7 .试述数据模型的概念、数据模型的作用和数据模型的三个要素。
数据模型是数据库中用来对现实世界进行抽象的工具,是数据库 中用于提供信息表示和操作手段的形式构架。一般地讲,数据模型是严格定义的概念的集合。这些概念精确描述了系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据操作和完整性约束三部分组成。
( l )数据结构:是所研究的对象类型的集合,是对系统静态特性的描述。 ( 2 )数据操作:是指对数据库中各种对象(型)的实例(值)允许进行的操作的集合,包括操作及有关的操作规则,是对系统动态特性的描述。 ( 3 )数据的约束条件:是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。解析数据模型是数据库系统中最重要的概念之一8 .试述概念模型的作用。
概念模型实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。
9 .定义并解释概念模型中以下术语:实体,实体型,实体集,属性,码,实体联系图( E 一 R 图)
实体:客观存在并可以相互区分的事物叫实体。 实体型:具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。 实体集:同型实体的集合称为实体集。 属性:实体所具有的某一特性,一个实体可由若干个属性来刻画。 码:惟一标识实体的属性集称为码。 实体联系图( E 一 R 图):提供了表示实体型、属性和联系的方法: · 实体型:用矩形表示,矩形框内写明实体名; · 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来; · 联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型( 1 : 1 , 1 : n 或 m : n )。10、试述层次模型的概念,举出三个层次模型的实例。
( l )教员学生层次数据库模型
( 2 )行政机构层次数据库模型
( 3 )行政区域层次数据库模型
11 .试述网状模型的概念,举出三个网状模型的实例。
满足下面两个条件的基本层次联系集合为网状模型。
( l )允许一个以上的结点无双亲; ( 2 )一个结点可以有多于一个的双亲。
实例 1 :
实例 2 :
实例 3 :
12 .试述网状、层次数据库的优缺点。
层次模型的优点主要有:
( l )模型简单,对具有一对多层次关系的部门描述非常自然、直观,容易理解,这是层次数据库的突出优点; ( 2 )用层次模型的应用系统性能好,特别是对于那些实体间联系是固定的且预先定义好的应用,采用层次模型来实现,其性能优于关系模型; ( 3 )层次数据模型提供了良好的完整性支持。层次模型的缺点主要有:
( l )现实世界中很多联系是非层次性的,如多对多联系、一个结点具有多个双亲等,层次模型不能自然地表示这类联系,只能通过引入冗余数据或引入虚拟结点来解决; ( 2 )对插入和删除操作的限制比较多; ( 3 )查询子女结点必须通过双亲结点。网状数据模型的优点主要有:
( l )能够更为直接地描述现实世界,如一个结点可以有多个双亲; ( 2 )具有良好的性能,存取效率较高。网状数据模型的缺点主要有:
( l )结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握; ( 2 )其 DDL 、 DML 语言复杂,用户不容易使用。由于记录之间联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径。因此,用户必须了解系统结构的细节,加重了编写应用程序的负担。13.试述关系模型的概念,定义并解释以下术语: ( l )关系( 2 )属性( 3 )域( 4 )元组 ( 5 )主码( 6 )分量( 7 )关系模式
关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
( l )关系:一个关系对应通常说的一张表; ( 2 )属性:表中的一列即为一个属性; ( 3 )域:属性的取值范围; ( 4 )元组:表中的一行即为一个元组; ( 5 )主码:表中的某个属性组,它可以惟一确定一个元组; ( 6 )分量:元组中的一个属性值; ( 7 )关系模式:对关系的描述,一般表示为关系名(属性 1 ,属性 2 , … ,属性 n )14 .试述关系数据库的特点。
关系数据模型具有下列优点:
( l )关系模型与非关系模型不同,它是建立在严格的数学概念的基础上的。 ( 2 )关系模型的概念单一,无论实体还是实体之间的联系都用关系表示,操作的对象和操作的结果都是关系,所以其数据结构简单、清晰,用户易懂易用。 ( 3 )关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。当然,关系数据模型也有缺点,其中最主要的缺点是,由于存取路径对用户透明,查询效率往往不如非关系数据模型。因此为了提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。15 .试述数据库系统三级模式结构,这种结构的优点是什么?
数据库系统的三级模式结构由外模式、模式和内模式组成。 外模式,亦称子模式或用户模式,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。 模式,亦称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式描述的是数据的全局逻辑结构。外模式涉及的是数据的局部逻辑结构,通常是模式的子集。 内模式,亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。 数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给 DBMs 管理,使用户能逻辑抽象地处理数据,而不必关心数据在计算机中的表示和存储。 为了能够在内部实现这三个抽象层次的联系和转换,数据库系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。16 .定义并解释以下术语:模式、外模式、内模式、 DDL 、 DML 模式,
模式亦称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式描述的是数据的全局逻辑结构。 外模式涉及的是数据的局部逻辑结构,通常是模式的子集。 内模式,亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。 DDL :数据定义语言,用来定义数据库模式、外模式、内模式的语言。 DML :数据操纵语言,用来对数据库中的数据进行查询、插入、删除和修改的语句。17 .什么叫数据与程序的物理独立性?什么叫数据与程序的逻辑独立性?为什么数据库系统具有数据与程序的独立性?
数据与程序的逻辑独立性:当模式改变时(例如增加新的关系、新的属性、改变属性的数据类型等),由数据库管理员对各个外模式/模式的映像做相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。 数据与程序的物理独立性:当数据库的存储结构改变了,由数据库管理员对模式/内模式映像做相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性,简称数据的物理独立性。 数据库管理系统在三级模式之间提供的两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。18 .试述数据库系统的组成。
数据库系统一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。
19 . DBA 的职责是什么?
负责全面地管理和控制数据库系统。具体职责包括:
① 决定数据库的信息内容和结构; ② 决定数据库的存储结构和存取策略; ③ 定义数据的安全性要求和完整性约束条件; ④ 监督和控制数据库的使用和运行; ⑤ 改进和重组数据库系统。20 .系统分析员、数据库设计人员、应用程序员的职责是什么?答
系统分析员负责应用系统的需求分析和规范说明, 系统分析员要和用户及 DBA 相结合,确定系统的硬件、软件配置,并参与数据库系统的概要设计。 数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。数据库设计人员必须参加用户需求调查和系统分析,然后进行数据库设计。在很多情况下,数据库设计人员就由数据库管理员担任。应用程序员负责设计和编写应用系统的程序模块,并进行调试和安装。