欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    数据库规范化理论复习课件.ppt

    • 资源ID:5359833       资源大小:1.25MB        全文页数:145页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据库规范化理论复习课件.ppt

    1,数据库规范化理论复习,一、数据依赖:是一个关系内部属性与属性之间的一种约束关系,主要有:函数依赖和多值依赖、完全函数依赖、部分函数依赖、传递依赖、平凡与非平凡依赖等。二、范式:就是关系数据库中的关系所满足的不同条件的要求。1NF:在关系模式R中的每一个具体关系r中,若每一个属性值都不可再分,则称R为第一范式的关系,记为:R 1NF。2NF:若R 1NF,且每一个非主属性完全依赖于码,则R 2NF。,2,数据库规范化理论复习,3NF:若R 2NF,且每一个非主属性即不部分依赖于码也不传递依赖于码,则它属于三范式的关系,记为R 3NF。BCNF:关系模式R中,若每一个决定因素都包含码,则R BCNF。,3,数据库系统概论An Introduction to Database System第七章 数据库设计,4,7.1 数据库设计概述,数据库设计:定义:数据库设计是指对于一个给定的应用环境,设计优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。注:逻辑模式,也就是数据库的模式,是数据库全体数据的逻辑结构和特征的描述。,5,7.1.1 数据库设计的特点,三分技术,七分管理,十二分基础数据:强调了数据的收集、整理、组织和不断更新是数据库建设中的重要环节。结构(数据)设计和行为(处理)设计相结合:整个设计过程中,要把数据库结构设计和对数据的处理设计密切结合起来。,6,数据库设计的特点(续),结构和行为分离的设计,7,7.1.2 数据库设计方法,新奥尔良(New Orleans)方法:将数据库设计分为若干阶段和步骤。基于E-R模型的数据库设计方法:概念设计阶段广泛采用。3NF(第三范式)的设计方法:逻辑阶段可采用的有效方法。ODL(Object Definition Language)方法:面向对象的数据库设计方法。,8,数据库设计方法(续),计算机辅助设计:ORACLE:Designer 2000SYBASE:PowerDesigner,9,7.1.3 数据库设计的基本步骤,数据库设计分6个阶段:需求分析:概念结构设计:逻辑结构设计:物理结构设计:数据库实施:数据库运行和维护:需求分析和概念设计独立于任何数据库管理系统。逻辑设计和物理设计与选用的DBMS密切相关。,10,数据库设计的基本步骤(续),一、数据库设计的准备工作:选定参加设计的人。1.系统分析人员、数据库设计人员:自始至终参与数据库设计。2.用户和数据库管理员:主要参加需求分析和数据库的运行维护。3.应用开发人员(程序员和操作员):在系统实施阶段参与进来,负责编制程序和准备软硬件环境。,11,数据库设计的基本步骤(续),二、数据库设计的过程(六个阶段)需求分析阶段:准确了解与分析用户需求(包括数据与处理)。最困难、最耗费时间的一步。,12,数据库设计的基本步骤(续),概念结构设计阶段:整个数据库设计的关键。通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。,13,数据库设计的基本步骤(续),逻辑结构设计阶段:将概念结构转换为某个DBMS所支持的数据模型。对其进行优化。“数据模型”:它是对现实世界数据特征的抽象,它是用来描述数据、组织数据和对数据进行操作的,把具体事物转换成计算机能处理的数据,通俗地讲,它就是现实世界的模拟。,14,数据库设计的基本步骤(续),数据库物理设计阶段:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。,15,数据库设计的基本步骤(续),数据库实施阶段:运用DBMS提供的数据库语言(如SQL)及宿主语言,根据逻辑设计和物理设计的结果。建立数据库。编制与调试应用程序。组织数据入库。进行试运行。,16,数据库设计的基本步骤(续),数据库运行和维护阶段:数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行过程中必须不断地对其进行评价、调整与修改。,数据库设计各个阶段的设计描述,18,7.1.4数据库设计过程中的各级模式,数据库设计不同阶段形成的数据库各级模式,数据库的各级模式,19,第七章 数据库设计,7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库实施和维护7.7 小结,20,7.2.1 需求分析的任务,需求分析的重点:是“数据”和“处理”,获得用户对数据库要求。信息要求:处理要求:安全性与完整性要求:,21,7.2.2 需求分析的方法,调查需求:达成共识:分析表达需求:,22,7.2.3 数据字典,数据字典:是系统中各类数据描述的的集合。数据字典的内容:数据项:数据结构:数据流:数据存储:处理过程:,23,数据项,数据项是不可再分的数据单位。对数据项的描述:数据项描述 数据项名,数据项含义说明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系,数据项之间的联系,24,数据结构,数据结构反映了数据之间的组合关系。一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。对数据结构的描述 数据结构描述数据结构名,含义说明,组成:数据项或数据结构,25,数据流,数据流是数据结构在系统内传输的路径。对数据流的描述:数据流描述 数据流名,说明,数据流来源,数据流去向,组成:数据结构,平均流量,高峰期流量,26,数据存储,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。对数据存储的描述:数据存储描述数据存储名,说明,编号,输入的数据流,输出的数据流,组成:数据结构,数据量,存取频度,存取方式,27,处理过程,处理过程说明性信息的描述处理过程描述处理过程名,说明,输入:数据流,输出:数据流,处理:简要说明,28,数据字典举例,例:学生学籍管理子系统的数据字典。数据项,以“学号”为例:数据项:学号 含义说明:唯一标识每个学生别名:学生编号 类型:字符型 长度:8 取值范围:00000000至99999999取值含义:前两位表示那一届的学生,第3,4位该学生所在系,第5,6两位表示班级,第7,8位表示学生在班级的编号。,29,处理过程(续),数据结构,以“学生”为例。“学生”是该系统中的一个核心数据结构:数据结构:学生。含义说明:是学籍管理子系统的主体数据结构,定义了一个学生的有关信息。组成:学号,姓名,性别,年龄,所在系,年级。,30,处理过程(续),数据流,“体检结果”可如下描述:数据流:体检结果 说明:学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成:平均流量:高峰期流量:,31,处理过程(续),数据存储,“学生登记表”可如下描述:数据存储:学生登记表 说明:记录学生的基本情况流入数据流:流出数据流:组成:数据量:每年3000张 存取方式:随机存取,32,处理过程(续),处理过程“分配宿舍”可如下描述:处理过程:分配宿舍说明:为所有新生分配学生宿舍输入:学生,宿舍输出:宿舍安排处理:在新生报到后,为所有新生分配学生宿舍。要求同一间宿舍只能安排同一性别的学生,同一个学生只能安排在一个宿舍中。每个学生的居住面积不小于3平方米。安排新生宿舍其处理时间应不超过15分钟。,33,数据字典,数据字典是关于数据库中数据的描述,是元数据,而不是数据本身。数据字典在需求分析阶段建立,在数据库设计过程中不断修改、充实、完善。,34,7.3 概念结构设计,7.3.1 概念结构7.3.2 概念结构设计的方法与步骤7.3.3 数据抽象与局部视图设计7.3.4 视图的集成,35,7.3.1 概念结构,什么是概念结构设计:将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计。概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。概念结构设计是整个数据库设计的关键。,36,概念结构(续),37,概念结构(续),概念结构设计的特点:(1)能真实、充分地反映现实世界。(2)易于理解。(3)易于更改。(4)易于向关系、网状、层次等各种数据模型转换。,38,概念结构(续),描述概念模型的工具:E-R模型:实体-联系模型。,39,7.3.2 概念结构设计的方法与步骤,设计概念结构的四类方法:自顶向下:首先定义全局概念结构的框架,然后逐步细化,自顶向下策略,40,7.3.2 概念结构设计的方法与步骤,自底向上:首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构,自底向上策略,41,概念结构设计的方法与步骤(续),逐步扩张:首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构。,逐步扩张策略,42,概念结构设计的方法与步骤(续),混合策略:将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。,43,概念结构设计的方法与步骤(续),常用策略:自顶向下地进行需求分析。自底向上地设计概念结构。,44,概念结构设计的方法与步骤(续),自底向上设计概念结构的步骤 第1步:抽象数据并设计局部视图第2步:集成局部视图,得到全局概念结构,45,7.3.3 数据抽象与局部视图设计,数据抽象:局部视图设计:,46,数据抽象,抽象是对实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述。概念结构是对现实世界的一种抽象。,47,局部视图设计,设计分E-R图的步骤:选择局部应用逐一设计分E-R图,48,选择局部应用,在多层的数据流图中选择一个适当层次的数据流图,作为设计分E-R图的出发点。通常以中层数据流图作为设计分E-R图的依据。,49,选择局部应用(续),设计分E-R图的出发点,50,逐一设计分E-R图,任务将各局部应用涉及的数据分别从数据字典中抽取出来。参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码。确定实体之间的联系及其类型(1:1,1:n,m:n)。,51,逐一设计分E-R图(续),两条准则:(1)属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。(2)属性不能与其他实体具有联系。联系只发生在实体之间。,52,7.3 概念结构设计,7.3.1 概念结构7.3.2 概念结构设计的方法与步骤7.3.3 数据抽象与局部视图设计7.3.4 视图的集成,53,7.3.4 视图的集成,各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总E-R图。,54,视图集成的两种方式,多个分E-R图一次集成:一次集成多个分E-R图。通常用于局部视图比较简单时。,55,视图的集成(续),逐步集成:用累加的方式一次集成两个分E-R图。,56,视图的集成(续),集成局部E-R图的步骤:1.合并。2.修改与重构。,57,视图的集成(续),视图集成,58,合并分E-R图,生成初步E-R图,各分E-R图存在冲突:各个分E-R图之间必定会存在许多不一致的地方。合并分E-R图的主要工作与关键:合理消除各分E-R图的冲突。,59,合并分E-R图,生成初步E-R图(续),冲突的种类:属性冲突:属性值的类型、取值范围等。命名冲突:同名异义,异名同义。结构冲突:,60,属性冲突,两类属性冲突:属性域冲突:属性值的类型。取值范围。取值集合不同。属性取值单位冲突:,61,命名冲突,两类命名冲突:同名异义:不同意义的对象在不同的局部应用中具有相同的名字。异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字。,62,结构冲突,三类结构冲突:同一对象在不同应用中具有不同的抽象。同一实体在不同分E-R图中所包含的属性个数和属性排列次序不完全相同。实体之间的联系在不同局部视图中呈现不同的类型。,63,消除不必要的冗余,设计基本E-R图,基本任务:消除不必要的冗余,设计生成基本E-R图。,64,Stop here!,65,第七章 数据库设计,7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库的实施和维护7.7 小结,66,7.4 逻辑结构设计,逻辑结构设计的任务:把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构。逻辑结构设计的步骤:将概念结构转化为一般的关系、网状、层次模型。将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换。对数据模型进行优化。,67,逻辑结构设计(续),逻辑结构设计时的3个步骤,68,7.4 逻辑结构设计,7.4.1 E-R图向关系模型的转换7.4.2 数据模型的优化7.4.3 设计用户子模式,69,7.4.1 E-R图向关系模型的转换(重点),E-R图向关系模型的转换要解决的问题:如何将实体型和实体间的联系转换为关系模式。如何确定这些关系模式的属性和码。转换内容:将E-R图转换为关系模型:将实体、实体的属性和实体之间的联系转换为关系模式。,70,将E-R图转换为关系模型(重点),将E-R图转换为关系模型实际上就是将实体、实体的属性和实体之间的联系转化为关系模式,这种转换一般遵循如下原则:1、一个实体型转换为一个关系模式:实体的属性就是关系的属性。实体的码就是关系的码。例如:学生实体可以转换为如下关系模式,其中学号为学生关系的码。学生(学号,姓名,出生日期,所在系,年级,平均成绩),71,2、一个1:1的联系可以转换成一个独立的关系,此时,与该联系相连的各个实体的码以及联系本身的属性均转换为关系的属性,如:班长管理班级。可以将其转换为一个独立的关系模式:管理(学号,班级号)也可以与任意一端的关系模式和并,此时应加入另一个关系的码和联系本身的属性。如与班级和并应为:班级(班级号,学生人数,学号),72,3、一个 1:n 联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为n端实体的码。此时可使用独立关系:组成(学号,班级号)。另一种方法是将其与学生关系模式合并,这时学生关系的模式为:学生(学号,姓名,出生日期,所在系,年级,班级号,平均成绩)后一种方法减少系统中关系个数,一般情况下采用这种方法。,73,4、一个m:n联系转换为一个关系模式:与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。此时关系结构式为:SC(Sno,Cno,Grade),74,5、三个或三个以上实体间的一个多元联系转换为一个关系模式:与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。例如:教师、课程、所用书之间的“讲授”联系是一个三元联系,可以将它转换为如下关系模式,其中课程号、教师号、书号为关系的组合码:讲授(课程号,教师号,书号),75,6、同一实体集的实体间的联系,即自联系,也可按上述1:1,1:n,m:n三种情况分别处理。例如:如果教师实体集内部存在领导与被领导的1:n自联系,可以将该联系与教师实体合并,这时,主码职工号将多次出现,但作用不同,可用不同的属性名加以区别,比如在合并后的关系模式中,主码仍为职工号,再增设一个“系主任”属性,存放相应系主任的职工号。,76,7、为了减少系统中的关系个数,如果两个关系模式具有相同的主码,可以考虑将它们合并为一个关系模式。合并方法是将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的同义属性,并适当调整属性的次序即可。,77,Stop here!,78,7.4 逻辑结构设计,7.4.1 E-R图向关系模型的转换7.4.2 数据模型的优化7.4.3 设计用户子模式,79,7.4.2 数据模型的优化,得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模型的优化关系数据模型的优化通常以规范化理论为指导,80,数据模型的优化(续),优化数据模型的方法确定数据依赖按需求分析阶段所得到的语义,分别写出每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间数据依赖消除 冗余的联系对于各个关系模式之间的数据依赖进行极小化处理,消除 冗余的联系。确定所属范式按照数据依赖的理论对关系模式逐一进行分析考查是否存在部分函数依赖、传递函数依赖、多值依赖等确定各关系模式分别属于第几范式,81,数据模型的优化(续),按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。注意:并不是规范化程度越高的关系就越优,一般说来,第三范式就足够了,82,数据模型的优化(续),例:在关系模式 学生成绩单(学号,英语,数学,语文,平均成绩)中存在下列函数依赖:学号英语 学号数学 学号语文 学号平均成绩(英语,数学,语文)平均成绩,83,数据模型的优化(续),显然有:学号(英语,数学,语文)因此该关系模式中存在传递函数信赖,是2NF关系 虽然平均成绩可以由其他属性推算出来,但如果应用中需要经常查询学生的平均成绩,为提高效率,仍然可保留该冗余数据,对关系模式不再做进一步分解,84,数据模型的优化(续),按照需求分析阶段得到的各种应用对数据处理的要求,对关系模式进行必要的分解,以提高数据操作的效率和存储空间的利用率常用分解方法水平分解垂直分解,85,数据模型的优化(续),水平分解什么是水平分解把(基本)关系的元组分为若干子集合,定义每个子集合为一个子关系,以提高系统的效率水平分解的适用范围满足“80/20原则”的应用并发事务经常存取不相交的数据,86,数据模型的优化(续),垂直分解什么是垂直分解把关系模式R的属性分解为若干子集合,形成若干子关系模式垂直分解的适用范围取决于分解后R上的所有事务的总效率是否得到了提高,87,7.4 逻辑结构设计,7.4.1 E-R图向关系模型的转换7.4.2 数据模型的优化7.4.3 设计用户子模式,88,7.4.3 设计用户子模式,定义用户外模式时应该注重的问题 包括三个方面:(1)使用更符合用户习惯的别名(2)针对不同级别的用户定义不同的View,以 满足系统对安全性的要求。(3)简化用户对系统的使用,89,设计用户子模式(续),例 关系模式产品(产品号,产品名,规格,单价,生产车间,生产负责人,产品成本,产品合格率,质量等级),可以在产品关系上建立两个视图:为一般顾客建立视图:产品1(产品号,产品名,规格,单价)为产品销售部门建立视图:产品2(产品号,产品名,规格,单价,车间,生产负责人)顾客视图中只包含允许顾客查询的属性销售部门视图中只包含允许销售部门查询的属性生产领导部门则可以查询全部产品数据可以防止用户非法访问不允许他们查询的数据,保证系统的安全性,90,逻辑结构设计小结,任务将概念结构转化为具体的数据模型逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换对数据模型进行优化设计用户子模式,91,逻辑结构设计小结,E-R图向关系模型的转换内容E-R图向关系模型的转换原则,92,逻辑结构设计小结,优化数据模型的方法 1.确定数据依赖 2.对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。3.确定各关系模式分别属于第几范式。4.分析对于应用环境这些模式是否合适,确定是否要对它们进行合并或分解。5.对关系模式进行必要的分解或合并,93,逻辑结构设计小结,设计用户子模式 1.使用更符合用户习惯的别名 2.针对不同级别的用户定义不同的外模式,以满足系统对安全性的要求。3.简化用户对系统的使用,94,第七章 数据库设计,7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库的实施和维护7.7 小结,95,7.5 数据库的物理设计,数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据库管理系统为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计,96,数据库的物理设计(续),数据库物理设计的步骤确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构 对物理结构进行评价,评价的重点是时间和空间效率 如果评价结果满足原设计要求,则可进入到物理实施阶段,否则,就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修改数据模型,97,数据库的物理设计(续),98,7.5 数据库的物理设计,7.5.1 数据库物理设计的内容和方法7.5.2 关系模式存取方法选择7.5.3 确定数据库的存储结构7.5.4 评价物理结构,99,7.5.1 数据库物理设计的内容和方法,设计物理数据库结构的准备工作对要运行的事务进行详细分析,获得选择物理数据库设计所需参数充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构,100,数据库的物理设计的内容和方法(续),选择物理数据库设计所需参数 数据库查询事务查询的关系 查询条件所涉及的属性 连接条件所涉及的属性 查询的投影属性,101,数据库的物理设计的内容和方法(续),选择物理数据库设计所需参数(续)数据更新事务被更新的关系每个关系上的更新操作条件所涉及的属性 修改操作要改变的属性值 每个事务在各关系上运行的频率和性能要求,102,数据库的物理设计的内容和方法(续),关系数据库物理设计的内容为关系模式选择存取方法(建立存取路径)设计关系、索引等数据库文件的物理存储结构,103,7.5 数据库的物理设计,7.5.1 数据库物理设计的内容和方法7.5.2 关系模式存取方法选择7.5.3 确定数据库的存储结构7.5.4 评价物理结构,104,7.5.2 关系模式存取方法选择,数据库系统是多用户共享的系统,对同一个关系要建立多条存取路径才能满足多用户的多种应用要求物理设计的任务之一就是要确定选择哪些存取方法,即建立哪些存取路径,105,关系模式存取方法选择(续),DBMS常用存取方法索引方法目前主要是B+树索引方法经典存取方法,使用最普遍 聚簇(Cluster)方法HASH方法,106,一、索引存取方法的选择,根据应用要求确定 对哪些属性列建立索引 对哪些属性列建立组合索引 对哪些索引要设计为唯一索引,107,索引存取方法的选择(续),选择索引存取方法的一般规则如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索引)如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引如果一个(或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引关系上定义的索引数过多会带来较多的额外开销 维护索引的开销 查找索引的开销,108,二、聚簇存取方法的选择,聚簇为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇,109,聚簇存取方法的选择(续),聚簇的用途1.大大提高按聚簇码进行查询的效率 例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数,110,聚簇存取方法的选择(续),2.节省存储空间聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了,111,聚簇存取方法的选择(续),聚簇的局限性1.聚簇只能提高某些特定应用的性能2.建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动,112,聚簇存取方法的选择(续),聚簇的适用范围1.既适用于单个关系独立聚簇,也适用于多个关系组合聚簇例:假设用户经常要按系别查询学生成绩单,这一查询涉及学生关系和选修关系的连接操作,即需要按学号连接这两个关系,为提高连接操作的效率,可以把具有相同学号值的学生元组和选修元组在物理上聚簇在一起。这就相当于把多个关系按“预连接”的形式存放,从而大大提高连接操作的效率。,113,聚簇存取方法的选择(续),2.当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇码无关的其他访问很少或者是次要的时,可以使用聚簇。尤其当SQL语句中包含有与聚簇码有关的ORDER BY,GROUP BY,UNION,DISTINCT等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作,114,聚簇存取方法的选择(续),设计候选聚簇对经常在一起进行连接操作的关系可以建立聚簇如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效果不明显,115,聚簇存取方法的选择(续),优化聚簇设计从聚簇中删除经常进行全表扫描的关系;从聚簇中删除更新操作远多于连接操作的关系;不同的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇 从这多个聚簇方案(包括不建立聚簇)中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小,116,三、HASH存取方法的选择,选择HASH存取方法的规则当一个关系满足下列两个条件时,可以选择HASH存取方法该关系的属性主要出现在等值连接条件中或主要出现在相等比较选择条件中该关系的大小可预知,而且不变;或 该关系的大小动态改变,但所选用的DBMS提供了动态HASH存取方法,117,7.5 数据库的物理设计,7.5.1 数据库物理设计的内容和方法7.5.2 关系模式存取方法选择7.5.3 确定数据库的存储结构7.5.4 评价物理结构,118,7.5.3 确定数据库的存储结构,确定数据库物理结构的内容1.确定数据的存放位置和存储结构 关系 索引 聚簇 日志 备份2.确定系统配置,119,1.确定数据的存放位置,确定数据存放位置和存储结构的因素存取时间存储空间利用率维护代价 这三个方面常常是相互矛盾的 例:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增加 必须进行权衡,选择一个折中方案,120,确定数据的存放位置(续),基本原则根据应用情况将易变部分与稳定部分分开存放存取频率较高部分与存取频率较低部分,分开存放,121,确定数据的存放位置(续),例:数据库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上如果计算机有多个磁盘或磁盘阵列,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并行工作,可以提高物理I/O读写的效率,122,确定数据的存放位置(续),例(续):可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能,123,2.确定系统配置,DBMS产品一般都提供了一些存储分配参数 同时使用数据库的用户数 同时打开的数据库对象数 内存分配参数 使用的缓冲区长度、个数 存储分配参数.,124,7.5 数据库的物理设计,7.5.1 数据库物理设计的内容和方法7.5.2 关系模式存取方法选择7.5.3 确定数据库的存储结构7.5.4 评价物理结构,125,7.5.4 评价物理结构,评价内容对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构,126,评价物理结构(续),评价方法(完全依赖于所选用的DBMS)定量估算各种方案 存储空间 存取时间 维护代价对估算结果进行权衡、比较,选择出一个较优的合理的物理结构如果该结构不符合用户需求,则需要修改设计,127,第七章 数据库设计,7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库的实施和维护7.7 小结,128,7.6数据库实施和维护,7.6.1 数据的载入和应用程序的调试7.6.2 数据库的试运行 7.6.3 数据库的运行和维护,129,7.6.1 数据的载入和应用程序的调试,数据的载入 应用程序的编码和调试,130,数据的载入,数据库结构建立好后,就可以向数据库中装载数据了。组织数据入库是数据库实施阶段最主要的工作。数据装载方法人工方法计算机辅助数据入库,131,应用程序的编码和调试,数据库应用程序的设计应该与数据设计并行进行在组织数据入库的同时还要调试应用程序,132,7.6数据库实施和维护,7.6.1 数据的载入和应用程序的调试7.6.2 数据库的试运行 7.6.3 数据库的运行和维护,133,7.6.2 数据库的试运行,在原有系统的数据有一小部分已输入数据库后,就可以开始对数据库系统进行联合调试,称为数据库的试运行 数据库试运行主要工作包括:1)功能测试实际运行数据库应用程序,执行对数据库的各种操作,测试应用程序的功能是否满足设计要求 如果不满足,对应用程序部分则要修改、调整,直到达到设计要求2)性能测试测量系统的性能指标,分析是否达到设计目标如果测试的结果与设计目标不符,则要返回物理设计阶段,重新调整物理结构,修改系统参数,某些情况下甚至要返回逻辑设计阶段,修改逻辑结构,134,数据库的试运行(续),强调两点:分期分批组织数据入库 重新设计物理结构甚至逻辑结构,会导致数据重新入库。由于数据入库工作量实在太大,费时、费力,所以应分期分批地组织数据入库先输入小批量数据供调试用待试运行基本合格后再大批量输入数据逐步增加数据量,逐步完成运行评价,135,数据库的试运行(续),数据库的转储和恢复在数据库试运行阶段,系统还不稳定,硬、软件故障随时都可能发生系统的操作人员对新系统还不熟悉,误操作也不可避免因此必须做好数据库的转储和恢复工作,尽量减少对数据库的破坏。,136,7.6数据库实施和维护,7.6.1 数据的载入和应用程序的调试7.6.2 数据库的试运行 7.6.3 数据库的运行和维护,137,7.6.3 数据库的运行与维护,数据库试运行合格后,数据库即可投入正式运行。数据库投入运行标志着开发任务的基本完成和维护工作的开始对数据库设计进行评价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和提高。应用环境在不断变化数据库运行过程中物理存储会不断变化,138,数据库的运行与维护(续),在数据库运行阶段,对数据库经常性的维护工作主要是由DBA完成的,包括:数据库的转储和恢复数据库的安全性、完整性控制数据库性能的监督、分析和改进数据库的重组织和重构造,139,数据库的运行与维护(续),数据库的重组织和重构造重组织的形式全部重组织部分重组织只对频繁增、删的表进行重组织重组织的目标提高系统性能,140,数据库的运行与维护(续),重组织的工作按原设计要求重新安排存储位置回收垃圾减少指针链数据库的重组织不会改变原设计的数据逻辑结构和物理结构,141,数据库运行与维护(续),数据库重构造根据新环境调整数据库的模式和内模式增加新的数据项改变数据项的类型改变数据库的容量增加或删除索引修改完整性约束条件,142,第七章 数据库设计,7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库的实施和维护7.7 小结,143,7.7 小结,数据库的设计过程需求分析概念结构设计逻辑结构设计物理设计实施和维护,144,小结(续),数据库各级模式的形成数据库的各级模式是在设计过程中逐步形成的需求分析阶段综合各个用户的应用需求(现实世界的需求)概念设计阶段形成独立于机器特点、独立于各个DBMS产品的概念模式(信息世界模型),用E-R图来描述,145,小结(续),在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型如关系模型,形成数据库逻辑模式。然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图(VIEW)形成数据的外模式在物理设计阶段根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式,

    注意事项

    本文(数据库规范化理论复习课件.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开