一、前言随着传统数据库技术的成熟,计算机网络技术的飞速发展和应用范围的扩大,数据库应用已经普遍建立在计算机网络上。这时候,集中式数据库系统的缺点就显现出来了:数据已经根据实际需要分散存储在网络上,集中处理势必造成较大的通信开销;如果出现故障,整个系统都会受到影响,可靠性不高;集中处理造成的系统规模和配置不够灵活,系统的可扩展性差。在这种情况下,集中式DB的“集中计算”概念发展为“分布式计算”的概念。分布式计算主要体现在客户端/服务器模式和分布式数据库架构两个方面。2.分布式数据库系统概述随着传统数据库技术的成熟,计算机网络技术的飞速发展和应用范围的扩大,分布式数据库系统的研究和开发引起了人们的关注。分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域形成了一个分支。分布式数据库的研究始于20世纪70年代中期。世界上第一个分布式数据库系统SDD-1于1979年由美国计算机公司(CCA)在一台DEC计算机上实现。1990年代以来,分布式数据库系统进入商业应用阶段,传统的关系数据库产品开始出现。发展为以计算机网络和多任务操作系统为中心的分布式数据库产品。模式开发。3.DDBS(分布式数据库系统)的分类(1)同构、同构的DDBS:所有站点都使用相同类型的数据模型(例如,它们都是关系型的),是同一类型的DBMS。(2)同构异构DDBS:各个站点采用相同类型的数据模型,但DBMS的模型不同,如DB2、ORACLE、SYBASE、SQLServer等。(3)异构DDBS:模型甚至类型每个站点的数据模型是不同的。随着计算机网络技术的发展,异构机联网问题得到了较好的解决。此时,依靠异构DDBS可以访问全网各种异构本地数据库中的数据。四、DDBS的特点和优缺点DDBS的基本特点:(1)物理分布:数据不是存储在一个站点,而是存储在计算机网络中的多个站点。(2)逻辑完整性:数据在物理上分布在各个站点,但在逻辑上是集成的,为所有用户(全局用户)共享,由一个DDBMS统一管理。(3)站点自治:各站点的数据由本地DBMS管理,具有自主处理能力,完成站点的应用(localapplication)。(4)场馆间的协作:各场馆虽然具有高度的自主性,但相互协作,形成一个整体。DDBS的其他特点(1)数据独立性(2)集中自治控制机制(3)适当增加数据冗余(4)分布式事务管理DDBS的优点(1)灵活的架构(2)适应分布式管控机制(3)优越的经济性能(4)系统可靠性高,可用性好(5)本地应用响应速度快(5)扩展性好,易于与现有系统集成DDBS的缺点(1)系统开销比较大,主要是花在了沟通部分。(2)复杂的访问结构(如辅助索引、文件链接技术)是集中式DBS有效访问数据的重要技术,但在分布式系统中不一定有效。(3)数据安全保密难处理。5.数据分片的类型:(1)水平分片:将全局关系的所有元组按照一定的条件分成若干个不相交的子集,每个子??集是关系的一段。(2)垂直分片:将一个全局关系的属性集划分为若干个子集,并对这些子集进行投影操作。每个投影称为垂直分片。(3)Derivedsharding:也称为derivedhorizo??ntalsharding,即水平分片的条件不是这个关系属性的条件,而是其他关系属性的条件。(4)Hybridsharding:以上三种方法的混合。你可以水平分片然后垂直分片,或者垂直分片然后水平分片,或者其他形式,但是它们的结果是不同的。条件:(1)完整性条件:全局关系中的所有数据必须映射到分片,属于全局关系的数据决不允许属于它的任何分片。(2)可重构条件:必须保证全局关系可以从同一个全局关系的每个片段中重构出来。对于水平分片,可以使用union操作来重构全局关系;对于垂直分片,可以使用连接操作来重构全局关系。(3)不相交条件:要求一个全局关系划分后得到的各个数据段之间不重叠(垂直分片的主键除外)。6.数据分布方式(1)集中式:所有数据分片都安排在同一个站点。(2)切分:所有数据只有一份,分成若干个逻辑段,每个逻辑段分配给一个特定的站点。(4)全复制:数据在每个站点重复存储。也就是说,每个站点都有一份完整的数据副本。(5)Hybrid:这是一种介于split和fullreplication之间的分布方式。7.架构数据分片和数据分布概念的分离形成了“数据分布无关”的概念。数据冗余的明确控制。分布模式下各站点数据分布情况一目了然,便于系统管理。本地DBMS独立性。此功能也称为“本地地图透明度”。这个特性允许我们研究与DDB管理相关的问题,而无需考虑本地DBMS特定的数据模型。8.分布式数据库管理系统接受用户请求并决定发送到哪里,或者必须访问哪些计算机才能满足要求。访问网络数据字典,了解如何请求和使用其中的信息。如果目标数据存储在系统中的多台计算机上,则需要分布式处理。通讯接口功能。用户、本地DBMS和其他计算机的DBMS之间的协调。在异构分布式处理环境中,还需要提供对数据和进程迁移的支持。这里的异构类型是指各个站点的硬件和软件之间的差异。九。总结(1)“分布式计算”的概念突破了集中式DBS的框架。数据分布使系统走上了分布式DB的道路,功能分布使系统走上了C/S的道路。这是DBS的两个发展。(2)C/S系统包括计算机网络,通常通过局域网连接。在几乎所有情况下,客户端计算机都是微型计算机;服务器有时是小型机或大型机,但大多数情况下也使用微型机或高端微型机。应用程序在客户端处理,DBMS和OS的数据管理分布在服务器端。(3)C/S结构经历了从两层、三层到多层的演变过程。总的趋势是让客户端电脑越来越“瘦”,变成浏览器;服务器的种类越来越多,实现系统组装也很容易。(4)C/S系统拉近了应用与用户的距离,为用户提供更好的性能和更复杂的界面。(5)分布式系统是在集中式系统的基础上发展起来的。DDB是数据库技术与网络技术相结合的产物。随着计算机网络技术的飞速发展,DDBS逐渐成为数据库领域的主流方向。(6)DDB具有数据分布和逻辑完整性的特点。DDBS可以支持涉及多个站点的全局应用程序。DDB数据存储有两种策略:数据分片和数据分配。(7)DDB的模式结构为理解DDBS提供了一个通用的概念结构。分发透明是DDBS追求的目标。DDBMS是一个负责管理分布式环境中逻辑集成数据的访问、一致性、有效性和完整性的软件系统。(8)DDBS中的数据分布在各个地方,系统的首要性能目标是最小化网络中传输信息的次数和传输的数据量。分布式查询中基于半连接的优化策略是一种常用的技术。(9)对于并发控制和恢复,在DDBMS环境中会出现大量在集中式DBMS环境中遇到不了的问题。分布式并发控制包括主站点方法和主副本方法,辅以备份站点技术。
