1
数据库原理与应用技术
1.2.6.1 1.6.1 数据库技术与其他相关技术的结合
1.6.1 数据库技术与其他相关技术的结合

数据库技术与其他相关技术的结合,是数据库技术的重要发展趋势。如数据库技术与分布处理技术相结合,产生了分布式数据库系统;数据库技术与并行处理技术相结合,产生了并行数据库系统;数据库技术与人工智能技术相结合,产生了知识库系统和主动数据库系统;数据库技术与多媒体技术相结合,产生了多媒体数据库系统;数据库技术与面向对象技术相结合,产生了面向对象数据库系统;数据库系统与模糊技术相结合,产生了模糊数据库系统等。

1. 分布式数据库系统

前面提到的数据库系统都属于集中式数据库系统,所有的工作都由一台计算机完成。这有很多优点,例如,当大型计算机配置大容量数据库时,价格比较合算,人员易于管理,能完成大型任务。数据集中管理,减少了数据冗余,应用程序和数据之间有较高的独立性。

但是,随着数据库应用的不断发展,规模的不断扩大,逐渐感觉到集中式数据库系统也有不便之处。如大型数据库系统的设计和操作都比较复杂,系统显得不灵活且安全性也较差。因此,采用将数据分散的方法,把数据库分成多个,建立在多台计算机上,这种系统称为分散式系统。在这种系统中,数据库的管理、应用程序的编写等都是相互独立的,它们之间不存在数据通信联系。

随着计算机网络通信的发展,有可能把分散在各处的数据库系统通过网络通信连接起来,这样形成的系统称为分布式数据库系统(Distributed DataBase System,DDBS)。分布式数据库系统兼有集中式和分散式的优点。这种系统由多台计算机组成,计算机之间由通信网络相互联系着。

分布式数据库系统是一个逻辑上属于同一整体,而物理上分布存放在一个计算机网络节点上的数据集合。在分布式数据库环境中,每一个节点都有自己的计算机及其设备,有自己的数据库管理系统。前面强调了它的分布性,实际上它还有一个重要的特色,即每个节点都有高度的自治性。这就是说,当不需要存取其他节点的数据时,该节点如同一个集中式数据库系统一样,因此应当把分布式系统内的关系想象为一系列独立的但相互合作的集中式系统之间的伙伴关系。

分布式数据库系统具有的特性如下。

(1) 位置透明性。

位置透明性是指用户和应用程序不必知道它所使用的数据在什么地方。用户用到的数据有可能在本地数据库中,也有可能在外地数据库中。如果用户涉及的数据在外地,那么要把数据从外地通过网络传输到本地,或者从本地传输到外地,或者多次往返传输。系统提供位置透明性后,用户就不必关心数据在本地还是在外地,即使数据的位置改变,也不必修改应用程序,否则应用程序要复杂得多。这种位置透明性简化了应用程序,大大方便了用户。这是分布式数据库系统的主要目标之一。

(2) 复制透明性。

在分布式数据库系统中,为了提高系统的性能和实用性,有些数据并不只存放在一个场地,很可能同时重复地存放在不同的场地。这样,本地数据库中也包含了外地数据库中的数据。执行应用程序时,就可在本地数据库的基础上运行,不必借助通信网络与外地数据库联系,而用户还以为在使用外地数据库中的数据。这种方法加快了应用程序的运行速度。但各场地上大量复制数据使更新操作要涉及所有复制的数据库,以保证数据的一致性,这势必增加系统的开销。然而,总的来说,复制透明性可以提高系统的查询效率。

这里存在一个问题——如何执行有复制数据的更新操作。如果由应用程序来做,一个应用中的更新操作就要涉及所有复制的数据库。如果这件事由系统去做,我们就说系统提供了复制透明性,即用户不必关心数据库在网络中各个节点的数据库复制情况,更新操作引起的异常由系统去处理。

(3) 系统的可靠性高、可用性好。

分布式数据库系统比集中式数据库系统具有更高的可靠性和更好的可用性。因为数据分布在不同的地方,并且有很多备份数据,即使在个别地方或个别通信链路上发生故障,也不会引起整个系统崩溃。

(4) 可扩展性好,易于集成现有的系统。

在一个部门建立若干数据库之后,为了充分利用数据资源,开发全局应用,就要研制分布式数据库系统。这比新建一个大型系统要简单,既省时间,又省财力、物力。另外,只要增加组成分布式数据库的场地数,就能扩充数据库。

(5) 效率高和灵活性好。

分布式数据库系统中的数据可以存储在常用地点,这样可减少响应时间,也可降低通信代价。数据可动态传送或复制,甚至可以取消。

除了上述优点外,也存在系统开销大的缺点,主要是指通信开销。另外,数据的安全性和保密性较难保证,在具有高度场地自治的分布式数据库系统中,局部数据库管理员可以认为他管辖的数据比较安全,但是还不能保证全局的数据是安全的。安全性问题是分布式数据库系统的固有问题。因为分布式数据库系统是通过网络实现分布控制的,而通信网络本身在保护数据方面存在着弱点,数据比较容易被黑客窃取,所以在此网络的安全性显得尤为重要。

2. 面向对象数据库系统

在面向对象的方法中,对象作为描述信息实体的统一概念,把数据和对数据的操作融为一体,通过方法类、继承、封装和实例化机制来实现信息含义的存储和描述。因此,对象可以自然、直观地表达复杂结构对象,并用操作封装来增强数据处理能力。

面向对象数据库的实现一般有两种方法:一种是纯粹的面向对象数据库技术,用于构建面向对象技术的数据库;另一种是在现有关系数据库的基础上增加对象管理的技术,从而构成面向对象数据库。由于面向对象数据库支持的对象标识符、类属联系、分属联系、方法等概念很难实现存储和管理,所以第一种方法实现起来成本比较高。因此,大多数人将目光转到改造和优化现有的关系数据库上,这种基于关系数据库实现的对象数据库又称为对象关系数据库。

对象关系数据库增强了关系数据库的数据管理能力,是对关系数据库的改进,同时也是对象数据库理论的一种实践应用。对象关系模型是指在关系数据模型的基础上增加了对复杂数据类型的查询规则的模型。通过复杂数据类型管理,关系数据库中元组的属性可以是复杂的数据类型。这种数据库的演变是为了扩展现有数据库系统的建模能力,而不是破坏已有的成熟的数据模型。基于对象关系模型的对象关系数据库系统为那些想在关系数据库中使用面向对象特征的用户提供了一种便利的操作途径。

对象关系数据库系统集成了关系数据库系统的优点和面向对象数据库的建模能力,具有用户根据应用需要扩展数据类型和函数的机制,支持复杂数据类型的存储和操作能力。由于对象关系数据库系统增强了面向对象的建模能力,因此具有面向对象数据库的特征和优点,是目前关系数据库系统发展的一个新方向。

3. 模糊数据库系统

模糊数据库系统是指能够处理模糊数据的数据库系统。我们一般遇到的数据库都是具有二值逻辑和精确数据的。但是,在现实中还有很多不确定的模糊不清的事情。我们的大脑也是偏向于处理一些模糊的事件,对这些模糊事件更感兴趣。当一件东西太清楚地展示在我们面前时,我们的大脑就失去了对事物进行探索的欲望。这样就可以把不完全性、不确定性、模糊性引入数据库系统中,从而形成模糊数据库。自1965年美国的L. Z. 扎德提出模糊理论以来,人们就对这个领域产生了极大的兴趣,模糊理论的应用也在不断扩大,作为流行的数据库更是受到了注意。

随着模糊数学理论体系的建立,人们可以用数量来描述模糊事件并能进行模糊运算。在数据库系统中,也可以将数学上的这种成果,如不完全性、不确定性、模糊性引入,从而形成模糊数据库。

模糊数据库的研究主要有两方面:首先是如何在数据库中存放模糊数据,其次是定义各种运算、建立模糊数据上的函数。模糊数据的表示主要有模糊区间数、模糊中心数、模糊集合数和隶属函数等。

在模糊数据库中,如果把各记录值视为节点,把关系视为节点间的连线,一个模糊数据库就可看成是一个复杂的网络。模糊数据库上的操作主要是指从某节点到网络其他节点的移动。但由于要涉及很强的指针或游标来指示当前的位置,其复杂性会大大增加,所以发展前景也不乐观。

在模糊层次数据模型中,将树中的各节点“父子关系”和“兄弟关系”的亲密程度通过隶属值来实现。然而,与模糊网络数据模型一样,其复杂性也限制了模糊层次数据库的发展。

模糊关系数据模型中,有元组模糊关系数据模型、模糊关系数据模型、集合值模糊关系数据模型和属性具有加权模糊值的模糊关系数据模型等几类。其中属性具有加权模糊值的模糊关系数据库是一种对一般关系数据库模糊化最彻底的模糊数据库,并且是一种具有广泛应用的模糊数据库。

模糊E-R数据模型,可以提供一个模糊E-R图,E-R图直观而形象地描述了模糊数据库,为数据库的设计提供了一个很友好的图形工具。但是,它并没有明确地指明在数据上可以实现的各种操作,在设计时可以在E-R图中设计和修改满意后用相应的转换工具进行转换才行。

在模糊面向对象数据库中,对象类的定义引入了递归的概念,采用面向对象的描述方法,模块化强,结构化程度高,便于分层实现,有利于实际系统的开发。但由于目前还不成熟,给开发带来了很大的困难。

对象-关系数据模型是结合关系数据模型和面向对象模型一起发展的一种模型,它具有关系数据模型的强大查询语言的功能,同时也有面向对象的特性,所以是目前建立模糊数据库的最好选择。

4. 多媒体数据库系统

一般认为,数据模型化是数据库技术的基础和核心。广义地理解,数据模型化包括了概念模型、逻辑模型和物理模型的建立。其中概念模型是数据库设计者对现实世界的抽象,逻辑模型是对概念模型的逻辑表示,而物理模型是对逻辑模型的计算机表示。要把复杂的现实世界正确地描述出来,并将其数据及关系在数据库中进行存储和管理,关键的一步是要把现实世界抽象为概念模型。多媒体数据库所依托的是多媒体数据模型,首先需要把各种媒体所建立的概念模型结合为一个有机的统一整体,使概念模型一体化,以形成一个“多媒体概念模型”,再以某种符号系统加以表示,形成多媒体数据模型的基础。

1)多媒体数据模型具有的特性

(1) 能支持媒体的独立性。这是因为多媒体数据库的目标应能实现诸如媒体的混合、媒体的扩充、媒体的互换,即应能使用户最大限度地可忽略各种媒体间的差别,而实现对复杂数据对象的管理和使用。

(2) 要支持数据模型的三个基本要素:数据的结构性质,能描述实体及实体间的联系;具有与数据库相关的语义完整性限制;体现数据的操作特性,即要通过对各种媒体的符号化、抽象化,用户可以对各种媒体数据进行统一的处理和一致性管理。对不同内部表示的数据用同样的数据库语言进行操作,并提供能用于多媒体数据库的语言接口。

2)实现多媒体数据模型的方法

(1) 基于关系数据模型的方法,即在关系数据模型中引入抽象数据类型,并对数据类型定义所必要的数据表示形式及其操作定义加以扩充。

(2) 基于语义数据模型的方法,语义数据模型能提供更自然的处理现实世界的数据及其联系能力,并在实体类型的表示及其联系上具有特点。当然还有其他的方法,如基于面向对象的建模方法等。目前对多媒体数据模型的研究还很不充分,仍然缺乏完整的、具有普遍意义的理论。

5. 演绎数据库

演绎数据库是指具有演绎推理能力的数据库。一般地,它用一个数据库管理系统和一个规则管理系统来实现。将推理用的事实数据存放在数据库中,称为外延数据库;用逻辑规则定义要导出的事实,称为内涵数据库。主要研究内容为,如何有效地计算逻辑规则推理。具体为:递归查询的优化、规则的一致性维护等。