分布式 DBMS - 分布式数据库


本章介绍DDBMS的概念。在分布式数据库中,存在多个数据库,这些数据库在地理上可能分布在世界各地。分布式 DBMS 以某种方式管理分布式数据库,使其对用户来说就像一个数据库。在本章的后面部分,我们将继续研究导致分布式数据库的因素、其优点和缺点。

分布式数据库是多个互连数据库的集合,这些数据库物理上分布在通过计算机网络进行通信的各个位置。

特征

  • 集合中的数据库在逻辑上是相互关联的。它们通常代表单个逻辑数据库。

  • 数据物理存储在多个站点。每个站点中的数据都可以由独立于其他站点的 DBMS 进行管理。

  • 站点中的处理器通过网络连接。它们没有任何多处理器配置。

  • 分布式数据库不是松散连接的文件系统。

  • 分布式数据库包含事务处理,但它并不等同于事务处理系统。

分布式数据库管理系统

分布式数据库管理系统 (DDBMS) 是一种集中式软件系统,它管理分布式数据库,就像所有数据库都存储在一个位置一样。

特征

  • 它用于创建、检索、更新和删除分布式数据库。

  • 它定期同步数据库并提供访问机制,从而使分布对用户变得透明。

  • 它确保在任何站点修改的数据都得到普遍更新。

  • 它用于大量用户同时处理和访问大量数据的应用领域。

  • 它是为异构数据库平台而设计的。

  • 它维护数据库的机密性和数据完整性。

鼓励 DDBMS 的因素

以下因素鼓励转向 DDBMS -

  • 组织单位的分布式性质- 当前大多数组织都细分为物理分布在全球各地的多个单位。每个单元都需要自己的本地数据集。因此,组织的整体数据库变得分布式。

  • 数据共享的需求- 多个组织单位经常需要相互通信并共享其数据和资源。这需要以同步方式使用通用数据库或复制数据库。

  • 支持 OLTP 和 OLAP - 在线事务处理 (OLTP) 和在线分析处理 (OLAP) 在可能具有公共数据的多样化系统上工作。分布式数据库系统通过提供同步数据来帮助这两种处理。

  • 数据库恢复- DDBMS 中使用的常用技术之一是跨不同站点的数据复制。如果任何站点的数据库损坏,数据复制会自动帮助数据恢复。在重建受损站点时,用户可以访问其他站点的数据。因此,数据库故障对于用户来说可能变得几乎不明显。

  • 支持多种应用软件- 大多数组织使用各种应用软件,每种软件都有其特定的数据库支持。DDBMS 提供了在不同平台之间使用相同数据的统一功能。

分布式数据库的优点

以下是分布式数据库相对于集中式数据库的优势。

模块化开发- 如果系统需要在集中式数据库系统中扩展到新地点或新单元,则需要付出大量努力并破坏现有功能。然而,在分布式数据库中,工作只需要向新站点添加新计算机和本地数据,最后将它们连接到分布式系统,而不会中断当前功能。

更可靠- 如果数据库发生故障,整个集中式数据库系统就会停止。然而,在分布式系统中,当某个组件发生故障时,系统继续运行可能会降低性能。因此DDBMS更加可靠。

更好的响应- 如果数据以有效的方式分发,则可以从本地数据本身满足用户请求,从而提供更快的响应。另一方面,在集中式系统中,所有查询都必须通过中央计算机进行处理,这增加了响应时间。

较低的通信成本- 在分布式数据库系统中,如果数据位于主要使用的本地,则可以最小化数据操作的通信成本。这在集中式系统中是不可行的。

分布式数据库的困境

以下是与分布式数据库相关的一些逆境。

  • 需要复杂且昂贵的软件- DDBMS 需要复杂且通常昂贵的软件来提供跨多个站点的数据透明度和协调。

  • 处理开销- 即使是简单的操作也可能需要大量通信和额外计算才能提供跨站点数据的一致性。

  • 数据完整性- 在多个站点更新数据的需要会带来数据完整性问题。

  • 数据分布不当的开销- 查询的响应能力在很大程度上取决于正确的数据分布。不正确的数据分发通常会导致对用户请求的响应非常缓慢。