MongoDB - 分片


分片是跨多台机器存储数据记录的过程,是 MongoDB 满足数据增长需求的方法。随着数据大小的增加,单台机器可能不足以存储数据,也无法提供可接受的读写吞吐量。分片解决了水平扩展的问题。通过分片,您可以添加更多机器来支持数据增长以及读写操作的需求。

为什么要分片?

  • 在复制中,所有写入都转到主节点

  • 延迟敏感查询仍由 master 处理

  • 单个副本集限制为 12 个节点

  • 当活动数据集很大时,内存不能足够大

  • 本地磁盘不够大

  • 垂直缩放成本太高

MongoDB 中的分片

下图显示了 MongoDB 中使用分片集群的分片。

MongoDB 分片

在下图中,有三个主要组成部分 -

  • 分片- 分片用于存储数据。它们提供高可用性和数据一致性。在生产环境中,每个分片都是一个单独的副本集。

  • 配置服务器- 配置服务器存储集群的元数据。该数据包含集群数据集到分片的映射。查询路由器使用此元数据将操作定位到特定分片。在生产环境中,分片集群正好有 3 个配置服务器。

  • 查询路由器- 查询路由器基本上是 mongo 实例,与客户端应用程序交互并直接操作适当的分片。查询路由器处理并将操作定位到分片,然后将结果返回给客户端。分片集群可以包含多个查询路由器来划分客户端请求负载。客户端向一个查询路由器发送请求。通常,分片集群有许多查询路由器。