12 / 17

MongoDB 分片集群配置

当我们的应用程序日渐成熟，数据量和访问量不断增长时，单台 MongoDB 服务器往往会遇到性能瓶颈。这时候，MongoDB 的分片（Sharding）技术就成为了解决大规模数据存储和处理的关键方案。在前面的学习中，我们已经了解了在单机环境下搭建基础集群的方法，而在实际的生产环境中，我们需要构建更加稳定和可扩展的分片集群架构。

因此我们这节课将深入探讨如何在真实的分布式环境中配置 MongoDB 分片集群，我们将学会如何协调配置服务器、分片节点和路由进程之间的工作关系，掌握集群扩容的策略，以及理解数据在分布式环境中的存储和分发机制。

分片集群配置

分片时机的判断

是否启用分片架构，是MongoDB大规模应用架构设计中的一个核心决策。合理的分片时机，需要基于对系统性能瓶颈的识别与评估，既要避免过早复杂化系统，也要防止因扩展滞后而影响业务连续性。

避免过早分片的风险

在数据规模及访问压力未达阈值之前过早实施分片，通常弊大于利。分片集群相较单一副本集在架构、运维、监控及故障处理等多个维度上复杂度大幅提升。更重要的是，分片键（Shard Key）一旦选定，后续更改成本极高，极易造成长期的架构锁定。因此，只有在系统规模和并发需求已到达单机极限时，分片才有其实际价值。例如，若某电商平台用户量规模仍处于早期阶段即启用分片，除增加运维难度外，还可能因数据规模过小，无法发挥分片的可扩展性优势，使系统维护成本远高于预期效益。

分片应在系统资源出现如下典型瓶颈时优先考虑：

内存瓶颈：当业务工作集（Working Set）持续超过服务器可用内存，频繁的磁盘I/O导致数据库响应性能显著下降，通过分片将数据水平拆分至多台服务器，可有效扩展总体内存资源。
存储容量瓶颈：随着业务数据持续增长，单台服务器磁盘容量无法承载全部数据，即便通过硬件升级进行纵向扩展也会受限于成本及物理极限，此时分片能够实现横向扩容。
计算与连接数瓶颈：服务器CPU长期处于高负载，或并发连接数超出承载能力，分片有助于并行分担请求压力。
吞吐瓶颈：应用的读写操作量已超过单实例mongod的处理上限，在高并发场景（如实时数据分析、社交网络等）分片成为必要架构手段。

分片决策必须依赖详细的性能监控数据，而非主观判断。需要建立完善的监控体系，持续量化评估内存占用、磁盘空间、CPU负载与网络吞吐等核心指标，并依据数据动态调整架构，确保扩展措施及时且精准落地。

监控驱动下的分片决策

在高可用生产环境下，系统常因单一资源瓶颈导致性能受限，而非所有资源同步耗尽。因此，应通过持续监控识别关键瓶颈，并据此制定专门的扩容与分片策略。例如，图片社交应用主要受磁盘容量约束，需优先考虑存储扩展及数据分片；而即时通信系统则因高并发连接对内存、网络等资源消耗巨大，应重点监控连接数、内存及带宽。

分片集群的核心组件

要构建一个完整的 MongoDB 分片集群，我们需要协调三个关键组件的工作：配置服务器（Config Servers）、分片节点（Shards）和路由进程（mongos）。这三个组件各司其职，共同构成了一个高可用、可扩展的分布式数据库系统。

配置服务器负责存储集群的元数据信息，包括哪些副本集充当分片、哪些集合被分片、每个数据块位于哪个分片上等关键信息。分片节点则是实际存储数据的地方，通常由副本集组成以确保高可用性。而 mongos 进程则充当客户端和分片之间的路由器，负责将查询请求定向到正确的分片上。

配置服务器

配置服务器可以说是整个分片集群的「大脑」，它们保存着集群运行所需的所有关键元数据。这些元数据包括集群拓扑信息、分片映射关系、数据块的分布情况等。正因为承担着如此重要的职责，配置服务器的设计和部署就显得尤为关键。

从 MongoDB 3.2 版本开始，配置服务器必须组成副本集的形式运行，这取代了早期版本中使用的同步机制。这种改进不仅提高了配置服务器的可用性，还简化了数据一致性的管理。在生产环境中，我们建议配置服务器副本集至少包含三个成员，并且最好将它们部署在不同的物理机器上，甚至考虑地理分布以提高容错能力。

配置服务器的启动流程

让我们通过一个实际的例子来了解如何启动配置服务器。假设我们有三台专门用于配置服务器的机器，IP 地址分别为 192.168.1.10、192.168.1.11 和 192.168.1.12。

首先，我们需要在每台机器上启动 mongod 进程，并指定相应的参数：

|
# 在第一台配置服务器上执行
$ mongod --configsvr --replSet configRS --bind_ip localhost,192.168.1.10 --dbpath /var/lib/mongodb
 
# 在第二台配置服务器上执行  
$ mongod --configsvr --replSet configRS --bind_ip localhost,192.168.1.11 --dbpath /var/lib/mongodb
 
# 在第三台配置服务器上执行
$ mongod --configsvr --replSet configRS --bind_ip localhost,192.168.1.12 --dbpath /var/lib/mongodb

|
rs.initiate({
  _id: "configRS",
  configsvr: true,
  members: [
    { _id: 0, host: "192.168.1.10:27019" },
    { _id: 1, host: "192.168.1.11:27019" },
    { _id: 2, host: "192.168.1.12:27019" }
  ]
})

|
# 重启第一个从节点
$ mongod --replSet "rs0" --shardsvr --port 27017 --bind_ip localhost,192.168.2.11
 
# 重启第二个从节点  
$ mongod --replSet "rs0" --shardsvr --port 27017 --bind_ip localhost,192.168.2.12

|
# 在每台新服务器上启动 mongod
$ mongod --replSet "rs1" --shardsvr --port 27017 --bind_ip localhost,192.168.3.10
$ mongod --replSet "rs1" --shardsvr --port 27017 --bind_ip localhost,192.168.3.11  
$ mongod --replSet "rs1" --shardsvr --port 27017 --bind_ip localhost,192.168.3.12

启用数据库级别的分片

在对具体的集合进行分片之前，我们首先需要在数据库级别启用分片功能。假设我们有一个音乐应用，主要数据存储在 music 数据库中，我们可以这样启用分片：

|
db.enableSharding("music")

这个命令告诉 MongoDB，music 数据库中的集合可以被分片。需要注意的是，启用数据库分片是对集合分片的前提条件，但这本身并不会对数据的存储方式产生任何影响。

集合分片的实施

在数据库级别启用分片后，我们就可以对具体的集合进行分片了。假设 music 数据库中有一个 artists 集合，我们希望根据艺术家名称进行分片：

|
sh.shardCollection("music.artists", {

数据块	范围	包含的用户年龄
初始块	minKey ≤ age < maxKey	所有年龄的用户

数据块	范围	包含的用户年龄
块1	minKey ≤ age < 25	0-24岁的用户
块2	25 ≤ age < maxKey	25岁及以上的用户

数据块	范围	包含的用户年龄
块1a	minKey ≤ age < 12	0-11岁的用户
块1b	12 ≤ age < 25	12-24岁的用户
块2	25 ≤ age < maxKey	25岁及以上的用户

|
// 数据块 A
{
  min: { username: $minKey, age: $minKey },
  max: { username: "user107487", age: 73 }
}
 
// 数据块 B  
{
  min: { username: "user107487", age: 73 },
  max: { username: "user114978", age: 119

|
{ username: "alice", message: "你好" }
{ username: "alice", message: "今天天气不错" }
{ username: "alice", message: "准备出门了" }
// 可以在这里分割
{ username: "bob", message: "工作中..." }
{ username: "bob",

|
// 创建支持中文排序的索引，但分片键部分使用simple排序
db.comments.createIndex(
  { userId: 1, content: 1 },
  { 
    collation: { locale: "zh", strength: 1 },
    partialFilterExpression: { content: { $exists: true } }
  }
)
 
// 分片键索引使用simple排序
db.comments.createIndex({ userId: 1 }, { collation: { locale: "simple" } })

分片键索引的自动处理

如果 artists 集合已经存在并且包含数据，MongoDB 会检查是否存在以 name 字段为前缀的索引。如果不存在，分片操作会失败，并提示我们需要创建相应的索引：

|
db.artists.createIndex({"name": 1})

创建索引后再次执行分片命令即可成功。值得注意的是，如果集合尚不存在，MongoDB 会自动创建分片键索引，这为我们省去了手动创建的步骤。

MongoDB 分片集群配置 | 自在学

MongoDB 分片集群配置

分片时机的判断

避免过早分片的风险

监控驱动下的分片决策

分片集群的核心组件

配置服务器

配置服务器的启动流程

数据一致性保障机制

配置服务器资源规划

mongos 路由进程

mongos 的启动和配置

mongos 部署最佳实践

预检查与状态确认

配置分片服务器参数

将副本集注册为分片

应用程序连接方式的迁移

集群容量扩展

添加全新的分片节点

整合现有副本集的策略

数据分片的配置流程

分片集群数据组织原理

Chunk（数据块）

动态 Chunk 分裂机制

Chunk 边界的无重叠性

分片键类型约束

数据块与物理存储的区别

数据块范围与分割策略

数据块范围的定义规则

复合分片键的范围管理

数据块分割的触发条件

配置服务器可用性的关键影响

自动平衡与高级特性

自动平衡器

数据迁移的高可用与一致性保障

多语言排序规则下的分片一致性设计

实时变更流

小结