10 / 17

MongoDB 复制集管理 | 自在学

MongoDB 复制集管理

在MongoDB集群管理实践中，复制集管理是保障数据安全性与高可用性的核心环节。其内容涵盖成员节点的生命周期管理、复制集配置的优化调整、操作日志(Oplog)的维护以及数据一致性等运维和管理任务。高效的复制集管理能够有效降低故障风险，提升集群的稳定性与业务的连续性。

专业的复制集管理侧重于定期监控各成员节点的运行状态，提前发现潜在问题，并根据业务需求灵活调整配置。例如，通过分析节点健康状况与同步延迟，实现对节点的有序维护，优化主从切换过程，确保读写服务的持续可用。

MongoDB 复制集管理

独立模式

在复杂的维护场景下，如特定节点需要进行数据修复或特殊操作，常规的从节点通常不接受写入，而在主节点操作又可能影响线上业务。此时，采用独立模式（standalone mode）是一种标准的专业处理方式。

独立模式的基本原理是：将复制集中的某个成员节点暂时脱离复制集环境，单独以独立服务器角色运行。这样可隔离业务影响，便于管理员对数据进行排查、修复、导入导出等敏感操作，并保障生产复制集的整体稳定性和安全性。

进入独立模式的步骤

当我们需要对某个成员进行维护时，首先要查看它的启动参数。我们可以通过命令行查看当前的配置：

|
> db.serverCmdLineOpts()
{
  "argv" : [ "mongod", "-f", "/var/lib/mongod.conf" ],
  "parsed" : {
    "replSet": "myProductionSet",
    "port": "27017",
    "dbpath": "/var/lib/mongodb"
  },
  "ok" : 1
}

在这个例子中，我们可以看到服务器当前配置了复制集名称“myProductionSet”，端口是27017，数据目录是/var/lib/mongodb。要进入独立模式，我们需要做三个关键调整：移除复制集配置、更换端口、保持数据目录不变。首先，我们需要关闭当前的服务器：

|
> db.shutdownServer()

然后在操作系统层面重新启动MongoDB，但这次不包含复制集配置：

|
$ mongod --port 30000 --dbpath /var/lib/mongodb

注意我们将端口改为30000，这样复制集中的其他成员就无法找到这个节点，会认为它已经下线。这样的操作可以同时保持数据目录不变，这样我们就可以访问和修改这个节点的数据。

现在这个MongoDB实例就以独立服务器的身份运行在30000端口上。复制集中的其他成员会尝试连接原来的27017端口，发现连接失败后就会将这个成员标记为不可用状态。

维护完成后的恢复

当维护工作完成后，我们需要将这个成员重新加入复制集。这个过程相对简单：关闭独立模式的服务器，然后使用原来的配置重新启动。这个过程是自动的，我们不需要手动干预。

|
$ mongod --replSet myProductionSet --port 27017 --dbpath /var/lib/mongodb

重新启动后，这个成员会自动与复制集中的其他成员同步，复制在它“离线”期间错过的所有操作。

独立模式为我们提供了一个安全的维护环境，无论是重建索引、修复数据还是进行其他需要大量资源的操作，都可以在不影响生产环境的情况下完成。这种灵活性使得MongoDB复制集在企业级应用中能够保持高可用性，即使在维护期间也不会中断服务。

复制集配置

复制集的配置信息是整个集群正常运行的核心。每个复制集成员的身份、角色、及其职责均以配置文档的形式存储在local.system.replset集合里，确保所有节点均拥有一致的配置视图。配置文档对于复制集来说至关重要。为保障复制集的一致性与数据安全，严禁通过update等普通数据库操作直接修改此配置文档。MongoDB 官方推荐使用rs系列辅助函数以及replSetReconfig命令对配置进行变更；这些工具能确保成员间的数据状态与操作的原子性。

初始化复制集

首次部署复制集时，需要预先启动多个MongoDB实例作为集群节点。随后，需指定详细的复制集配置，通过集中式配置使多个节点成为统一的复制集。以下为一个三节点电商系统复制集的初始化配置示例，这跟我们上一堂课学过的内容几乎没什么差别：

|
> var config = {
    "_id" : "ecommerceReplSet",
    "members" : [
        {"_id" : 0, "host" : "db-primary.company.com:27017"},
        {"_id" : 1, "host" : "db-secondary1.company.com:27017"},
        {"_id" : 2, "host" : "db-secondary2.company.com:27017"}
    ]
}
> rs.initiate(config)

这个配置定义了一个名为"ecommerceReplSet"的复制集，包含三个成员。每个成员都有一个唯一的_id和对应的主机地址。

创建复制集时一定要提供完整的配置对象。如果不提供，MongoDB会尝试自动生成一个单成员的复制集配置，但可能不会使用我们期望的主机名或正确的配置参数。

值得注意的是，我们只需要在一个成员上执行rs.initiate()命令。这个成员会成为临时的“组织者”，负责将配置信息传播给其他成员，让整个团队都知道新的组织结构。

复制集成员的动态调整

在企业级MongoDB运维过程中，复制集成员结构调整是一项常见且关键的维护操作。此类调整既包括根据业务扩展需求添加新节点，也涉及因硬件更替或节点故障而移除现有成员。MongoDB为此提供了完善且灵活的成员管理机制，以确保集群高可用性与一致性。

新成员的添加

当需要向复制集引入新成员时，应综合考虑同步策略。若待添加节点的数据目录为空，MongoDB会自动执行完整的数据初始同步，将全部必要数据从现有任一节点复制到新成员，提高数据一致性与可靠性。若该节点已恢复了某成员的最新备份，则可以加速数据同步过程，减少恢复时间与IO压力。标准的成员添加操作如下：

|
> rs.add("db-secondary3.company.com:27017")

有时候我们需要添加具有特殊配置的成员，比如一个只用于备份的隐藏节点：

|
> rs.add({
    "host" : "backup-server.company.com:27017",
    "priority" : 0,
    "hidden" : true
})

这个配置创建了一个优先级为0（永远不会成为主节点）且隐藏的成员，应用程序无法直接读取这个节点，它专门用于数据备份。

移除成员

移除成员同样简单，我们通过指定主机地址来移除。

|
> rs.remove("old-server.company.com:27017")

大规模集群的特殊考虑

当复制集规模增大时，我们需要考虑一些特殊的限制和约束。MongoDB将复制集限制为最多50个成员，其中只有7个可以参与投票。这个限制的设计初衷是减少网络通信开销，因为成员之间需要定期进行心跳检测，同时也能限制选举过程的时间。当我们添加第8个及以后的成员时，必须将它们的投票权设置为0：

|
> rs.add({
    "_id" : 7,
    "host" : "data-warehouse.company.com:27017",
    "votes" : 0
})

这些非投票成员仍然可以同步数据，也可以处理读请求，但不能参与主节点选举过程。

配置变更的限制与策略

MongoDB对配置变更设置了一些重要的限制，这些限制确保了复制集的稳定性和一致性。我们无法更改成员的_id，也不能将当前连接的主节点设置为优先级0，更不能在仲裁者和普通成员之间进行转换。

然而，有一个重要的例外是主机地址的修改。如果我们最初配置时使用了不合适的IP地址（比如使用了公网IP而不是内网IP），我们可以通过重新配置来修正：

|
> var config = rs.config()
> config.members[0].host = "internal-db-primary:27017"
> rs.reconfig(config)

这种灵活性为我们在网络架构调整时提供了必要的支持。

应急情况下的强制重新配置

在某些极端情况下，比如数据中心故障导致大部分节点不可用时，我们可能需要在没有主节点的情况下重新配置复制集。这时候强制重新配置就派上了用场。

|
> rs.reconfig(config, {"force" : true})

强制重新配置必须在从节点上执行，并且配置必须是有效的。“force”选项并不能让我们提交无效的配置，它只是允许从节点接受配置变更请求。

强制重新配置会大幅增加复制集的版本号，可能跳跃数万甚至数十万。这是为了防止网络分区两侧同时进行配置变更时产生版本冲突。

成员状态管理

在MongoDB复制集中，每个成员都具有特定的状态，用以反映其在集群中的角色与职责。运维过程中，管理员常常需要根据实际的维护需求或业务压力，手动调整成员状态，以保障复制集的高可用性与数据一致性。

主节点的优雅切换

如需对主节点进行维护，可通过控制主节点主动卸任，将其角色切换为从节点。

|
> rs.stepDown()

这个命令会让主节点在60秒内保持从节点状态。如果在这段时间内没有新的主节点被选出，它可以重新参与选举。我们也可以指定更长的退位时间。

|
> rs.stepDown(600)  // 退位10分钟

防止意外选举

在对主节点进行维护时，若需严格控制主节点的选举权、避免其他成员在维护期间自动被选为主节点，可对指定节点执行“冻结”操作：

|
> rs.freeze(10000)  // 冻结约2.8小时

维护完成后，我们可以解除冻结：

|
> rs.freeze(0)

这种机制确保了在维护期间复制集结构的稳定性。

这些状态管理功能为我们提供了精细的控制能力，让复制集维护变得更加安全和可预测。无论是计划内的维护还是应急响应，我们都有相应的工具来确保服务的连续性。

性能优化与维护

操作日志

操作日志（oplog）是MongoDB复制集的数据变更追踪机制，决定了在发生故障或节点恢复时可进行数据追赶与同步的最大时长窗口。企业级生产环境中建议oplog能够覆盖至少数日甚至一周的操作，以确保在非工作时间（如周末、假期）发生异常时，具备充足的恢复缓冲，不至于因oplog过短导致节点需要全量同步（initial sync）。

在现代MongoDB版本中，WiredTiger存储引擎允许运维团队无需重启即可动态调整oplog大小，这大幅提升了复制集的可维护性。实际操作中，务必遵循“先从节点后主节点”的调整顺序，避免主节点在未扩大oplog的情况下发生角色切换，确保整个复制集在任何时刻均有充足的oplog容量，防止数据延迟或成员落后。

首先，我们可以通过以下方式查询当前oplog的容量。

|
> use local
> db.oplog.rs.stats(1024*1024).maxSize
1024

这表明当前oplog大小为1GB。如果我们发现这个大小不足以支撑预期的维护窗口，就需要进行调整。调整oplog大小的过程相对简单，但需要在每个成员上分别执行：

|
> db.adminCommand({replSetResizeOplog: 1, size: 8192})
{
  "ok" : 1
}

这个命令将oplog调整为8GB。需要注意的是，size参数的单位是MB，所以8192表示8GB。

如果缩小了oplog大小，可能需要运行compact命令来回收磁盘空间。但是，不建议在主节点运行时执行compact操作，应该等到它变成从节点时再进行。

实际上，减小oplog大小很少是一个好主意。虽然oplog可能占用几个月的磁盘空间，但它通常不会消耗宝贵的RAM或CPU资源，而且磁盘空间相对便宜。维持一个较大的oplog为我们提供了更大的运维安全边界。

索引构建

索引构建是复制集维护中最具挑战性的任务之一。当我们在主节点上创建索引时，这个操作会被复制到所有从节点，可能导致整个集群同时进行资源密集型的索引构建操作。如果所有从节点同时开始构建索引，可能会让整个应用服务陷入停顿。为了避免这种情况，我们可以采用“滚动索引构建”的策略，即一次只在一个节点上构建索引：

第一阶段是处理所有从节点。对于每个从节点，我们按照以下步骤进行：

|
# 1. 关闭从节点
> db.shutdownServer()
 
# 2. 以独立模式重启
$ mongod --port 30000 --dbpath /data/db
 
# 3. 连接到独立模式的节点并构建索引
$ mongo --port 30000
> use myDatabase
> db.users.createIndex({email: 1}, {background: false})
 
# 4. 索引构建完成后，关闭独立模式
> db.shutdownServer()
 
# 5. 恢复复制集模式
$ mongod --replSet myReplSet --port 27017 --dbpath /data/db

重复这个过程处理每个从节点。当所有从节点都完成索引构建后，我们面临两个选择来处理主节点。

第一个选择是直接在主节点上构建索引。如果有相对空闲的时间段，这可能是最简单的方法。我们可以临时调整读偏好，将更多读操作转移到从节点上：

|
> db.users.createIndex({email: 1})

由于从节点已经有了这个索引，当这个索引构建操作复制到从节点时，它们会发现索引已经存在，直接跳过这个操作。

第二个选择是让主节点主动退位，然后按照处理从节点的方式处理它：

|
# 让主节点退位
> rs.stepDown(3600)  // 退位1小时
 
# 等待新主节点选出后，将旧主节点按从节点方式处理

这种方法需要一次故障切换，但在索引构建期间我们仍然有一个正常工作的主节点。

在构建唯一索引时，必须确保主节点不会插入重复数据。如果主节点在从节点构建唯一索引期间插入了重复数据，会导致从节点的复制失败并自动关闭。这种情况下，需要以独立模式重启从节点，删除唯一索引，然后重新加入复制集。

差异化索引

有时候我们可能希望在某些从节点上构建不同的索引，比如用于离线分析的专用从节点。这种配置是允许的，但需要确保这样的节点永远不会成为主节点：

|
> rs.add({
    "host" : "analytics-server:27017",
    "priority" : 0,
    "hidden" : true,
    "buildIndexes" : false
})

这个配置创建了一个专门用于分析的从节点，它不会参与主节点选举，对应用程序不可见，并且可以有自己独特的索引策略。

预算有限的复制

在资源受限的环境中，我们仍然可以通过巧妙的配置来获得复制集的好处。核心思想是创建一个高性能的主节点配合一个或多个资源受限的从节点，专门用于灾难恢复。假设我们有一台高配置的生产服务器和一台配置较低的备份服务器，我们可以这样配置复制集：

|
> var config = {
    "_id" : "budgetReplSet",
    "members" : [
        {
            "_id" : 0,
            "host" : "production-server:27017",
            "priority" : 1
        },
        {
            "_id" : 1,
            "host" : "backup-server:27017",
            "priority" : 0,
            "hidden" : true,
            "buildIndexes" : false

参数	含义及作用
`"priority": 0`	确保备份服务器永远不会成为主节点，所有的应用流量都由高性能的生产服务器处理。
`"hidden": true`	使得应用程序无法发现这个从节点，所有读操作都会被路由到主节点，避免性能较弱的备份服务器影响业务。
`"buildIndexes": false`	可选优化，大幅减少备份服务器的CPU和存储压力。如果从备份恢复，需要手动重建索引，但通常这是可以接受的权衡。
`"votes": 0`	在仅有两台服务器时非常关键。若备份服务器有投票权且宕机，主节点会因票数不足自动降级。设置为0，即使备份离线，主节点仍能正常提供服务。

如果我们有第三台服务器（比如应用服务器），更好的做法是在第三台服务器上运行一个仲裁者：

|
> rs.addArb("app-server:27017")

仲裁者不存储数据，只参与选举过程，资源消耗极低。这样我们就有了一个真正的多数投票系统，提高了整体的可用性。

这种配置为我们提供了数据安全保障和基本的高可用性，而无需投资两台高性能服务器。在预算充足后，我们可以逐步升级备份服务器的硬件配置，或者添加更多的从节点来提高读取性能和可用性。通过合理的复制集管理，我们不仅能够确保数据的安全性和高可用性，还能够在各种约束条件下找到最适合的解决方案。

本部分我们学习了一些基础的复制集管理知识，包括独立模式、复制集配置、成员状态管理、性能优化与维护等。但是，复制集管理是一个复杂的主题，需要根据实际情况灵活应用。在实际操作中，可能需要根据业务需求和实际情况，灵活应用这些知识，确保复制集的高可用性和数据一致性。