集群维护模式
集群维护模式是 GreptimeDB 中的一个安全特性,用于临时禁止集群的自动调度操作。
该模式在以下情况下特别有用:
- 集群部署
- 集群升级
- 计划停机
- 任何可能暂时影响集群稳定性的操作
何时使用维护模式
使用 GreptimeDB Operator
如果你使用 GreptimeDB Operator 升级集群,你不需要手动启用维护模式。Operator 会自动处理。
不使用 GreptimeDB Operator
当不使用 GreptimeDB Operator 升级集群时,在以下情况下必须手动启用 Metasrv 的维护模式:
- 部署新集群(在 metasrv 节点就绪后启用维护模式)
- Datanode 节点滚动升级
- Metasrv 节点升级
- Frontend 节点升级
- 任何可能暂时影响节点可用性的操作
在集群部署/升级完成后,你可以停用维护模式。
维护模式的影响
当维护模式启用时:
- Region Balancer(如果启用)将暂停
- Region Failover(如果启用)将暂停
- 手动操作/迁移 Region 仍然可行
- 集群读、写服务正常工作
- 监控和指标收集继续运行
管理维护模式
维护模式可以通过 Metasrv 的 HTTP 接口启用和禁用:http://{METASRV}:{HTTP_PORT}/admin/maintenance/enable
和 http://{METASRV}:{HTTP_PORT}/admin/maintenance/disable
。请注意,此接口监听 Metasrv 的 HTTP_PORT
,默认为 4000
。