MySQL MGR选主机制：原理、配置与优化实践

蓝天白云很快了

1. MySQL Group Replication选主机制深度解析

MySQL Group Replication（简称MGR）作为MySQL官方提供的高可用解决方案，其单主模式下的自动选主机制是保障业务连续性的关键。在实际生产环境中，我曾多次见证MGR集群在主库故障时的自动切换过程，这种看似简单的"故障转移"背后其实隐藏着一套精密的决策逻辑。

MGR的选主过程就像一场精心设计的选举，每个候选节点都需要经过多轮"政审"。与常见的简单优先级选举不同，MGR采用了分层筛选机制，确保最终当选的主库既符合数据一致性要求，又能满足管理员对集群的规划意图。这种设计在保证自动化的同时，也给予了DBA足够的控制权。

2. 选主前提：多数派存活原则

2.1 集群法定人数机制

MGR采用Paxos-like共识协议，这意味着它严格执行"多数派"原则。我曾在一个5节点集群中做过测试：当2个节点宕机时，剩余3个节点仍能正常选举；但当第3个节点宕机后，剩下的2个节点就会进入只读状态。

重要提示：部署MGR集群时，建议节点数量为奇数（3、5、7等）。这样在相同容错能力下（比如都能容忍1个节点故障），奇数节点集群的资源利用率更高。

2.2 网络分区处理

在实际运维中，网络分区是最棘手的场景之一。去年我们遇到过机房光纤被挖断的情况，导致3节点集群被分割成2+1。此时2节点一侧能继续提供服务，而1节点一侧会自动进入只读模式。这种设计虽然会导致部分节点不可用，但确保了数据一致性。

3. 选举优先级规则详解

3.1 版本兼容性检查

MySQL版本兼容性是选举的第一道门槛。在混合版本集群中：

如果存在8.0.17以下版本的节点，选举会优先考虑主版本号较低的节点。这是因为低版本节点无法作为从库复制高版本的数据格式变更。
全为8.0.17+版本时，则会在补丁版本最低的节点中继续筛选。这个设计确保了新主库能够被所有节点正常复制。

我曾协助一个客户从5.7升级到8.0，期间就利用了这特性：先加入8.0节点作为从库，等所有节点升级完成后再切换主库。

3.2 节点权重配置实战

group_replication_member_weight参数是DBA手中的重要调控工具。在配置时需要注意：

权重值范围0-100，默认50

权重设置应结合硬件配置：

sql复制-- 为高性能节点设置更高权重
SET GLOBAL group_replication_member_weight = 80;

权重修改后需要重启MGR线程生效：

sql复制STOP GROUP_REPLICATION;
START GROUP_REPLICATION;

在我们的生产环境中，通常会给配备了SSD的节点设置更高权重，而机械硬盘节点则调低权重。

3.3 数据一致性保障机制

数据最新程度是选举的核心考量。MGR通过比较last_applied_seq_no来确保新主库拥有最完整的数据。这个设计带来了一个重要启示：在跨机房部署时，网络延迟可能导致各节点数据同步进度不同，因此建议将主库部署在应用服务器所在机房。

我曾处理过一个案例：某客户的两个机房之间网络延迟达50ms，导致异地节点总是落后本地节点数百个事务。后来我们通过调整机房部署解决了这个问题。

3.4 UUID决胜机制

当所有条件都相同时，MGR会使用server_uuid的字典序作为最终裁决标准。虽然这种情况很少见，但我们可以利用这个特性：

sql复制-- 查看节点的server_uuid
SHOW GLOBAL VARIABLES LIKE 'server_uuid';

在部署新节点时，如果希望特定节点在极端情况下优先当选，可以手动配置一个字典序较小的UUID（不推荐生产环境这样做）。

4. 企业版增强特性解析

4.1 most up-to-date模式

MySQL企业版9.3.0引入的这个模式将数据最新程度提升为最高优先级。启用方式：

sql复制SET GLOBAL group_replication_primary_election_mode = 'MOST_UP_TO_DATE';

这种模式特别适合对数据一致性要求极高的金融场景。在我们参与的某银行项目中，就采用了这种配置来确保故障切换时的数据零丢失。

4.2 第三方分支优化

GreatSQL等分支对选主机制做了进一步优化。比如其GTID_FIRST模式：

sql复制SET GLOBAL group_replication_primary_election_mode = 'GTID_FIRST';

这种模式下，只要节点拥有最新的GTID集合，即使权重较低也会优先当选。我们在一些互联网客户的高并发场景中测试发现，这种模式可以减少约30%的故障切换时间。

5. 选主过程实战观察

5.1 选举日志分析

通过查看MySQL错误日志，可以观察详细的选举过程：

code复制[Note] Plugin group_replication reported: 'Members removed from the group: db1:3306'
[Note] Plugin group_replication reported: 'Primary election: db2:3306 is elected as new primary'
[Note] Plugin group_replication reported: 'Primary server changed from 'db1:3306' to 'db2:3306''

在运维过程中，我总结出一个经验：选举通常在2-5秒内完成，如果超过10秒还未完成，就需要检查网络或节点状态。

5.2 手动干预选举

虽然MGR设计为自动选举，但有时我们需要手动干预：

sql复制-- 强制指定某节点为主库（需要超级权限）
SET GLOBAL group_replication_set_as_primary = 'db2:3306';

这个命令会绕过选举流程直接指定主库，适用于特殊维护场景。但要注意，被指定的节点必须满足基本选举条件（数据相对较新、版本兼容等）。

6. 生产环境配置建议

6.1 参数优化配置

根据多年运维经验，我推荐以下参数组合：

ini复制[mysqld]
# 选举相关
group_replication_member_weight = 70  # 根据硬件调整
group_replication_flow_control_mode = "QUOTA"
group_replication_consistency = "BEFORE_ON_PRIMARY_FAILOVER"

# 网络超时设置
group_replication_communication_max_message_size = 10M
group_replication_member_expel_timeout = 30