高可用Web集群架构设计与LVS+Keepalived实战-代码聚汇网

高可用Web集群架构设计与LVS+Keepalived实战

Jonna轩姐

1. 高可用集群架构全景解析

这个方案本质上是通过多层冗余设计构建的"无单点故障"Web服务体系。我在金融行业做架构师时，曾用类似方案支撑过日均10亿级请求的支付系统。整套架构的核心思想是：任何单一节点故障时，业务流量都能在秒级自动切换。

典型部署拓扑包含五个关键层：

负载均衡层：LVS+Keepalived组成双活DR模式集群，通过VRRP协议实现VIP漂移
域名解析层：DNS轮询实现LB节点的流量分配，配合TTL调优实现故障快速收敛
应用服务层：多台Web服务器通过NFS共享静态资源，session保持使用redis集群
存储层：NFS服务采用双主复制+inotify实时同步，避免存储单点故障
监控层：Zabbix+自定义脚本实现秒级健康检查，触发Keepalived状态切换

关键设计原则：每层组件都必须有至少两个可立即接管的备用节点，且故障检测时间要小于业务容忍的中断时间阈值。

2. 基础环境准备与调优

2.1 服务器规划建议

根据实际业务压力，我推荐以下配置方案（以电商大促场景为例）：

节点类型	数量	配置示例	网络要求
LVS-DR主备节点	2	4C8G+千兆网卡x2	需VIP绑定网卡
Web应用节点	≥4	8C16G+SSD	千兆内网互通
NFS存储节点	2	16C32G+10G网卡+RAID10	万兆存储网络
DNS解析节点	2	2C4G	公网IP+Anycast支持

系统调优关键参数：

bash复制# LVS节点必须开启IP转发
echo "net.ipv4.ip_forward = 1" >> /etc/sysctl.conf

# Web节点需要调整文件描述符限制
echo "* soft nofile 65535" >> /etc/security/limits.conf

# NFS服务器优化内核参数
echo "sunrpc.tcp_max_slot_table_entries = 128" >> /etc/sysctl.conf

2.2 网络拓扑配置要点

VIP配置规范：

使用单独的网卡绑定VIP（非eth0）

ARP抑制必须开启：

bash复制echo "net.ipv4.conf.all.arp_ignore = 1" >> /etc/sysctl.conf
echo "net.ipv4.conf.all.arp_announce = 2" >> /etc/sysctl.conf

NFS网络隔离建议：
- 存储网络建议使用单独网段（如192.168.100.0/24）
- 使用Jumbo Frame提升吞吐量：
```
bash复制ifconfig eth1 mtu 9000
```

3. 核心组件部署实战

3.1 LVS-DR模式深度配置

DR模式相比NAT的优势在于：

响应流量直接由Web节点返回，避免LB成为瓶颈
支持更高的并发连接（实测单节点可处理50万+并发）

安装配置流程：

bash复制# 安装ipvsadm管理工具
yum install ipvsadm -y

# 创建虚拟服务（以HTTP为例）
ipvsadm -A -t 192.168.1.100:80 -s wrr
ipvsadm -a -t 192.168.1.100:80 -r 192.168.1.21:80 -g -w 1
ipvsadm -a -t 192.168.1.100:80 -r 192.168.1.22:80 -g -w 1

# 持久化配置
service ipvsadm save

重要细节：Web节点需要配置回环接口绑定VIP，但必须禁止该VIP响应ARP请求。

3.2 Keepalived高可用机制

Keepalived通过VRRP协议实现主备切换，关键配置项：

conf复制vrrp_instance VI_1 {
    state MASTER       # 初始状态
    interface eth1     # 监听网卡
    virtual_router_id 51
    priority 100       # 主节点优先级更高
    advert_int 1       # 心跳间隔
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.1.100/24 dev eth1 label eth1:0
    }
    track_script {
        chk_http_port  # 自定义健康检查
    }
}

健康检查脚本示例：

bash复制#!/bin/bash
curl -s --connect-timeout 3 http://localhost/health > /dev/null
if [ $? -ne 0 ]; then
    systemctl stop keepalived
fi

3.3 NFS共享存储优化方案

高性能NFS服务端配置：

conf复制# /etc/exports 配置示例
/data 192.168.1.0/24(rw,sync,no_root_squash,no_subtree_check)

# 内核参数优化
echo "nfsd 65535" > /proc/fs/nfsd/threads
echo "options sunrpc tcp_slot_table_entries=128" > /etc/modprobe.d/sunrpc.conf

客户端挂载最佳实践：

bash复制mount -t nfs -o vers=4.1,nolock,proto=tcp,rsize=131072,wsize=131072,hard,intr,timeo=150,retrans=3 192.168.1.31:/data /webroot

4. 全链路测试与故障演练

4.1 故障切换测试矩阵

故障场景	预期行为	验证方法
主LVS节点宕机	VIP在3秒内漂移到备节点	手动关闭主节点keepalived服务
Web节点服务停止	自动从LVS转发列表移除该节点	kill -9 nginx进程
NFS主存储不可用	自动切换到备用NFS服务器	umount共享目录
DNS解析超时	客户端自动尝试其他DNS服务器	修改DNS响应延迟模拟

4.2 性能压测关键指标

使用JMeter进行全链路压测时，重点关注：

LVS转发能力：TPS波动应小于5%
故障切换时间：从触发故障到流量恢复应<5秒
NFS吞吐量：通过iostat监控磁盘IO等待时间

bash复制# 实时监控命令示例
watch -n 1 "ipvsadm -ln && echo '---' && netstat -ant | awk '{print \$6}' | sort | uniq -c"

5. 生产环境维护要点

5.1 日常监控指标

LVS层：连接数波动、丢包率、CPU软中断
Web层：NFS挂载点IO延迟、PHP-FPM空闲进程数
存储层：inode使用率、网络带宽饱和度

推荐使用Prometheus+Granfana配置以下监控面板：

LVS连接数热力图
Web节点响应时间百分位图
NFS读写延迟趋势图

5.2 版本升级策略

采用蓝绿部署模式：

将半数Web节点移出LVS转发列表
滚动升级应用代码
运行AB测试验证新版本
逐步将流量切到新节点

bash复制# 动态调整LVS权重实现灰度发布
ipvsadm -E -t 192.168.1.100:80 -s wrr
ipvsadm -e -t 192.168.1.100:80 -r 192.168.1.21:80 -g -w 10  # 新版本
ipvsadm -e -t 192.168.1.100:80 -r 192.168.1.22:80 -g -w 1   # 旧版本

6. 典型问题排查指南

案例1：VIP切换后部分用户仍访问旧节点

原因：客户端DNS缓存未过期
解决：调小DNS TTL至60秒，使用HTTP 301强制跳转

案例2：NFS写入性能突然下降

检查：nfsstat -c 查看重传率
解决：优化网络MTU值，增加NFSd线程数

案例3：LVS出现SYN_RECV堆积

检查：netstat -s | grep -i listen
解决：调整内核参数 net.ipv4.tcp_max_syn_backlog = 8192

经过三年生产环境验证，这套架构的稳定性可以达到99.99%的SLA。最关键的经验是：每次变更后必须进行全链路测试，特别是要模拟网络分区等极端情况。我们曾因为交换机固件bug导致脑裂问题，后来通过引入第三方仲裁节点彻底解决了这类问题。