当前位置:首页 > RockyLinux > 正文

RockyLinux高可用故障转移实战指南(手把手教你搭建Keepalived高可用集群)

在现代 IT 基础设施中,服务的连续性和稳定性至关重要。为了保障关键业务系统不因单点故障而中断,RockyLinux高可用架构成为企业首选方案之一。本文将围绕故障转移集群的核心技术,使用 Keepalived 工具,在 Rocky Linux 系统上搭建一个简单但高效的高可用环境。即使你是 Linux 新手,也能轻松跟着本教程完成部署。

什么是高可用与故障转移?

高可用(High Availability, HA)是指系统在出现硬件或软件故障时,仍能持续提供服务的能力。故障转移(Failover)是高可用的核心机制:当主服务器宕机时,备用服务器自动接管其工作,用户几乎无感知。

RockyLinux高可用故障转移实战指南(手把手教你搭建Keepalived高可用集群) RockyLinux高可用 故障转移集群 Keepalived配置 Rocky Linux HA 第1张

实验环境准备

  • 两台 Rocky Linux 9 服务器(可使用虚拟机)
  • IP 地址规划:
      - 主节点(node1):192.168.1.10
      - 备节点(node2):192.168.1.11
      - 虚拟 IP(VIP):192.168.1.100(对外提供服务的浮动 IP)
  • 确保两台机器网络互通,且能访问互联网

步骤一:安装 Keepalived

Keepalived 是实现 VRRP(虚拟路由冗余协议)的开源工具,广泛用于 Linux 高可用场景。在两台服务器上分别执行以下命令:

sudo dnf install -y keepalivedsudo systemctl enable --now keepalived

步骤二:配置主节点(node1)

编辑 Keepalived 配置文件 /etc/keepalived/keepalived.conf

sudo tee /etc/keepalived/keepalived.conf << 'EOF'global_defs {    router_id node1}vrrp_instance VI_1 {    state MASTER    interface eth0    virtual_router_id 51    priority 100    advert_int 1    authentication {        auth_type PASS        auth_pass rockyha    }    virtual_ipaddress {        192.168.1.100/24    }}EOF

注意:interface eth0 请根据你实际网卡名称修改(可通过 ip a 查看)。

步骤三:配置备节点(node2)

在 node2 上创建类似的配置,但需调整角色和优先级:

sudo tee /etc/keepalived/keepalived.conf << 'EOF'global_defs {    router_id node2}vrrp_instance VI_1 {    state BACKUP    interface eth0    virtual_router_id 51    priority 90    advert_int 1    authentication {        auth_type PASS        auth_pass rockyha    }    virtual_ipaddress {        192.168.1.100/24    }}EOF

步骤四:启动并验证服务

在两台服务器上重启 Keepalived 服务:

sudo systemctl restart keepalived

查看 VIP 是否绑定到主节点:

ip addr show eth0

你应该能在 node1 的 eth0 接口下看到 192.168.1.100。此时,你可以通过该 VIP 访问你的服务(如 Web 服务、数据库等)。

测试故障转移

手动停止 node1 上的 Keepalived:

sudo systemctl stop keepalived

几秒后,在 node2 上执行 ip addr show eth0,你会发现 VIP 已自动漂移到备节点。这说明 Rocky Linux HA 故障转移机制已成功运行!

进阶建议

- 可结合 Nginx、Apache 或 MySQL 实现应用层高可用
- 使用脚本健康检查增强可靠性(通过 track_script
- 防火墙需放行 VRRP 协议(协议号 112)或关闭 firewalld 测试
- 生产环境中建议使用专用心跳线(Heartbeat Network)提升安全性

结语

通过本教程,你已经掌握了在 Rocky Linux 上搭建基于 Keepalived 的故障转移集群的基本方法。这种架构成本低、配置简单,非常适合中小企业或测试环境。掌握 Keepalived配置 技能,将为你构建稳定可靠的 IT 系统打下坚实基础。

祝你在 RockyLinux高可用 的道路上越走越远!