当前位置：首页 > RockyLinux > 正文

RockyLinux高可用故障转移实战指南（手把手教你搭建Keepalived高可用集群）

主机测评网
RockyLinux
2025-12-21
1018

在现代 IT 基础设施中，服务的连续性和稳定性至关重要。为了保障关键业务系统不因单点故障而中断，RockyLinux高可用架构成为企业首选方案之一。本文将围绕故障转移集群的核心技术，使用 Keepalived 工具，在 Rocky Linux 系统上搭建一个简单但高效的高可用环境。即使你是 Linux 新手，也能轻松跟着本教程完成部署。

什么是高可用与故障转移？

高可用（High Availability, HA）是指系统在出现硬件或软件故障时，仍能持续提供服务的能力。故障转移（Failover）是高可用的核心机制：当主服务器宕机时，备用服务器自动接管其工作，用户几乎无感知。

RockyLinux高可用故障转移实战指南（手把手教你搭建Keepalived高可用集群） RockyLinux高可用故障转移集群 Keepalived配置 Rocky Linux HA 第1张

实验环境准备

两台 Rocky Linux 9 服务器（可使用虚拟机）
IP 地址规划：
  - 主节点（node1）：192.168.1.10
  - 备节点（node2）：192.168.1.11
  - 虚拟 IP（VIP）：192.168.1.100（对外提供服务的浮动 IP）
确保两台机器网络互通，且能访问互联网

步骤一：安装 Keepalived

Keepalived 是实现 VRRP（虚拟路由冗余协议）的开源工具，广泛用于 Linux 高可用场景。在两台服务器上分别执行以下命令：

sudo dnf install -y keepalivedsudo systemctl enable --now keepalived

步骤二：配置主节点（node1）

编辑 Keepalived 配置文件 /etc/keepalived/keepalived.conf：

sudo tee /etc/keepalived/keepalived.conf << 'EOF'global_defs {    router_id node1}vrrp_instance VI_1 {    state MASTER    interface eth0    virtual_router_id 51    priority 100    advert_int 1    authentication {        auth_type PASS        auth_pass rockyha    }    virtual_ipaddress {        192.168.1.100/24    }}EOF

注意：interface eth0 请根据你实际网卡名称修改（可通过 ip a 查看）。

步骤三：配置备节点（node2）

在 node2 上创建类似的配置，但需调整角色和优先级：

sudo tee /etc/keepalived/keepalived.conf << 'EOF'global_defs {    router_id node2}vrrp_instance VI_1 {    state BACKUP    interface eth0    virtual_router_id 51    priority 90    advert_int 1    authentication {        auth_type PASS        auth_pass rockyha    }    virtual_ipaddress {        192.168.1.100/24    }}EOF

步骤四：启动并验证服务

在两台服务器上重启 Keepalived 服务：

sudo systemctl restart keepalived

查看 VIP 是否绑定到主节点：

ip addr show eth0

你应该能在 node1 的 eth0 接口下看到 192.168.1.100。此时，你可以通过该 VIP 访问你的服务（如 Web 服务、数据库等）。

测试故障转移

手动停止 node1 上的 Keepalived：

sudo systemctl stop keepalived

几秒后，在 node2 上执行 ip addr show eth0，你会发现 VIP 已自动漂移到备节点。这说明 Rocky Linux HA 故障转移机制已成功运行！

进阶建议

- 可结合 Nginx、Apache 或 MySQL 实现应用层高可用
- 使用脚本健康检查增强可靠性（通过 track_script）
- 防火墙需放行 VRRP 协议（协议号 112）或关闭 firewalld 测试
- 生产环境中建议使用专用心跳线（Heartbeat Network）提升安全性