当前位置:首页 > RockyLinux > 正文

RockyLinux集群测试验证指南(手把手教你搭建与验证高可用集群)

在现代企业IT架构中,RockyLinux集群测试是保障服务高可用性的关键步骤。本文将面向初学者,详细讲解如何在RockyLinux系统上搭建一个基础的高可用集群,并完成完整的RockyLinux高可用验证流程。即使你从未接触过集群技术,也能轻松上手!

一、准备工作

在开始之前,请确保你有以下资源:

  • 两台安装了 RockyLinux 8 或 9 的虚拟机或物理服务器
  • 每台机器至少拥有两个网络接口(一个用于业务通信,一个用于集群心跳)
  • root 权限或具有 sudo 权限的用户
  • 两台机器之间网络互通,且能解析对方主机名(可通过 /etc/hosts 配置)
RockyLinux集群测试验证指南(手把手教你搭建与验证高可用集群) RockyLinux集群测试 RockyLinux高可用验证 集群部署教程 Linux集群故障转移 第1张

二、安装高可用集群组件

RockyLinux 使用 Pacemaker + Corosync 作为默认的高可用集群解决方案。我们首先在两台服务器上安装所需软件包:

# 在 node1 和 node2 上分别执行sudo dnf install -y pacemaker pcs corosync fence-agents-all resource-agents# 启动并启用 pcsd 服务(用于 Web 管理界面和配置同步)sudo systemctl enable --now pcsd# 设置 hacluster 用户密码(两台机器必须相同)echo "your_password" | sudo passwd --stdin hacluster

三、初始化集群

接下来,我们在其中一台节点(如 node1)上初始化集群配置:

# 认证节点(输入 hacluster 密码)sudo pcs cluster auth node1 node2 -u hacluster -p your_password# 创建名为 mycluster 的集群sudo pcs cluster setup mycluster node1 node2# 启动集群服务sudo pcs cluster start --all# 设置集群开机自启sudo pcs cluster enable --all

四、禁用 STONITH 与仲裁(仅用于测试环境)

在生产环境中,STONITH(Shoot The Other Node In The Head)和仲裁机制非常重要。但在测试环境中,为简化配置,我们可以暂时关闭它们:

sudo pcs property set stonith-enabled=falsesudo pcs property set no-quorum-policy=ignore

五、创建测试资源(VIP 虚拟 IP)

为了验证集群是否正常工作,我们创建一个虚拟 IP 地址作为高可用资源。假设你的业务网段是 192.168.1.0/24,我们可以使用 192.168.1.100 作为 VIP:

sudo pcs resource create virtual_ip ocf:heartbeat:IPaddr2 \  ip=192.168.1.100 cidr_netmask=24 op monitor interval=30s

六、RockyLinux高可用验证:故障转移测试

现在进入核心环节——集群部署教程中的关键一步:验证故障转移能力。

  1. 首先,查看当前资源运行在哪台节点上:
    pcs status
  2. 假设 virtual_ip 运行在 node1 上,现在手动停止 node1 的集群服务:
    sudo pcs cluster stop node1
  3. 等待约 30 秒后,在 node2 上执行 pcs status,你会看到 virtual_ip 已自动迁移到 node2。
  4. 使用 ping 或 curl 测试 192.168.1.100 是否仍然可达,确认服务未中断。

这一步成功说明你的 Linux集群故障转移机制已正常工作!

七、恢复与清理

测试完成后,可以重新启动 node1 并让资源根据策略回迁(或保持在当前节点):

sudo pcs cluster start node1# 查看状态pcs status

八、总结

通过本篇RockyLinux集群测试验证指南,你已经掌握了从零搭建高可用集群、配置虚拟 IP 资源,并成功完成了故障转移测试。这些技能是构建企业级高可用服务的基础。后续可进一步学习添加实际应用(如 Apache、MySQL)作为集群资源,实现真正的业务高可用。

提示:本文适用于学习和测试环境。生产部署请务必启用 STONITH、配置仲裁、使用专用心跳网络,并进行充分的压力与故障演练。