当前位置:首页 > RockyLinux > 正文

RockyLinux Pacemaker集群管理(手把手教你搭建高可用HA集群)

在现代企业IT架构中,服务的高可用性(High Availability, HA)至关重要。一旦关键服务宕机,可能造成业务中断甚至重大损失。为此,RockyLinux Pacemaker集群管理提供了一套成熟、稳定且开源的解决方案。本文将从零开始,详细讲解如何在 Rocky Linux 系统上使用 Pacemaker + Corosync 搭建一个高可用集群,即使你是 Linux 新手,也能轻松上手。

RockyLinux Pacemaker集群管理(手把手教你搭建高可用HA集群) Pacemaker集群管理 高可用集群配置 HA集群 Pacemaker Corosync教程 第1张

一、什么是 Pacemaker 和 Corosync?

Pacemaker 是一个开源的高可用集群资源管理器,负责监控和管理集群中的服务(如 Web 服务器、数据库等),确保它们始终在线。当某个节点故障时,Pacemaker 会自动将服务迁移到健康节点。

Corosync 则是集群通信层,负责节点之间的消息传递和成员状态同步。Pacemaker 通常与 Corosync 配合使用,构成完整的 HA 解决方案。

二、实验环境准备

本教程使用以下环境:

  • 操作系统:Rocky Linux 9(最小化安装)
  • 节点数量:2 台(node1 和 node2)
  • IP 地址:
      • node1: 192.168.1.10
      • node2: 192.168.1.11
  • 主机名已正确设置,并且两台机器之间可通过主机名互相解析(建议配置 /etc/hosts)

三、安装 Pacemaker 和 Corosync

在两台 Rocky Linux 服务器上执行以下命令安装所需软件包:

sudo dnf install -y pacemaker corosync pcs resource-agents

安装完成后,启动并启用 pcsd 服务(用于 Web 管理和集群配置):

sudo systemctl enable --now pcsd

为 hacluster 用户设置密码(两台机器必须相同):

sudo passwd hacluster# 输入一个强密码,例如:MyClusterPass123!

四、配置集群通信

在任意一台节点(例如 node1)上执行以下命令,认证集群节点:

sudo pcs host auth node1 node2 -u hacluster -p MyClusterPass123!

创建名为 mycluster 的集群:

sudo pcs cluster setup mycluster node1 node2

启动集群服务:

sudo pcs cluster start --allsudo pcs cluster enable --all

五、验证集群状态

运行以下命令查看集群是否正常运行:

sudo pcs status

如果看到两个节点都处于 Online 状态,说明 RockyLinux HA集群 已成功搭建!

六、添加一个高可用资源(以虚拟 IP 为例)

我们创建一个虚拟 IP 地址(VIP),作为对外服务的入口。假设 VIP 为 192.168.1.100:

sudo pcs resource create virtual_ip ocf:heartbeat:IPaddr2 \  ip=192.168.1.100 cidr_netmask=24 op monitor interval=30s

再次运行 pcs status,你会看到 virtual_ip 资源已启动并在其中一个节点上运行。此时,你可以 ping 192.168.1.100 测试连通性。

七、常见问题与维护

- 若需手动迁移资源,可使用:
pcs resource move virtual_ip node2

- 查看详细日志:
journalctl -u pacemaker -f

通过以上步骤,你已经掌握了 Pacemaker Corosync教程 的核心内容。后续可根据实际需求添加 Web 服务、数据库等资源,构建完整的高可用架构。

结语

本文详细介绍了如何在 Rocky Linux 上部署和管理 Pacemaker 高可用集群。无论你是系统管理员还是 DevOps 工程师,掌握 RockyLinux Pacemaker集群管理 技能都将极大提升你的运维能力。建议在测试环境中多加练习,再应用于生产环境。