当前位置:首页 > RockyLinux > 正文

RockyLinux云监控配置指南(手把手教你部署系统监控工具)

在云计算时代,对服务器进行实时监控是保障业务稳定运行的关键。本文将为初学者详细讲解如何在 RockyLinux 系统上配置基础的云监控环境,涵盖安装、配置和验证全过程。即使你是 Linux 新手,也能轻松上手!

RockyLinux云监控配置指南(手把手教你部署系统监控工具) RockyLinux云监控配置 RockyLinux系统监控 云服务器监控工具 Linux性能监控 第1张

一、为什么需要云监控?

通过 RockyLinux云监控配置,你可以实时掌握 CPU 使用率、内存占用、磁盘 I/O、网络流量等关键指标。一旦系统出现异常(如高负载、磁盘满、服务宕机),监控系统能第一时间告警,帮助你快速响应问题。

二、准备工作

确保你的 RockyLinux 服务器满足以下条件:

  • 已安装 RockyLinux 8 或 9(本文以 RockyLinux 9 为例)
  • 具有 root 权限或 sudo 权限
  • 服务器已联网

三、安装 Node Exporter(采集系统指标)

我们将使用 Prometheus 生态中的 node_exporter 来收集系统性能数据。它是轻量级、开源且广泛使用的 Linux性能监控组件。

1. 下载并解压 node_exporter:

wget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0.linux-amd64.tar.gztar xvfz node_exporter-1.7.0.linux-amd64.tar.gzcd node_exporter-1.7.0.linux-amd64

2. 创建系统用户并移动可执行文件:

sudo useradd -rs /bin/false node_exportersudo mv node_exporter /usr/local/bin/

3. 创建 systemd 服务文件:

sudo tee /etc/systemd/system/node_exporter.service <<EOF[Unit]Description=Node ExporterAfter=network.target[Service]User=node_exporterGroup=node_exporterType=simpleExecStart=/usr/local/bin/node_exporter[Install]WantedBy=multi-user.targetEOF

4. 启动并设置开机自启:

sudo systemctl daemon-reexecsudo systemctl start node_exportersudo systemctl enable node_exporter

此时,node_exporter 已在 9100 端口运行。你可以通过浏览器访问 http://你的服务器IP:9100/metrics 查看原始指标数据。

四、安装 Prometheus(存储与查询)

Prometheus 是一个强大的时间序列数据库,用于存储 node_exporter 采集的数据。

1. 创建配置目录并编写配置文件:

sudo mkdir -p /etc/prometheus /var/lib/prometheussudo tee /etc/prometheus/prometheus.yml <<EOFglobal:  scrape_interval: 15sscrape_configs:  - job_name: 'node'    static_configs:      - targets: ['localhost:9100']EOF

2. 下载并安装 Prometheus:

wget https://github.com/prometheus/prometheus/releases/download/v2.45.0/prometheus-2.45.0.linux-amd64.tar.gztar xvfz prometheus-2.45.0.linux-amd64.tar.gzcd prometheus-2.45.0.linux-amd64sudo cp prometheus /usr/local/bin/sudo cp promtool /usr/local/bin/

3. 创建 systemd 服务:

sudo tee /etc/systemd/system/prometheus.service <<EOF[Unit]Description=PrometheusWants=network-online.targetAfter=network-online.target[Service]User=prometheusGroup=prometheusType=simpleExecStart=/usr/local/bin/prometheus \    --config.file /etc/prometheus/prometheus.yml \    --storage.tsdb.path /var/lib/prometheus/ \    --web.console.templates=/etc/prometheus/consoles \    --web.console.libraries=/etc/prometheus/console_libraries[Install]WantedBy=multi-user.targetEOF

4. 创建用户并启动服务:

sudo useradd -rs /bin/false prometheussudo chown -R prometheus:prometheus /etc/prometheus /var/lib/prometheussudo systemctl daemon-reexecsudo systemctl start prometheussudo systemctl enable prometheus

现在,Prometheus Web UI 可通过 http://你的服务器IP:9090 访问。

五、安装 Grafana(可视化仪表盘)

Grafana 能将 Prometheus 中的数据以图表形式展示,是优秀的 云服务器监控工具

1. 添加官方仓库并安装:

sudo dnf install -y dnf-plugins-coresudo dnf config-manager --add-repo https://packages.grafana.com/oss/rpm/grafana.reposudo dnf install -y grafana

2. 启动 Grafana:

sudo systemctl start grafana-serversudo systemctl enable grafana-server

Grafana 默认运行在 3000 端口,访问 http://你的服务器IP:3000,初始账号密码均为 admin

六、配置 Grafana 数据源与仪表盘

  1. 登录 Grafana 后,点击左侧齿轮图标进入 Configuration → Data Sources
  2. 点击 Add data source,选择 Prometheus
  3. URL 填写 http://localhost:9090,点击 Save & test
  4. 返回首页,点击 Create → Import,输入仪表盘 ID:1860(Node Exporter Full)。
  5. 选择刚才添加的数据源,点击 Import

恭喜!你现在拥有了一个完整的 RockyLinux系统监控平台,可以直观查看服务器各项性能指标。

七、安全建议

生产环境中,请务必:

  • 配置防火墙(如 firewalld)仅允许可信 IP 访问 9090 和 3000 端口
  • 为 Grafana 设置强密码并启用 HTTPS
  • 定期更新软件包以修复安全漏洞

总结

通过本教程,你已经成功在 RockyLinux 上搭建了一套基于 Prometheus + Node Exporter + Grafana 的 云监控系统。这套方案免费、开源、功能强大,适用于个人项目到企业级应用。掌握 RockyLinux云监控配置技能,将极大提升你的运维效率与系统稳定性。