当前位置：首页 > RockyLinux > 正文

RockyLinux内核崩溃分析（手把手教你排查系统宕机原因）

主机测评网
RockyLinux
2025-12-13
1044

当你的 RockyLinux 服务器突然宕机、无响应或自动重启时，很可能遭遇了内核崩溃（Kernel Panic）。这种情况对系统管理员来说非常棘手，但别担心！本文将带你从零开始，详细讲解如何进行 RockyLinux内核崩溃分析，即使是 Linux 新手也能轻松上手。

什么是内核崩溃？

内核崩溃是指 Linux 内核在运行过程中遇到无法恢复的严重错误，导致系统停止响应。此时，系统通常会打印“Kernel panic - not syncing”等信息，并可能自动重启。

第一步：启用 kdump 服务

要分析内核崩溃，首先需要捕获崩溃时的内存快照，这依赖于 kdump 服务。它会在内核崩溃时生成一个名为 vmcore 的转储文件。

1. 安装 kexec-tools：

sudo dnf install -y kexec-tools

2. 启用并启动 kdump 服务：

sudo systemctl enable kdumpsudo systemctl start kdump

默认情况下，vmcore 文件会保存在 /var/crash/ 目录下。

RockyLinux内核崩溃分析（手把手教你排查系统宕机原因） RockyLinux内核崩溃分析 Linux内核调试 crash工具使用内核转储文件分析第1张

第二步：安装 crash 和 debuginfo 工具

分析 vmcore 需要使用 crash 工具，同时还需要对应内核版本的调试符号（debuginfo）。

1. 安装 crash 工具：

sudo dnf install -y crash

2. 启用 debuginfo 仓库并安装内核调试包：

sudo dnf config-manager --set-enabled debuginfosudo dnf install -y kernel-debuginfo-$(uname -r)

注意：$(uname -r) 会自动替换为你当前运行的内核版本。

第三步：使用 crash 分析 vmcore

假设你的崩溃文件位于 /var/crash/12345678/vmcore，对应的内核镜像为 /boot/vmlinuz-$(uname -r)。

运行以下命令启动 crash 分析环境：

crash /usr/lib/debug/lib/modules/$(uname -r)/vmlinux \      /var/crash/12345678/vmcore

进入 crash 命令行后，你可以使用多种命令查看崩溃信息：

bt：查看崩溃时的堆栈回溯（backtrace）
log：查看内核日志
ps：列出所有进程状态
sys：显示系统信息

例如，输入 bt 可以看到导致崩溃的函数调用链：

crash> btPID: 1234   TASK: ffff9f1234567890  CPU: 2   COMMAND: "kworker/u16:3" #0 [ffff9f1234567abc] __schedule at ffffffff98a12345 #1 [ffff9f1234567def] schedule at ffffffff98a123ab #2 [ffff9f1234567ghi] worker_thread at ffffffff98b234cd ...

常见问题与技巧

- 如果 kdump 无法启动，可能是预留内存不足。编辑 /etc/default/grub，在 GRUB_CMDLINE_LINUX 中添加 crashkernel=auto 或指定值如 crashkernel=512M，然后运行 grub2-mkconfig -o /boot/grub2/grub.cfg 并重启。

- 若找不到对应版本的 kernel-debuginfo，请确认你已启用正确的 debuginfo 仓库，并确保系统已更新到最新内核。

总结

通过本文，你已经掌握了 RockyLinux内核崩溃分析 的完整流程：从启用 kdump、安装调试工具，到使用 crash工具使用 技术深入分析 内核转储文件分析。这些技能对于保障生产环境稳定性至关重要。记住，每一次崩溃都是系统在“说话”，学会倾听它，你就能成为更强大的 Linux 系统守护者！

关键词回顾：RockyLinux内核崩溃分析、Linux内核调试、crash工具使用、内核转储文件分析