当前位置：首页 > Centos > 正文

CentOS深度学习环境搭建全攻略（手把手教你配置PyTorch与CUDA）

主机测评网
Centos
2025-12-20
923

在当今人工智能热潮中，深度学习已成为核心技能之一。而CentOS作为一款稳定、安全的企业级Linux发行版，被广泛用于服务器部署和科研计算。本文将为零基础用户详细讲解如何在CentOS系统上搭建完整的深度学习框架环境，包括驱动安装、CUDA配置以及PyTorch部署。

CentOS深度学习环境搭建全攻略（手把手教你配置PyTorch与CUDA） CentOS深度学习环境搭建 CentOS安装PyTorch CentOS配置CUDA CentOS深度学习框架教程第1张

一、准备工作：确认系统与硬件

首先，请确保你的服务器或PC满足以下条件：

操作系统：CentOS 7 或 CentOS 8（推荐 CentOS 7.9）
GPU：NVIDIA 显卡（建议 GTX 1060 及以上，支持 CUDA）
内存：至少 8GB RAM
磁盘空间：至少 20GB 可用空间

二、安装 NVIDIA 驱动

深度学习离不开 GPU 加速，因此首先要安装 NVIDIA 官方驱动。

1. 禁用默认的 Nouveau 驱动：

sudo echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist.confsudo echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist.confsudo dracut --force

2. 重启系统并进入命令行模式（无图形界面）：

sudo systemctl set-default multi-user.targetsudo reboot

3. 下载并安装 NVIDIA 驱动（以 RTX 3080 为例）：

wget https://us.download.nvidia.com/XFree86/Linux-x86_64/535.113.01/NVIDIA-Linux-x86_64-535.113.01.runchmod +x NVIDIA-Linux-x86_64-535.113.01.runsudo ./NVIDIA-Linux-x86_64-535.113.01.run --no-opengl-files

安装完成后，执行 nvidia-smi 命令，若看到 GPU 信息即表示驱动安装成功。

三、安装 CUDA 与 cuDNN

CUDA 是 NVIDIA 提供的并行计算平台，cuDNN 是深度神经网络加速库。二者是 CentOS配置CUDA 的关键。

1. 安装 CUDA Toolkit（以 CUDA 11.8 为例）：

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.runsudo sh cuda_11.8.0_520.61.05_linux.run

安装时取消勾选“Driver”（因已安装），只保留“CUDA Toolkit”。

2. 配置环境变量：

echo 'export PATH=/usr/local/cuda-11.8/bin:$PATH' >> ~/.bashrcecho 'export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrcsource ~/.bashrc

3. 安装 cuDNN（需注册 NVIDIA 账号下载）：

tar -xzvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xzsudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/includesudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

四、安装 Python 与 PyTorch

推荐使用 Anaconda 管理 Python 环境，便于依赖管理。

1. 安装 Miniconda：

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shbash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3source ~/.bashrc

2. 创建虚拟环境并安装 PyTorch：

conda create -n dl python=3.9 -yconda activate dlpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

注意：上述命令安装的是支持 CUDA 11.8 的 PyTorch 版本，与前面安装的 CUDA 版本一致。

五、验证安装是否成功

运行以下 Python 代码测试 GPU 是否可用：

python -c "import torch; print('CUDA available:', torch.cuda.is_available()); print('GPU count:', torch.cuda.device_count())"

如果输出显示 CUDA available: True，恭喜你！CentOS深度学习环境搭建 已成功完成。

六、常见问题与解决方案

问题1：nvidia-smi 报错 “NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.”
解决：检查驱动是否正确安装，确认内核版本未更新导致驱动失效。
问题2：PyTorch 无法识别 GPU。
解决：确认 CUDA 版本与 PyTorch 编译版本一致，可通过 nvcc --version 查看。