当前位置:首页 > Centos > 正文

CentOS深度学习环境搭建(从零开始配置CUDA、cuDNN与PyTorch)

在当今人工智能飞速发展的时代,深度学习已成为科研与工业界的核心技术之一。而CentOS作为一款稳定、安全的企业级Linux发行版,常被用于部署高性能计算环境。本文将手把手教你如何在CentOS系统上搭建完整的深度学习环境,包括NVIDIA驱动、CUDA、cuDNN以及主流深度学习框架PyTorch的安装。即使你是Linux小白,也能轻松跟做!

CentOS深度学习环境搭建(从零开始配置CUDA、cuDNN与PyTorch) CentOS深度学习环境搭建  CentOS安装CUDA 深度学习开发环境配置 Linux深度学习教程 第1张

一、准备工作

在开始之前,请确保你满足以下条件:

  • 一台安装了CentOS 7或CentOS 8的物理机或云服务器(推荐CentOS 7.9)
  • 一块支持CUDA的NVIDIA显卡(如GTX 10系列、RTX 20/30/40系列或Tesla系列)
  • 具备root权限或sudo权限
  • 网络连接正常(用于下载依赖包)

二、更新系统并安装基础依赖

首先,打开终端,执行以下命令更新系统并安装必要工具:

sudo yum update -ysudo yum groupinstall -y "Development Tools"sudo yum install -y epel-releasesudo yum install -y wget vim git python3 python3-pip

确认Python 3和pip已正确安装:

python3 --versionpip3 --version

三、安装NVIDIA显卡驱动

深度学习离不开GPU加速,因此必须先安装NVIDIA官方驱动。

1. 禁用默认的nouveau驱动(开源但不支持CUDA):

echo 'blacklist nouveau' | sudo tee -a /etc/modprobe.d/blacklist.confecho 'options nouveau modeset=0' | sudo tee -a /etc/modprobe.d/blacklist.confsudo dracut --force

2. 重启系统以生效:

sudo reboot

3. 重启后,进入命令行模式(无图形界面),下载并安装NVIDIA驱动:

# 查看显卡型号lspci | grep -i nvidia# 下载驱动(以535版本为例,请根据官网选择最新版)wget https://us.download.nvidia.com/XFree86/Linux-x86_64/535.113.01/NVIDIA-Linux-x86_64-535.113.01.run# 安装驱动sudo sh NVIDIA-Linux-x86_64-535.113.01.run

安装过程中按提示操作,建议接受默认选项。安装完成后验证:

nvidia-smi

如果看到GPU信息表格,说明驱动安装成功!

四、安装CUDA Toolkit

CUDA是NVIDIA提供的并行计算平台,深度学习框架依赖它进行GPU加速。请根据你的驱动版本选择兼容的CUDA版本(参考官方文档)。

以CUDA 11.8为例(适用于大多数PyTorch/TensorFlow版本):

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.runsudo sh cuda_11.8.0_520.61.05_linux.run

安装时取消勾选“Driver”(因为我们已单独安装),只保留“CUDA Toolkit”和“Symbolic Link”。安装完成后,配置环境变量:

echo 'export PATH=/usr/local/cuda-11.8/bin:$PATH' >> ~/.bashrcecho 'export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrcsource ~/.bashrc

验证CUDA安装:

nvcc --version

五、安装cuDNN

cuDNN(CUDA Deep Neural Network library)是NVIDIA提供的深度学习原语库,能显著加速卷积等操作。

1. 访问 NVIDIA cuDNN官网,注册账号并下载与CUDA 11.8兼容的cuDNN(需登录)。

2. 假设你下载的是 cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz,执行以下命令安装:

tar -xvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xzsudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

六、安装PyTorch深度学习框架

现在可以安装PyTorch了!推荐使用pip安装GPU版本:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

验证PyTorch是否能调用GPU:

python3 -c "import torch; print(torch.cuda.is_available())"# 输出 True 表示成功!

七、总结

恭喜你!你已经成功在CentOS上搭建了完整的深度学习开发环境。整个流程涵盖了驱动、CUDA、cuDNN和PyTorch的安装,适用于大多数Linux深度学习教程中的项目需求。

后续你可以继续安装Jupyter Notebook、TensorFlow或其他工具。记住定期备份环境,并关注NVIDIA和PyTorch的版本兼容性。

如果你在操作中遇到问题,欢迎在评论区留言交流。祝你在CentOS深度学习环境搭建的道路上一帆风顺!