当前位置:首页 > 系统教程 > 正文

Ubuntu 22.04深度学习GPU环境搭建指南

Ubuntu 22.04深度学习GPU环境搭建指南

(新手图文教程:显卡驱动、CUDA、cuDNN、PyTorch一步到位)

欢迎来到Ubuntu 22.04深度学习GPU环境搭建教程。无论你是刚接触深度学习GPU环境的小白,还是需要快速配置开发环境的老手,本文将带你从零开始,一步步安装显卡驱动、CUDA、cuDNN和PyTorch,让你的机器发挥出GPU的强大算力。整个教程基于命令行操作,图文并茂,确保每一步都清晰易懂。

1. 准备工作

首先,确保你的电脑拥有NVIDIA显卡,并且已经安装了Ubuntu 22.04系统。打开终端(Ctrl+Alt+T),更新软件包列表并安装必要的依赖:

sudo apt updatesudo apt upgrade -ysudo apt install build-essential dkms

2. 安装NVIDIA显卡驱动

Ubuntu 22.04通常会自动检测推荐驱动。运行以下命令查看可用的驱动版本:

ubuntu-drivers devices

根据输出,选择带有“recommended”标记的驱动版本进行安装(例如nvidia-driver-535):

sudo apt install nvidia-driver-535

安装完成后,重启系统:

sudo reboot
Ubuntu 22.04深度学习GPU环境搭建指南 22.04 深度学习GPU环境 CUDA安装 PyTorch配置 第1张

图1:使用nvidia-smi命令验证驱动安装成功

重启后,在终端输入nvidia-smi,如果显示GPU信息,则驱动安装成功。

3. 安装CUDA

CUDA是NVIDIA的并行计算平台,深度学习框架依赖它。我们需要根据驱动版本选择合适的CUDA版本(例如驱动535通常支持CUDA 12.x)。前往NVIDIA CUDA下载页选择Linux -> x86_64 -> Ubuntu -> 22.04 -> runfile(或deb)。本教程以runfile为例,因为它更通用:

wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda_12.3.0_545.23.08_linux.runsudo sh cuda_12.3.0_545.23.08_linux.run

安装时,取消勾选“Driver”(因为我们已经安装了驱动),只选择CUDA Toolkit。安装完成后,需要将CUDA路径添加到环境变量。编辑~/.bashrc:

echo "export PATH=/usr/local/cuda/bin:$PATH" >> ~/.bashrcecho "export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH" >> ~/.bashrcsource ~/.bashrc

验证CUDA安装nvcc --version,应显示CUDA版本信息。

4. 安装cuDNN

cuDNN是针对深度神经网络的GPU加速库。需要注册NVIDIA开发者账号,从官网下载与CUDA匹配的cuDNN版本(例如cuDNN for CUDA 12.x)。下载deb包或tar包,这里以tar包为例:

# 假设下载的文件为 cudnn-linux-x86_64-8.9.5.30_cuda12-archive.tar.xztar -xvf cudnn-linux-x86_64-8.9.5.30_cuda12-archive.tar.xzcd cudnn-linux-x86_64-8.9.5.30_cuda12-archivesudo cp include/cudnn.h /usr/local/cuda/includesudo cp lib/libcudnn /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

至此,cuDNN安装完成。

5. 安装PyTorch并验证GPU

PyTorch配置是最后一步。推荐使用pip安装PyTorch,前往PyTorch官网获取适合你CUDA版本的命令。例如:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

如果还没有pip3,先安装:sudo apt install python3-pip

安装后,在Python中测试:

python3 -c "import torch; print(torch.cuda.is_available()); print(torch.cuda.get_device_name(0))"

如果输出True和你的显卡名称,恭喜你,深度学习GPU环境搭建成功!

常见问题

  • 驱动冲突:如果之前安装过驱动,建议先卸载:sudo apt purge nvidia*
  • CUDA版本不匹配:使用nvidia-smi查看支持的CUDA最高版本,PyTorch的CUDA版本应≤该值。
  • 权限问题:如果遇到Permission denied,检查文件权限或使用sudo。

通过本教程,你应该已经成功在Ubuntu 22.04上配置了完整的GPU深度学习环境。如果有任何问题,欢迎在评论区交流。祝你炼丹顺利!