当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04 + RTX 5060 Ti 深度学习环境配置指南 (从零开始)

Ubuntu 24.04 + RTX 5060 Ti 深度学习环境配置指南 (从零开始)

手把手教你搭建高性能深度学习工作站,完美支持CUDA加速

本文面向深度学习初学者,详细讲解如何在 Ubuntu 24.04 系统上,为最新的 RTX 5060 Ti 显卡配置完整的 深度学习环境,包括显卡驱动安装、CUDA 工具包部署、cuDNN 配置以及主流框架(PyTorch/TensorFlow)的安装。无论你是准备进行科研还是项目开发,这份指南都能帮你快速上手。

一、准备工作

  • 一台已安装 Ubuntu 24.04 的电脑(推荐最小安装,确保联网)
  • 一张 RTX 5060 Ti 显卡(确保供电充足)
  • 稳定的网络环境(用于下载驱动和依赖包)
  • 基本的终端操作知识(复制粘贴即可)

二、安装 NVIDIA 显卡驱动

RTX 5060 Ti 需要较新的驱动版本,建议使用官方驱动或系统自带的“附加驱动”工具安装。

  1. 打开终端,更新软件源:sudo apt update && sudo apt upgrade -y
  2. 安装驱动依赖:sudo apt install build-essential dkms
  3. 添加图形驱动PPA(可选):sudo add-apt-repository ppa:graphics-drivers/ppa && sudo apt update
  4. 使用 ubuntu-drivers 工具自动检测推荐驱动:ubuntu-drivers devices 查看推荐版本,然后运行 sudo apt install nvidia-driver-550(具体版本号以推荐为准)
  5. 安装完成后重启:sudo reboot

重启后,在终端输入 nvidia-smi,如果看到类似下图的显卡信息,说明驱动安装成功。

Ubuntu 24.04 + RTX 5060 Ti 深度学习环境配置指南 (从零开始)  深度学习环境 CUDA 第1张

三、安装 CUDA 工具包

深度学习框架依赖 CUDA 进行 GPU 加速。请根据 RTX 5060 Ti 的架构选择兼容的 CUDA 版本(建议 CUDA 12.x)。

  1. 前往 NVIDIA 官网下载 CUDA 12.4(举例):wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.15_linux.run
  2. 执行安装程序:sudo sh cuda_12.4.0_550.54.15_linux.run,注意取消勾选 Driver(因为我们已经装过驱动)
  3. 添加环境变量:编辑 ~/.bashrc,在末尾添加:
    export PATH=/usr/local/cuda-12.4/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH
  4. 使环境变量生效:source ~/.bashrc
  5. 验证 CUDA 安装:nvcc -V 应显示 CUDA 版本信息。

四、安装 cuDNN

cuDNN 是 NVIDIA 针对深度神经网络的加速库,需要注册账号下载。这里以 cuDNN for CUDA 12.x 为例。

  1. 从 NVIDIA 官网下载 cuDNN 的 deb 包或 tar 包(推荐 deb 安装)。
  2. 安装本地 deb 包:sudo dpkg -i cudnn-local-repo-*.deb,然后按照提示添加密钥环。
  3. 更新并安装:sudo apt update && sudo apt install cudnn
  4. 验证 cuDNN 版本:cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

五、配置 Python 虚拟环境

推荐使用 Miniconda 管理 Python 环境,避免依赖冲突。

  1. 下载 Miniconda 安装脚本:wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
  2. 运行安装:bash Miniconda3-latest-Linux-x86_64.sh,按提示完成安装。
  3. 创建深度学习虚拟环境:conda create -n deeplearning python=3.10 -y
  4. 激活环境:conda activate deeplearning

六、安装深度学习框架

在虚拟环境中安装 PyTorch 和 TensorFlow,确保它们能调用 CUDA 加速。

  • PyTorchpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
  • TensorFlowpip install tensorflow[and-cuda] (TensorFlow 2.15+ 支持 CUDA 12)

七、验证环境

在 Python 中运行以下代码,确认 GPU 可用:

import torchprint("PyTorch GPU available:", torch.cuda.is_available())print("GPU name:", torch.cuda.get_device_name(0))import tensorflow as tfprint("TensorFlow GPU available:", tf.config.list_physical_devices("GPU"))

如果输出显示你的 RTX 5060 Ti,说明整个 深度学习环境 配置成功!

八、常见问题

  • 驱动安装后无法进入图形界面:可能是驱动冲突,可在恢复模式卸载 nouveau 驱动。
  • CUDA 版本不兼容:请根据框架要求选择合适的 CUDA,比如 PyTorch 2.4 支持 CUDA 12.1/12.4。
  • conda 环境找不到 CUDA:检查环境变量是否正确设置,或尝试在虚拟环境中安装 cudatoolkit(conda 方式)。

—— 祝你在 Ubuntu 24.04 + RTX 5060 Ti 上享受深度学习的乐趣!