当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04 AI深度学习环境全配置(一步步安装Nvidia驱动、CUDA与cuDNN)

Ubuntu 24.04 AI深度学习环境全配置(一步步安装Nvidia驱动、CUDA与cuDNN)

在本教程中,我们将详细介绍如何在Ubuntu 24.04系统上配置AI深度学习训练环境。我们将覆盖从安装Nvidia显卡驱动到CUDA和cuDNN的完整过程,确保即使是小白用户也能轻松跟随。

准备工作

在开始之前,请确保你的系统是Ubuntu 24.04,并且有一张Nvidia显卡。打开终端,检查显卡型号:

lspci | grep -i nvidia

此外,更新系统包列表:

sudo apt update

步骤一:安装Nvidia显卡驱动

Ubuntu 24.04 提供了多种方式安装Nvidia驱动。推荐使用官方PPA或Ubuntu的附加驱动。首先,添加PPA:

sudo add-apt-repository ppa:graphics-drivers/ppasudo apt update

然后,安装适合你显卡的最新驱动。你可以使用以下命令查看可用驱动:

ubuntu-drivers devices

选择推荐的驱动进行安装。例如,安装驱动版本535:

sudo apt install nvidia-driver-535

安装完成后,重启系统:

sudo reboot

重启后,验证Nvidia显卡驱动安装是否成功:

nvidia-smi

以下是一个示例输出:

Ubuntu 24.04 AI深度学习环境全配置(一步步安装Nvidia驱动、CUDA与cuDNN)  Nvidia显卡驱动 CUDA安装 cuDNN配置 第1张

如果看到显卡信息,说明驱动安装成功。

步骤二:安装CUDA

CUDA是Nvidia的并行计算平台,对于深度学习至关重要。访问Nvidia CUDA下载页面,选择适合Ubuntu 24.04的版本。这里以CUDA 12.1为例。

首先,下载CUDA安装包。在终端中,使用wget命令:

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run

然后,运行安装脚本:

sudo sh cuda_12.1.0_530.30.02_linux.run

在安装过程中,接受许可协议,并选择安装选项。建议选择默认安装。安装完成后,需要配置环境变量。编辑~/.bashrc文件:

nano ~/.bashrc

在文件末尾添加以下行:

export PATH=/usr/local/cuda-12.1/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存并退出,然后使配置生效:

source ~/.bashrc

验证CUDA安装:

nvcc -V

如果显示CUDA版本信息,说明安装成功。

步骤三:安装cuDNN

cuDNN是Nvidia的深度学习库,优化了GPU加速。首先,访问Nvidia cuDNN下载页面(需要注册账号)。下载对应CUDA版本的cuDNN。例如,对于CUDA 12.1,下载cuDNN for Linux。

下载后,解压文件:

tar -xvf cudnn-linux-x86_64-8.9.0.131_cuda12-archive.tar.xz

然后,复制文件到CUDA目录:

sudo cp cudnn-linux-x86_64-8.9.0.131_cuda12-archive/include/cudnn*.h /usr/local/cuda-12.1/include/sudo cp cudnn-linux-x86_64-8.9.0.131_cuda12-archive/lib/libcudnn* /usr/local/cuda-12.1/lib64/sudo chmod a+r /usr/local/cuda-12.1/include/cudnn*.h /usr/local/cuda-12.1/lib64/libcudnn*

验证cuDNN安装:

cat /usr/local/cuda-12.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

如果显示版本信息,说明cuDNN配置成功。

步骤四:验证AI深度学习环境

现在,我们已经完成了Nvidia显卡驱动、CUDA和cuDNN的安装。为了确保环境配置正确,可以运行一个简单的深度学习测试。例如,安装Python和TensorFlow:

pip install tensorflow

然后,在Python中导入TensorFlow并检查GPU是否可用:

python -c "import tensorflow as tf; print(tf.config.list_physical_devices("GPU"))"

如果输出显示GPU设备,说明环境配置成功。

恭喜!你已经在Ubuntu 24.04上成功配置了AI深度学习训练环境,包括Nvidia显卡驱动、CUDA安装和cuDNN配置。现在你可以开始你的深度学习项目了。