当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04 AI深度学习环境全攻略(从零安装Nvidia驱动、CUDA与cuDNN配置AI训练平台)

Ubuntu 24.04 AI深度学习环境全攻略(从零安装Nvidia驱动、CUDA与cuDNN配置AI训练平台)

本教程将详细指导你在Ubuntu 24.04系统上安装Nvidia显卡驱动、CUDA和cuDNN,配置AI深度学习训练环境。过程简单易懂,小白也能快速上手,为AI项目打下坚实基础。

Ubuntu 24.04 AI深度学习环境全攻略(从零安装Nvidia驱动、CUDA与cuDNN配置AI训练平台) Nvidia驱动安装 CUDA配置 cuDNN安装 深度学习环境搭建 第1张

1. 安装Nvidia显卡驱动

Nvidia驱动安装是第一步,确保GPU能被系统识别。打开终端,依次执行以下命令:

    sudo apt updatesudo ubuntu-drivers autoinstall   # 自动安装推荐驱动sudo reboot  

重启后,验证驱动安装:运行 nvidia-smi,如果显示GPU信息,则Nvidia驱动安装成功。这是深度学习环境搭建的关键步骤。

2. 安装CUDA工具包

CUDA配置用于GPU加速计算。访问Nvidia官网下载CUDA 12.4(适配Ubuntu 24.04),或直接命令行安装:

    wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.runsudo sh cuda_12.4.0_550.54.14_linux.run  

安装时,取消驱动选项(因已安装)。完成后,设置环境变量:编辑 ~/.bashrc 文件,添加:

    export PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH  

运行 source ~/.bashrc,验证CUDA配置:nvcc -V 输出版本信息。

3. 安装cuDNN库

cuDNN安装优化深度学习性能。从Nvidia官网下载cuDNN(需注册),匹配CUDA 12.4版本。解压并复制文件:

    tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xzsudo cp cudnn-linux-x86_64-8.9.7.29_cuda12-archive/include/cudnn*.h /usr/local/cuda/include/sudo cp -P cudnn-linux-x86_64-8.9.7.29_cuda12-archive/lib/libcudnn* /usr/local/cuda/lib64/sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*  

cuDNN安装完成,可通过深度学习框架测试验证。

4. 配置AI深度学习训练环境

最后,配置深度学习环境搭建,安装PyTorch或TensorFlow。例如,安装PyTorch(支持CUDA 12.4):

    pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124  

或安装TensorFlow:pip install tensorflow[and-cuda]。创建测试脚本:

    import torchprint(torch.cuda.is_available())  # 输出True表示成功  

至此,Ubuntu 24.04上的AI深度学习训练环境已配置完成。本教程涵盖了Nvidia驱动安装、CUDA配置、cuDNN安装和深度学习环境搭建全流程,助你快速启动AI项目。遇到问题,可参考官方文档或社区资源。