当前位置:首页 > Ubuntu > 正文

Ubuntu深度学习框架配置(从零开始搭建PyTorch与CUDA环境)

在当今人工智能飞速发展的时代,Ubuntu深度学习环境配置已成为每位AI初学者或开发者的必备技能。本文将手把手教你如何在Ubuntu系统上搭建一个完整的深度学习开发环境,涵盖NVIDIA驱动、CUDA、cuDNN以及PyTorch的安装,并使用conda创建隔离的虚拟环境。即使你是完全的小白,也能轻松跟做!

Ubuntu深度学习框架配置(从零开始搭建PyTorch与CUDA环境) Ubuntu深度学习环境配置  CUDA安装教程 PyTorch安装指南 conda虚拟环境配置 第1张

一、准备工作

首先,请确保你使用的是Ubuntu 20.04 LTS 或 22.04 LTS版本,并且你的电脑配备了一块NVIDIA显卡(如GTX 1060及以上)。如果没有NVIDIA显卡,则无法使用GPU加速,但CPU版本的PyTorch依然可以运行。

二、安装NVIDIA显卡驱动

打开终端(Ctrl + Alt + T),输入以下命令查看推荐驱动:

ubuntu-drivers devices

通常系统会推荐一个驱动版本(如nvidia-driver-535)。执行以下命令自动安装推荐驱动:

sudo ubuntu-drivers autoinstall

安装完成后重启系统:

sudo reboot

重启后,在终端输入 nvidia-smi,如果看到显卡信息,说明驱动安装成功。

三、安装CUDA与cuDNN

PyTorch官方已将CUDA集成在其预编译包中,因此无需单独安装完整版CUDA Toolkit。但为了兼容性,建议安装与PyTorch匹配的CUDA运行时库。

访问 PyTorch官网,选择你的系统配置(Linux, Pip, Python, CUDA版本),它会自动生成安装命令。例如(以CUDA 11.8为例):

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

这样就同时安装了PyTorch和所需的CUDA运行时,无需手动配置cuDNN。

四、使用conda创建虚拟环境(推荐)

为了避免Python包冲突,强烈建议使用conda虚拟环境配置。首先安装Miniconda(轻量版Anaconda):

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shbash Miniconda3-latest-Linux-x86_64.sh

按照提示安装,完成后重启终端。接着创建名为dl_env的虚拟环境:

conda create -n dl_env python=3.10conda activate dl_env

然后在该环境中安装PyTorch(同样参考官网命令):

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

五、验证安装是否成功

在Python中运行以下代码:

import torchprint(torch.__version__)print(torch.cuda.is_available())print(torch.cuda.get_device_name(0) if torch.cuda.is_available() else "No GPU")

如果输出类似以下内容,说明CUDA安装教程成功完成:

2.1.0+cu118TrueNVIDIA GeForce RTX 3060

六、常见问题与小贴士

  • 如果nvidia-smi报错,可能是Secure Boot阻止了驱动加载,请在BIOS中关闭Secure Boot。
  • 不要混用pip和conda安装PyTorch,容易导致依赖冲突。
  • 每次使用前记得激活虚拟环境:conda activate dl_env
  • 如需Jupyter Notebook支持,在环境中运行:pip install jupyter

结语

通过以上步骤,你已经成功完成了Ubuntu深度学习环境配置,并掌握了PyTorch安装指南的核心流程。现在,你可以开始你的深度学习项目了!如有疑问,欢迎查阅PyTorch官方文档或社区论坛。