当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南:让 Docker 拥抱 GPU

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南:让 Docker 拥抱 GPU

本文将手把手教你如何在 Ubuntu 24.04 上安装 NVIDIA Container Toolkit,实现 Docker GPU 支持,轻松运行 GPU 容器化 应用。无论你是AI开发者还是数据科学家,这篇指南都能帮你快速配置环境。

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南:让 Docker 拥抱 GPU  支持 驱动 容器化 第1张

1. 前置条件

  • 一台安装了 Ubuntu 24.04 的电脑(物理机或支持GPU直通的虚拟机)。
  • 拥有 NVIDIA GPU(计算能力3.5以上)。
  • 具备 sudo 权限的用户。
  • 稳定的网络连接(用于下载软件包)。

2. 更新系统

在开始安装任何软件前,先更新系统软件包索引并升级现有软件:

    sudo apt update && sudo apt upgrade -y  

3. 安装 NVIDIA 驱动

Ubuntu 24.04 安装 NVIDIA 驱动 有多种方式,这里推荐使用系统自带的 ubuntu-drivers 工具自动安装推荐驱动:

    # 查看推荐的驱动版本ubuntu-drivers devices# 自动安装推荐驱动sudo apt install -y nvidia-driver-550  

或者你也可以通过 apt 安装指定版本(如 nvidia-driver-545)。安装完成后必须重启系统

    sudo reboot  

重启后运行 nvidia-smi 验证驱动是否成功安装,如果显示GPU信息则驱动正常。

4. 安装 Docker

Docker GPU 支持 需要先安装 Docker 社区版。按照官方文档添加仓库并安装:

    # 卸载旧版本sudo apt remove docker docker-engine docker.io containerd runc# 安装依赖sudo apt install -y ca-certificates curl gnupg lsb-release# 添加 Docker 官方 GPG 密钥sudo mkdir -p /etc/apt/keyringscurl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg# 设置仓库echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null# 安装 Docker Enginesudo apt updatesudo apt install -y docker-ce docker-ce-cli containerd.io docker-compose-plugin# 将当前用户加入 docker 组(避免每次使用 sudo)sudo usermod -aG docker $USERnewgrp docker  

验证 Docker 安装:docker --versiondocker run hello-world

5. 安装 NVIDIA Container Toolkit

现在安装主角 NVIDIA Container Toolkit,它让 Docker 容器能够访问宿主机的 GPU。步骤:

    # 添加 NVIDIA 官方仓库curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \n  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \n    sed "s#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g" | \n    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list# 更新并安装 nvidia-container-toolkitsudo apt updatesudo apt install -y nvidia-container-toolkit# 配置 Docker 使用 NVIDIA 运行时sudo nvidia-ctk runtime configure --runtime=docker# 重启 Docker 服务sudo systemctl restart docker  

6. 验证 GPU 容器化

运行一个带 GPU 支持的容器,执行 nvidia-smi 命令:

    docker run --rm --gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi  

如果看到 GPU 信息输出,说明 GPU 容器化 配置成功!你也可以运行更复杂的 AI 框架容器,如 TensorFlow、PyTorch 等。

7. 常见问题

  • 问题: 运行 nvidia-smi 提示未找到命令 → 检查驱动是否安装成功,重启系统。
  • 问题: Docker 容器内无法使用 GPU → 确保安装了 NVIDIA Container Toolkit 并正确配置 runtime。
  • 问题: 权限问题 → 确保当前用户加入 docker 组并重新登录。

8. 总结

通过本教程,你在 Ubuntu 24.04 上成功配置了 NVIDIA Container Toolkit,实现了 Docker GPU 支持,为后续的 GPU 容器化 应用开发扫清了障碍。现在你可以尽情使用容器运行 AI、深度学习任务了!

关键词:NVIDIA Container ToolkitDocker GPU 支持Ubuntu 24.04 安装 NVIDIA 驱动GPU 容器化