当前位置:首页 > 系统教程 > 正文

Ubuntu 22.04离线安装Docker与NVIDIA Container Toolkit全攻略(从零搭建GPU Docker环境的离线部署指南)

Ubuntu 22.04离线安装Docker与NVIDIA Container Toolkit全攻略(从零搭建GPU Docker环境的离线部署指南)

在完全离线的 Ubuntu 22.04 离线安装 Docker 并配置 NVIDIA Container Toolkit 离线安装 是许多内网生产环境面临的挑战。本文提供一份手把手的 GPU Docker 环境配置 指南,涵盖从依赖包下载到最终验证的全流程,助你轻松实现 离线部署 Docker GPU 环境。

1. 准备工作:从联网机器下载离线安装包

首先准备一台网络畅通且同样运行 Ubuntu 22.04 的机器,用于下载 DockerNVIDIA Container Toolkit 的所有 .deb 依赖包。

# 1. 下载 Docker CE 离线包(包含 containerd、docker-ce-cli 等)mkdir docker-offline && cd docker-offlineapt-get download docker-ce docker-ce-cli containerd.io docker-compose-plugin# 2. 下载 NVIDIA Container Toolkit 离线包# 首先添加 NVIDIA Docker 官方仓库(仅为了获取下载链接,实际不安装)distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \n   && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \n   && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.listsudo apt-get update# 下载 nvidia-container-toolkit 及其依赖(如 libnvidia-container-tools、libnvidia-container1)apt-get download nvidia-container-toolkit libnvidia-container-tools libnvidia-container1# 3. 将所有 .deb 文件打包并传输至离线机器tar -czvf nvidia-docker-offline.tar.gz *.deb

提示: 若依赖缺失,可使用 apt-cache depends 查看完整依赖并一并下载。

2. 传输文件至离线 Ubuntu 22.04 主机

将打包好的 nvidia-docker-offline.tar.gz 通过 U 盘、SCP 或内部传输工具复制到离线的目标机器上。

# 在离线机器上解压tar -xzvf nvidia-docker-offline.tar.gz -C ~/docker-offline/cd ~/docker-offline

  Ubuntu 22.04离线安装Docker与NVIDIA Container Toolkit全攻略(从零搭建GPU Docker环境的离线部署指南)
 22.04 离线安装 Docker NVIDIA Toolkit GPU 环境配置 离线部署 第1张

3. 离线安装 Docker

进入包含所有 .deb 文件的目录,使用 dpkg 依次安装。推荐按依赖顺序安装:

sudo dpkg -i containerd.io_*.debsudo dpkg -i docker-ce-cli_.debsudo dpkg -i docker-ce_.debsudo dpkg -i docker-compose-plugin_*.deb# 如果出现依赖错误,执行以下命令修复sudo apt --fix-broken install -y   # 离线环境会自动使用本地的 .deb 包修复

安装完成后启动 Docker 并设置开机自启:

sudo systemctl start dockersudo systemctl enable docker

4. 离线安装 NVIDIA Container Toolkit

在相同目录下安装 NVIDIA 容器工具包:

sudo dpkg -i libnvidia-container1_*.debsudo dpkg -i libnvidia-container-tools_.debsudo dpkg -i nvidia-container-toolkit_.deb# 同样,如有依赖问题执行sudo apt --fix-broken install -y

此过程即完成 NVIDIA Container Toolkit 离线安装 的核心步骤。

5. 配置 Docker 支持 GPU(关键步骤)

使用 nvidia-ctk 命令修改 Docker 运行时配置:

sudo nvidia-ctk runtime configure --runtime=dockersudo systemctl restart docker

该命令会在 /etc/docker/daemon.json 中添加 nvidia 运行时,是 GPU Docker 环境配置 中不可或缺的一环。

6. 验证 GPU 容器是否可用

拉取一个包含 CUDA 的测试镜像(若完全离线,需提前在内网 registry 导入或使用已下载的镜像),并运行 nvidia-smi

docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

如果输出 GPU 信息列表,则表明 Ubuntu 22.04 离线安装 Docker 与 NVIDIA Container Toolkit 已成功,且 离线部署 Docker GPU 环境圆满完成。

📌 总结

通过以上六个步骤,即使在没有公网访问权限的 Ubuntu 22.04 系统中,也能完整搭建支持 GPU 调用的 Docker 环境。本文覆盖了 Ubuntu 22.04 离线安装 DockerNVIDIA Container Toolkit 离线安装GPU Docker 环境配置 以及 离线部署 Docker GPU 的全流程,是内网部署 AI 训练环境的实用参考。