当前位置：首页 > 系统教程 > 正文

3D视觉之三维重建NeRF实战：Ubuntu 20.04部署Instant-NGP并利用自己的数据集训练实现桌面场景的三维重建

主机测评网
系统教程
2026-03-15
884

在计算机视觉与自动驾驶等前沿领域，三维重建技术始终是研究的热点。近年来，神经辐射场（NeRF）作为一种隐式三维场景表示方法，彻底改变了传统三维重建的技术路径。然而，传统NeRF训练速度缓慢，限制了其实际应用。NVIDIA推出的Instant-NGP（Instant Neural Graphics Primitives）通过多分辨率哈希编码，将训练时间从数天缩短至数秒，让快速三维重建成为现实。本文将为读者，尤其是初学者，提供一份详尽的实战指南，带领大家在Ubuntu 20.04系统上从零部署Instant-NGP，并利用自己拍摄的桌面场景视频，完成从数据采集到模型导出的完整三维重建流程。

3D视觉之三维重建NeRF实战：Ubuntu 20.04部署Instant-NGP并利用自己的数据集训练实现桌面场景的三维重建三维重建神经辐射场 Instant-NGP Ubuntu 20.04 第1张

一、部署Instant-NGP：基础环境搭建

在开始神奇的三维重建之旅前，我们需要先搭建好坚实的基础。本节将一步步引导你在Ubuntu 20.04系统上配置所有必要的环境和依赖。

1. 安装系统依赖库

打开终端，执行以下命令，安装编译和运行Instant-NGP所需的系统开发工具及库文件。这是保证后续步骤顺利的前提 -1。

sudo apt-get updatesudo apt-get install build-essential git python3-dev python3-pip libopenexr-dev libxi-dev \nlibglfw3-dev libglew-dev libomp-dev libxinerama-dev libxcursor-dev

2. 配置NVIDIA驱动与CUDA

Instant-NGP的强大性能离不开NVIDIA显卡的加速。首先，检查你的驱动是否已安装：运行 nvidia-smi。如果未安装，可以通过以下命令自动安装推荐驱动 -1：

sudo apt updatesudo apt install ubuntu-drivers-commonsudo ubuntu-drivers autoinstall

安装完成后，重启电脑使驱动生效。

接下来，安装CUDA工具包。Instant-NGP需要CUDA 10.2或更高版本，推荐使用11.3至11.8之间的版本 -1。访问NVIDIA CUDA Toolkit Archive，选择对应Ubuntu 20.04的runfile版本进行下载和安装 -1-4。

# 以CUDA 11.6为例wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.runsudo sh cuda_11.6.0_510.39.01_linux.run

注意： 在安装界面中，务必取消勾选“Driver”选项，因为我们已经安装了驱动，避免冲突 -1。

安装后，编辑 ~/.bashrc 文件，添加环境变量：

export PATH="/usr/local/cuda-11.6/bin:$PATH"export LD_LIBRARY_PATH="/usr/local/cuda-11.6/lib64:$LD_LIBRARY_PATH"

执行 source ~/.bashrc 使其生效，并通过 nvcc --version 验证安装。

3. 安装CMake

Instant-NGP要求CMake版本不低于3.21 -1。如果系统自带的版本过低，需要手动安装最新版。

# 下载CMake安装脚本，请前往官网获取最新链接wget https://github.com/Kitware/CMake/releases/download/v3.29.0/cmake-3.29.0-linux-x86_64.shchmod +x cmake-3.29.0-linux-x86_64.shsudo sh cmake-3.29.0-linux-x86_64.sh --prefix=/usr/local --skip-license

4. 编译Instant-NGP

一切就绪，终于可以开始编译主角了。克隆仓库并构建项目 -1：

git clone --recursive https://github.com/nvlabs/instant-ngpcd instant-ngpcmake . -B build -DCMAKE_BUILD_TYPE=RelWithDebInfocmake --build build --config RelWithDebInfo -j

编译完成后，可以通过运行官方示例来验证安装是否成功：

./instant-ngp ./data/nerf/fox/

如果看到一个训练狐狸的图形界面，那么恭喜你，部署成功！

二、实战：用自己的数据集重建桌面场景

环境跑通后，我们进入最激动人心的环节——利用自己的数据实现桌面场景的三维重建。

1. 准备Python环境与依赖

为了更好的包管理，推荐使用Conda创建一个新环境 -1：

conda create -n ngp python=3.9conda activate ngp# 在instant-ngp根目录下安装Python依赖pip install -r requirements.txt

2. 数据采集：拍摄你的桌面

数据是三维重建的基石。使用你的手机或相机，围绕桌面物体（如玩偶、摆件、书本）匀速、平稳地拍摄一段视频。请务必注意以下几点以保证重建质量 -1-8：

光线充足均匀：避免阴影和过曝。
场景静止：拍摄对象不能移动。
覆盖全面：从多个角度完整覆盖整个场景，绕行一周是个好方法。
画面清晰：避免运动模糊，建议使用三脚架或稳定器。

3. 生成相机位姿（核心步骤）

神经辐射场（NeRF）需要知道每张图片是从哪个角度拍摄的。Instant-NGP提供了强大的脚本 colmap2nerf.py，可以自动从视频中抽帧并利用COLMAP计算相机位姿，生成 transforms.json 文件 -1。

将你的视频（例如命名为 desktop.mp4）放入 instant-ngp/scripts/ 目录下，然后执行：

python scripts/colmap2nerf.py --video_in desktop.mp4 --video_fps 2 --run_colmap --aabb_scale 16

参数说明：

--video_fps 2：每秒从视频中抽取2帧，通常获取50-150张图片即可 -1。
--aabb_scale：场景范围参数。对于桌面等小场景，通常设为16或32即可 -1。

脚本运行成功后，会在视频同级目录下生成一个包含图片和 transforms.json 的文件夹。这个 json 文件就是我们下一步训练的关键。

4. 训练与实时预览

现在，让我们见证奇迹的发生。在instant-ngp根目录下执行以下命令，开始训练你的桌面场景：

./instant-ngp ./path/to/your/dataset/

其中 ./path/to/your/dataset/ 应替换为包含 transforms.json 和 images 文件夹的路径。程序会打开一个图形窗口，你可以看到三维重建从模糊到清晰的全过程，通常只需几分钟就能得到一个不错的结果。

5. 导出Mesh模型

训练满意后，你可以将重建的NeRF模型导出为通用的三角网格文件，以便在其他软件（如Blender、MeshLab）中使用。在图形界面中：

点击右侧面板的 "Mesh it!" 按钮，系统开始从NeRF中提取网格。
提取完成后，点击 "Save it!" 按钮，即可将模型保存为 .obj 或 .ply 格式 -1。

总结

至此，我们已经成功在Ubuntu 20.04上完成了Instant-NGP的部署，并用自己的视频数据实现了桌面场景的三维重建。通过本次实战，我们可以看到，得益于多分辨率哈希编码等创新，曾经耗时良久的神经辐射场（NeRF）技术如今已变得触手可及。希望这篇教程能帮助你打开三维重建世界的大门，在你的研究和创作中发挥价值。