欢迎阅读本教程!本文将手把手教你在Ubuntu 22.04系统上,通过拓展坞连接两块Tesla V100显卡,并成功安装NVIDIA驱动和CUDA 12.8。即使你是Linux新手,按照步骤操作也能顺利完成。
打开终端(Ctrl+Alt+T),执行以下命令更新软件源并安装必要的编译工具:
sudo apt update && sudo apt upgrade -ysudo apt install build-essential dkms gcc make linux-headers-$(uname -r) -y
Nouveau是开源的NVIDIA驱动,与官方驱动冲突,必须禁用:
echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.confecho "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.confsudo update-initramfs -u
重启系统:sudo reboot
访问NVIDIA官网(https://www.nvidia.com/Download/index.aspx)选择对应驱动:产品系列:Tesla,产品:V100,操作系统:Linux 64-bit,CUDA工具包:12.8(或最新)。下载NVIDIA驱动安装包,例如 NVIDIA-Linux-x86_64-550.xxx.run。也可直接使用wget:
wget https://us.download.nvidia.com/tesla/550.144.03/NVIDIA-Linux-x86_64-550.144.03.run
进入下载目录,给文件添加执行权限并运行安装:
chmod +x NVIDIA-Linux-x86_64-*.runsudo ./NVIDIA-Linux-x86_64-*.run --dkms
安装过程中选择“OK”接受协议,遇到“32-bit compatibility”建议选Yes,其余默认。安装完成后重启。
运行以下命令检查显卡状态:
nvidia-smi
如果显示两块Tesla V100的信息,说明驱动安装成功。如果只显示一块,检查拓展坞连接和供电。
CUDA 12.8提供了完整的开发环境。下载官方runfile安装包:
wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda_12.8.0_570.86.10_linux.run
运行安装:
sudo sh cuda_12.8.0_570.86.10_linux.run
注意:安装时不要选择安装驱动(因为已安装),仅勾选“CUDA Toolkit”和“CUDA Samples”。
编辑 ~/.bashrc 添加CUDA路径:
echo "export PATH=/usr/local/cuda-12.8/bin:$PATH" >> ~/.bashrcecho "export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH" >> ~/.bashrcsource ~/.bashrc
检查CUDA版本:
nvcc --version
编译并运行示例程序:
cd /usr/local/cuda-12.8/samples/1_Utilities/deviceQuerysudo make./deviceQuery
如果显示双卡信息,说明CUDA 12.8安装教程成功。
对于Tesla V100双卡配置,可以通过nvidia-smi查看两张卡的利用率。如果使用拓展坞,注意PCIe带宽可能成为瓶颈,建议监控实际性能。
sudo apt install gcc-12 并设置优先级。至此,你已经完成了Ubuntu 22.04安装NVIDIA驱动和拓展坞显卡设置,可以开始你的深度学习或科学计算任务了!如有问题欢迎留言交流。
本文由主机测评网于2026-02-17发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260225519.html