当前位置：首页 > 系统教程 > 正文

在Ubuntu上安装vLLM：完整指南

主机测评网
系统教程
2026-01-04
920

在Ubuntu上安装vLLM：完整指南

从GPU到CPU的三种方案详解

本教程将详细指导您在Ubuntu系统上安装vLLM，覆盖从GPU到CPU的三种方案。无论您是初学者还是经验丰富的用户，都能按照步骤轻松完成vLLM安装。vLLM是一个高性能的大语言模型推理和服务库，支持GPU加速和CPU部署，适用于各种硬件环境。

在Ubuntu上安装vLLM：完整指南 vLLM安装 Ubuntu教程 GPU加速 CPU部署第1张

在开始之前，请确保您的Ubuntu系统版本为18.04或更高，并已安装Python 3.8及以上。对于涉及GPU的方案，需要NVIDIA GPU和相应驱动。我们将从GPU方案开始，逐步过渡到CPU方案。

方案一：GPU安装vLLM（高性能方案）

此方案利用GPU加速实现最佳性能，适合拥有NVIDIA GPU的用户。请按照以下步骤操作：

更新系统包：打开终端，运行 sudo apt update && sudo apt upgrade -y。
安装CUDA工具包（如未安装）：参考NVIDIA官方指南安装CUDA 11.8或更高版本。
安装vLLM：运行 pip install vllm，这将自动安装GPU依赖。
验证安装：创建一个Python脚本测试vLLM是否能正常使用GPU推理。

完成以上步骤后，您已成功在Ubuntu上通过GPU安装vLLM，享受高速推理。这是最常见的vLLM安装方式。

方案二：混合安装（GPU到CPU过渡方案）

如果您计划从GPU环境迁移到CPU，此方案提供灵活性。先安装GPU版本，再添加CPU支持：

按照方案一完成GPU安装。
安装CPU附加依赖：运行 pip install "vllm[cpu]"，以扩展CPU功能。
配置环境变量：设置VLLM_DEVICE=cpu来切换到CPU模式。

这个混合方案适合需要在GPU和CPU之间切换的用户，确保CPU部署的兼容性。

方案三：纯CPU安装vLLM（无GPU方案）

对于没有GPU的Ubuntu系统，此方案提供纯CPU安装，虽然性能较低，但适用于测试或轻量级应用：

安装Python和pip：运行 sudo apt install python3-pip -y。
安装vLLM CPU版本：直接运行 pip install vllm[cpu]，无需GPU驱动。
验证安装：运行简单推理脚本确认vLLM在CPU上工作正常。

纯CPU方案简化了vLLM安装过程，是CPU部署的理想选择，尤其适合资源有限的环境。

总结与建议

通过本Ubuntu教程，您已经掌握了三种vLLM安装方案：从GPU高性能安装到混合过渡，再到纯CPU安装。根据您的硬件需求，选择合适方案——如果追求速度，使用GPU加速；如果硬件受限，采用CPU部署。无论哪种方式，都能在Ubuntu上成功运行vLLM。如有问题，请参考官方文档或社区支持。