当前位置:首页 > 系统教程 > 正文

在Ubuntu上安装vLLM:完整指南

在Ubuntu上安装vLLM:完整指南

从GPU到CPU的三种方案详解

本教程将详细指导您在Ubuntu系统上安装vLLM,覆盖从GPU到CPU的三种方案。无论您是初学者还是经验丰富的用户,都能按照步骤轻松完成vLLM安装。vLLM是一个高性能的大语言模型推理和服务库,支持GPU加速和CPU部署,适用于各种硬件环境。

在Ubuntu上安装vLLM:完整指南 vLLM安装 Ubuntu教程 GPU加速 CPU部署 第1张

在开始之前,请确保您的Ubuntu系统版本为18.04或更高,并已安装Python 3.8及以上。对于涉及GPU的方案,需要NVIDIA GPU和相应驱动。我们将从GPU方案开始,逐步过渡到CPU方案。

方案一:GPU安装vLLM(高性能方案)

此方案利用GPU加速实现最佳性能,适合拥有NVIDIA GPU的用户。请按照以下步骤操作:

  1. 更新系统包:打开终端,运行 sudo apt update && sudo apt upgrade -y
  2. 安装CUDA工具包(如未安装):参考NVIDIA官方指南安装CUDA 11.8或更高版本。
  3. 安装vLLM:运行 pip install vllm,这将自动安装GPU依赖。
  4. 验证安装:创建一个Python脚本测试vLLM是否能正常使用GPU推理。

完成以上步骤后,您已成功在Ubuntu上通过GPU安装vLLM,享受高速推理。这是最常见的vLLM安装方式。

方案二:混合安装(GPU到CPU过渡方案)

如果您计划从GPU环境迁移到CPU,此方案提供灵活性。先安装GPU版本,再添加CPU支持:

  1. 按照方案一完成GPU安装。
  2. 安装CPU附加依赖:运行 pip install "vllm[cpu]",以扩展CPU功能。
  3. 配置环境变量:设置VLLM_DEVICE=cpu来切换到CPU模式。

这个混合方案适合需要在GPU和CPU之间切换的用户,确保CPU部署的兼容性。

方案三:纯CPU安装vLLM(无GPU方案)

对于没有GPU的Ubuntu系统,此方案提供纯CPU安装,虽然性能较低,但适用于测试或轻量级应用:

  1. 安装Python和pip:运行 sudo apt install python3-pip -y
  2. 安装vLLM CPU版本:直接运行 pip install vllm[cpu],无需GPU驱动。
  3. 验证安装:运行简单推理脚本确认vLLM在CPU上工作正常。

纯CPU方案简化了vLLM安装过程,是CPU部署的理想选择,尤其适合资源有限的环境。

总结与建议

通过本Ubuntu教程,您已经掌握了三种vLLM安装方案:从GPU高性能安装到混合过渡,再到纯CPU安装。根据您的硬件需求,选择合适方案——如果追求速度,使用GPU加速;如果硬件受限,采用CPU部署。无论哪种方式,都能在Ubuntu上成功运行vLLM。如有问题,请参考官方文档或社区支持。