当前位置：首页 > Centos > 正文

打造你的智能助手：CentOS语音识别系统搭建全攻略（从零开始部署开源语音识别环境）

主机测评网
Centos
2025-12-06
470

在人工智能快速发展的今天，语音识别已成为人机交互的重要方式。对于使用CentOS系统的用户来说，搭建一个本地化的语音识别系统不仅能提升工作效率，还能为物联网、智能家居等项目提供基础支持。本教程将手把手教你如何在CentOS 7/8上部署一个功能完整的开源语音识别环境，即使你是Linux新手也能轻松上手！

打造你的智能助手：CentOS语音识别系统搭建全攻略（从零开始部署开源语音识别环境） Centos语音识别 Linux语音识别系统 CentOS安装语音识别开源语音识别教程第1张

一、准备工作

在开始之前，请确保你有一台运行CentOS 7或CentOS 8的服务器或虚拟机，并具备以下条件：

系统已更新至最新状态
拥有sudo权限
至少2GB内存（推荐4GB以上）
麦克风设备（用于实时语音输入）

二、安装依赖环境

我们将使用Python生态中的Vosk作为语音识别引擎，它基于Kaldi，支持离线识别且准确率高。

首先，安装必要的系统依赖：

sudo yum update -ysudo yum install -y python3 python3-pip git alsa-lib-devel portaudio-devel

接着，升级pip并安装Python依赖：

pip3 install --upgrade pippip3 install vosk pyaudio

三、下载中文语音模型

Vosk支持多语言模型。这里我们以中文为例（你也可以根据需要选择英文或其他语言）：

mkdir -p ~/vosk-modelscd ~/vosk-modelswget https://alphacephei.com/vosk/models/vosk-model-small-zh-cn-0.22.zipunzip vosk-model-small-zh-cn-0.22.zipmv vosk-model-small-zh-cn-0.22 cn_model

该模型体积小（约50MB），适合普通应用场景。如需更高精度，可下载完整版模型（约1.4GB）。

四、编写语音识别脚本

创建一个Python脚本 speech_recognize.py：

import osimport sysfrom vosk import Model, KaldiRecognizerimport pyaudio# 指定模型路径MODEL_PATH = os.path.expanduser("~/vosk-models/cn_model")if not os.path.exists(MODEL_PATH):    print(f"请先下载模型到 {MODEL_PATH}")    sys.exit(1)# 加载模型model = Model(MODEL_PATH)rec = KaldiRecognizer(model, 16000)# 初始化音频流p = pyaudio.PyAudio()stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=8000)stream.start_stream()print("🎤 请开始说话（按 Ctrl+C 停止）...")try:    while True:        data = stream.read(4000, exception_on_overflow=False)        if rec.AcceptWaveform(data):            result = rec.Result()            print("识别结果：", result)except KeyboardInterrupt:    print("\n⏹️ 识别已停止")finally:    stream.stop_stream()    stream.close()    p.terminate()