当前位置：首页 > Ubuntu > 正文

Ubuntu语音识别系统部署（手把手教你搭建开源语音转文字环境）

主机测评网
Ubuntu
2025-12-06
790

在当今智能时代，Ubuntu语音识别技术正变得越来越重要。无论你是开发者、学生还是普通用户，掌握如何在Linux系统上部署一个基本的语音识别系统都能极大提升工作效率。本教程将带你从零开始，在Ubuntu系统中安装并配置一个简单但功能完整的开源语音识别系统，即使你是Linux小白也能轻松上手。

Ubuntu语音识别系统部署（手把手教你搭建开源语音转文字环境） Ubuntu语音识别 Linux语音助手开源语音识别系统 Ubuntu语音转文字第1张

准备工作

在开始之前，请确保你的Ubuntu系统满足以下条件：

Ubuntu 20.04 或更高版本（推荐使用22.04 LTS）
已连接麦克风并能正常录音
具备稳定的网络连接（用于下载依赖包）
拥有sudo权限

第1步：更新系统并安装基础依赖

首先打开终端（Ctrl + Alt + T），运行以下命令来更新系统并安装必要的工具：

sudo apt updatesudo apt upgrade -ysudo apt install -y python3-pip python3-venv portaudio19-dev libasound2-dev git

这些包包括Python虚拟环境支持、音频驱动开发库等，是后续安装语音识别库的基础。

第2步：创建Python虚拟环境

为了避免与其他Python项目冲突，建议使用虚拟环境：

mkdir ~/speech-recognitioncd ~/speech-recognitionpython3 -m venv venvsource venv/bin/activate

激活虚拟环境后，你会看到命令行前缀出现 (venv)，表示当前处于该环境中。

第3步：安装SpeechRecognition库

我们将使用Python中非常流行的 SpeechRecognition 库，它支持多种语音识别引擎（如Google Web Speech API、PocketSphinx等）。在本教程中，我们先使用离线的 PocketSphinx 引擎，无需联网即可实现Ubuntu语音转文字功能。

pip install SpeechRecognition pyaudio pocketsphinx

第4步：测试语音识别功能

创建一个简单的Python脚本进行测试：

cat > recognize.py << 'EOF'import speech_recognition as sr# 创建识别器对象r = sr.Recognizer()# 使用默认麦克风作为音频源with sr.Microphone() as source:    print("请说话...（5秒内）")    audio = r.listen(source, timeout=5)try:    # 使用 PocketSphinx 进行离线识别    text = r.recognize_sphinx(audio, language='zh-CN')    print("识别结果：", text)except sr.UnknownValueError:    print("无法理解语音")except sr.RequestError as e:    print("识别服务出错：", e)EOF

注意：如果你希望识别中文，请确保安装了中文语言模型。若未安装，可先用英文测试（将 language='zh-CN' 改为 language='en-US'）。