当前位置：首页 > Python > 正文

高效数据序列化利器：Python Protocol Buffers 入门详解（小白也能轻松上手的 protobuf 教程）

主机测评网
Python
2025-12-10
1057

在现代软件开发中，如何高效、安全地在不同系统之间传输结构化数据是一个常见问题。这时候，Protocol Buffers（简称 Protobuf）就派上了大用场！Protobuf 是 Google 开发的一种高效数据交换格式，它比 JSON 和 XML 更小、更快，非常适合用于微服务通信、配置文件、日志记录等场景。

本教程将带你从零开始学习如何在 Python 中使用 Protocol Buffers，即使你是编程新手，也能轻松掌握！

高效数据序列化利器：Python Protocol Buffers 入门详解（小白也能轻松上手的 protobuf 教程） Python 教程序列化高效数据交换格式第1张

一、什么是 Protocol Buffers？

Protocol Buffers 是一种与语言无关、平台无关的可扩展机制，用于序列化结构化数据。你只需定义一次数据结构（通过 .proto 文件），就可以用生成的源代码轻松地在各种语言（如 Python、Java、C++ 等）中读写这些结构化数据。

二、安装 Protocol Buffers 编译器和 Python 库

首先，你需要安装两个东西：

protoc：Protocol Buffers 的编译器（用于将 .proto 文件转换为 Python 代码）
protobuf Python 包：提供运行时支持

在 macOS 上使用 Homebrew 安装 protoc：

brew install protobuf

在 Ubuntu/Debian 上：

sudo apt-get install protobuf-compiler

然后安装 Python 的 protobuf 库：

pip install protobuf

三、定义你的第一个 .proto 文件

假设我们要定义一个“用户”数据结构，包含姓名、年龄和邮箱。创建一个名为 user.proto 的文件：

syntax = "proto3";package tutorial;message User {  string name = 1;  int32 age = 2;  string email = 3;}

说明：

syntax = "proto3"; 表示使用 proto3 语法（最新且最简洁）
message 类似于类或结构体
每个字段都有一个唯一的数字标签（如 =1, =2），用于二进制编码，不可重复

四、编译 .proto 文件生成 Python 代码

在终端中运行以下命令：

protoc --python_out=. user.proto

这会在当前目录生成一个 user_pb2.py 文件，里面包含了可直接在 Python 中使用的类。

五、在 Python 中使用生成的代码

现在，我们来创建、序列化和反序列化一个 User 对象：

from user_pb2 import User# 创建 User 实例user = User()user.name = "张三"user.age = 28user.email = "zhangsan@example.com"# 序列化为二进制字节serialized_data = user.SerializeToString()print("序列化后的数据（字节）:", serialized_data)# 反序列化new_user = User()new_user.ParseFromString(serialized_data)print("反序列化结果:")print(f"姓名: {new_user.name}")print(f"年龄: {new_user.age}")print(f"邮箱: {new_user.email}")

运行这段代码，你会看到成功打印出用户信息！这就是 Python Protocol Buffers 的基本用法。