当前位置：首页 > Rust > 正文

用Rust玩转博弈论（从零开始实现经典博弈模型）

主机测评网
Rust
2025-12-03
404

你是否曾好奇两个理性人如何在竞争或合作中做出最优决策？这正是博弈论研究的核心。而使用现代系统编程语言 Rust 来实现博弈论算法，不仅能高效运行，还能借助其内存安全特性避免常见错误。本教程将带你从零开始，用 Rust 实现一个经典的“囚徒困境”博弈模型，并解释其中的关键概念——纳什均衡。

用Rust玩转博弈论（从零开始实现经典博弈模型） Rust博弈论纳什均衡 Rust算法实现策略交互模拟第1张

什么是博弈论？

博弈论是研究多个决策者（称为“参与者”）在相互影响的环境中如何做出策略选择的数学理论。它广泛应用于经济学、政治学、人工智能甚至生物学。

一个经典例子是“囚徒困境”：两名共犯被分开审讯，每人有两个选择——坦白或沉默。收益矩阵如下：

双方都沉默 → 各判1年
一方坦白，另一方沉默 → 坦白者释放，沉默者判10年
双方都坦白 → 各判5年

在这个博弈中，无论对方怎么做，自己“坦白”总是更优（即占优策略），最终双方都坦白，形成纳什均衡——没有人愿意单方面改变策略的状态。

为什么用 Rust 实现？

Rust 提供了零成本抽象、内存安全和并发无畏等特性，非常适合构建高性能的模拟系统。此外，Rust 的类型系统能帮助我们在编译期就捕获逻辑错误，这对实现复杂的Rust算法实现非常有帮助。

动手：用 Rust 模拟囚徒困境

我们将创建一个简单的程序，让两个玩家根据策略进行多轮博弈，并统计结果。

首先，在终端中创建新项目：

cargo new prisoner_dilemmacd prisoner_dilemma

然后，编辑 src/main.rs 文件：

#[derive(Debug, Clone, Copy)]enum Action {    Cooperate, // 沉默（合作）    Defect,    // 坦白（背叛）}fn payoff(p1: Action, p2: Action) -> (i32, i32) {    match (p1, p2) {        (Action::Cooperate, Action::Cooperate) => (-1, -1),        (Action::Cooperate, Action::Defect)    => (-10, 0),        (Action::Defect, Action::Cooperate)    => (0, -10),        (Action::Defect, Action::Defect)       => (-5, -5),    }}// 简单策略：总是背叛fn always_defect() -> Action {    Action::Defect}// 另一策略：总是合作fn always_cooperate() -> Action {    Action::Cooperate}fn main() {    let mut score1 = 0;    let mut score2 = 0;    let rounds = 10;    for _ in 0..rounds {        let a1 = always_defect();        let a2 = always_cooperate();        let (s1, s2) = payoff(a1, a2);        score1 += s1;        score2 += s2;    }    println!("玩家1总得分: {}", score1);    println!("玩家2总得分: {}", score2);    println!("\n这体现了策略交互模拟的核心思想：不同策略组合产生不同结果。");}

运行程序：

cargo run

输出应为：

玩家1总得分: 0玩家2总得分: -100

可以看到，“总是背叛”的策略完胜“总是合作”，这正是囚徒困境的残酷之处。

进阶：寻找纳什均衡

在双人有限博弈中，纳什均衡可通过检查每个策略组合是否满足“无人愿单方面偏离”来确定。我们可以扩展程序，自动检测均衡点：

fn is_nash_equilibrium(a1: Action, a2: Action) -> bool {    // 检查玩家1是否想改变    let current_payoff1 = payoff(a1, a2).0;    let alternative_payoff1 = payoff(        if a1 == Action::Cooperate { Action::Defect } else { Action::Cooperate },        a2    ).0;    // 检查玩家2是否想改变    let current_payoff2 = payoff(a1, a2).1;    let alternative_payoff2 = payoff(        a1,        if a2 == Action::Cooperate { Action::Defect } else { Action::Cooperate }    ).1;    current_payoff1 >= alternative_payoff1 && current_payoff2 >= alternative_payoff2}// 在 main 函数中添加：println!("(Defect, Defect) 是纳什均衡吗？{}",          is_nash_equilibrium(Action::Defect, Action::Defect));

运行后你会发现，只有 (Defect, Defect) 返回 true，验证了它是唯一的纳什均衡。