当前位置：首页 > Rust > 正文

深入Rust后缀自动机（Suffix Automaton）实现详解：从零构建高效字符串处理结构

主机测评网
Rust
2025-12-07
1070

在字符串处理领域，后缀自动机（Suffix Automaton）是一种强大而高效的工具，能够在线性时间内完成多种复杂操作，如子串查询、不同子串计数等。本文将手把手教你使用 Rust语言 实现一个功能完整的后缀自动机，即使你是编程新手也能轻松理解！

深入Rust后缀自动机（Suffix Automaton）实现详解：从零构建高效字符串处理结构 Rust后缀自动机字符串算法 Rust编程教程后缀自动机实现第1张

什么是后缀自动机？

后缀自动机是一种有限状态自动机，它能识别给定字符串的所有后缀。更神奇的是，它还能识别该字符串的所有子串！它的核心优势在于：

空间复杂度为 O(n)，其中 n 是字符串长度
构建时间复杂度也是 O(n)
支持快速子串存在性判断、不同子串数量统计等操作

这些特性使得Rust后缀自动机成为高性能字符串算法中的明星结构。

Rust实现思路

我们将采用经典的在线增量构建方法。每个状态节点包含以下信息：

len：该状态能表示的最长字符串长度
link：后缀链接（suffix link），指向另一个状态
next：字符到状态的转移映射

完整代码实现

下面是一个完整的、可运行的 Rust 后缀自动机实现：

#[derive(Default)]pub struct State {    len: usize,    link: Option,    next: [Option; 26], // 假设只处理小写英文字母}pub struct SuffixAutomaton {    states: Vec,    last: usize,}impl SuffixAutomaton {    pub fn new() -> Self {        let mut states = Vec::new();        states.push(State::default()); // 初始状态        Self { states, last: 0 }    }    pub fn extend(&mut self, c: char) {        let c_idx = (c as u8 - b'a') as usize;        let cur = self.states.len();        self.states.push(State {            len: self.states[self.last].len + 1,            link: None,            next: Default::default(),        });        let mut p = self.last;        while p != 0 && self.states[p].next[c_idx].is_none() {            self.states[p].next[c_idx] = Some(cur);            p = self.states[p].link.unwrap_or(0);        }        if p == 0 {            self.states[cur].link = Some(0);        } else {            let q = self.states[p].next[c_idx].unwrap();            if self.states[p].len + 1 == self.states[q].len {                self.states[cur].link = Some(q);            } else {                let clone = self.states.len();                self.states.push(State {                    len: self.states[p].len + 1,                    link: self.states[q].link,                    next: self.states[q].next,                });                while p != 0 && self.states[p].next[c_idx] == Some(q) {                    self.states[p].next[c_idx] = Some(clone);                    p = self.states[p].link.unwrap_or(0);                }                self.states[q].link = Some(clone);                self.states[cur].link = Some(clone);            }        }        self.last = cur;    }    // 计算不同子串的数量    pub fn count_distinct_substrings(&self) -> usize {        let mut total = 0;        for i in 1..self.states.len() {            total += self.states[i].len - self.states[self.states[i].link.unwrap()].len;        }        total    }}// 使用示例fn main() {    let mut sam = SuffixAutomaton::new();    for c in "abcbc".chars() {        sam.extend(c);    }    println!("不同子串数量: {}", sam.count_distinct_substrings());}