当前位置：首页 > Java > 正文

Rabin-Karp算法详解（Java语言实现字符串匹配的高效哈希方法）

主机测评网
Java
2025-12-12
1094

在计算机科学中，Rabin-Karp算法是一种用于字符串匹配的经典算法。它巧妙地结合了哈希算法的思想，使得在文本中查找模式串变得高效且易于理解。本教程将带你从零开始，用Java语言一步步实现 Rabin-Karp 算法，即使你是编程小白，也能轻松掌握！

什么是 Rabin-Karp 算法？

Rabin-Karp 算法由 Michael O. Rabin 和 Richard M. Karp 在 1987 年提出。它的核心思想是：通过计算模式串（pattern）的哈希值，并在文本（text）中滑动窗口，逐个计算子串的哈希值进行比对。如果哈希值相同，再逐字符验证是否真正匹配，从而减少不必要的比较。

Rabin-Karp算法详解（Java语言实现字符串匹配的高效哈希方法） Rabin-Karp算法字符串匹配 Java实现哈希算法第1张

为什么使用哈希？

直接逐字符比较每个位置的时间复杂度为 O(nm)，其中 n 是文本长度，m 是模式串长度。而 Rabin-Karp 利用滚动哈希（rolling hash），可以在 O(1) 时间内更新窗口的哈希值，从而将平均时间复杂度优化到 O(n + m)。

Java 实现步骤

我们将按以下步骤实现：

选择一个合适的基数（base）和模数（prime modulus）
计算模式串的哈希值
计算文本中第一个窗口的哈希值
滑动窗口，利用滚动哈希快速更新哈希值
当哈希值匹配时，进行字符级验证

完整 Java 代码示例

public class RabinKarp {    // 基数，通常取一个大于字符集大小的质数    private static final int BASE = 256;    // 大质数，用于防止哈希溢出    private static final long PRIME = 1000000007;    public static void search(String pattern, String text) {        int m = pattern.length();        int n = text.length();        // 如果模式串比文本还长，直接返回        if (m > n) {            return;        }        // 计算 BASE^(m-1) % PRIME，用于滚动哈希        long h = 1;        for (int i = 0; i < m - 1; i++) {            h = (h * BASE) % PRIME;        }        // 计算模式串和文本前 m 个字符的哈希值        long patternHash = 0;        long textHash = 0;        for (int i = 0; i < m; i++) {            patternHash = (patternHash * BASE + pattern.charAt(i)) % PRIME;            textHash = (textHash * BASE + text.charAt(i)) % PRIME;        }        // 滑动窗口遍历文本        for (int i = 0; i <= n - m; i++) {            // 如果哈希值匹配，再逐字符验证            if (patternHash == textHash) {                boolean match = true;                for (int j = 0; j < m; j++) {                    if (text.charAt(i + j) != pattern.charAt(j)) {                        match = false;                        break;                    }                }                if (match) {                    System.out.println("Pattern found at index: " + i);                }            }            // 更新滚动哈希（移除最左字符，添加新字符）            if (i < n - m) {                textHash = (BASE * (textHash - text.charAt(i) * h) + text.charAt(i + m)) % PRIME;                // 防止负数                if (textHash < 0) {                    textHash += PRIME;                }            }        }    }    // 测试示例    public static void main(String[] args) {        String text = "ABABCABABA";        String pattern = "ABABA";        search(pattern, text);    }}