在计算机科学中,KMP算法(Knuth-Morris-Pratt算法)是一种高效的字符串查找算法,用于在一个主串(文本)中快速查找一个子串(模式)的位置。与暴力匹配不同,KMP算法通过预处理模式串,避免了不必要的回溯,从而将时间复杂度从 O(n×m) 降低到 O(n+m),其中 n 是主串长度,m 是模式串长度。
本教程将用通俗易懂的方式,带你从零开始理解并用 C语言实现KMP算法,即使是编程小白也能轻松掌握!
假设我们要在字符串 "ABABDABACDABABCABCABC" 中查找子串 "ABABC"。如果使用暴力匹配(逐个字符比较,失败就回退),一旦匹配失败,主串指针就要回退,效率很低。
而 KMP算法 的核心思想是:当发生不匹配时,利用已匹配部分的信息,让模式串“滑动”到下一个可能匹配的位置,**主串指针不回退**,从而提升效率。

KMP算法的核心是 next 数组(也叫部分匹配表)。它记录了模式串中每个位置之前的子串的“最长相等前后缀长度”。
例如,模式串 "ABABC":
下面我们用 C 语言完整实现 KMP 算法,包括 getNext 函数和 kmpSearch 函数。
#include <stdio.h>#include <string.h>// 构建 next 数组void getNext(char* pattern, int* next) { int len = strlen(pattern); next[0] = -1; // 通常设为 -1,便于后续处理 int i = 0, j = -1; while (i < len - 1) { if (j == -1 || pattern[i] == pattern[j]) { i++; j++; next[i] = j; } else { j = next[j]; } }}// KMP 主搜索函数int kmpSearch(char* text, char* pattern) { int textLen = strlen(text); int patLen = strlen(pattern); if (patLen == 0) return 0; int* next = (int*)malloc(sizeof(int) * patLen); getNext(pattern, next); int i = 0, j = 0; while (i < textLen && j < patLen) { if (j == -1 || text[i] == pattern[j]) { i++; j++; } else { j = next[j]; } } free(next); if (j == patLen) { return i - j; // 返回首次匹配位置 } return -1; // 未找到}// 测试函数int main() { char text[] = "ABABDABACDABABCABCABC"; char pattern[] = "ABABC"; int pos = kmpSearch(text, pattern); if (pos != -1) { printf("模式串在主串中的位置: %d\n", pos); } else { printf("未找到匹配的子串\n"); } return 0;}getNext 函数使用双指针技巧构建 next 数组,时间复杂度 O(m)。kmpSearch 函数利用 next 数组进行匹配,主串指针 i 从不回退,时间复杂度 O(n)。通过本教程,你已经掌握了 KMP算法 的基本原理和 C语言字符串匹配 的完整实现。KMP 是面试和实际开发中非常重要的 字符串查找算法,尤其适用于大文本中的模式匹配场景。
记住,理解 next 数组的构建逻辑是掌握 KMP 的关键。多动手写几遍代码,加深理解!
希望这篇关于 模式匹配优化 的教程对你有帮助!
本文由主机测评网于2025-12-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/2025125874.html