串的匹配应用十分广泛,比如搜索引擎、拼写检查、语言翻译、数据压缩等等,都需要进行串的匹配。 串的模式匹配设有两个字符串 S 和 T ,设 S 为主串(正文串),T 为子串(模式),在主串 S 中查找与模式 T 相匹配的子串,如果匹配成功,确定相匹配的子串中第一个字符在主串 S 中出现位置。下面介绍两种算法:BF 算法和 KMP 算法。
1、分别利用计数指针 i 和 j 指示主串 S 和 模式 T 中当前待比较的字符位置。 2、如果比较未到结尾,则循环执行以下操作: ① S.ch[ i ] 和 T.ch[ j ] 比较,若相等,则 i++; j++; 继续比较后续字符。 ② 若不等,指针后退重新匹配,从主串的下一个字符(i = i - j + 2)起再重新和模式的第一个字符(j = 1)比较。 3、如果 j > T.length,说明匹配成功,返回和模式 T 第一个字符相等的字符在主串中的序号(i - T.length),否则失败,返回0。 该算法的时间复杂度为 O(m × n)
#include<stdio.h> #include<stdlib.h> #include<string.h> #define MAXSIZE 20 typedef struct { // 定义数组存储字符串 char ch[MAXSIZE+1]; int length; }String; int index_BF(String S, String T); int main() { int flag; String S, T; printf("请输入主串S:"); gets(S.ch + 1); S.length = strlen(S.ch+1); S.ch[0] = (char)S.length; printf("请输入模式串T:"); gets(T.ch + 1); T.length = strlen(T.ch+1); T.ch[0] = (char)T.length; flag = index_BF(S, T); if (flag) printf("匹配成功,在第%d位。\n", flag); else printf("匹配失败,未找到该子串。\n"); } int index_BF(String S, String T) // BF算法 { int i = 1,j = 1; while (i <= S.length && j <= T.length) // 两串均未到达串尾 { if (S.ch[i] == T.ch[j]) { i++; j++; } // 继续向后匹配字符 else { i = i - j + 2; j = 1;} // 若不相等,回溯 } if (j > T.length) return i - T.length; else return 0; }此算法的改进在于,每当每当匹配过程中出现字符比较不相等时,不需要回溯 i 指针,而是利用已经得到的 “部分匹配” 的结果将模式向右 “滑动” 尽可能远的一段距离,继续进行比较。而滑动的具体距离,由 get_next 函数确定,具体原理不再描述。 时间复杂度为 O(m + n),较BF算法有很大提升。
#include<stdio.h> #include<stdlib.h> #include<string.h> #define MAXSIZE 20 typedef struct { // 定义数组存储字符串 char ch[MAXSIZE + 1]; int length; }String; int index_KMP(String S, String T, int next[]); void get_next(String T, int next[]); int main() { int flag; int next[MAXSIZE] = {0}; String S, T; printf("请输入主串S:"); gets(S.ch + 1); S.length = strlen(S.ch + 1); S.ch[0] = (char)S.length; printf("请输入模式串T:"); gets(T.ch + 1); T.length = strlen(T.ch + 1); T.ch[0] = (char)T.length; get_next(T, next); flag = index_KMP(S, T, next); if (flag) printf("匹配成功,在第%d位。\n", flag); else printf("匹配失败,未找到该子串。\n"); } void get_next(String T, int next[]) { int j = 0, i = 1; next[1] = 0; while (i < T.length) { if (j==0 || T.ch[i] == T.ch[j]) { i++; j++; next[i] = j; } else j = next[j]; } } int index_KMP(String S, String T, int next[]) { int i = 1, j = 0; while (i <= S.length && j <= T.length) { if (j == 0 || S.ch[i] == T.ch[j]) { i++; j++; } else j = next[j]; } if (j > T.length) return i - T.length; else return 0; }