kmp算法的简单介绍
从主串中快速找到与要找的串的相同位置
如果使用暴力算法去求解这个问题,时间复杂度为O(i*j) => 很大
kmp算法则是对这类问题的优化
因整理过于麻烦,,详细的介绍可以参照这篇博客,,花时间看完就明白了,写的很棒!!!
kmp算法详细介绍
下面是自己学习的一些注意的地方,主要是针对于代码模版来讲解。
next[i]的介绍
以i为终点的后缀和从1开始的前缀相等,并且保证后缀的长度最长
ex: next[ i ] = j
p[ 1 , j] = p[ i - j + 1,i]
//p数组中从1到j这一段与 从i-j+1到i这一段相等
当上面数组移动到S[i] 下面移动到p[j + 1]的时候,s[i] != p[j+1]
此时就要将 红颜色的线从前往后移动 要计算的是 从前往后最少需要移动多少 直接调用next[j]
移动完成之后 就变成第三段线段 从原本的j变成next[j]
然后就继续比较next[j]下面一位跟s[i]
最终就一直递归上面的操作 直到完全匹配为止
代码分析:
1、kmp匹配的过程
// j=1定义是因为 在比较的时候一直是p[j] 与 s[i+1]进行比较
//所以j要多加一个1去错位for (int i = 1, j = 0; i <= m; i++){// while(j)的意思是j没有退回到起点 //j如果退回到起点(j == 0)含义就是需要重新开始匹配//s[i] != p[j+1] 出现不匹配的数字while(j && s[i] != p[j+1]) j = ne[j];//while循环结束有两种条件 //一个是j退回到了起点 //第二个是成功匹配了//如果他们两个已经匹配了,j就可以移动到下一个位置if(s[i] == p[j+1]) j++;if(j == n){//3.匹配成功}
}
2、求next过程
跟第一个线段的绿色点位置进行比较
如果不同,则j = ne[j] 仍然不相同就 j = ne[ne[j]]
一直匹配到相等为止
//next[1]不需要去注意 因为j是从0开始的
//如果next[1] 中的q前面只有一个数 也就是说next[1] == 》 p[0] for (int i = 2, j = 0; i <= n; i++){while (j && p[i] != p[j + 1]) j = ne[j];if (p[i] == p[j + 1]) j++;ne[i] = j;}
3、匹配成功的操作
//输出起始位置printf("%d ",i - n);j = ne[j];
kmp字符串题目
给定一个字符串 S,以及一个模式串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 P 在字符串 S 中多次作为子串出现。
求出模式串 P 在字符串 S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N,表示字符串 P 的长度。
第二行输入字符串 P。
第三行输入整数 M,表示字符串 S 的长度。
第四行输入字符串 S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤N≤1e5
1≤M≤1e6
输入样例:
3
aba
5
ababa
输出样例:
0 2
#include <iostream>using namespace std;
const int N = 10010, M = 100010;int n, m;
//
char p[N], s[M];
int ne[N];int main()
{// p + 1 跟 s + 1 表示下标从1开始cin >> n >> p + 1 >> m >> s + 1;//求next数组的过程for (int i = 2, j = 0; i <= n; i++){while (j && p[i] != p[j + 1]) j = ne[j];if (p[i] == p[j + 1]) j++;ne[i] = j;}//kmp的匹配过程// i是为了遍历s数组// j是从0开始做,每一次试图往前走,看能否走通for (int i = 1, j = 0; i <= m; i++){//j能否往后退 ,可以后退调用 j = ne[j] while (j && s[i] != p[j + 1]) j = ne[j];//不能后退了之后还是不能走 条件都没有满足 i++ 看s串的下一个位置if (s[i] == p[j + 1]) j++;if (j == n){//匹配完成//输出起始位置printf("%d ",i - j);j = ne[j];}}return 0;
}