文章目录
- 找出字符串中第一个匹配项的下标 leetcode28 串的模式匹配问题
- 暴力求解
- 使用KMP模式匹配算法
- KMP算法简述
- KMP算法的代码实现
找出字符串中第一个匹配项的下标 leetcode28 串的模式匹配问题
暴力求解
func strStr(haystack string, needle string) int {
L := len(needle)
Cap := len(haystack)H := []byte(haystack)
N := []byte(needle)for i, val := range H {if val == N[0] {
if i+L <= Cap && haystack[i:i+L] == needle {
return i
}
}
}
return -1
}
使用KMP模式匹配算法
KMP算法简述
当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。
其主要的用途就是查找字符串,从主字符串中寻找模式字符串。
其相比暴力解法,时间复杂度从O(mXn)》O(m+n)
所以如何记录已经匹配的文本内容,是KMP的重点,也是next数组肩负的重任。
什么叫字符串的前缀后缀?
对于字符串ababc
来说,它的前缀有[a,ab,aba,abab]
,也就是以字符串第一个字符作为开头,同时不包括最后一个字符的所有子串,
同理它的后缀有[c,bc,abc,babc]
,也就是以字符串最后一个字符作为结尾,同时不包括第一个字符的所有字串。
- 思路分析
当我们进行字符串匹配时,假如第一次匹配失败时如图所示
第4个字母不一致,但前三个字母是一致的,那么当我们继续寻找时,没有必要再从第一个字母开始对应
为什么我们能看出不从第一个字母进行对应呢?
续接我们提到的前后缀的概念,前三个字符为aba,则前缀为a,ab
后缀为 a,ba
,二者之中最长的相等的部分为a
,一般称这个最长的部分为最长公共前后缀
由此,我们第一个字母a
就没有必要再进行比较,直接从第2个字母开始进行比较即可
那么,从这里我们又能够发现,下次从第几个数字开始进行比较,只跟这次重复的子串有关系,
因此我们可以对模式字符串建立一个数组,分别记录当第几个开始不对应时,下次从第几个再开始比较,也就是常说的next
2. next
数组(前缀表)
前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。
- 使用
next
数组来进行匹配
以下我们以前缀表统一减一之后的next数组来做演示。
有了next数组,就可以根据next数组来 匹配文本串s,和模式串t了。
注意next数组是新前缀表(旧前缀表统一减一了)。
这里借用代码随想录中的gif来示意:
KMP算法的代码实现
思路可以参考这篇文章
- 计算next数组
// 此函数用来初始化next数组
func initNext(needle string) []int {//后缀中末尾 abc中ci := 1//前缀中末尾;同时在这里也有着记录最长公共串长度的作用,二者本质是一样的j := 0L := len(needle)//初始化next数组;next[0]默认为0,因为对于一个字母我们不认为其具有前后缀,后续也不会再对next[0]进行赋值next := make([]int, L)//求next数组过程中,我们的i不回退,采用类似于动态规划的思想,也是我们这里的循环条件for i < L {//如果前后缀匹配if needle[i] == needle[j] {//前缀末尾向后移一位,同时代表长度+1j++//当前后缀末尾所在位置的最长子串即为j//最长子串是有基础的,如果next[2]=2,那么next[3]的可能性为3或者0,这里是为3的情况next[i] = j//后缀末尾向后移一位i++} else { //如果前后缀不匹配//当j>0,说明仍旧处于回退的过程if j > 0 {j = next[j-1]} else { //如果j=0,并且前后缀依旧不匹配,则长度计数应该重新从0开始//这里是为0的情况next[i] = j//后缀末尾向后移i++}}}//返回next数组return next
}
- 利用next数组进行字符串的匹配
// kmp算法,用空间换时间
func strStr(haystack string, needle string) int {//获取next数组next := initNext(needle)//主串长度L := len(haystack)//目标匹配长度,即needle的长度target := len(needle)//匹配字符串中指针位置j := 0//i为主串中指针的位置for i := 0; i < L; {// 如果匹配上了if haystack[i] == needle[j] {if j == target-1 {return i - target + 1}j++i++} else { //如果没匹配上//跟计算next数组有异曲同工之妙if j > 0 {j = next[j-1]} else {i++}}}return -1
}