重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
O(m * n)
复杂度,就有了K姓大佬,M姓大佬,P姓大佬设计出来的一套O(n + m)
字符串查找算法;于是他们的名字被载入史册,且这套算法被命名为KMP算法刚接触KMP算法时,你大概会觉得这个算法非常诡异,一波诡异的操作处理后生成了一个next
数组,又一波诡异的遍历操作后,就找到了目标位置(???WTF);
代码倒是不长,每个单词都认识,但是放一块就不认识了,像极了四级英语阅读。。
首先你需要知道大前后缀是什么;
以下图为例:在箭头位置上,它的前置大前后缀为abb
以下图为例:在箭头位置上,它的前置大前后缀为abbsab
看到这里你可能会有疑惑,大前后缀的规则是什么?下面简单进行一个总结:
abbsabb
(s以前的所有字符),图二中大前后缀不能取b以前的所有字符,那样的话就失去了它的意义。ab
、abbsabb
,我们需要取其中较大的那个。next
数组next
数组专门用于保存字符串的每个位置之前,它的大前后缀长度
比如在刚刚的那个字符串所对应的next
数组
再举一个例子:
它的每个位置,都记录着在它位置之前的子串中的大前后缀长度。
至于next
数组是哪里来的,有什么用?会放在后面讲。
这里先展示一下如何使用大前后缀
比如有字符串str1
和str2
,要求在str1
中查找str2
位置;(这里的字符串跟上面关于next
讲解的部分的没关系,千万不要搞混了)
首先假设我们已经得到了str2
的正确的next
数组
那么我们怎么通过已知的信息来对暴力解法进行优化呢?
经过之前7个字符的比较,指针顺利来到了s
位置
此时发现该位置两个该位置不匹配,那咋办?
此时我们已经知道了str2
的next
数组中,x
位置上的前置子串大前后缀长度为3
那这是不是代表,我把str2
字符串向前移到相对应得位置,那么此时str1
和str2
得前缀依然是匹配上了:
这一步,过滤了暴力解法的主串指针回溯过程
那么为什么可以这么跳过呢?
主要分两个证明:
问题一自不用说,肉眼可见,下面主要证明步骤2;为什么经过区间一定不含可能匹配的存在
next
数组中的已求得数据不符,所以该结论不成立。跳跃到哪个位置将由next
数组决定,next
数组与str2
共用一个下标,需要查询前缀位置直接在next
的对应下标位置寻找
例如下图中,在箭头位置 首次匹配失败,通过直接查询next
数组中x
的对应位置找到需要跳转的下标。
这里还匹配失败如下图:
那么这里就再次进行跳转,跳转到0位置继续匹配
如果str2
指针已经跳到0位置,还匹配失败的话,就挪动主串指针:
以上就是主串的整个匹配过程。
计算可得:这个过程的大时间复杂度不超过O(2 * N)
int strStr(string str1, string str2) {vectornext;
func(next, str2); //求next数组
int idx1 = 0;
int idx2 = 0;
while(idx1< str1.size())
{if(str1[idx1] == str2[idx2]) //匹配上就两个指针一起往下走
{idx1++;
idx2++;
if(idx2 == str2.size())
{return idx1 - idx2;
}
}
else if(idx2 == 0) //没匹配上而且idx2在0位置
{idx1++;
}
else{ //没匹配上 idx2不在0位置
idx2 = next[idx2];
}
}
return -1;
}
三、求next
数组next
数组所用的是经典的动态规划过程,简单来说就是两个指针一个在头部找前缀,一个指针在尾部找后缀。O(m ** 2)
,那么在某些极端情况下,整个算法的时间复杂度会涨到O(n ** 2)
我不论如何,先给next数组填一个0
为啥这么做呢?是因为下标0位置不包含前缀,而且这一位也不会被访问到,我们真正开始计算next
数组是从1号下标开始。
创建两个指针,分别寻找前缀和后缀,这里用颜色区分。
第一步发现:两个字符相等,那么都自增,后缀位置next
数组内填(前缀指针下标 + 1)
即(0 + 1)
第二步发现:还相等,重复上过程
第三步发现:她两不相等,那么就通过已知大前缀数来找到需要跳转到的位置:next[1]
== 1
第四步发现:她两还不相等,那么通过已知大前缀数来找到需要跳转到的位置:next[0] == 0
此时发现她两还不相等,但是 前缀下标已经走到了0
位置, 所以说明s
位置不存在任何可以匹配的相等前后缀,就给该位置赋0
然后后缀指针自增
继续重复上述过程:
以上就是整个next
数组的求解过程,主要采用动态规划的形式,以类似主逻辑的方式将整个next
数组求解。
next
数组的最前一位和最后一位都用不到,逻辑上next
数组第0
位必须存在,最后一位可以不存在class Solution {//求next 数组
void func(vector& next, string& str2)
{next.resize(0);
next.push_back(0);
int idx1 = 1;
int idx2 = 0;
while(idx1< str2.size())
{//相等则next填充,两指针自增
if(str2[idx1] == str2[idx2])
{next.push_back(++idx2);
idx1++;
}//格式串在最左部,
else if(idx2 == 0)
{next.push_back(0);
idx1++;
}
else{//可以向前找
idx2 = next[idx2 - 1];
}
}
}
public:
int strStr(string str1, string str2) {vectornext;
func(next, str2); //求next数组
int idx1 = 0;
int idx2 = 0;
while(idx1< str1.size())
{if(str1[idx1] == str2[idx2]) //匹配上就两个指针一起往下走
{idx1++;
idx2++;
if(idx2 == str2.size())
{return idx1 - idx2;
}
}
else if(idx2 == 0) //没匹配上而且idx2在0位置
{idx1++;
}
else{ //没匹配上 idx2不在0位置
idx2 = next[idx2];
}
}
return -1;
}
}
你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧