最近在看《大话数据结构》,在串这章中,讲到关于KMP算法。其中关于在一直前j个next值,如何求得j+1的值,有个公式一直不是很理解,后来查了下资料,终于搞懂了。
这是知乎上一位的讲解,我觉得比较清楚:
模式字符串记为P(下标从0开始),next[q] = k 表示 P[q]之前的子串中,存在长度为k的相同前缀和后缀,即P[0]~P[k-1]与P[q-k]~P[q-1]依次相同。如果P[k] = P[q],那么next[q+1] = k+1,此时表示 P[q+1]之前的子串中,存在长度为k+1的相同前后缀,这应该不成问题。下面贴张图详细表示:如果P[k] != P[q],那么说明next[q+1] 不会是 k+1,也就是说P[q+1]之前的子串中,不会存在长度为k+1的相同前后缀。那么我们就要去寻找长度更短的相同前后缀,假设长度为j,此时P[0]~P[j-1]和P[q-j]~P[q-1]依次相同。下面再贴张图:
接着我们比较P[q]和P[j]是否相同,如果相同,则next[q+1] = j+1;如果不同,则按照k = next[k]递归查找。说到这,大家应该可以看出这里的 j = next[k]。如果还不明白,看看next数组的定义,next[k] = j 表示 P[k]之前的子串中,存在长度为j的相同前后缀。从图2可以看出,P[0]~P[j-1]和P[k-j]~P[k-1]是依次相同的。 参考文章: July的 从头到尾彻底理解KMP(2014年8月22日版) http://blog.csdn.net/v_july_v/article/details/7041827 知乎讲解 https://www.zhihu.com/question/21474082