POJ-1743:Musical Theme(后缀数组加高度数组的应用以及预处理)

xiaoxiao2021-02-28  11

 

题目链接:点击打开链接

 

题意解析:

就是给你一长串的整数序列,让你求这个序列中存不存在最长不重复子串的长度(至少大于5)。 但是这个子串匹配不是单纯的相等,而且可以由前面的子串统一加上或减少某个数字得到。

例如:1 2 3 4 5 6 7 8 9 10 的答案就是 5,  因为6 7 8 9 10可以由1到5同时加1得到。

 

解题思路:

学校内部的比赛碰到的这道题,此时刚刚学完kmp和扩展kmp,一看,嗨呀,就是个字符串匹配吗,一看长度,我艹20000,这尼玛怎么做。我怎么想都只能想出来n^2的算法。后来真的做不出来放弃了,赛后一查,后缀数组,还有什么楼教主之男人八题,这啥玩意儿。。。咳咳,不瞎扯了,解题思路 后缀数组+高度数组的应用。

后缀数组看了大概半天原理还没懂,只知道是用了倍增算法,然后套了个模板上去把题A了。简要谈一下对后缀数组和高度数组的理解(不一定正确),和它们对这道题的帮助。

后缀数组 sa[i]=j,表示以下标 j 开头的后缀在所有能得到的后缀中字典序排第 i 位。注意是字典序而不是单纯的字符串排序。而后缀数组得到的值对这道题最有帮助的就是因为它是按照字典序排序的,所以最接近的两个下标他们所表示的后缀子串一定是最相似的。具体可以去查后缀数组定义,

而高度数组 lcp[i] 表示后缀数组 sa[i-1] 和 sa[i] 的最长公共前缀。。。

还有这道题最关键的一步,因为后面的串是可以通过前面的串统一加上某个数字得到,所以要对题目给的串做预处理,不管统一加多少怎么样,两个数之间的差值总是一定的,就用这个性质进行预处理即可。处理以后就是求最长不重复子串了,

这样的话这道题就可以用这两个数组来求解,二分长度,依次用高度数组判断有没有符合要求的两个串,如果符合的话再判断是否符合不重叠的要求。最后找到的长度大于等于5就输出。这样的话这道题就解决了,代码是参照网上的大神博客写的,略微有些差异,

 

 

#include <iostream> #include <cstdio> #include <cstring> #include <string> #include <cstdlib> #include <cmath> #include <vector> #include <queue> #include <map> #include <algorithm> #include <set> #include <functional> #define rank ra using namespace std; int INF=1e9+7; typedef long long LL; typedef unsigned long long ULL; int n,m,k; int a[20005]; int rank[20005]; int tmp[20005],sa[20005],lcp[20005]; bool cmp(int i,int j) { if(rank[i]!=rank[j]) return rank[i]<rank[j]; else { int ri=i+k<=n?rank[i+k] : -1; int rj=j+k<=n?rank[j+k] : -1; return ri<rj; } } void get_sa(int s[],int sa[],int n) //得到后缀数组 { for(int i=0;i<=n;i++) { sa[i]=i; rank[i]=i<n?s[i]:-1; } for(k=1;k<=n;k=k*2) { sort(sa,sa+1+n,cmp); tmp[sa[0]]=0; for(int i=1;i<=n;i++) tmp[sa[i]]=tmp[sa[i-1]]+(cmp(sa[i-1],sa[i])?1:0); for(int i=0;i<=n;i++) rank[i]=tmp[i]; } } void get_lcp(int s[],int sa[],int lcp[],int n) //得到高度数组 { for(int i=0;i<=n;i++) rank[sa[i]]=i; int k=0; lcp[0]=0; for(int i=0;i<n;i++) { if(k) k--; if(!rank[i]) continue; int j=sa[rank[i]-1]; while(s[i+k]==s[j+k]) k++; lcp[rank[i]]=k; } } int main() { while(scanf("%d",&n)!=EOF) { if(n==0) break; for(int i=0;i<n;i++) scanf("%d",&a[i]); for(int i=0;i<n-1;i++) //对串预处理,防止负数所以加上100 a[i]=a[i+1]-a[i]+100; a[--n]=0; get_sa(a,sa,n); //看大佬博客这边传的n+1,可能是模板不同,我传n+1 wa了, get_lcp(a,sa,lcp,n); //我用的是白书的模板 int l=1,r=n+1,mid,L,R; int flag=0; while(l<=r) //二分找长度 { mid=(l+r)>>1; flag=0; L=INF;R=-INF; for(int i=1;i<=n;i++) { if(lcp[i]>=mid) //判断是否有符合要求的串 { L=min(min(sa[i-1],sa[i]),L); R=max(max(sa[i-1],sa[i]),R); } else { if(L+mid+1<=R) //判断是否不重叠 话说这里和下面我换成L+mid<=R也能A flag=1; //不懂 费解,可能是poj数据太弱了 L=INF;R=-INF; } } if(L+mid+1<=R) flag=1; if(flag) l=mid+1; else r=mid-1; } if(l>=5) printf("%d\n",l); else printf("0\n"); } }

 

 

 

 

 

转载请注明原文地址: https://www.6miu.com/read-1100265.html

最新回复(0)