【洛谷】P2743 [USACO5.1]乐曲主题Musical Themes(后缀数组+二分)
作者:互联网
题意
给出长度为 \(N\) 的数字串,求最大相似子串长度,如果没有输出 \(0\)。
相似子串定义为:
1.两个不重叠的子串,其中一个是另一个加/减一个数得来的。
2.长度 \(\geq 5\)。
数据范围
\(1 \leq N \leq 20000,1 \leq a_i \leq 88\)。
思路
对于相似子串的第一个定义,很容易想到将原数组差分,就可以题意转化为求两个本质相同的不重叠子串。至于长度的要求,最后判断一下就好。下面讨论如何求本质不同的不重叠子串。
利用后缀数组的思想。原数字串的所有子串就是原数字串的所有后缀的所有前缀。这句话有点绕,但理解起来不复杂。那么就可以将题意进一步转化为求两个后缀的最长公共前缀(即 \(lcp\))。同时还要满足这两个最长公共前缀在原串中没有重叠的部分。那么就可以二分最大长度。
设当前枚举的长度为 \(mid\)。根据后缀数组中 \(lcp\) 的性质,即对于排序后的后缀(下文默认后缀为排序后的后缀),满足 \(lcp(i,j)=\min_{i\leq k \leq j}(lcp(i,k),lcp(k,j))\)。可以将所有后缀分成几个大的区间,边界点 \(i\) 满足 \(lcp(i,i-1) < mid\) 。那么此时的区间 \([i,j]\) 中的任意两个后缀的 \(lcp\) 都 \(\geq mid\)。只需要记录一下区间中的后缀在原数字串中的最大起始点和最小起始点,如果它们的差不小于 \(mid\),就是找到了一组长度为 \(mid\) 相似子串。接下来按照二分的基本流程操作即可。
code:
#include<cstring>
#include<algorithm>
using namespace std;
const int N=2e5+10;
int n,m,height[N],sa[N],rk[N],s[N],x[N],y[N],c[N];
void get_sa()
{
memset(c,0,sizeof(c));m=188;
for(int i=1;i<=n;i++) c[x[i]=s[i]]++;
for(int i=2;i<=m;i++) c[i]+=c[i-1];
for(int i=n;i>=1;i--) sa[c[x[i]]--]=i;
for(int k=1;k<=n;k<<=1)
{
int num=0;
for(int i=n-k+1;i<=n;i++) y[++num]=i;
for(int i=1;i<=n;i++)
if(sa[i]>k) y[++num]=sa[i]-k;
for(int i=1;i<=m;i++) c[i]=0;
for(int i=1;i<=n;i++) c[x[i]]++;
for(int i=2;i<=m;i++) c[i]+=c[i-1];
for(int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
swap(x,y);num=1;x[sa[1]]=1;
for(int i=2;i<=n;i++) x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
if(num==n) break;m=num;
}
}
void get_height()
{
memset(height,0,sizeof(height));
for(int i=1;i<=n;i++) rk[sa[i]]=i;
for(int i=1,k=0;i<=n;i++)
{
if(rk[i]==1) continue;
if(k) k--;
int j=sa[rk[i]-1];
while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
height[rk[i]]=k;
}
}
bool check(int mid)
{
int maxx=sa[1],minn=sa[1];
for(int i=2;i<=n;i++)
if(height[i]<mid) maxx=minn=sa[i];
else
{
maxx=max(maxx,sa[i]);
minn=min(minn,sa[i]);
if(maxx-minn-1>=mid) return true;
}
return false;
}
int main()
{
scanf("%d",&n);
for(int last=0,now,i=1;i<=n;i++) scanf("%d",&now),s[i]=now-last+100,last=now;//注意在差分的时候可能会出现数字小于0的情况,需要整体加上一个偏移量才能进行后缀排序
get_sa();get_height();
int l=1,r=n/2,ans=-1;
while(l<=r)
{
int mid=l+r>>1;
if(check(mid)) ans=mid,l=mid+1;
else r=mid-1;
}
printf("%d\n",++ans<5?0:ans);
return 0;
}```
标签:子串,P2743,洛谷,lcp,leq,后缀,mid,USACO5.1,int 来源: https://www.cnblogs.com/NLCAKIOI/p/16029365.html