最长公共子串对
先放一段考场暴力代码:
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
char a[2005],b[2005];
int na,nb,f[2005][2005],c[2005][2005],ans;
//f[i][j]表示 s[1...i]与 t[1...j]以s[i]、t[j]结尾的最长公共子串长度
int lowbit(int x){return x&(-x);
}
void update(int x,int y,int v){for(int i=x;i<=na;i+=lowbit(i)){for(int j=y;j<=nb;j+=lowbit(j)){c[i][j]=max(c[i][j],v);}}
}
int query(int x,int y){int res=0;for(int i=x;i;i-=lowbit(i)){for(int j=y;j;j-=lowbit(j)){res=max(res,c[i][j]);}}return res;
}
int main(){scanf("%s%s",a+1,b+1);na=strlen(a+1);nb=strlen(b+1);for(int i=1;i<=na;i++){for(int j=1;j<=nb;j++){if(a[i]==b[j]) f[i][j]=max(f[i][j],f[i-1][j-1]+1);ans=max(ans,query(i-f[i][j],j-f[i][j])+f[i][j]);update(i,j,f[i][j]);}}printf("%d\n",ans);return 0;
}
在这段代码中,能优化的地方有两个:
1.求最长公共子串(即求fff)可以用SAM,对s串建一个SAM,让 t 在 s 的SAM上做匹配
(这是一个非常经典的问题,但我考试时连SAM是什么都忘了。。。)
2.我拼接两段公共子串时,用的是二维树状数组,能不能转为一维呢?
答案是可以的。题目的本质,其实就是拼接两段公共子串。
s,t前缀的公共子串是s,t串的公共子串,s,t后缀的公共子串当然也是。
如果我们枚举i,拼接t[1…i]与s前缀的公共子串和t[i+1…n]与s后缀的公共子串,那么就只需保证 我们所选的两段公共子串在s串上不相交,这个用一维树状数组即可维护
正序t 在正序s 的SAM上做匹配,可以求s,t前缀的最长公共子串,
那么,逆序t 在逆序s 的SAM上做匹配,即可以求s,t后缀的最长公共子串。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<vector>
using namespace std;
const int N=2e5+5;
struct SAM{int tot,lst,ch[N<<1][26],len[N<<1],fa[N<<1],pos[N<<1];//fa:parent tree上的faint tax[N<<1],id[N<<1];SAM(){tot=lst=1;}void add(int c,int id){int p=lst,np=lst=++tot;len[np]=len[p]+1;pos[np]=id;for(;p&&!ch[p][c];p=fa[p])//在这里,p=fa(p)即从长到短遍历旧串的所有后缀。ch[p][c]=np;//旧串后缀加c构成新串后缀 if(!p) fa[np]=1;else{int q=ch[p][c];if(len[q]==len[p]+1) fa[np]=q;//q中原有的子串同时也是新串的后缀 else{int nq=++tot;for(int i=0;i<26;i++) ch[nq][i]=ch[q][i];fa[nq]=fa[q];len[nq]=len[p]+1;pos[nq]=pos[q];fa[q]=fa[np]=nq;for(;p&&ch[p][c]==q;p=fa[p]) ch[p][c]=nq;//把是新串后缀但不是旧串后缀的子串放到新建节点nq上 }}}void sort(){for(int i=1;i<=tot;i++) tax[len[i]]++;for(int i=1;i<=tot;i++) tax[i]+=tax[i-1];for(int i=tot;i>=1;i--) id[tax[len[i]]--]=i;//基数排序: len为第一关键字,for(i=tot;i>=1;i--)时保证fa[id[i]]在id[i]后遍历到 }
}pre,suf;
char s[N],t[N];
int n,m,tag[N<<1],ans;
struct Qry{int length,p;
};
vector<Qry> pf[N],sf[N];
int c[N];
int lowbit(int x){return x&(-x);
}
void update(int x,int v){for(int i=x;i<=n;i+=lowbit(i)) c[i]=max(c[i],v);
}
int query(int x){int res=0;for(int i=x;i;i-=lowbit(i)) res=max(res,c[i]);return res;
}
int main(){scanf("%s%s",s+1,t+1);n=strlen(s+1);m=strlen(t+1);for(int i=1;i<=n;i++) pre.add(s[i]-'a',i);for(int i=n;i>=1;i--) suf.add(s[i]-'a',n-i+1);pre.sort();suf.sort();for(int i=1,u=1,len=0;i<=m;i++){//正序t 在正序s 的SAM上做匹配(求s,t前缀的最长公共子串) int c=t[i]-'a';while(u&&!pre.ch[u][c]) u=pre.fa[u];if(!u){u=1;len=0;}else{len=min(len,pre.len[u])+1;//注意写法 u=pre.ch[u][c];}if(u>1&&!tag[pre.fa[u]]) tag[pre.fa[u]]=i;//节点u的祖先中s的子串,同时也都是t的长度为i的前缀的后缀。pf[i].push_back((Qry){len,pre.pos[u]});}for(int i=pre.tot;i>=1;i--){int u=pre.id[i];if(!tag[u]) continue;if(!tag[pre.fa[u]]||tag[pre.fa[u]]>tag[u]) tag[pre.fa[u]]=tag[u];pf[tag[u]].push_back((Qry){pre.len[u],pre.pos[u]});} memset(tag,0,sizeof(tag));for(int i=m,u=1,len=0;i>=1;i--){//逆序t 在逆序s 的SAM上做匹配(求s,t后缀的最长公共子串) int c=t[i]-'a';while(u&&!suf.ch[u][c]) u=suf.fa[u];if(!u){u=1;len=0;}else{len=min(len,suf.len[u])+1;u=suf.ch[u][c];}if(u>1&&!tag[suf.fa[u]]) tag[suf.fa[u]]=i;sf[i].push_back((Qry){len,suf.pos[u]});} for(int i=suf.tot;i>=1;i--){int u=suf.id[i];if(!tag[u]) continue;if(!tag[suf.fa[u]]||tag[suf.fa[u]]<tag[u]) tag[suf.fa[u]]=tag[u];sf[tag[u]].push_back((Qry){suf.len[u],suf.pos[u]});}ans=0;for(int i=m;i>=1;i--){for(int j=0;j<pf[i].size();j++){Qry q=pf[i][j];ans=max(ans,q.length+query(n-q.p));}for(int j=0;j<sf[i].size();j++){Qry q=sf[i][j];if(q.p) update(q.p,q.length);}}printf("%d\n",ans);return 0;
}