其他分享
首页 > 其他分享> > 最短母串

最短母串

作者:互联网

E. 最短母串

内存限制:512 MiB 时间限制:1000 ms 标准输入输出 题目类型:传统 评测方式:文本比较  

题目描述

原题来自:HNOI 2006

给定n个字符串 ,要求找到一个最短的字符串s ,使得这 n个字符串都是s的子串。

输入格式

第一行是一个正整数n,表示给定的字符串的个数;

以下的n行,每行有一个全由大写字母组成的字符串。

输出格式

只有一行,为找到的最短的字符串。

在保证最短的前提下,如果有多个字符串都满足要求,那么必须输出按字典序排列的第一个。

样例

样例输入

2 
ABCD
BCDABC

样例输出

ABCDABC

析:这是道AC自动机好题,同时利用了状压的思想,我们将 flag 置为 (1<<(i-1)) ,那么当我们搜索到的状态  s==((1<<n)-1) 时,即为满足条件的最短母串 (状压??,没错,就是个比较不一样的状压题)
这道题的 bfs 相当妙,我们首先开两个队列,Q1, Q2 ,Q1用来存储当前的位置,Q2用来枚举状态,那么我们的边界条件就是 Q2.top()==(1<<n)-1;
下面我详细的说一下 bfs 的过程,首先,若以当前点为起点的 son[i] 没有被遍历过,那么我们首先将他的 vis 数组=1,然后将其 (包括其更新的状态 ) 放入队列,这里同时用到了两个数组,fa 用来记录每次连边的 father,这个在最后输出结果时有用,net 用来记录每次连边的字符,
(显然,我们如果直接存储一段字符串是很难处理的,那么我们就存储字符), my 表示当前的层数,在每一次搜寻结束后累加;
接下来是我们输出答案的过程,这里可能有些难理解,建议自己手模一下,首先,我们要理解 get_fail() 中的操作:
 if(!v)
     use[u].son[i]=use[Fail].son[i];

 这里的操作就是我们利用 bfs 计算的正确性所在,如果我们现在的节点没有这个儿子,那么他的儿子就是他的 Fail 指针的儿子,如图:

这样我们就可以在遍历到 A 的时候将 B 的状态加入队列;

蓝色箭头表示 在遍历到 A 的时候将 B 加入了队列,并更新了状态

绿色箭头表示输出时回溯的过程

看一下输出的过程:

void pr(int x) {     if(!x)         return;     pr(fa[x]);     putchar(net[x]+'A'); } if(t==((1<<n)-1))        {             pr(my);             return;         }

 但是我们注意到我们在存储的过程中:

if(!vis[use[now].son[i]][t|use[use[now].son[i]].flag]&&use[now].son[i]>1)             {                 vis[use[now].son[i]][t|use[use[now].son[i]].flag]=1;                 fa[++tot]=my;                 net[tot]=i;                 Q1.push(use[now].son[i]);                 Q2.push(t|use[use[now].son[i]].flag);             }  

 这里为什么不用 tot,要用 my 呢?

首先我们要明确一个事情,每次我们将一个字符 Push 进队列的时候,都相当于从这个点向外连了一条边,但是,有些边可能是重复的,那么我们最终需要的答案就是当 t==(1<<n)-1 时,这是很显然当前的字符为最终答案的末尾,那么我们就要从当前这个点连边的 father

不停向上回溯,最终输出答案。最后再解释一下为什么从 my 开始回溯,因为我已知当前点为末尾,那么我当前的 my 一定与我的最后一条连我的边的编号相同!!,到这里应该解释的比较清楚了;

哦,最后还有一点,就是可能会有重复的单词,那我们在初始化的时候就要:

 use[now].flag|=(1<<(pos-1));

 这样无论如何我们都能将其加入计算

代码:

#include<bits/stdc++.h> #define re register int using namespace std; const int N=700; int n,num=1,ed,tot,cnt,my; int fa[N*(1<<13)],net[N*(1<<13)]; char s[N]; bool vis[N*30][1<<14]; queue<int> q; queue<int> Q1,Q2; struct CUN { int fail,flag; int son[30]; }use[N*30]; void insert(char ss[],int pos) { int now=1; int l=strlen(ss); for(re i=0;i<l;i++) { int p=ss[i]-'A'; if(!use[now].son[p]) use[now].son[p]=++num; now=use[now].son[p]; } use[now].flag|=(1<<(pos-1)); } void get_fail() { for(re i=0;i<26;i++) use[0].son[i]=1; use[1].fail=0; q.push(1); while(!q.empty()) { int u=q.front(); q.pop(); int Fail=use[u].fail; for(re i=0;i<26;i++) { int v=use[u].son[i]; if(!v) { use[u].son[i]=use[Fail].son[i]; continue; } use[v].fail=use[Fail].son[i]; use[v].flag|=use[use[v].fail].flag; q.push(v); } } } void pr(int x) {     if(!x)         return;     pr(fa[x]);     putchar(net[x]+'A'); } void bfs() {     Q1.push(1); //位置     Q2.push(0); //状态     vis[1][0]=1;     for(re i=0;i<(1<<n);i++)         vis[0][i]=1;     while(!Q1.empty())     {         int now=Q1.front();         int t=Q2.front();         Q1.pop();         Q2.pop();         if(t==((1<<n)-1))         {             pr(my);             return;         }         for(re i=0;i<26;i++)         {             if(!vis[use[now].son[i]][t|use[use[now].son[i]].flag]&&use[now].son[i]>1)             {                 vis[use[now].son[i]][t|use[use[now].son[i]].flag]=1;                 fa[++tot]=my;                 net[tot]=i;                 Q1.push(use[now].son[i]);                 Q2.push(t|use[use[now].son[i]].flag);             }            }         ++my;     } } int main() { scanf("%d",&n); for(re i=1;i<=n;i++) { scanf("%s",s); insert(s,i); } get_fail(); bfs(); return 0; }

 


标签:use,now,int,son,flag,母串,最短,my
来源: https://www.cnblogs.com/WindZR/p/14879635.html