AcWing 1282. 搜索关键词
作者:互联网
#include <bits/stdc++.h>
using namespace std;
const int N = 10010 * 55; //模式串最长长度,短串
const int M = 1e6 + 10; //长度为m的文章,长串
int n;
//tr:trie树,每个结点最多26个儿子
//cnt:trie的每个结点存在的以此结点结尾的字符串个数
//idx:游标变量,结点号
int tr[N][26], cnt[N], idx;
string str;//字符串变量,前面用做输入模式串,最后一个是文章串
//AC自动机自己的数据结构 q:bfs用的队列 fail:失配指针
int q[N], fail[N];
//构建Trie树
void insert() {
int p = 0; //游标变量
for (int i = 0; i < str.size(); i++) { //遍历模式字符串
int t = str[i] - 'a'; //计算对应的索引号
if (!tr[p][t]) tr[p][t] = ++idx;//如果不存在这个结点,则创建之
p = tr[p][t]; //走进去
}
cnt[p]++; //打上字符串完结标识
}
//构建AC自动机(填充失配指针)
void build() {
int hh = 0, tt = -1;//清空队列,所以前面不需要每次都memset清空q
for (int i = 0; i < 26; i++) //查找root的所有26个可能存在的儿子
if (tr[0][i]) //如果该儿子存在
q[++tt] = tr[0][i]; //把这个儿子放入队列中
while (hh <= tt) { //bfs框架
int p = q[hh++]; //取出队列头,父结点
for (int i = 0; i < 26; i++) { //尝试找出该结点的所有儿子
int c = tr[p][i]; //子结点
//如果不存在,这个的失配指针指向,父节点的失配指针对应的相同字节点下
if (!c) tr[p][i] = tr[fail[p]][i];
else {
//存在依旧指向父节点的失配指针下的同子节点
fail[c] = tr[fail[p]][i];
q[++tt] = c;//放入队列
}
}
}
}
int main() {
int T;
cin >> T;
while (T--) {
//多组数据,每次清空
memset(tr, 0, sizeof tr);
memset(cnt, 0, sizeof cnt);
memset(fail, 0, sizeof fail);
idx = 0;
cin >> n;
for (int i = 1; i <= n; i++) {
cin >> str;
//构建Trie树
insert();
}
//构建AC自动机
build();
//读入文章长串
cin >> str;
int res = 0;
//j记录当前树节点的指针,初始是根节点
for (int i = 0, j = 0; i < str.size(); i++) { //枚举总串str的每一个字母
int u = str[i] - 'a';
j = tr[j][u]; //跳到下一个树节点
int p = j; //每次从当前树节点开始
while (p) {
res += cnt[p]; //累加命中的模式串个数
cnt[p] = 0; //去除标记
p = fail[p]; //继续查询
}
}
printf("%d\n", res);
}
return 0;
}
标签:cnt,1282,int,关键词,tr,++,str,fail,AcWing 来源: https://www.cnblogs.com/littlehb/p/15861241.html