后缀自动机总结
作者:互联网
一些定义
endpos("") 表示一个 S 的子串在 S 中出现的结束位置集合。每个子串都有一个 endpos 集合,可能有一些子串的 endpos 集合相同,就合并,构成后缀自动机节点。也即一个节点代表一个 endpos 集合的等价类,里边包含一些串,容易知道这些串是连续的,且互为包含关系。一个点的 endpos 集合大小即为当前点所有串在 S 中出现的次数。
每个点有一些转移边,表示在当前节点所能表示的所有串后面接一个字符,转移到一些新的等价类。容易知道这样的转移关系构成一个拓扑图。
每个点有一个 parent,也即后缀链接,表示把当前串前面删去一些字符,第一次使得 endpos 集合发生改变的转移边。容易知道这样的转移关系构成一棵树。
一条根到一个节点的路径唯一构成了 S 中一个子串,不同路径所构成的串一定不同。根据这点可以在拓扑图中 dp 出,以某串为前缀的串的个数有多少种,可以查询字典序第 k 大的串是哪个。
Luogu P2408 不同子串个数
给你一个长为N的字符串,求本质不同的子串的个数。
SOL: 拓扑图上 dp,\(S_{u}=\sum S_v+1\)
标签:总结,子串,拓扑图,后缀,endpos,集合,自动机,节点 来源: https://www.cnblogs.com/wwlwQWQ/p/14782294.html