跳蚤[BZOJ4310]
作者:互联网
【题目描述】
很久很久以前,森林里住着一群跳蚤。一天,跳蚤国王得到了一个神秘的字符串,它想进行研究。首先,他会把串分成不超过 \(k\) 个子串,然后对于每个子串 \(S\),他会从\(S\)的所有子串中选择字典序最大的那一个,并在选出来的 \(k\) 个子串中选择字典序最大的那一个。他称其为“魔力串”。现在他想找一个最优的分法让“魔力串”字典序最小。
【输入格式】
第一行一个整数 k, \(k\leq 15\)
接下来一个长度不超过 \(10^5\) 的字符串 S。
【输出格式】
输出一行,表示字典序最小的“魔力串”。
题解
根据后缀数组height数组的定义,一个串s的本质不同的子串数目是\(\sum_{i=2}^{|s|} |s|-sa[i]+1-height[i]\)
可以二分答案\(mid\),即判定字典序排名为第\(mid\)的子串是否可以作为答案
如何找到排在第\(mid\)的子串是哪一个?有个显而易见的结论:排在第i的后缀的所有前缀的字典序一定比 排在第i+1的后缀的所有前缀的字典序小
所以得到一个这样的求法
inline pair<int, int> getrnk(ll r) {
int i;
for (i = 1; i <= n && r > n - sa[i] - height[i] + 1; i++) {
r -= n - sa[i] - height[i] + 1;
}
return make_pair(sa[i], height[i] + r);
}
返回的是起始位置+子串长度 自行理解一下
然后其实二分判定是一个贪心的思想 从后往前扫 如果当前的这个后缀比二分的子串小了 就需要从上一位开始截掉 这个可以用LCP来快速判断
最后如果截断次数\(<k\),就是一个符合条件的子串
时间复杂度\(O(n\log n)\) (预处理ST表)
【代码】
#include <bits/stdc++.h>
#define N 100005
#define fi first
#define se second
using namespace std;
typedef long long ll;
char s[N];
int n, m, k, sa[N], sa2[N], rnk[N], key[N], sum[N], height[N];
int st[N<<1][21];
inline bool ok(int *num, int a, int b, int l) {
return num[a] == num[b] && num[a+l] == num[b+l];
}
inline void suffix() {
int i, j, p;
for (i = 1; i <= m; i++) sum[i] = 0;
for (i = 1; i <= n; i++) sum[rnk[i]=s[i]]++;
for (i = 1; i <= m; i++) sum[i] += sum[i-1];
for (i = n; i >= 1; i--) sa[sum[rnk[i]]--] = i;
for (j = 1; j <= n; j <<= 1, m = p) {
for (p = 0, i = n - j + 1; i <= n; i++) sa2[++p] = i;
for (i = 1; i <= n; i++) if (sa[i] > j) sa2[++p] = sa[i] - j;
for (i = 1; i <= n; i++) key[i] = rnk[sa2[i]];
for (i = 1; i <= m; i++) sum[i] = 0;
for (i = 1; i <= n; i++) sum[key[i]]++;
for (i = 1; i <= m; i++) sum[i] += sum[i-1];
for (i = n; i >= 1; i--) sa[sum[key[i]]--] = sa2[i];
for (swap(sa2, rnk), i = 2, p = 2, rnk[sa[1]] = 1; i <= n; i++) {
rnk[sa[i]] = ok(sa2, sa[i-1], sa[i], j) ? p-1 : p++;
}
}
}
inline void geth() {
int p = 0;
for (int i = 1; i <= n; i++) {
int j = sa[rnk[i]-1];
if (p) p--;
while (s[i+p] == s[j+p]) p++;
height[rnk[i]] = p;
}
}
inline void init_st() {
for (int i = 1; i <= n; i++) st[i][0] = height[i];
for (int l = 1; l <= 20; l++) {
for (int i = 1; i + (1 << l) - 1 <= n; i++) {
st[i][l] = min(st[i][l-1], st[i+(1<<(l-1))][l-1]);
}
}
}
inline int LCP(int x, int y) {
if (x == y) return n - x + 1;
int l = rnk[x], r = rnk[y];
if (l > r) swap(l, r);
l++;
int len = log2(r - l + 1);
return min(st[l][len], st[r-(1<<len)+1][len]);
}
inline pair<int, int> getrnk(ll r) {
int i;
for (i = 1; i <= n && r > n - sa[i] - height[i] + 1; i++) {
r -= n - sa[i] - height[i] + 1;
}
return make_pair(sa[i], height[i] + r);
}
inline bool cmp(pair<int, int> a, pair<int, int> b) {
int lcp = LCP(a.fi, b.fi);
if (lcp >= a.se || lcp >= b.se) {
return a.se <= b.se;
} else return s[a.fi + lcp] < s[b.fi + lcp];
}
inline bool check(ll mid) {
pair<int, int> a = getrnk(mid);
int cnt = 0;
for (int i = n, lst = n; i >= 1; i--) {
if (s[a.fi] < s[i]) {
return false;
}
if (!cmp(make_pair(i, lst - i + 1), a)) {
cnt++, lst = i;
}
if (cnt >= k) {
return false;
}
}
return true;
}
int main() {
scanf("%d%s", &k, s+1); n = strlen(s+1); m = 128;
suffix(); geth();
ll tot = 0;
for (int i = 1; i <= n; i++) tot += n - sa[i] + 1 - height[i];
init_st();
ll l = 1, r = tot, mid, ans = tot;
while (l <= r) {
mid = (l + r) >> 1;
if (check(mid)) {
ans = mid; r = mid - 1;
} else l = mid + 1;
}
pair<int, int> aa = getrnk(ans);
for (int i = aa.fi; i <= aa.fi + aa.se - 1; i++) {
putchar(s[i]);
}
return 0;
}
标签:子串,return,int,mid,height,BZOJ4310,sa,跳蚤 来源: https://www.cnblogs.com/ak-dream/p/AK_DREAM32.html