字符串专题-KMP+扩展KMP
作者:互联网
KMP算法
例题1:E. Martian Strings【前缀函数的运用】
这一题笨笨地写了个SA+二分,慢死了(常数大)。虽然这一题是多串匹配,但是\(m=100\),S串长度为\(1e5\),所以是可以暴力check每一个pattern的。。但是因为这一题要把一个串分成两个不相交的区间,所以考虑顺序、逆序做一次KMP,特判长度为1的pat。复杂度\(O(m*n=1e7)\)
思路来自于:聚聚的blog LINK
查看代码
int n, q, k, nt[maxn], pv[maxn], sf[maxn];
char pat[1111], s[maxn];
inline void initNxt(char s[], int n) {
nt[1] = 0;
for (int i = 2, k = 0; i <= n; i++) {
while (k && s[i] != s[k + 1]) k = nt[k];
nt[i] = (s[i] == s[k + 1] ? ++k : 0);
}
}
inline void search(int* ar, int n, int m) {
for (int i = 1, k = 0; i <= n; i++) {
while (k && k < m && s[i] != pat[k + 1]) k = nt[k];
if (k < m && s[i] == pat[k + 1]) k++;
ar[i] = max(ar[i - 1], k); // 根据题目而取 max
}
}
inline bool chk() {
int m = strlen(pat + 1);
if (m > n || m == 1) return false;
initNxt(pat, m), search(pv, n, m);
reverse(pat + 1, pat + m + 1);
reverse(s + 1, s + 1 + n);
initNxt(pat, m), search(sf, n, m);
reverse(s + 1, s + 1 + n);
reverse(sf + 1, sf + 1 + n);
for (int i = 1; i < n; i++)
if (pv[i] + sf[i + 1] >= m) return true;
return false;
}
inline void solve() {
cin >> s + 1 >> q, n = strlen(s + 1);
int ans = 0;
for (int i = 1; i <= q; i++) cin >> pat + 1, ans += chk();
cout << ans << endl;
}
扩展KMP算法 - Z函数
例题1: E. Text Editor【贪心 + Z函数预处理】
题意:给一个长度为m的T串,和一个长度为n>m的S串。现在让你删去S中的一些位置,使得S变成T。最开始光标在S串末尾,你只能操作1.backspace、2.left、3.right、4.home、5.end 这5个按键。求出最少按键次数。
思路:
枚举S中的一个分界点sp,再枚举T中的一个分界点tp。
① sp左侧尽可能往左边匹配,计算公式为:\(sp-tp+|LCS|\),其中LCS是S[1:sp]和T[1:tp]的最长公共后缀
② sp右侧尽可能往右匹配,计算公式为:\(|LCP|\),其中LCP是S[sp+1:n]和T[tp+1:m]的最长公共前缀。
考虑使用Z函数预处理优化掉一个n,同时使用贪心策略判断能不能表示,最后复杂度是:\(O(n^2+n*m)\)。妈的,因为脑子猪了,所以写了一年。
查看代码
int n, m, pre[maxn], suf[maxn];
string S, T, revT;
vector<int> getZ(const string& s) {
vector<int> z(s.size(), 0);
for (int i = 1, l = 0, r = 0; i < s.size(); ++i) {
if (i <= r && z[i - l] < r - i + 1) {
z[i] = z[i - l];
} else {
z[i] = max(0, r - i + 1);
while (i + z[i] < s.size() && s[z[i]] == s[i + z[i]]) ++z[i];
}
if (i + z[i] - 1 > r) l = i, r = i + z[i] - 1;
}
return z;
}
void solve() {
cin >> n >> m >> S >> T;
revT = T, reverse(all(revT));
for (int i = 0, j = -1; i <= n; i++) {
if (i < n && j < m - 1 && S[i] == T[j + 1]) j++;
pre[i] = j;
}
suf[n] = m + 1; // 记得初始化
for (int i = n - 1, j = m; i >= 0; i--) {
if (j > 0 && S[i] == T[j - 1]) j--;
suf[i] = j;
}
int ans = inf_int;
string LS, RS = S;
for (int sp = 0; sp <= n; sp++) {
auto lz = getZ(LS + "#" + revT);
move(lz.begin() + LS.size() + 1, lz.end(), lz.begin());
auto rz = getZ(RS + "#" + T);
move(rz.begin() + RS.size() + 1, rz.end(), rz.begin());
for (int tp = 0; tp <= sp; tp++) {
if (tp - 1 > (sp ? pre[sp - 1] : -1)) break;
if (tp < suf[sp] || m - tp > n - sp) continue;
// 这里存在一个边界条件,当tp=0且sp=0时,说明不会按home键,反之默认按home键
int Lans = 2 * (int)LS.size() + (tp ? 1 - lz[m - tp] - tp : (sp != 0));
int Rans = (int)RS.size() - (tp < m ? rz[tp] : 0);
if (Lans < 0 || Rans < 0) continue;
ans = min(Lans + Rans, ans);
}
if (sp == n || RS.size() == 0) break;
LS.insert(0, 1, S[sp]);
RS = RS.substr(1, (int)RS.size() - 1); \\ string的erase有bug,会删除p之后所有字符
}
cout << (ans == inf_int ? -1 : ans) << '\n';
}
标签:专题,pat,RS,int,sp,tp,KMP,字符串,size 来源: https://www.cnblogs.com/guanjinquan/p/15832599.html