其他分享
首页 > 其他分享> > 2022杭电多校 2H / HDU 7157 - Keyboard Warrior (KMP)

2022杭电多校 2H / HDU 7157 - Keyboard Warrior (KMP)

作者:互联网

Problem Link


题意

给定一个长度为 \(n\) 的字符串 \(S\) 及 \(m\) 次操作,初始时打字机为空

每次操作可以往打字机上的字符串尾部按顺序添加 \(k\) 次字符 \(ch\),或是从打字机上的字符串尾部删去 \(k\) 次字符(即键盘 Backspace)

问是否存在一个时刻,使得字符串 \(S\) 是打字机上的字符串的子串?

\(1\le n,m\le 2\times 10^5\)

\(0\le k\le 10^9\)


思路

变量名就按照代码里写的来命名了


考虑按照顺序模拟每次操作,使用 \(pair(char,count)\) 形式来存储当前字符串

首先将输入的字符串 \(S\) 处理为该形式,存储于 \(bvec\) 内(例如,字符串 \(abbbaa\) 可用 \(vector\{(a,1),(b,3),(a,2)\}\) 来描述)

接下来维护打字机上的字符串,同样按照上述形式来存储于 \(svec\) 内,可以借助栈的方法来做到 \(O(n)\),每次如果要往尾部插入字符,且字符与栈顶字符相同则直接让栈顶字符出现次数加上 \(k\),否则需要再 push 进一个 pair;如果要删除字符,则每次与栈顶字符出现次数进行比较,视情况减去或 pop 即可

按照上述的存储方法,即使打字机上的字符串非常长,vector 内的 pair 对数也不会超过 \(m\) 对,因此可以同时对比 \(pair(char,count)\) 这个二元组,也就是在 \(svec\)(维护打字机上的字符串)内查找是否存在一个连续子序列,二元组能够与 \(bvec\)(维护原字符串)“相对应”

这里所说的“相对应”,对于原串而言代表子字符串,但对于二元组序列而言,只需要首部和尾部的字符出现数量大于等于原串出现数量即可,不需要保证完全一致;但内部字符出现数量需要保证严格一致

举个例子:

5 4
abbab
a 2
b 2
a 1
b 2

打字机四步后打出的字符串为 \(aabbabb\),原串出现在了 \(2\sim 6\) 这段区间内。对于开头的字符 \(a\),在 \(svec\) 内描述为 \((a,2)\),而 \(bvec\) 内为 \((a,1)\),我们只需要拿右端的字符来匹配,所以视作可行;结尾的字符 \(b\) 同理;但中间的 \((b,2),(a,1)\) 需要严格保证一致


如果我们的操作不带删除,每次只会往结尾加上 \(k\) 个字符 \(ch\) 的话,如何做这题呢

考虑 KMP,处理出 \(bvec\) 的 \(Next\) 数组,表示如果在某位置出现失配时,下一步在最优情况下应该拿哪一个二元组继续进行匹配;该数组处理方法与经典的 KMP 一致

但根据上面所述,开头和结尾需要特殊判断,不需要严格一致,因此在后续的匹配过程中需要稍加修改,这里我又开了一个 \(match\) 数组,\(match[i]\) 表示 \(svec\)(主串)内的 \(i\) 位置往前与 \(bvec\)(模式串)最长能够匹配的长度,也就是记录下 KMP 匹配过程中到达位置 \(i\) 时模式串的下标 \(j\) 所在位置

如果当前下标 \(j=0\),则判断相等的条件应为 \(svec[i].count\ge bvec[0].count\);否则,条件定为 \(svec[i].count=bvec[j].count\)

对于最后一个位置,也这样特判一下,如果能直接完全对应(即 \(match[i]=bvec.size\))直接 YES,否则如果就差一个位置对应(即 \(match[i-1]=bvec.size-1\)),如上判断即可


由于本题存在删除操作,因此 \(svec.size\) 是需要变化的

但发现 size 初始是从 \(0\) 开始,且每次就算是新增二元组也只加一个,因此每次只需要维护 \(i=svec.size\) 这个末位置

每次先置 \(match[svec.size]=match[svec.size-1]\),继承上一个位置的匹配状态;如果一直不匹配,则令 \(match[svec.size]=Next[match[svec.size]]+1\),将其指向失配后的位置

因为使用了 \(match\) 来存储 \(j\) 这个在 KMP 中一直变化的变量,所以这里也就是重做 KMP 中间的某一步


时间复杂度大致 \(O(n+m)\),但二元组的维护常数会有点大

Code

// Problem: H - Keyboard Warrior
// Contest: Virtual Judge - Cosmic Training / 2022 HDU Round 2
// URL: https://vjudge.net/contest/506261#problem/H
// Memory Limit: 512 MB
// Time Limit: 2000 ms
// 
// Author: StelaYuri
// Import Time: 2022-07-22 14:23:10.349
// 
// Powered by CP Editor (https://cpeditor.org)

#include<bits/stdc++.h>
using namespace std;
#define closeSync ios::sync_with_stdio(0);cin.tie(0);cout.tie(0)
#define multiCase int T;cin>>T;for(int t=1;t<=T;t++)
#define rep(i,a,b) for(auto i=(a);i<=(b);i++)
#define repp(i,a,b) for(auto i=(a);i<(b);i++)
#define pb push_back
typedef pair<char,int> pii;

int n,m;
char s[200050];
vector<pii> bvec,svec;
int siz;
int match[200050];
int Next[200050];
void getNext()
{
    Next[0]=-1;
    int j=-1;
    repp(i,1,siz)
    {
        while(j>-1&&bvec[j+1]!=bvec[i])
            j=Next[j];
        if(bvec[j+1]==bvec[i])
            j++;
        Next[i]=j;
    }
}

void solve()
{
    bvec.clear();
    svec.clear();
    
    cin>>n>>m;
    cin>>s;
    
    bvec.pb(pii(s[0],1));
    repp(i,1,n)
    {
        if(s[i]==s[i-1])
            bvec.back().second++;
        else
            bvec.pb(pii(s[i],1));
    }
    siz=bvec.size();
    
    getNext();
    
    bool flag=false;
    while(m--)
    {
        char c; int t;
        cin>>c>>t;
        
        if(flag||t==0)
            continue;
        
        if(c=='-')
        {
            while(!svec.empty()&&t>0)
            {
                if(svec.back().second<=t)
                {
                    t-=svec.back().second;
                    svec.pop_back();
                }
                else
                {
                    svec.back().second-=t;
                    break;
                }
            }
        }
        else
        {
            if(!svec.empty()&&svec.back().first==c)
                svec.back().second+=t;
            else
                svec.pb(pii(c,t));
        }
        
        int len=svec.size();
        match[len]=0; // 重新判断 len 位置的匹配状态
        if(len==0)
            continue;
        else
        {
            match[len]=match[len-1];
            while(match[len]>0&&svec.back()!=bvec[match[len]])
                match[len]=Next[match[len]]+1;
            if(match[len]==0&&svec.back().first==bvec[match[len]].first&&svec.back().second>=bvec[match[len]].second
                ||match[len]>0&&svec.back()==bvec[match[len]])
                match[len]++;
        }
        
        if(match[len]==siz
            ||match[len-1]==siz-1
            &&svec.back().first==bvec.back().first
            &&svec.back().second>=bvec.back().second)
            flag=true;
    }
    cout<<(flag?"yes":"no")<<'\n';
}
signed main()
{
    closeSync;
    multiCase
    {
        solve();
    }
    return 0;
}

标签:杭电多校,HDU,Warrior,len,字符串,bvec,size,match,svec
来源: https://www.cnblogs.com/stelayuri/p/16506760.html