其他分享
首页 > 其他分享> > # 滚动哈希

# 滚动哈希

作者:互联网

滚动哈希

假设字符串\(C=c_1*c_2*...c_m\),定义哈希函数\(H(C)=(C_1*b^{m-1}+C_2*b^{m-2}+...C_m*b^{0})mod\; h\)

从k开始长为|m|的子串的hash值转移到从k+1开始长为|m|的字串的hash值的转移公式为 :\[H(S[k+1..k+m]=(H(S[k..k+m-1])*b-s_k*b^m+s_{k+m}\]

基数使用1e7以上的素数减少冲突,使并且用\(ull\)自然溢出代替取模运算,滚动哈希的期望复杂度为\(O(n+m)\)。

题目链接:

给出字符串S和T,求S在T中出现的次数。

AcCode:

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
typedef unsigned long long ull;
const ull B = 100000007;//哈希基数
int n;
char w[10010],t[1000010];
int main(){
    scanf("%d",&n);
    while(n--){
        scanf("%s%s",w,t);
        int lw=strlen(w),lt=strlen(t);
        ull wh=0,th=0,base=1;
        //计算W和T串从第一位开始的长度为lenw的哈希值
        for(int i=0;i<lw;i++)
            wh=wh*B+w[i],th=th*B+t[i];

        //计算base的lenw次方,用于哈希转移
        for(int i=0;i<lw;++i)base*=B;

        int ans=0;
        for(int i=0;i+lw<=lt;++i){
            if(wh==th)ans++;
            if(i+lw<lt)th=th*B+t[i+lw]-t[i]*base;//这里减法可能会溢出,但是利用无符号数的自然溢出就无需加上一个模数了
        }
        printf("%d\n",ans);
    }
    return 0;
}

标签:滚动,哈希,int,ull,include,长为
来源: https://www.cnblogs.com/sstealer/p/11741900.html