编程语言
首页 > 编程语言> > [题解]LeetCode 28. 实现 strStr()(C++)

[题解]LeetCode 28. 实现 strStr()(C++)

作者:互联网

题目

实现 strStr() 函数。

给你两个字符串 haystackneedle,请你在 haystack字符串中找出 needle字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回  -1 。

说明:

当 needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。

对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与 C 语言的 strstr() 以及 Java 的 indexOf() 定义相符。

示例 1:

输入:haystack = "hello", needle = "ll"
输出:2

示例 2:

输入:haystack = "aaaaa", needle = "bba"
输出:-1

提示:

来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/implement-strstr
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

思路

暴力求解,直接遍历 haystack字符串中的每一个位置查看其是否是needle字符串出现的第一个位置。
时间复杂度O(nm),空间复杂度O(1)。m是needle字符串的长度,n是haystack字符串的长度。

代码

class Solution {
public:
    int strStr(string haystack, string needle) {
        if(needle.empty()) return 0;
        int n = haystack.size(), m = needle.size();
        if(n < m) return -1;
        for (int i = 0; i <= n - m; i++) {
            int j = 0;
            while(j < m && haystack[i + j] == needle[j]){
                ++j;
            }
            if (j == m) {
                return i;
            }
        }
        return -1;
    }
};

改进

用KMP算法,KMP算法的核心思想在于,用一个数组(前缀表next)保存needle字符串中每一个位置,其往前最多有多少位和从needle字符串开头的前缀完全一致。当我们在haystack字符串中查找needle字符串时,匹配到needle字符串的第i位发现不同,此时可以依据前缀表直接跳到needle字符串的第next[i - 1]位,此时needle字符串在next[i - 1]位前的前缀与刚才的第i位前next[i - 1]位这么长的后缀是相同的,因此也就和haystack字符串中对应的子串匹配。重复上述过程直至找到needle字符串中新的匹配点或者从头开始。

注意,KMP算法中的前缀表指的是:以needle字符串第i位为结尾,有next[i]位长的子串与从needle字符串开头开始的next[i]位完全相同。

那么,如何构建前缀表next呢?如果用暴力方法的话,时间复杂度为O(m^2),显然不理想。我们同样可以利用前缀表自身来协助构建,我们定义一个长度为m的next数组,初始令next[0]=0,这是显而易见的。定义两个指针i和j,i指向现在要确认next[i]值的位置,j指向前缀的末尾。我们遍历needle字符串,令下标i从1到m递增。

  1. 若needle[i]与needle[j]相同,则将j加1后赋值给next[i],因为已经找到了最长的相同前缀。
  2. 若needle[i]与needle[j]不同,说明当前的needle[i]和字符串开头的前缀末尾元素不同,需要向前回退找到末尾相同的前缀,那么,应该如何回退呢?是遍历前缀,从j递减1到0为止吗?并不是,而是回退到第next[j - 1]位!如何证明呢?
    首先明确一点,next[j]一定小于等于j,那么next[j-1]一定不大于j-1,也就是说回退的速度必定比按1递减更快!但是如何保证在回退的时候一定不会出现退的太快导致遗漏了某个前缀?其实我们从前缀表的定义出发,在回退j时本来应该是回退到next[i - 1]位,这样就找到了i前面一位最长相同的前后缀长度,然而我们实际上有j - 1 >= next[i - 1],这样就保证了回退时必定不会跳过合适的前缀。

时间复杂度O(n+m),空间复杂度O(m)

代码

class Solution {
public:
    int strStr(string haystack, string needle) {
        if(needle.size() == 0) return 0;
        int next[needle.size()];
        getNext(next, needle);
        int j = 0;
        for(int i = 0; i < haystack.size(); ++i){
            while(j > 0 && haystack[i] != needle[j]){
                j = next[j - 1];
            }
            if(haystack[i] == needle[j]){
                ++j;
            }
            if(j == needle.size()){
                return i - j + 1;
            }
        }
        return -1;
    }

    void getNext(int* next, const string& s){
        int j = 0;
        next[0] = 0;
        for(int i = 1; i < s.size(); ++i){
            while(j > 0 && s[i] != s[j]){
                j = next[j - 1];
            }
            if(s[i] == s[j]){
                ++j;
            }
            next[i] = j;
        }
    }
};

标签:strStr,前缀,int,题解,needle,28,next,字符串,haystack
来源: https://www.cnblogs.com/fusheng-chana/p/16457158.html