【算法4】5.3.4.子字符串查找-BoyerMoore算法
作者:互联网
Boyer Moore 算法思想:将模式字符串与文本字符串从右往左进行匹配。
Boyer Moore 需要先对模式字符串进行预处理,根据模式字符串生成 right[]
数组,记录字符集中的字符在模式字符串中最右出现的位置。
当将模式字符串从右往左对比出现不匹配时,会有以下情况:
- 文本字符
text.chatAt(i+j)
不在模式字符串中,需要将模式字符串右移到text.chatAt(i+j)
之后 - 文本字符
text.chatAt(i+j)
在模式字符串中,需要将模式字符串该字符出现的最右位置与该字对齐(要保证至少右移一个位置)
/*
* Boyer Moore 算法
* */
public class BoyerMoore {
private static final int R = 256; // 字母表
private int[] right; // 记录字符集中的字符在模式字符串中出现的最后位置,不存在则是 -1
private String pattern;
public BoyerMoore(String pattern) {
right = new int[R];
this.pattern = pattern;
int M = pattern.length();
for (int i = 0; i < R; i++) {
right[i] = -1;
}
for (int i = 0; i < M; i++) {
right[pattern.charAt(i)] = i;
}
}
public int search(String text) {
int M = pattern.length();
int N = text.length();
int skip;
for (int i = 0; i <= N - M; i += skip) {
skip = 0;
for (int j = M - 1; j >= 0; j--) {
if (text.charAt(i + j) != pattern.charAt(j)) {
skip = j - right[text.charAt(i + j)];
if (skip < 1) skip = 1; // 至少需要向右移动一个位置
break;
}
}
if (skip == 0) {
return i;
}
}
return -1;
}
}
标签:5.3,int,pattern,模式,算法,right,text,BoyerMoore,字符串 来源: https://www.cnblogs.com/liaozibo/p/boyer-moore.html