leetcode 72 动规经典题《编辑距离》问题的理解
作者:互联网
编辑距离
题目链接
题目内容
给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
插入一个字符
删除一个字符
替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
提示:
0 <= word1.length, word2.length <= 500
word1 和 word2 由小写英文字母组成
思路
- 动态规划,二维dp数组,dp[i][j]表示word1中的前i个字符组成的字串和word2中前j个字符组成的字串的编辑距离。
- 初始化:
dp[i][0] = i and dp[0][j] = j
,表明任何字符串和空串的编辑距离都是该串自身的长度(全部删光) - 状态转移方程:
- 如果word1[i] == word2[j],说明当前两个字符不用做任何操作,那么dp[i][j] = dp[i - 1][j - 1]
- 如果word1[i] != word2[j],说明当前两个字符处需要做变动操作。那么
dp[i][j] = min(min(dp[i][j - 1], dp[i - 1][j]), dp[i - 1][j - 1]) + 1
上式有一个相对难理解的点,也是本篇想表达的重点。下面会更深入解答。点这里跳转
代码
class Solution {
public:
int minDistance(string word1, string word2) {
int size1 = word1.size();
int size2 = word2.size();
vector<vector<int>> dp(size1+1, vector<int>(size2+1));
// 任何字符串和空串的编辑距离都是该串自身的长度(全部删光)
for (int i = 0; i <= size1; i ++) {
dp[i][0] = i;
}
for (int j = 0; j <= size2; j ++) {
dp[0][j] = j;
}
for (int i = 1 ; i <= size1 ; i ++) {
for (int j = 1 ; j <= size2; j ++) {
// 匹配的情况
if (word1[i - 1] == word2[j - 1]) {
dp[i][j] = dp[i - 1][j - 1];
}
// 不匹配的情况
else {
dp[i][j] = min(min(dp[i - 1][j] + 1, dp[i][j - 1] + 1), dp[i - 1][j - 1] + 1);
}
}
}
return dp[size1][size2];
}
};
失配时dp数组的转移怎么理解
- 根据题意,当word1[i - 1] != word2[j - 1]时,我们可以选择增加,删除或者是替换当前元素,对两个字符串进行调整。
- 删除:
- 1)如果删除word1[i - 1],dp[i][j]等于【计算word1中第 1 到第 i-1 个元素组成的字串和word2中第 1 到第 j 个元素组成的字串之间的编辑距离】,然后增加1(删除word1[i]的操作)
- 2)如果删除word2[j - 1],dp[i][j]等于【计算word1中第 1 到第 i 个元素组成的字串和word2中第 1 到第 j-1 个元素组成的字串之间的编辑距离】,然后增加1(删除word1[i]的操作)。也就是:
// 在操作为删除的情况下
dp[i][j] = min(dp[i - 1][j], dp[i][j - 1]);
- 替换:word1[i - 1]和word2[j - 1]经过一个替换操作变成了一样的字母,那么只需要拿到这两个字母前面的字串的编辑距离加1即可,如下:
// 在操作为替换的情况下
dp[i][j] = dp[i - 1][j - 1] + 1;
- 增加:这个是本题使用动态规划方法最难理解的一个点。根据代码可以发现实际上是没有显式的去计算增加操作的,等于是忽略了这种操作,所以这是为什么?一张图就可以说明问题。
- 从图中我们可以看出,在word1中添加元素c的目的,为的是通过一个操作去消除word2中当前失配的这个字母word2[j],该操作等于在word2中删除元素word2[j],同时两个操作dp数组(编辑距离)的计算公式也无异。
- 同理,由于操作的对称性,在word2中添加元素也等价于在word1中删除元素。
- 所以,最终的状态转移方程为:
dp[i][j] = min(
min(
dp[i - 1][j] + 1, // 在word1中删除word1[i],或者在word2[j]后方中添加word1[i]元素
dp[i][j - 1] + 1 // 在word2中删除一个元素word2[j],或者在word1[i]后方添加word2[j]元素
),
dp[i - 1][j - 1] + 1 // 将word1[i]替换为word2[j]或者将word2[j]替换为word1[i]
);
标签:元素,删除,动规,替换,word1,72,word2,leetcode,dp 来源: https://www.cnblogs.com/LeisureLak/p/16581822.html