编辑距离问题
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
输入
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
输出
输出a和b的编辑距离
输入示例
kitten
sitting
输出示例
3
递推式:f(i,j) = min(f(i – 1, j – 1) + same(i,j), f(i – 1,j ) + 1, f(i, j – 1) + 1);f(0, j) = j; f(i, 0) = i;
伪代码:
for j = 0 to n do
f[j] = j
endfor
for i = 1 to m do
last = f[0]
f[0] = i
for j = 1 to n do
temp = f[i,j]
f[i,j] = min(last + same(i,j), temp + 1, f[j – 1] + 1)
last = temp
endfor
endforAC代码:
#include<cstdio>
#include<algorithm>
#include<iostream>
#include<cstring>
int dp[1001][1001];
using namespace std;
int main()
{
char a[1001],b[1001];
while(scanf("%s %s",a+1,b+1)!=EOF){
a[0]=b[0]='0';
int n=strlen(a)-1,m=strlen(b)-1;
memset(dp,0,sizeof(dp));
for(int i=0;i<max(n,m);i++){
dp[0][i]=dp[i][0]=i;
}
for(int i=1;i<=n;i++){
for(int j=1;j<=m;j++){
if(a[i]==b[j]){
dp[i][j]=dp[i-1][j-1];
}else{
dp[i][j]=dp[i-1][j-1]+1;
}
dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i][j]);
}
}
printf("%d\n",dp[n][m]);
}
return 0;
}