编辑距离问题

xiaoxiao2021-02-28  4

编辑距离问题 编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 例如将kitten一字转成sitting: sitten (k->s) sittin (e->i) sitting (->g) 所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。 给出两个字符串a,b,求a和b的编辑距离。 输入 第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。 输出 输出a和b的编辑距离 输入示例 kitten sitting 输出示例 3 递推式:f(i,j) = min(f(i – 1, j – 1) + same(i,j), f(i – 1,j ) + 1, f(i, j – 1) + 1);f(0, j) = j; f(i, 0) = i; 伪代码: for j = 0 to n do f[j] = j endfor for i = 1 to m do last = f[0] f[0] = i for j = 1 to n do temp = f[i,j] f[i,j] = min(last + same(i,j), temp + 1, f[j – 1] + 1) last = temp endfor endforAC代码: #include<cstdio> #include<algorithm> #include<iostream> #include<cstring> int dp[1001][1001]; using namespace std; int main() { char a[1001],b[1001]; while(scanf("%s %s",a+1,b+1)!=EOF){ a[0]=b[0]='0'; int n=strlen(a)-1,m=strlen(b)-1; memset(dp,0,sizeof(dp)); for(int i=0;i<max(n,m);i++){ dp[0][i]=dp[i][0]=i; } for(int i=1;i<=n;i++){ for(int j=1;j<=m;j++){ if(a[i]==b[j]){ dp[i][j]=dp[i-1][j-1]; }else{ dp[i][j]=dp[i-1][j-1]+1; } dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i][j]); } } printf("%d\n",dp[n][m]); } return 0; }
转载请注明原文地址: https://www.6miu.com/read-250366.html

最新回复(0)