帅帅经常跟同学玩一个矩阵取数游戏:对于一个给定的n行*m列的矩阵,矩阵中的每个元素aij均为非负整数。游戏规则如下:
每次取数时须从每行各取走一个元素,共n个。m次后取完矩阵所有的元素;每次取走的各个元素只能是该元素所在行的行首或行尾;每次取数都有一个得分值,为每行取数的得分之和;每行取数的得分 = 被取走的元素值*i,其中i表示第i次取数(从1开始编号);游戏结束总得分为m次取数得分之和。 帅帅想请你帮忙写一个程序,对于任意矩阵,可以求出取数后的最大得分。包括n+1行; 第一行为两个用空格隔开的整数n和m。 第2~n+1行为n*m矩阵,其中每行有m个用单个空格隔开 。
l<=n,m<=80,1<=aij<=1000
仅包含1行,为一个整数,即输入矩阵取数后的最大的分。
2 3
1 2 3
3 4 2
34
观察题目,易知对于每行而言任务相同,故问题可分割为对每行求出取数得分之和最大值并相加。
对于每行取数得分最大值的求解有若干种方法,较容易想到的是贪心法与搜索法。
一般而言,观察题供测试数据,易得如下贪心方法:
每次取两端点中较小的一个数,加权求和。
1、对于两端点相等的情况难以作出决断,取任意一个均有其合理性与不合理性; 2、看似符合排序不等式,实际上是以局部最优取代整体最优,错误判断结果,如果碰到较小数被较大数所夹的情况则易证其不是最优解。
即每次对于取左端与右端进行搜索:
O(n*2m) 显然在数据较大时易超时。
动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解,创立了解决这类过程优化问题的新方法——动态规划。 2
观察题目,易知对于每行而言任务相同,故问题可分割为对每行求出取数得分之和最大值并相加。对于每行均可验证其问题的阶段性及无后效性,并通过寻找局部最优解,通过动态规划以实现问题的高效求解。
对于每一行而言,每一次取数均可视为一阶段,该阶段得分与且仅与上一行的取数结果及状态有关,满足阶段性。
对于每一次取数,其所能达到的最优解仅与上一行的有限种状态和局部最优解有关。对于上一行的每一种状态,无论其取法顺序,最后剩余序列必然为连续若干数,取法顺序对于本行决策无影响,满足无后效性。
以f[i][j]数组记录第i次取数后剩余区间左端为j时的最优解,“左端为j”即剩余区间为从j开始到m+j-i-1的连续m-i项。
f[1][1]=a[m]表示第一次取数取右端时得分为a[m],剩余项为1到m-1项; f[1][2]=a[1]表示第一次取数取左端时得分为a[1],剩余项为2到m项。
每次比较取左侧端点与取右侧端点的得分大小,取较大解。
f[i][j]=max{f[i-1][j-1]+a[j-1]*i,f[i-1][j]+a[j+m-i]*i}
观察到f[i][j]仅与f[i-1][j]和f[i-1][j-1]有关,故可调整j循环顺序,采用一维数组替代二维数组(尽管对这道题而言意义不大),则只需要一维数组f[j]即可。
f[j]=max{f[j-1]+a[j-1]*i,f[j]+a[j+m-i]*i}
最终程序代码(C++)如下:
O(n*m2) 完全没有超时风险。
二维数组O(m2) 一维数组O(m) 由此可见此处降维并不是必须的。
1、本题代码中对第i-1次取数得分是否为0的探讨是否必要? 2、a[j+m-i]是否存在越界风险? 3、本题中变量j的有效变化范围是多少? 4、控制变量j的范围是否可以解决上述问题?
原题加强版可见 http://codevs.cn/problem/1166/ ↩︎
动态规划相关定义参照百度百科 https://baike.baidu.com/item/动态规划/529408?fr=aladdin ↩︎
在此去掉了绝大部分原有注释,请读者掌握算法原理后自行理解 ↩︎
欢迎评论或私信以交流意见,接受正当批评与指正 ↩︎