我们有多种方案来对模型进行数据拟合,来得到模型的未知参数值,因此存在着一个问题,我们如何去挑选一个合适的模型。 我们先来考虑上一篇文章所讲的的模型 y=Ax2 的适配问题。
对于这个模型,我们在上一篇就已经用 最小二乘法准则 和 变换后的最小二乘准则 来对其进行拟合,我们发现,两个拟合后的结果并不大一样。对于一个模型是否很好的拟合了数据的一个评估途径是 计算模型数据点与实际点的偏差。稍后我们将对几种方式获得的模型的绝对偏差进行对比。 现在我们先应用 切比雪夫近似准则 来对该模型进行数据拟合。 因为有5个数据点,该数学问题就是最小化五个数 |ri|=|yi−f(xi)| 中的最大者,我们将其记为 r 。我们需要极小化r,可以产生一系列线性规划约束方程,即
|r−ri|≥0 对这一系列线性规划约束方程进行求解,将产生 r=028293 和 A=3.17073 。这里我们将最大绝对偏差降到了0.28293。注意,这是我们所能获得的最大绝对偏差的最小值。 现在确定了该模型 y=Ax2 的三个估计,那么我们要选择其中哪个呢。下表将列举三个估计的绝对偏差与实测点的 残差 xi yi yi−3.1869x2i yi−3.1368x2i yi−3.17073x2i 0.50.7-0.0967-0.0842-0.09271.03.40.21310.26320.22931.57.20.0294750.14220.06592.012.4-0.3476-0.1472-0.28292.520.10.1818750.49500.28293接下来我们对这三个模型的偏差进行一个总结
方法模型 ∑[yi−f(xi)]2 max|yi−f(xi)| 最小二乘 yi−3.1869x2i 0.20950.3476变换后的最小二乘 yi−3.1368x2i 0.36330.4950切比雪夫 yi−3.17073x2i 0.22560.28293从上表中我们可以看出,每一种方法都有其优势之处。所以在我们对模型估计进行挑选的时候,我们需要去考虑模型的使用目的,实际情况所要求的精度,数据的准确性等等因素去综合考虑
回顾车辆的停止距离的问题,我们讨论了速度和刹车距离之间的关系,得到了一个停止距离模型
d=1.1v+0.054v2 现在我们利用 最小二乘准则 来对这个模型进行拟合,可得到结果为 d=1.104v+0.0542v2 ,可以发现结果并没有显著的差异。 接下来我们要分析拟合结果,如下图所示。 我们可以发现,我们的模型在70mph之前都是大于实测速度,之后都是低估了停止距离,为此我们可以划出该模型的 残差图 以此来看到哪里这个模型哪里出现了问题,将残差作为一个独立变量的函数而得到的函数图即为残差图。如下图所示 在这里可以很明显的看出,在70mph之前的残差都是大于0的值,之后都小于0。而如果一个模型是完美的拟合了实际情况的话,这个模型的残差图所展现的偏差不仅小,而且应该有正有负,所以我们得到的这个停止距离的模型,并不是一个完美的模型,他无法对我们的现实生活中的停止距离进行拟合。