LMCF文章阅读

xiaoxiao2021-02-28  10

这篇文章的作者在知乎上有比较详细的中文介绍https://zhuanlan.zhihu.com/p/25761718

the large margin tracking method with circulant feature maps

利用循环移位样本的特征图(circulant feature maps)与一个向量的内积,作为是目标的可能性;

目标函数的约束条件:使得目标中心处的patch是目标的可能性大于(w,h)处是目标的可能性超过一个距离。意为large margin!!

a fast optimization algorithm that builds up a bridge between our problem formulation and the well-known correlation filter.

给定了需要优化的目标函数和约束条件,利用一种与CF结合的快速在线优化算法,将求解过程转化到频域,加速了优化过程。

w和z其中一个固定的话,优化过程就变得很简单了,一步即可求出来,其中w是在频域计算的。然后交替更新,优化。

(1)w固定,z的求解方式:

(2)z固定,w转化到频域进行求解,加速了运算(计算公式如下图)

(3)非线性模型的求解:是需要求解参数alpha,由公式可计算出w(计算公式如下图)

多峰目标检测

新的一帧到来时,通过公式(1)向量参数与特征图做内积得到的响应图来预测目标位置,

x是以上一帧目标位置为中心,与目标区域成比例的一个iamge patch;

是目标可能性的函数F定义为两个向量的内积:

由前面的内容可知,求解参数w的过程可以通过FFT来加速。

单峰目标检测(只找最高峰)

所有的循环样本的响应图放在一起,就变成了:

寻找响应图的最高峰,作为预测的目标位置。(s是前面的x)

解释:*s的循环移位样本的特征与w做内积运算==原始image patch s的联合特征图与w做循环卷积(移位量为0时)–>*转换到频域,就是二者的element-wise product。

缺陷:然而这种检测方法是单峰检测,如果有相似物体或背景干扰存在的话,它们对应的响应值可能很接近目标甚至比目标更高,因而响应图中的最高峰可能就不是我们最终要找的目标。我们要做的不应该是把最高峰当做目标,而是将所有的峰都考虑进去(即多峰检测),从中寻找代表目标位置的那个峰。

多峰目标检测(从多个峰里再找最高分)

在响应图的基础上,乘上一个与响应图大小相同的0/1矩阵B(B的元素在局部最大值处的值设为1,其余为0)。则P(s)中的非零值就表示响应图中的多峰。——其实就是把响应图中的多峰给过滤出来。

文中这样描述:

多峰响应公式:

多峰检测方法:当多峰和最高峰的比例超过预设的阈值时,就以这些峰所在的位置为中心,分别提取patch作为s,然后用公式15寻找每个峰所在区域的最大值点,再从中寻找最高峰,作为最终的预测目标位置。下图中间是检测到的多峰,最右是多峰检测后的最终目标位置。

High-coinfidence update

大多数的跟踪器不考虑检测结果是否精确,简单粗暴地每帧都更新。实际上,当目标被遮挡或消失了,或者当前帧的检测结果根本就不准确时,再用这些结果去更新模型,就会导致检测失败。

下图展示了目标被遮挡后继续每帧更新模型,造成后续某一帧跟踪结果错误的现象。(第一列的绿色框对应每帧更新,空色是high-coinfidence更新;第二列是LMCF本文算法的跟踪结果;第三列是每一帧都更新的跟踪结果,可以看到(f)图跟踪错了)

本文:利用跟踪结果的反馈信息(跟踪结果是否足够可信),来决定是否有必要更新模型!

理想的响应图:只有一个sharp peak(锐利的峰),其他区域平滑下降。相关峰越尖锐,检测结果越精确。

非理想的响应图:有很多的波动。如果继续用不确定是否是目标的区域作为训练样本去更新模型,可能导致跟踪结果出错。

A. 定义两个条件:

Fmax = max F(s,y;w):响应图中的最高相应分数

APCE:表示响应图的波动程度和检测结果的可信度。对于更尖锐的峰和少的噪音,响应图只有一个尖锐的峰和平滑下降的区域,APCE变得更大。当目标被遮挡或消失的时候,APCE将会急剧下降。

B. 更新条件(High-coinfidence):

当 当前帧的Fmax和APCE与它们各自的历史均值的比值超过beta1和beta2时,就认为当前帧的跟踪结果是高可信的,这个时候才选择更新模型。

C. 这样做的结果是

防止跟踪结果不准确时还去更新模型,造成模型堕落的问题。


本文的算法流程图


性能分析

只和相关滤波器的跟踪算法进行了比较

1.使用传统特征,fps可以达到85帧每秒;使用CNN特征,明显降低,变化成8f/s。但使用高层特征的精度更高。

2.对于遮挡、光线变化等各种情况的鲁棒性都表现的最好:(平均成功率最高)

3.DeepLMCF的精度仅次于C-COT

转载请注明原文地址: https://www.6miu.com/read-200120.html

最新回复(0)