目标检测
1.大体步骤i
1)候选框的选取Selective Search 2) 特征提取(featuremap) 3)特征分类 (SVM 支持向量机分类) 4)精修—>回归器
2.RCNN
(1)RCNN的四个步骤
1)一张图经过ss方法生成1K到2k个候选框
2)对每个候选框进行提取特征,使用深度网络进行提取feature map
3)特征送入每一类送到SVM分类器,判别是否属于该类
4)使用回归器进行精细修正候选框位置
(2)候选框的生成
使用SS方法进行将图片生成候选区域
- 使用一种过分割技术,将图片分割成小区域
- 查看小区域,合并可能性最高的两个区域,重复至到整张图片合并成一个区域位置
- 输出所有存在区域,即为候选区域
(3)特征的提取
使用深度网络方法进行特征的提取
1)预处理
首先将候选框处理为同一尺寸(区域归一化),227*227
影响性能问题:
- 外扩尺寸的大小
- 框外区域处理方法
- - 直接截取
- - 补灰
2)预训练
网络结构
训练数据 使用数据集
3)调优训练
网路结构:最后一层进行处理
训练数据:考察一个候选框和当前图像上所有标定框重叠的面积最大的一个,如果重叠面积大于0.5,则认为候选框作为此标定的类别,否则认为此候选框为背景。
(4)类别的判断
分类器
对于每一类目标,使用一个SVM二类分类器进行判断,输入为深度网络最后一层,输入为最后一层的数据,输出是否为此类。
输出后会有很多的负样本。修正此方法可以使用 hard negative mining 方法。
- 正样本 本类的真正候选框
- 负样本 与标定框的重叠小于0.3,即为负样本
(5)位置精修
目标检测的目标就是 检测出更好的位置
1)回归器
对于每一类目标,使用一个线性脊回归器进行精修
输入为深度网络pool5层的4096维特征,输出为xy 方向的缩放与平移
2) 训练的样本
判定与真值大于0.6的候选框