RCNN(Regions with CNN features)将CNN方法应用到目标检测问题上。 算法步骤: 1. 候选区域选择 对每张输入图片使用一个基于规则的“SelectiveSearch”算法来选取多个提议区域。Region Proposal是一类传统的区域提取方法,可以看作不同宽高的滑动窗口,通过窗口滑动获得潜在的目标图像。 2.CNN特征提取 跟微调迁移学习里那样,选取一个预先训练好的卷积神经网络并去掉最后一个输入层。每个区域被调整成这个网络要求的输入大小并计算输出。这个输出将作为这个区域的特征。 3.分类 使用这些区域特征来训练多个SVM来做物体识别,每个SVM预测一个区域是不是包含某个物体 4.边界回归 使用这些区域特征来训练线性回归器将提议区域 算法缺点: 1.多个候选区域对应的图像需要预先提取,占用较大的磁盘空间; 2.针对传统CNN需要固定尺寸的输入图像,crop/warp(归一化)产生物体截断或拉伸,会导致输入CNN的信息丢失; 3.每一个ProposalRegion都需要进入CNN网络计算,上千个Region存在大量的范围重叠,重复的特征提取带来巨大的计算浪费。