本篇开始解释Faster RCNN网络的结构 为什么不解释代码呢???因为我没找到代码在哪TOT…..(感觉越来越脱离主题了TOT) 首先是第一阶段的生产建议网络。
图像一共经过三类网络结构: 首先:在图像输入后,经过卷积层的特征提取操作,然后将输出的特征图复制成两份,其中一份输入到RPN中,另一份输入到ROI中 然后:RPN主要是根据输入的特征图先先经过3*3卷积,然后使用锚框将特征图进行扫描得到多个图像,同样复制成两份,一份使用二分类网络判断这个锚框内有没有物体,另一个进行锚框的修正回归。如果锚框内有物体的存在,就把修正后的锚框输出到ROI层中。 最后:在ROI层中得到的是一个从特征提取层中得到的特征图,还有一个是RPN中得到的一个建议区间,最后得到一个精确的图像。再将图像经过pooling层输出为相同大小后经过全连接操作后输出一个分类和一个锚框的回归。
这篇文章就主要简单结束下网络结构,在下一篇中解释锚框的生成。