人脸检测（一）

xiaoxiao2021-02-28 87

有天导师突然找我，让我搞一些关于人脸的应用，比如换个脸什么的……没办法那就先把人脸自动检测出来吧。人脸检测，即检测出图像中存在的人脸，并把它的位置准确地框出来。是人脸特征点检测、人脸识别的基础。可以谷歌Face Detection Benchmark寻找数据集和优秀论文，上thinkface论坛，搜集人脸检测数据集和方法。常用的人脸检测数据集，包括FDDB、AFLW、WIDER FACE等。随着近年来随着深度学习的快速发展，涌现出来很多优秀的人脸检测算法。例如，FDDB数据库就提交了很多出色的人脸检测算法，例如采用级联CNN网络的人脸检测方法：A Convolutioanal Neural Network Cascade，改进的faster rcnn做人脸检测：Face Detection using Deep Learning：An Improved Faster RCNN Approach，还有对小脸检测非常成功的Finding tiny faces等等，建议找个三篇左右认真研读就行了，也不需要去一一实现，没有太大意义。另外，像opencv、dlib、libfacedetect等也提供了人脸检测的接口。因为人脸检测是很基本的任务，所以很多公司都做了人脸检测的工作，而且做得很牛，例如face++。

下面仅介绍本人尝试并实现了的几种常见的人脸检测方法：

1.单个CNN人脸检测方法 2.级联CNN人脸检测方法 3.OpenCV人脸检测方法 4.Dlib人脸检测方法 5.libfacedetect人脸检测方法 6.Seetaface人脸检测方法

1.单个CNN人脸检测方法

该人脸检测方法的有点在于，思路简单，实现简单；缺点是速度较慢（在一块普通的gpu上对一副1000x600的图像进行多尺度检测也可能花上一两秒），检测效果还可以，但得到的人脸框不够准确。首先训练一个判断人脸非人脸的二分类器。例如采用卷积神经网络caffenet进行二分类，可以在imagenet数据集训练过的模型，利用自己的人脸数据集，进行微调。也可以自定义卷积网络进行训练，为了能检测到更小的人脸目标，我们一般采用小一点的卷积神经网络作为二分类模型，减小图像输入尺寸，加快预测速度。然后将训练好的人脸判断分类网络的全连接层改为卷积层，这样网络变成了全卷积网络，可以接受任意输入图像大小，图像经过全卷积网络将得到特征图，特征图上每一个“点”对应该位置映射到原图上的感受野区域属于人脸的概率，将属于人脸概率大于设定阈值的视为人脸候选框。图像上人脸的大小是变化的，为了适应这种变化，最暴力的办法就是使用图像金字塔的方式，将待检测的图像缩放到不同大小，以进行多尺度人脸检测。对多个尺度下检测出来的所有人脸候选框，做非极大值抑制NMS，得到最后人脸检测的结果。

这里提供用caffe实现该方法的数据集、模型文件和代码打包的下载链接

下面介绍用caffe实现该方法的具体过程。因为需要训练判断是否为人脸的CNN分类器，准备好正负训练样本，然后得到caffe训练所需的的数据集文件（由于采用的是48x48的网络，原始数据集归一化到了48x48）。这里CNN采用的是DeepID卷积神经网络，网络结构如下，它的输入只有48x48大小，而采用AlexNet或CaffeNet网络会增加时间开销。准备好网络模型文件train_val.prototxt和超参数配置文件solver.prototxt之后（下载链接中都有），开始训练，迭代10w次得到caffemodel。对测试集face_test文件夹中的图像进行测试，准备好测试用的deploy.prototxt。测试单张图像的python脚本face_test.py如下：

# -*- coding: utf-8 -*- """ Created on Fri Mar 10 23:02:06 2017 @author: Administrator """ import numpy as np import caffe size = 48 image_file = 'C:/Users/Administrator/Desktop/caffe/data/face/face_test/0/253_faceimage07068.jpg'#测试图片路径 model_def = 'C:/Users/Administrator/Desktop/caffe/models/face/deploy.prototxt' model_weights = 'C:/Users/Administrator/Desktop/caffe/models/face/_iter_10000.caffemodel' net = caffe.Net(model_def, model_weights, caffe.TEST) # 加载均值文件也可指定数值做相应的操作 #mu = np.load('C:/Users/Administrator/Desktop/caffe/python/caffe/imagenet/ilsvrc_2012_mean.npy') ###caffe 自带的文件 #mu = mu.mean(1).mean(1) # average over pixels to obtain the mean (BGR) pixel values transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape}) ##设定图片的shape格式(1,3,48,48)，大小由deploy 文件指定 #transformer.set_mean('data', mu) # 每个通道减去均值 # python读取的图片文件格式为H×W×K，需转化为K×H×W transformer.set_transpose('data', (2,0,1)) #改变维度的顺序，由原始图片(48,48,3)变为(3,48,48) # python中将图片存储为[0, 1]，而caffe中将图片存储为[0, 255]，所以需要一个转换 transformer.set_raw_scale('data', 255) # 缩放到【0，255】之间 transformer.set_channel_swap('data', (2,1,0)) #交换通道，将图片由RGB变为BGR #net.blobs['data'].reshape(1,3,size, size) # 将输入图片格式转化为合适格式（与deploy文件相同） #上面这句，第一参数：图片数量第二个参数：通道数第三个参数：图片高度第四个参数：图片宽度 image = caffe.io.load_image(image_file) #加载图片，始终是得到一副(h,w,3),rgb,0~1,float32的图像 net.blobs['data'].data[...] = transformer.preprocess('data', image) #用上面的transformer.preprocess来处理刚刚加载图片 caffe.set_device(0) caffe.set_mode_gpu() output = net.forward() output_prob = output['prob'][0].argmax() # 给出概率最高的是第几类，需要自己对应到我们约定的类别去 print output_prob print output['prob'][0][0] #或print output['prob'][0,1]

批量测试计算准确度的matlab脚本face_test.m如下：

%注意：caffe中维度顺序为(N,C,H,W),而matcaffe中Blob维度顺序为(W,H,C,N)，即完全相反 %matlab加载图像为(h,w,c),得到的是rgb,而caffe使用的是bgr function test_face() clear; addpath('..');%添加上级目录搜索路径 addpath('.');%添加当前目录搜索路径 caffe.set_mode_gpu(); %设置gpu模式 caffe.set_device(0); %gpu的id为0

转载请注明原文地址: https://www.6miu.com/read-59736.html

技术

最新回复(0)