其定性特征。
主动形状模型(ASM)和主动外观模型(AAM)是近年来流行的一种对象形状提取算法,其核心思想是在某种局部点模型匹配的基础上,利用统计模型对待识别的人脸的形状进行约束,从而转化为一个最优化求解问题,并期望最终收敛到实际的人脸形状上去。
而且,在实际的检测中,由于人脸的尺度、形状等的变化较大时往往检测效果较差,此种方法也没有获得较广泛的应用。
2.4 基于外观的方法
基于外观的方法也可以称为基于统计的人脸检测方法也可以称为基于分布特征的检测方法,它是利用统计分析和机器学习等方法来获得人脸和非人脸特征,利用这些特征和判决函数来进行人脸检测的方法。
MIT 的Sung 和Poggio提出了一种基于分布特征的人脸检测方法。他们建立了一个分布模型,指出通过对图像正例和反例样本的学习可以获得人脸的分布模型。该系统由两个部分组成,人脸模式和非人脸模式的分布模型及一个多层感知器分类器。每一个人脸和非人脸的学习样本首先进行预处理,包括归一化,直方图均衡等,然后处理为19×19 的图像,将这个图像作为361 维的矢量。接下来将这些矢量采用改进的K 均值聚类算法分成6个人脸和6个非人脸的聚类。每一类用它们的均值图像和协方差矩阵表示成一个高维的高斯函数。见图2-1 所示。
图
2-1 Sung 和Poggio提出的人脸非人脸聚类模型
11
值得强调的是,为了解决人脸检测中“非人脸”样本的选取问题,Sung 等人采用“自举(bootstrap)”方法:首先建立一个只使用“人脸”样本和少量“非人脸”样本训练的初始分类器对一组图像进行检测,将所有错检非人脸为人脸的图像加入“非人脸”样本库;然后把得到的“人脸”和“非人脸”样本训练构成一个新的分类器进行重新检测。将以上过程不断循环,直到收集到了足够的“非人脸”样本。这种循环检测来得到非人脸的收集方法后来得到许多研究者的使用。
由于人脸图像的复杂性,只使用基本特征与简单规则很难有效地描述人脸与背景的本质区别,因此基于统计和学习的方法越来越受到重视。这类方法是把人脸区域看作一类模式,利用统计分析与机器学习的方法对大量人脸样本和非人脸样本进行学习得到各自的统计特征,然后根据这些特征构造分类器,通过判别图像中所有可能区域属于哪类模式的方法实现人脸检测。实际上,人脸检测问题被转化为统计模式识别的二分类问题。该类方法主要包括:线性子空间法、神经网络、隐马尔可夫模型、支持向量机、基于AdaBoost算法等方法。
12
第3章 经典方法概述
人脸检测的方法多于牛毛,基于各种数学模型的方法估计有近百种。本节简单描述了用于人脸检测的几个经典方法,以便管中窥豹,这几个方法在人脸检测历史上都发挥过各自的作用。
3.1 特征脸
最早用特征向量来进行人脸检测的是Kohonen,他构建了一个简单的神经网络来实现规范化了的人脸图像的识别。这个神经网络用图像的自相关矩阵的特征向量近似计算了对人脸的描述。这些特征向量后来就发展成了特征脸(Eigenface)方法。
特征脸是基于从主成分分析(PCA)的一种人脸检测,它根据一组人脸训练样本构造主元子空间,检测时,将测试图像投影到主元子空间上,得到一组投影系数,再和各个己知的人脸图像模式比较,从而得到检测结果。
在传统特征脸的基础上,研究者注意到特征值大的特征人脸向量(特征脸)并不一定分类性能好,而因此发展了多种特征(子空间)选择方法,如Belhumeur的FisherFace方法等。事实上,特征脸方法是一种显式主元分析人脸建模的方法,而一些线性自联想、线性压缩型BP网则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量。特征脸方法是一种简单、快速、实用的基于变换系数特征的算法,但由于它在本质上依赖于训练集和测试集图像的灰度相关性,所以还有着很大的局限性。
3.2 神经网络
人工神经网络(Artificial Neural Network,ANN)方法是通过训练一个网络结构,把模式的统计信息隐含在神经网络的结构和参数之中。在人工神经网络的方法中,Rowley的工作较为突出。
Rowley等提出基于神经网络的人脸检测系统。他们的系统分为两个阶段:第一阶段是基于神经网络的分类器。该分类器的输入是规定尺寸的检测区域,输出为l到.1的数,由此来判断检测区域是否是人脸(输出接近1为人脸,接近.1为非人脸):第二阶段是合并重复检测并判别。由于训练样本以及分类器等因素,在图像中以人脸为中心的一定区域内会产生重复检测。此阶段使用了一个单层的神经网络对重复检测进行合井,并使用一个多层的神经网络对检测结果进行判决。以上所述方法局限性在于,仅能检测正面垂直的人脸。1998年,Rowley等增加了一级神经网络用以检测平面内旋转的人脸角度,在对原图像进行反旋转后,送到正面人脸检测器中进行检测,使得该系统可以检
13
测图像中按任意的角度旋转的人脸。
图3-1 Rowley 的带有图像预处理的神经网络系统
用神经网络进行人脸检测的好处是很容易训练一个用于检测人脸模式的系 统。但是,缺点是网络结构需要大范围的调整(层数、结点数、学习速率等等) 才能获得期望的性能。
3.3 隐马尔可夫模型方法
隐马尔科夫模型(Hidden Markov Model,HMM)是用于描述信号统计特性 的一组统计模型。前提假设是模型可被定义为一个参数化的进程。该进程的参数可通过精确的方法估计出来。HMM 使用马尔科夫链来模拟信号统计特征的变化,而这种变化又是间接地通过观察序列来描述的,因此,隐马尔科夫过程是一个双重的随机过程。在HMM 中,节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出这一特征的概率不同。由于HMM 是一个统计模型,对于同一特征序列,可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非确定的。这种模型对于状态序列来说是隐的,故称为隐马尔科夫模型。
Nefian等均各人脸从上到下划分为五个互有重叠的区域(头发、额头、眼、鼻、嘴)。根据这个划分构造了一个包含五个状态的一维连续HMM用以表示人脸。接着对各块进行KL变换,取每块若干最大的特征向量作为观测值对HMM进行训练。此后,Nefian等还提出基于嵌入式HMM 的人脸检测方法。该方法同时考虑到人脸由左到右各个特征的自然顺序,使用二维HMM,并采用二维DCT变换的系数作为观察向量。
3.4 支持向量机
支持矢量机(Support Vector Machines)是由V. Vapnik 与其领导的贝尔实验室的小组一起开发出来的一种新的机器学习技术。SVM 的理论基础来自于Vapnik等提出
14
的统计学习理论,它的基本思想是,对于一个给定的具有有限数量训练样本的学习任务,如何在准确性(对于给定训练集)和机器容量(机器可无错误地学习任意训练集的能力)进行折中,以得到最佳的推广(Generalization)性能。
与传统统计学相比,统计学习理论(Statistical Learning Theory或SLT)是一种专门研究小样本情况下机器学习规律的理论。该理论针对小样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。Vapnik 等人从六、七十年代开始致力于此方面研究,到九十年代中期,随着其理论的不断发展和成熟,也由于神经网络等学习方法在理论上缺乏实质性进展,统计学习理论开始受到越来越广泛的重视。 目前将该理论已经得到了一些应用,比如在光学字符识别等方面,并且获得了比较好的效果,不过由于建立完整的理论体系时间不长,该方法用于人脸检测的很少,尽管SVM 算法的性能在许多实际问题的应用中得到了验证,但是该算法在计算上存在着一些问题,包括训练算法速度慢、算法复杂而难以实现以及检测阶段运算量大等等。Osuna等人介绍了一种具体的算法并对人脸识别问题进行了实验。他将样本集分为两个集合B 和N,集合B 作为子问题工作样本集进行SVM 训练,并给出了两阶多项式分类器在人脸识别问题中的应用结果。试验结果表明该方法比Sung 等提出的基于分布特征的学习方法的检测率有所提高,同时计算复杂度下降,提高了检测速度。
15