基于小数据集下的面部表情BN识别方法与流程

文档序号:16579741发布日期:2019-01-14 17:51阅读:245来源:国知局
本发明涉及人工智能、图像工程与安保系统等的目标识别应用领域,具体涉及一种基于小数据集下的面部表情bn识别方法。
背景技术
::贝叶斯网络(bayesiannetwork,bn)可以表示为b(g,θ),其中g是一个具有n个节点的有向无环图,g中的n个节点代表n个随机变量,节点间的有向边代表随机变量之间的依赖关系;θ是与每个节点相关的条件概率表,表示为p(xi|pa(xi))。θ定量地表达了节点xi同其父节点pa(xi)之间的依赖程度,式(1)为bn的联合概率分布:其中,pa(xi)表示g中xi的父节点集合条件概率分布,p(xi|pa(xi))表示包含在g中给定父节点值的变量的每个值的概率。p(xi|pa(xi))第k个概率值表示为θijk=p(xi=k|pa(xi)=j)即是节点xi的一个参数,其中,θijk∈θ,1≤i≤n,1≤j≤qi,1≤k≤ri。ri表示xi的状态数量,qi表示xi父节点组合pa(xi)的势。显然,节点xi一共有ri×qi个参数,它们构成了一个ri×qi维的矩阵,称之为节点xi的参数θ,即条件概率分布表(conditionprobabilitytable,cpt)。cpt准确高效地确定,是有效利用bn模型解决实际问题的基础。cpt学习是根据确定bn的结构(有向无环图),利用样本信息与先验知识来学习结点变量的条件概率分布(条件概率表)。目前在bn的cpt学习的领域已经研究发展了许多经典实用的算法,但这些方法的实现和应用都是基于大规模数据集(完备或者经补充后完备),而在实际工程应用中,受限于环境、材料、时间等因素,很多试验往往不能够多次重复,使得能够获得的试验数据较少,样本规模很小,这样的小样本数据集里能够表达的信息不够完整,由此进行的bn参数学习的准确性和可靠性无法保证。由此衍生出基于小样本数据集的bn的cpt学习,即bn模型参数建模问题的研究。将问题域转化为bn模型表示后,便可利用bn理论完成推理任务。其中,联合树(junctiontree)算法是目前计算速度快、应用最广的bn精确推理算法之一。由于bn有机地结合了概率论与图论的理论成果,是解决不确定性和不完备信息问题处理的有效方法,是可应用于面部表情识别的理想工具。技术实现要素:本发明的目的是提供一种基于小数据集下的面部表情bn识别方法,是一种利用面部表情动作单元(au)小数据集进行贝叶斯网络结构与参数建模与推理的面部表情识别方法,利用动作单元(au)小样本数据集与定性专家经验有机结合,完成面部表情识别bn的结构建模和参数建模,最后利用面部表情识别bn推理结果来反映面部表情的状态,提高了面部表情识别的准确性和有效性。本发明所采用的技术方案为:基于小数据集下的面部表情bn识别方法,其特征在于:由以下步骤实现:首先提取面部表情图像的几何特征和hog特征,经特征融合和归一化等处理构成动作单元au标签样本集;其次构建面部表情识别bn结构,并将定性专家经验转化为bn条件概率之间的约束集合;随后引入目标函数,利用凸优化对最大化形式的目标函数求解,完成面部表情识别bn模型参数的估算;最后利用联合树推理算法识别出面部表情。具体由以下步骤实现:第1步:基于hog方法提取面部表情的特征向量,经特征融合和归一化等处理构成相应的au标签样本数据集d;第2步:判断面部表情bn是否已经结构建模;若已建模,则跳转至第3步;否则,根据专家经验建立bn模型结构g;第3步:判断bn参数cpt是否已经参数建模;若已参数建模,则跳转至第4步;若没有参数建模则利用参数学习算法,得到bn模型参数cpt;第4步:在bn模型中,由d得到待识别的观测证据ev,利用联合树算法进行推理,从而得到面部表情属性概率ω';第5步:判断目标属性概率ω'是否大于等于阈值ω;若不满足则返回第1步;若满足则输出面部表情属性,即面部表情识别结果。第2步中,模型结构g具体为:依次以父节点expression作为14条有向边的箭尾,箭头分别指向子节点au1、au2、au4、au5、au6、au7、au9、au12、au15、au17、au23、au24、au25、au27。第3步中,参数学习算法的具体步骤为:a、根据样本数据集d统计样本量nijk,即样本数据中父节点状态为j、第i个节点取第k个状态的统计值,再根据公式(2)计算得到θijk;若θijk为0,则令θijk=0.002;b、将专家经验根据公式(3)形成约束集合ξ;bn节点参数描述为等式和不等式集合,即:其中,θa表示参数序列,αa是相应的常数序列,α是一个常数且α≥0;c、根据θijk,约束集合ξ,即公式(3)以及目标函数公式(4)进行参数优化确定出bn参数cpt;cpt求解利用凸优化求解工具完成,然后返回第1步。本发明具有以下优点:基于bn的面部表情识别方法,结构建模方面以有向边和条件概率表的形式分别描述了变量之间定性与定量依赖关系,表达形象直观,理论基础坚实,推理能力强大,是不确定性问题建模和推理的有效工具。本发明利用提取的面部表情图像的几何特征和hog特征,经特征融合和归一化等处理构成动作单元(au)标签样本集,基于bn理论中建模方法、学习算法和成熟的推理算法完成面部表情识别所需的建模和推理任务。在参数学习方面,充分利用了表情识别专家经验的等式和不等式约束条件,在一定程度上弥补了数据不足对参数学习精度的影响,又避免了对面部表情识别过程进行复杂的数学建模。与现有技术比较,本发明提出的面部表情识别方法可在小数据集的条件下大大提高面部表情识别的精度,可广泛应用于人机交互、安保系统、医疗健康诊断、视频通信、驾驶员身份识别和疲劳驾驶等领域。附图说明图1为本发明的流程图;图2为本发明的bn模型结构图;图3为本发明参数学习算法的流程图。具体实施方式下面结合具体实施方式对本发明进行详细的说明。本发明涉及一种基于小数据集下的面部表情bn识别方法,由以下步骤实现:首先提取面部表情图像的几何特征和hog特征,经特征融合和归一化处理构成动作单元au标签样本集;其次构建面部表情识别bn结构,并将定性专家经验转化为bn条件概率之间的约束集合;随后引入目标函数,利用凸优化对最大化形式的目标函数求解,完成面部表情识别bn模型参数的估算;最后利用联合树推理算法识别出面部表情。上述方法的步骤具体为:第1步:基于hog方法提取面部表情的特征向量,经特征融合和归一化等处理构成相应的au标签样本数据集d;第2步:判断面部表情bn是否已经结构建模。若已建模,则跳转至第3步;否则,根据专家经验建立bn模型结构g,结构模型如图2所示,即依次以父节点expression作为14条有向边的箭尾,箭头分别指向子节点au1、au2、au4、au5、au6、au7、au9、au12、au15、au17、au23、au24、au25、au27;(动作单元au含义可参见:valstarmf,almaevt,girardjm,etal.fera2015-secondfacialexpressionrecognitionandanalysischallenge[c]//ieee,internationalconferenceandworkshopsonautomaticfaceandgesturerecognition.2015:1-8)其中动作单元au6表示“下嘴轮廓上翘”发生与否、au25代表“双唇分开暴露牙齿”发生与否事件等;第3步:判断bn参数cpt是否已经参数建模。若已参数建模,则跳转至第7步;否则利用如图3所描述的参数学习算法(第4步至第6步),得到bn模型参数cpt;第4步:根据样本数据集d统计样本量nijk,即样本数据中父节点状态为j、第i个节点取第k个状态的统计值,再根据公式(2)计算得到θijk;若θijk为0,则令θijk=0.002;第5步:将专家经验根据公式(3)形成约束集合ξ;bn节点参数可方便描述为等式和不等式集合,即:其中,θa表示参数序列,αa是相应的常数序列,α是一个常数且α≥0;第6步:根据θijk,约束集合ξ,即公式(3)以及目标函数公式(4)进行参数优化确定出bn参数cpt;cpt求解可利用凸优化求解工具完成,然后返回第1步;第7步:在bn模型中,由d得到待识别的观测证据ev,利用联合树算法(参见judeapearl著《causality:models,reasoningandinference(第2版)》,cambridgeuniversitypress,2009)进行推理,从而得到面部表情属性概率ω';第8步:判断目标属性概率ω'是否大于等于阈值ω。若不满足则返回第1步;若满足则输出面部表情属性,即面部表情识别结果。本发明使用的数据库是cohn-kanade表情数据库,选取6种基本表情的图像:1=“快乐”,2=“惊讶”,3=“害怕”,4=“愤怒”,5=“厌恶”,6=“悲伤”。凸优化求解选用的是cvx凸优化工具包(http://www.cvxr.com/cvx/)完成。实验平台为windows10系统,处理器为intelcpu2.6ghz,编程工具为matlabr2014a。bn推理软件采用kevinmurphy开发的bayesiannetworktool(简称bnt)工具包。目标属性概率阈值ω取0.78。以下为具体操作时本发明的实现步骤:第1步:基于hog方法提取面部表情的特征向量,经特征融合和归一化等处理构成相应的au标签样本数据集d。提取hog特征:将112*112像素的图像,分解成14*14个8*8像素大小的cell,由2*2个cell组成一个block,可以得到12*12个block,每个block可以提取31维特征,于是每幅图像可得12*12*31=4464维特征向量,采用主成分分析(pca)降到1391维特征向量,再处理得到au样本集。可选的,利用openface工具(参见:baltrusaitist,robinsonp,morencylp.openface:anopensourcefacialbehavioranalysistoolkit[c]//ieeewinterconferenceonapplicationsofcomputervision.2016:1-10)构成au样本集。第2步:判断面部表情bn是否已经结构建模。若已建模,则跳转至第3步;否则,根据专家经验建立bn模型结构g,如图2所示,用面部表情作为父节点expression,expression有6个取值事件,分别对应着“快乐”,“惊讶”,“厌恶”,“愤怒”,“害怕”,“悲伤”的表情,分别用“1”,“2”,“3”,“4”,“5”,“6”表示;以14个au作为子节点,每个au有两个取值事件,分别为“不发生”和“发生”,用“1”,“2”表示。用有向边依次连接父节点和子节点,即依次以expression作为14条有向边的箭尾,箭头分别指向au1、au2、au4、au5、au6、au7、au9、au12、au15、au17、au23、au24、au25、au27;第3步:判断bn参数cpt是否已经参数建模。若已参数建模,则跳转至第7步;若没有参数建模则利用如图3所描述的参数学习算法(第4步至第6步),得到bn模型参数cpt;第4步:根据样本数据集d,得到统计样本量nijk,即样本数据中父节点状态为j、第i个节点取第k个状态的统计值,再根据公式(2)计算得到θijk;此处以au25为例:ni12表示在快乐的表情下,au25节点“发生”的次数,再由公式(2)计算得到θijk,若θijk=0,则令θijk=0.002,选取140组au样本用于参数学习建模实验;第5步:将专家经验根据实施例一中的公式(3)形成约束集合ξ;以au25为例得到6组等式约束和4组不等式约束,如表1所示。编号1的解释为:根据专家经验,在“快乐”的表情下,au25“发生”的概率与“不发生”的概率之和为1;编号7“p(au25=1|expression=1)-p(au25=2|expression=1)<0”的意义为:根据专家经验,在“快乐”的表情下,au25“发生”的概率大于“不发生”的概率;类似的,可以得到形如公式(3)描述的一组约束集合ξ。表1au25节点参数的约束集合第6步:根据θijk,约束集合ξ,即公式(3)以及目标函数公式(4)进行参数优化确定出bn参数,然后返回第1步,直至bn所有参数cpt全部求解完成,即bn建模完成,然后,进行第7步的识别过程。第7步:在bn模型中,由d得到待识别的观测证据ev,利用bn推理算法进行推理,从而完成待识别类型节点信度ω'更新;选取122组中任一组au样本作为观测证据ev用于推理实验,完成面部表情识别任务;可选的,利用pearl的联合树算法进行完成推理;第8步:判断目标属性概率ω'是否大于等于阈值ω=0.78。若不满足则返回第1步;若满足则输出面部表情属性,即面部表情识别结果。本用例中进行了小数据集下的bn结构建模和参数学习,通过对面部表情识别,验证了本发明提出的学习建模方法的正确性和有效性:采用小样本集分别利用经典的支持向量机(supportvetormachine,svm)法、卷积神经网络(convolutionalneuralnetwork,cnn)法、adaboost法和本发明方法进行面部表情识别bn模型,利用联合树算法进行推理验证。推理识别结果列于表2。表2算法识别率结果对比对比表2可以看出:在小数据集条件下,用本发明方法正判率高于svm法、cnn法、adaboost法,说明了本发明方法正确性。在小样本条件下,仍然能够取得比较好的面部表情识别结果,表明本发明的方法在面部表情识别推理的有效性方面,具有较大的优势。基于小数据集下的面部表情bn识别方法,适用于不确定性、动态的环境,该方法可大大提表情识别的识别率,是解决面部表情识别问题的有效途径,可广泛应用于人机交互、安保系统、医疗健康诊断、视频通信、驾驶员身份识别和疲劳驾驶等领域。本发明的内容不限于实施例所列举,本领域普通技术人员通过阅读本发明说明书而对本发明技术方案采取的任何等效的变换,均为本发明的权利要求所涵盖。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1