基于小数据集下的BN参数学习的目标识别方法与流程

文档序号:15518837发布日期:2018-09-25 18:55阅读:225来源:国知局
本发明涉及人工智能、管理科学与工程中的目标识别应用领域,具体涉及一种基于小数据集下的bn参数学习的目标识别方法。
背景技术
::贝叶斯网络(bayesiannetwork,bn)是以条件概率表的形式表达结点间依赖关系的有向无环图,它将样本信息与先验知识相结合,以有向边和条件概率表的形式分别描述了变量之间定性与定量依赖关系,表达形象直观,理论基础坚实,推理能力强大,是不确定性问题建模和推理的有效工具,在处理音频识别、行为识别、人脸识别、医疗诊断、故障诊断等目标识别领域都有广泛的应用。准确高效的学习bn参数,是有效利用bn模型解决实际问题的基础。bn的参数学习是根据确定bn的结构(有向无环图),利用样本信息与先验知识来学习结点变量的条件概率分布(条件概率表)。目前在bn参数学习的领域已经研究发展了许多经典实用的算法,但这些方法的实现和应用都是基于大规模数据集(完备或者经补充后完备),而在实际工程应用中,受限于环境、材料、时间等因素,很多试验往往不能够多次重复,使得能够获得的试验数据较少,样本规模很小,这样的小样本数据集里能够表达的信息不够完整,由此进行的bn参数学习的准确性和可靠性无法保证。由此衍生出基于小样本数据集的bn参数学习,即bn模型建模问题的研究。将问题域转化为bn模型表示后,便可利用bn理论完成推理任务。其中,联合树(junctiontree)算法是目前计算速度快、应用最广的bn精确推理算法之一。bn作为解决不确定性和不完备信息问题处理的有效方法,由于其有机地结合了概率论与图论的理论成果,是可应用于目标识别的理想工具。技术实现要素:本发明的目的是提供一种基于小数据集下的bn参数学习的目标识别方法,利用小样本数据集与定性专家经验有机结合,借助凸优化求解来提高bn参数学习精度,从而完成目标识别bn建模,最后利用目标识别bn推理结果来反映目标状态,提高了目标识别的准确性和有效性。本发明所采用的技术方案为:基于小数据集下的bn参数学习的目标识别方法,其特征在于:利用小样本数据集与定性专家经验有机结合,借助凸优化求解来提高bn参数学习精度,从而完成目标识别bn建模,最后利用目标识别bn推理结果来反映目标状态。所述的基于小数据集下的bn参数学习的目标识别方法,其特征在于:具体包括以下步骤:第1步:设置目标识别的目标属性概率阈值ω以及bn参数学习中dirichlet分布超参数αijk;第2步:根据目标识别领域知识建立bn模型结构g;第3步:获取目标样本数据集d;第4步:判断bn参数θijk是否已经建模;若已参数建模,则跳转至第8步;若没有参数建模则利用第5步至第7步,计算出bn模型参数θijk;第5步:根据样本数据集d统计样本量nijk,即样本数据中父节点状态为j、第i个节点取第k个状态的统计值;第6步:将专家经验根据下面公式(2)和公式(3)形成约束集合ξ;根据bn节点参数的归一性得公式(2);有关部分bn节点参数描述为公式(3)的不等式集合,即:其中,θa表示参数序列,c是一个常数且c≥0;第7步:根据样本统计量nijk,约束集合ξ,即公式(2)、(3)以及目标函数公式(4)进行参数优化确定出bn参数θijk;若nijk为0,则令nijk=0.01;θijk求解利用凸优化求解工具完成,然后返回第3步;第8步:在bn模型中,由d得到待识别的观测证据ev,利用联合树算法进行推理,从而得到目标属性概率ω';第9步:判断目标属性概率ω'是否大于等于阈值ω;若不满足则返回步骤3;若满足则输出目标属性,即目标识别结果。本发明具有以下优点:本发明基于bn理论中学习算法和成熟的推理算法完成目标识别所需的建模和推理任务。充分利用了一些专家经验的等式和不等式约束条件,在一定程度上弥补了数据不足对参数学习精度的影响,又避免了对目标识别过程进行复杂的数学建模,所得识别推理模型具有特征参量少、学习能力强、解释性良好等优点,尤其适用于嘈杂、不确定性、动态的目标识别系统。与现有技术比较,本发明提出的目标识别方法可在数据集稀缺的条件下大大提高目标识别的精度和速度,可广泛应用于医学、军事、工农业生产等目标识别领域。附图说明图1为本发明实施例一提供的一种小数据集下的bn参数学习的目标识别的流程图;图2为本发明实施例二提供的一种小数据样本数据集条件下目标识别bn模型结构图。具体实施方式下面结合具体实施方式对本发明进行详细的说明。贝叶斯网络可以表示为b(g,θ),其中g是一个具有n个节点的有向无环图,g中的n个节点代表n个随机变量,节点间的有向边代表随机变量之间的依赖关系;θ是与每个节点相关的条件概率表,表示为p(xi|pa(xi))。θ定量地表达了节点xi同其父节点pa(xi)之间的依赖程度,式(1)为bn的联合概率分布:其中,pa(xi)表示g中xi的父节点集合条件概率分布,p(xi|pa(xi))表示包含在g中给定父节点值的变量的每个值的概率。p(xi|pa(xi))的第k个概率值表示为θijk=p(xi=k|pa(xi)=j)即是节点xi的一个参数,其中,θijk∈θ,1≤i≤n,1≤j≤qi,1≤k≤ri。ri表示xi的状态数量,qi表示xi父节点组合pa(xi)的势。显然,节点xi一共有ri×qi个参数,它们构成了一个ri×qi维的矩阵,称之为节点xi的条件概率分布表(conditionprobabilitytable,cpt)。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。实施例一:本发明实施例提供一种小样本数据集条件下bn模型参数学习方法,如图1所示,该方法包括:第1步:设置目标识别的目标属性概率阈值ω以及bn参数学习中dirichlet分布超参数αijk;第2步:根据目标识别领域知识建立bn模型结构g;第3步:获取目标样本数据集d;第4步:判断bn参数θijk是否已经建模。若已参数建模,则跳转至第8步;若没有参数建模则利用第5步至第7步描述的方法,计算出bn模型参数θijk;第5步:根据样本数据集d统计样本量nijk,即样本数据中父节点状态为j、第i个节点取第k个状态的统计值;第6步:将专家经验根据下面公式(2)和公式(3)形成约束集合ξ;根据bn节点参数的归一性可得公式(2);有关部分bn节点参数可方便描述为公式(3)的不等式集合,即:其中,θa表示参数序列,c是一个常数且c≥0;第7步:根据样本统计量nijk,约束集合ξ,即公式(2)、(3)以及目标函数公式(4)进行参数优化确定出bn参数θijk。若nijk为0,则令nijk=0.01;θijk求解可利用凸优化求解工具完成,然后返回第3步。第8步:在bn模型中,由d得到待识别的观测证据ev,利用联合树算法(参见judeapearl著《causality:models,reasoningandinference(第2版)》,cambridgeuniversitypress,2009)进行推理,从而得到目标属性概率ω';第9步:判断目标属性概率ω'是否大于等于阈值ω。若不满足则返回步骤3;若满足则输出目标属性,即目标识别结果。实施例二:基于与实施例一相同的发明构思,本发明实施例提供一种小样本数据集条件下bn模型参数学习方法,应用于轴承故障诊断这一典型目标识别问题,说明本发明基于小数据集下bn参数学习的目标识别方法的具体实施步骤。本用例中数据取自美国凯斯西储大学轴承数据中心提供的滚动轴承故障数据。该数据可以在其中心网站http://www.eecs.case.edu/laboratory/bearing/download.htm上获取。实验装置的驱动端轴承型号为skf6205-2rsjem,风扇端轴承型号为skf6203-2rsjem。在风扇端和驱动端轴承座上各放置了加速度传感器来采集振动信息。加速度传感器可以采集滚动轴承正常、内圈和滚动体的运行状态信息。振动加速度信号由16通道数据记录仪采集,驱动端轴承故障采样频率取12khz,电机负载为2马力时转速为1750rpm。实验通过电火花加工的方式分别为驱动端轴承内圈、外圈和滚动体制造点蚀损伤,模拟不同损伤程度的故障,在损伤直径分别从小到大(0.007英寸、0.014英寸、0.021英寸和0.028英寸)时进行测试。本用例选择点蚀损伤直径最小即0.007英寸时采集的数据进行分析,以仿真轴承发生早期故障时对其进行诊断的情况。特征数据获取方法详见文献(郭文强,张宝嵘,彭程等.基于小波包和bn模型的深沟球轴承故障诊断[j].轴承,2016,59(03):48-52.)。选取300组真实故障特征样本中的35组用于小数据集进行bn参数学习建模实验;169组真实故障特征样本作为观测证据ev用于推理实验,完成目标识别任务。用例中使用的硬件环境为4g内存、intelcpu2.6ghz的计算机,bn推理软件采用kevinmurphy开发的bayesiannetworktool(简称bnt)工具包。凸优化求解选用的是cvx凸优化工具包(http://www.cvxr.com/cvx/)完成。利用本发明所提出的方法对轴承故障进行识别,具体步骤如下:第1步:设置故障诊断信度阈值参数ω和bn学习中的超参数αijk;此处阈值参数ω=0.75;超参数αijk可由专家经验得到,具体参看第6步;第2步:根据专家经验建立bn模型结构g,如图2所示。用轴承故障类型作为父节点x1;x1有q=3个取值事件,分别对应滚动轴承“正常”、“内圈”和“滚动体”故障,分别用“1”、“2”、“3”表示。以8个离散化特征向量xu(u=2,……,9)作为子节点,每个xu有3个取值事件,分别为振动信号的“高频”、“中频”、“低频”分量,分别用“1”、“2”、“3”表示。用有向边依次连接父节点和子节点,即依次以x1作为8条有向边的箭尾,箭头分别指向x2、x3、x4、x5、x6、x7、x8和x9;第3步:获取目标样本数据集d;第4步:判断bn参数θijk是否已经建模。没有参数建模则利用步骤5至步骤7描述的方法计算出bn参数θijk;若已参数建模,则跳转至步骤8;第5步:根据样本数据集d统计样本量nijk,即样本数据中父节点状态为j、第i个节点取第k个状态的统计值;此处以x4为例,n4jk表示待识别目标的第三个特征向量为高频分量出现的次数。选取小样本集(前35组真实故障数据)用于参数学习实验;第6步:将专家经验根据公式(2)和公式(3)形成约束集合ξ;此处以x4为例,由公式(2)知,得到一组等式约束:滚动轴承为“正常”状态时,由专家经验可知,特征向量x4“低频”分量出现的概率、“中频”分量出现的概率与“高频”分量出现的概率之和为1,即θ411+θ412+θ413=1。在步骤1中超参数αijk取值只需当α413=-1和α411=1,其它超参数均取值为0,c=0,于是得到公式(3)的描述的不等式约束形式:α411θ411+α413θ413-0≤0可选的,滚动轴承为“内圈故障”状态时,x4“低频”分量出现的概率小于等于“高频”分量出现的概率,即θ413≤θ411;类似的,可以得到形如公式(2)和公式(3)的描述的一组约束集合ξ。第7步:根据样本统计量nijk,约束集合ξ,即公式(2)、(3)以及目标函数公式(4)进行参数优化确定出bn参数θijk。然后返回步骤3,直至bn所有参数θijk全部求解完成,即bn建模完成。然后,进行步骤8的识别过程。可选的,θijk求解可利用凸优化求解工具包cvx完成;第8步:在bn模型中,由d得到待识别的观测证据,利用bn推理算法进行推理,从而完成待识别类型节点x1信度ω'更新;可选的,利用pearl的联合树算法进行完成推理;第9步:判断目标属性概率ω'是否大于等于阈值ω=0.75。若不满足则返回步骤3;若满足则输出目标属性,即目标识别结果。本用例中进行了小数据集下(35组故障数据)的bn参数学习,并以此作为目标的推理识别模型,验证了本发明提出的学习建模方法的正确性和有效性:采用小样本集(35组故障数据)分别利用经典的mle法、cml法、ire法和本发明方法进行参数学习构建推理识别模型,随后用169组数据在已建立的bn模型下,利用联合树算法进行推理验证。推理识别结果列于表1。表1小样本下目标识别bn建模推理识别结果对比表1可以看出:在小数据集条件下,用本发明方法正判率高于mle法、cml法和ire法,说明了本发明方法正确性。在小样本条件下,仍然能够取得比较好的识别结果,表明本发明的方法在目标识别推理的有效性方面,具有较大的优势。基于小数据集下的bn参数学习的目标识别方法,适用于不确定性、动态的环境,该方法可大大提高bn参数学习的精度和目标识别的识别率,是解决目标识别问题的有效途径,可广泛应用于医学、军事、工农业等领域。本发明的内容不限于实施例所列举,本领域普通技术人员通过阅读本发明说明书而对本发明技术方案采取的任何等效的变换,均为本发明的权利要求所涵盖。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1