本发明涉及人工智能算法领域,具体涉及一种稀缺样本数据集条件下bn模型参数的学习系统及方法。
背景技术:
随着人工智能的不断发展,各种人工智能算法得到人们的广泛关注。由于贝叶斯网络(bayesiannetwork,bn)在解决复杂系统的不确定性和不完整性问题凸显出强大的适应性,并且成功应用于智能系统所涉及的众多领域,因此备受关注,尤针对bn模型的参数学习。
bn模型的参数学习是指在bn模型结构已知的前提下估算出bn模型参数的问题。目前,常见的参数学习方法包括最大似然估计(maximumlikelihoodestimation,mle)、最大后验估计(maximumaposterior,map)以及定性最大后验概率方法(qualitativemaximumaposterior,qmap)等(ruichang,weiwang.novelalgorithmforbayesiannetworkparameterlearningwithinformativepriorconstraints.proceedingsofthe2010internationaljointconferenceonneuralnetworks.barcelona,spain:ieee,2010,1-8.)。其中,mle适用于充足样本数据集条件下的bn模型参数学习,且学习结果具有较高的精度;最大后验估计融入了要估计量的先验分布,故最大后验估计可以看做规则化的最大似然估计。qmap是随稀缺样本数据集条件下bn模型参数学习应运而生的。qmap方法将定性领域知识定义为条件概率上的不同约束不等式集合,结合训练数据进行bn参数学习。
在实际中,某些系统中获取大量样本数据非常困难或者代价十分昂,人们仅仅能获得样本量较小的数据集,例如地震预测、航空发动机故障诊断系统中的样本数据等。当所研究的系统为上述稀缺样本数据集系统时,由于mle和map并未考虑先验专家定性约束经验,若利用mle以及map方法往往无法学习出符合客观规律且较为精确的参数;若采用qmap方法,其运算过程中的估算满足约束的候选模型所需的逼近似然函数较难选取,且整体运算过程复杂,限制了该方法的实用性。
技术实现要素:
本发明的目的是提供一种稀缺样本数据集条件下bn模型参数的学习系统及方法,能够解决现有参数学习法存在的不精确或复杂的问题,实现稀缺样本数据集条件下bn模型参数的有效学习。
本发明所采用的技术方案为:
稀缺样本数据集条件下bn模型参数的学习方法,其特征在于:
包括以下步骤:
获取领域定性约束知识和稀缺样本数据集;
依据所述领域定性约束知识和自助法,获得满足多组约束的bn参数集;
采用传统参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;
根据所述满足多组约束的bn参数集和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
依据所述领域定性约束知识和自助法,获得满足多组约束的bn参数集的具体步骤包括:
将所述领域定性约束知识转化为不等式参数约束集合;
根据所述不等式参数约束集合和所述自助法,获得所述满足多组约束的bn参数集。
根据所述满足多组约束的bn参数集和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数的具体步骤包括:
求取出所述满足多组约束的bn参数集的累加和,并标记为累加约束参数;
根据所述累加约束参数和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
根据所述累加约束参数和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数的具体步骤包括:
求取第一预设权值与所述累加约束参数之积,并标记为第一参数;
求取第二预设权值与所述初始参数之积,并标记为第二参数;
根据最大熵原则、所述第一参数和所述第二参数,求取出所述稀缺样本数据集条件下bn模型的参数。
所述传统参数学习方法包括最大似然估计法和最大后验概率参数学习方法;
其中,所述采用传统参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数的具体步骤包括:
获得所述稀缺样本数据集的大小;
判断所述大小是否大于所述预设值;
若所述大小小于等于所述预设值,采用所述最大后验概率参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;
若所述大小大于所述预设值,采用所述最大似然估计法计算出所述稀缺样本数据集条件下bn模型的初始参数。
稀缺样本数据集条件下bn模型参数的学习系统,其特征在于:
所述系统包括:
获取模块,用于获取领域定性约束知识和稀缺样本数据集;还用于依据所述领域定性约束知识和自助法,获得满足多组约束的bn参数集;
计算模块,用于采用传统参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;还用于根据所述满足多组约束的bn参数集和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
所述获取模块具体用于:
将所述领域定性约束知识转化为不等式参数约束集合;
根据所述不等式参数约束集合和所述自助法,获得所述满足多组约束的bn参数集。
所述计算模块包括:
求取单元,用于求取出所述满足多组约束的bn参数集的累加和,并标记为累加约束参数;
计算单元,用于根据所述累加约束参数和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
所述计算单元具体用于:
求取第一预设权值与所述累加约束参数之积,并标记为第一参数;
求取第二预设权值与所述初始参数之积,并标记为第二参数;
根据最大熵原则、所述第一参数和所述第二参数,求取出所述稀缺样本数据集条件下bn模型的参数。
所述传统参数学习方法包括最大似然估计法和最大后验概率参数学习方法;
其中,所述计算模块具体用于:
获得所述稀缺样本数据集的大小;
判断所述大小是否大于所述预设值;
若所述大小小于等于所述预设值,采用所述最大后验概率参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;
若所述大小大于所述预设值,采用所述最大似然估计法计算出所述稀缺样本数据集条件下bn模型的初始参数。
本发明具有以下优点:
本发明实施例提供了一种稀缺样本数据集条件下bn模型参数学习方法和系统,首先,获得领域定性约束知识和稀缺样本数据集;再依据领域定性约束知识和自助法,获得满足多组约束的bn参数集;然后,采用传统参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数;之后,根据满足多组约束的bn参数集和初始参数,获得稀缺样本数据集条件下bn模型的参数。这样一来,系统可通过领域定性约束知识和稀缺样本数据集来学习到稀缺样本数据集条件下bn模型的初始参数,从而避免了现有方法学习结果的不精确性和复杂性的问题,能够实现在稀缺样本数据集条件下通过便捷的方法获得精确的bn模型的参数,从而扩展了人工智能算法的应用范围。
附图说明
图1为本发明实施例一提供的一种稀缺样本数据集条件下bn模型参数学习方法流程图;
图2为本发明实施例一提供的bn模型参数学习获得满足多组约束的bn参数集方法流程图;
图3为本发明实施例一提供的bn模型参数学习初始参数计算方法流程图;
图4为本发明实施例一提供的另一种稀缺样本数据集条件下bn模型参数学习方法流程图;
图5为本发明实施例一提供的一种获取bn模型参数方法流程图;
图6为本发明实施例二提供的一种稀缺样本数据集条件下bn模型参数学习方法流程图;
图7为本发明实施例三提供的一种稀缺样本数据集条件下bn模型参数学习系统结构示意图;
图8为本发明实施例三提供的另一种稀缺样本数据集条件下bn模型参数学习系统结构示意图。
具体实施方式
下面结合具体实施方式对本发明进行详细的说明。
本发明涉及的稀缺样本数据集条件下bn模型参数的学习方法,包括以下步骤:
获取领域定性约束知识和稀缺样本数据集;
依据所述领域定性约束知识和自助法,获得满足多组约束的bn参数集;
采用传统参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;
根据所述满足多组约束的bn参数集和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
上述方法中:
1、依据所述领域定性约束知识和自助法,获得满足多组约束的bn参数集的具体步骤包括:
将所述领域定性约束知识转化为不等式参数约束集合;
根据所述不等式参数约束集合和所述自助法,获得所述满足多组约束的bn参数集。
2、根据所述满足多组约束的bn参数集和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数的具体步骤包括:
求取出所述满足多组约束的bn参数集的累加和,并标记为累加约束参数;
根据所述累加约束参数和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
其中,根据所述累加约束参数和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数的具体步骤包括:
求取第一预设权值与所述累加约束参数之积,并标记为第一参数;
求取第二预设权值与所述初始参数之积,并标记为第二参数;
根据最大熵原则、所述第一参数和所述第二参数,求取出所述稀缺样本数据集条件下bn模型的参数。
3、所述传统参数学习方法包括最大似然估计法和最大后验概率参数学习方法;
其中,所述采用传统参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数的具体步骤包括:
获得所述稀缺样本数据集的大小;
判断所述大小是否大于所述预设值;
若所述大小小于等于所述预设值,采用所述最大后验概率参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;
若所述大小大于所述预设值,采用所述最大似然估计法计算出所述稀缺样本数据集条件下bn模型的初始参数。
上述方法涉及了稀缺样本数据集条件下bn模型参数的学习系统,所述系统包括:
获取模块,用于获取领域定性约束知识和稀缺样本数据集;还用于依据所述领域定性约束知识和自助法,获得满足多组约束的bn参数集;
计算模块,用于采用传统参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;还用于根据所述满足多组约束的bn参数集和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
系统中:
1、所述获取模块具体用于:
将所述领域定性约束知识转化为不等式参数约束集合;
根据所述不等式参数约束集合和所述自助法,获得所述满足多组约束的bn参数集。
2、所述计算模块包括:
求取单元,用于求取出所述满足多组约束的bn参数集的累加和,并标记为累加约束参数;
计算单元,用于根据所述累加约束参数和所述初始参数,计算所述稀缺样本数据集条件下bn模型的参数。
其中:
所述计算单元具体用于:
求取第一预设权值与所述累加约束参数之积,并标记为第一参数;
求取第二预设权值与所述初始参数之积,并标记为第二参数;
根据最大熵原则、所述第一参数和所述第二参数,求取出所述稀缺样本数据集条件下bn模型的参数。
3、所述传统参数学习方法包括最大似然估计法和最大后验概率参数学习方法;
其中,所述计算模块具体用于:
获得所述稀缺样本数据集的大小;
判断所述大小是否大于所述预设值;
若所述大小小于等于所述预设值,采用所述最大后验概率参数学习方法计算出所述稀缺样本数据集条件下bn模型的初始参数;
若所述大小大于所述预设值,采用所述最大似然估计法计算出所述稀缺样本数据集条件下bn模型的初始参数。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本发明实施例提供一种稀缺样本数据集条件下bn模型参数学习方法,应用于稀缺样本数据集条件下bn模型参数学习系统,如图1所示,该方法包括:
s101、获取领域定性约束知识和稀缺样本数据集。
这里,领域定性约束知识是根据客观规律以及专家经验获得的,该领域定性约束知识能够反映出所研究系统的bn模型参数之间存在固有属性。稀缺样本数据集可以通过系统中的采集模块采集得到,该采集模块可以由各种传感器组成;此外,稀缺样本数据集的形式可以且不限于包括短消息、语音、机械振动信号等等。这里对采集模块和稀缺样本数据集的形式并不做限定。
s102、依据领域定性约束知识和自助法,获得满足多组约束的bn参数集。
这里,自助法是一种从给定训练集中有放回的均匀抽样。
具体的,如图2所示,s102可以且不限于包括:
s1021:将领域定性约束知识转化为不等式参数约束集合;
s1022:根据不等式参数约束集合和自助法,获得满足多组约束的bn参数集。
这里,不等式约束参数集合是指不同概率之间的大小关系。具体的,首先,将抽象的领域定性约束知识转化为不等式约束参数集合,即将抽象的信息具体化,并且用数学语言表示出来;接着,通过自助法生成一组参数,判断该组参数是否满足上述不等式约束参数集合,若满足则将该组参数标记为一组约束参数,否则便舍弃该组参数。这的说明的是,最终生成约束参数的组数是人为提前设定的,只需重复通过使用自助法来生成满足设定组数的满足多组约束的bn参数集。
示例的,若认为预先设定需要l-1组约束参数,那么就需要反复通过自助法生成约束参数,直至约束参数的组数达到l-1时停止。这里,l为大于等于1的正整数。
s103、采用传统参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数。
这里,传统参数学习方法包括mle和map参数学习方法。
具体的,如图3所示,s103可以且不限于包括:
s1031:获取稀缺样本数据集的大小;
s1032:判断稀缺样本数据集的大小是否大于预设值;如是则执行s1033’,否则执行s1033。
s1033:采用map参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数。
s1033’:采用mle参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数。
这里,预设值的选取与所研究的系统密切相关:当研究系统包含的节点较多时,选取的预设值就较大;当研究系统包含的节点较少时,选取的预设值就较小。也就是说,当mle方法能够适用于所研究系统的bn参数学习时,会优先选择该方法;当获得的数据集非常有限,mle方法已经失效时,则采用map方法学习出初始参数。
实际上,当稀缺样本数据集的大小小于等于预设值时,就表明此时样本数据集已经很小,如采用mle参数学习方法,可能使计算公式产生分母为零的情况,无法计算出初始参数。而map参数学习方法恰好克服了mle该缺点,即样本数据集再小也不会出现分母为零的情况,因此,在该情况下采用map参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数。
事实上,当样本数据集的大小大于预设值时,表明此时样本数据集并不是非常小,也就是说此时mle参数学习方法还是适用的,再加之mle具有运算简单、精度高的特点,因此,在该种情况之下就采用mle参数学习方法进行稀缺样本数据集条件下bn模型初始参数的计算。
s104、根据满足多组约束的bn参数集和初始参数,获得稀缺样本数据集条件下bn模型的参数。
具体的,如图4所示,s104可以且不限于包括:
s1041:求取出满足多组约束的bn参数集的累加和,并标记为累加约束参数;
s1042:根据累加约束参数和所述初始参数,获得稀缺样本数据集条件下bn模型的参数。
具体的,如图5所示,s1042可以且不限于包括:
s10421:求取第一预设权值与累加约束参数之积,并标记为第一参数;
s10422:求取第二预设权值与初始参数之积,并标记为第二参数;
s10423:根据最大熵原则、第一参数和第二参数,求取出稀缺样本数据集条件下bn模型的参数。
这里,第一预设权值为[0,1]之间的任意自然数,第二预设权值也为[0,1]之间的任意自然数,并且第一预设权值与第二预设权值的和恒为1。
示例的,假设约束参数的组数为l-1,第一预设权值为α,α∈[0,1]。满足多组约束的bn参数集分别为
其中,
值得说明的是,本实施例中所提的稀缺样本数据集条件下bn模型参数学习的方法能够适用于bn应用的各个领域,例如:故障诊断、疾病诊断、模式识别等实际问题,本实施例并不对所提方法的应用领域作具体限定。
这样一来,系统可通过领域定性约束知识和稀缺样本数据集来学习到稀缺样本数据集条件下bn模型的初始参数,从而避免了现有方法学习结果的不精确性和复杂性的问题,能够实现在稀缺样本数据集条件下通过便捷的方法获得精确的bn模型的参数,从而扩展了人工智能算法的应用范围。
实施例二
基于与实施例一相同的发明构思,本发明实施例提供一种稀缺样本数据集条件下bn模型参数学习方法,应用于轴承故障诊断装置。这里,该滚动轴承可以是深沟球轴承、滚针轴承、角接触轴承以及调心球轴承等任何类型的滚动轴承。在本实施例中,假设该滚动轴承为skf6205深沟球轴承,并在实际采集时仅仅获得较少的样本数据集,在此基础上,完成滚动轴承bn建模,实现skf6205深沟球轴承的故障诊断。如图6所示,该方法包括:
s601、获取轴承的领域定性约束知识和稀缺样本数据集;
s602、将领域定性约束知识转化为不等式参数集合;
s603、通过不等式参数集合和自助法,获得满足多组约束的bn参数集;
s604、获取稀缺样本数据集的大小;
s605、判断稀缺样本数据集的大小是否大于预设值;如果是则执行s606,否则执行s606’;
s606、采用mle参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数;
s606’、采用map参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数;
s607、求取出满足多组约束的bn参数集的累加和,并标记为累加约束参数;
s608、求取第一预设权值与累加约束参数之积,并标记为第一参数;
s69、求取第二预设权值与初始参数之积,并标记为第二参数;
s610、根据最大熵原则、第一参数和第二参数,求取出skf6205深沟球轴承稀缺样本数据集条件下bn故障诊断模型的参数。
s611、根据已知skf6205深沟球轴承bn结构和skf6205深沟球轴承稀缺样本数据集条件下bn故障诊断模型的参数,建立skf6205深沟球轴承bn故障诊断模型;
s612、利用skf6205深沟球轴承bn模型进行skf6205深沟球轴承故障诊断。
这样一来,系统可通过领域定性约束知识和稀缺样本数据集来学习到稀缺样本数据集条件下bn模型的初始参数,从而避免了现有方法学习结果的不精确性和复杂性的问题,能够实现在稀缺样本数据集条件下通过便捷的方法获得精确的bn模型的参数,从而扩展了人工智能算法的应用范围。
实施例三
基于与实施例一相同的发明构思,本发明实施例提供一种稀缺样本数据集条件下bn模型参数学习系统70,该系统能够实现在稀缺样本数据集条件下通过便捷的方法获得精确的bn模型的参数,如图7所示,该系统70包括:
获取模块701,用于获取领域定性约束知识和稀缺样本数据集;还用于依据自助法和领域定性约束知识,获得满足多组约束的bn参数集;计算模块702,用于采用传统参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数;还用于根据满足多组约束的bn参数集和初始参数,计算稀缺样本数据集条件下bn模型的参数。
具体的,获取模块具体用于:将领域定性约束知识转化为参数不等式约束集合;根据自助法和参数不等式约束集合,获得满足多组约束的bn参数集。
具体的,如图8所示,计算模块702包括:求取单元7021,用于求取出满足多组约束的bn参数集的累加和,并标记为累加约束参数;计算单元7022,用于根据累加约束参数和初始参数,计算稀缺样本数据集条件下bn模型的参数。
具体的,计算单元具体用于:求取第一预设权值与累加约束参数之积,并标记为第一参数;求取第二预设权值与初始参数之积,并标记为第二参数;根据最大熵原则、第一参数和第二参数,求取出稀缺样本数据集条件下bn模型的参数。
具体的,传统参数学习方法包括最大似然估计法和最大后验概率参数学习方法;计算模块具体用于:获得样本数据集的大小;判断大小是否大于预设值;若大小小于等于预设值,采用最大后验概率参数学习方法计算出稀缺样本数据集条件下bn模型的初始参数;若大小大于预设值,采用最大似然估计法计算出稀缺样本数据集条件下bn模型的初始参数。
这样一来,系统可通过领域定性约束知识和稀缺样本数据集来学习到稀缺样本数据集条件下bn模型的初始参数,从而避免了现有方法学习结果的不精确性和复杂性的问题,能够实现在稀缺样本数据集条件下通过便捷的方法获得精确的bn模型的参数,从而扩展了人工智能算法的应用范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图或方框图来描述的。应理解可由计算机程序指令实现流程图或方框图中的每一流程或方框、以及流程图或方框图中的流程和方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和方框图一个方框或多个方框中指定的功能的步骤。
本发明的内容不限于实施例所列举,本领域普通技术人员通过阅读本发明说明书而对本发明技术方案采取的任何等效的变换,均为本发明的权利要求所涵盖。