一种产品fmeca报告分析决策辅助方法_2

文档序号:9750874阅读:来源:国知局
于正确分类的样本,则降低其权重。这样可以使得错分的样本突出出来,并得到一个新的样本分布。同时,根据错分的情况赋予hl(x) —个权重,表示该基本分类器的重要程度,错分得越少权重越大。在新的样本分布下,再次对基本分类器进行训练,得到基本分类器h2(x)及其权重。依次类推,经过T次这样的循环,就得到了 T个基本分类器,以及T个对应的权重。最后把这T个基本分类器按一定权重累加起来,就得到了最终所期望的强分类器。本实施例中,比如首先利用已有分类如:{混合信号放大器,电阻器,印制,电路板……}属于“组成单元名称型号”类,{特征数据,储存,信号,联接,装载……}属于“功能”类等,用于训练分类算法。
[0042]之后,利用朴素贝叶斯网络,进行实体关系抽取,贝叶斯网络的建立可以根据主观知识或是客观数据。建模分为两个步骤,第一个步骤是结构学习,也就是创建网络拓扑结构。第二个步骤是参数学习,即估计出各节点的条件概率表。训练完成之后就可以利用贝叶斯网络来进行推断和预测。例如:“特征数据”与“储存”表现为强关联,“储存”与“装载”表现为若关联。并对关联型进行排序。
[0043]这里需要指出的是,在利用朴素贝叶斯网络进行实体关系抽取的过程中,针对异常值,需要反馈给用户进行确认或者修改,该修改过程也可以在实体应用中对于最小距离距离小于阈值的实体调用实体知识库进行分析,异常实体反馈给用户进行确认;对于最小距离大于阈值的实体提示用户是否新增入语义特征库,之后详述。
[0044]图1中还给出了,在所述步骤S2中,应当构建故障特征库,本实施例中,针对用于FMECA语义特征库,抽取每个条目对应的设备名称、故障模式、故障影响、严酷程度、危害度等级、设计改进措施等内容,固化为向量。
[0045]例如:向量格式可以表示为{序号,组成单元名称型号,故障模式、故障影响1、故障影响2、故障影响3、严酷程度、危害度等级},以某大气数据传感器FMECA报告为例向量形如{1、电阻器、参数漂移、元件质量、性能降低、性能降低、任务降级4,0.00672}。
[0046]利用随机森林法对上述向量进行分析及利用Apr1ri进行关联规则挖掘,并形成故障特征库。需要说明的是,随机森林法是一种组合分类方法,该法的基本组成就是决策树。决策树是一种由结点与向量组成的层次结构。决策树包含了三种结点:根结点、内结点、终结点。其中,根结点有并且仅有一个,它是训练数据的总体集合。决策树的每个内结点都是一个分支问题的起点。这些内结点能够将达到该点处的样本数据按照特定属性进行分类处理。此外,每个终结点是带有分类标签的数据集合。这样,任何一条从决策树的根结点到终结点的路径就是一个判别规则。而Apr1ri算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第I步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
[0047]本实施例中,决策树采用了自顶向下、逐次展开的算法,每个内结点选择分类结果最好的属性,从而实现将到达该点的子样本数据分类成多组。这样的过程持续进行,直至该决策树能够准确地分类全部训练集的数据,比如对飞机分解工艺的决策树分解,根结点为分解工艺,一级结点为部件、组合件、零件,二级结点为分部件、部件用组合件;或者根结点为分解工艺,一级结点为机翼、发动机、机身等,二级结点为机翼内各部件、发动机各部件等等。
[0048]当与故障特征库都构建完毕以后,就需要对新的需要分析的产品FMECA报告进行分析决策,自主分析及辅助决策方法主要包括步骤S3-S6:
[0049]首先,对于新的产品FMECA报告,进行中文自动分词,命名实体识别,中文自然语言处理。针对抽取的命名实体,与词汇特征库进行比对。其次,对于最小距离小于阈值的实体调用语义特征库进行分析,异常实体反馈给用户进行确认;对于最小距离大于阈值的实体提示用户是否新增入语义特征库,最后,对新的产品FMECA报告实体中,设备名称、故障模式、故障影响、严酷程度、危害度等级进行统计,绘制产品故障影响拓扑图,并调用故障特征库标注频发故障模式和严酷度、危害等级较高的故障模式辅助用户进行后期决策。
[0050]例如:新的产品FMECA报告中的各个命名实体及其组成的实体向量,利用KNN算法计算FMECA词汇特征库中实体相似度的距离,发现每个实体的距离的最小值均小于阈值,根据实体知识库发现如下异常:
[0051 ] I)知识库中“印制”与“电路板”的相关性远高于“印制”与“线路板”,经用户确认后发现此条名称为填写错误,应为“印制电路板”。
[0052]2)按照知识库的分类“漏电”应归为“故障模式”类,而新FMECA报告归为“功能”类,经用户确认后修改。
[0053]3)按照知识库提供的信息,某项故障模式的危害度值服从均值为0.006的正态分布,而新的产品FMECA报告中危害度为0.03,界定为异常值反馈给用户进行确认,经用户确认,此处存在设计缺陷,应与设计人员沟通进行修正。
[0054]例如:新的产品FMECA报告中的各个命名实体及其组成的实体向量,利用KNN算法计算FMECA词汇特征库中实体相似度的距离,发现距离的最小值大于阈值,经用户确认,将新的实体向量纳入实体知识库与故障特征库。
[0055]这里需要说明的是,上述KNN算法是指如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
[0056]最后需要指出的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种产品FMECA报告分析决策辅助方法,其特征在于,包括: S1、提取试验产品FMECA报告中的特征元素,并构建词汇特征集合; S2、对所述词汇特征集合进行分类,构建实体知识库与故障特征库; S3、对需要分析的产品FMECA报告,抽取命名实体,并与所述实体知识库中的实体进行比对; S4、若比对结果少于阈值,则调用所述实体知识库进行产品故障分析,若比对结果大于阈值,则将该命名实体加入实体知识库及故障特征库; S5、对于步骤S4中的比对结果少于阈值,且命名实体存在异常的,通知用户确认或修改; S6、绘制产品故障影响拓扑图。2.如权利要求1所述的产品FMECA报告分析决策辅助方法,其特征在于:所述构建实体知识库通过Boost法进行词汇分类以及通过朴素贝叶斯网络进行实体关系抽取。3.如权利要求1所述的产品FMECA报告分析决策辅助方法,其特征在于:所述构建故障特征库包括将产品内的某一条目的故障程度固化为向量。4.如权利要求3所述的产品FMECA报告分析决策辅助方法,其特征在于:所述构建故障特征库包括利用随机森林法对上述向量进行分析及利用Apr1ri进行关联规则挖掘。5.如权利要求1所述的产品FMECA报告分析决策辅助方法,其特征在于:在所述步骤S3中,所述抽取的命名实体与所述实体知识库中的实体进行比对时,包括采用KNN算法计算两者之间相似度。
【专利摘要】本发明公开了一种产品FMECA报告分析决策辅助方法,属于数据科学和装备制造领域。首先提取试验产品FMECA报告中的特征元素,并构建词汇特征集合,对所述词汇特征集合进行分类,构建实体知识库与故障特征库;之后,对需要分析的产品FMECA报告,抽取命名实体,并与所述实体知识库中的实体进行比对;若比对结果少于阈值,则调用所述实体知识库进行产品故障分析,若比对结果大于阈值,则将该命名实体加入实体知识库及故障特征库,其中,对于命名实体存在异常的,通知用户确认或修改;最后,绘制产品故障影响拓扑图。本发明基于文本挖掘技术,对品FMECA报告进行分析决策辅助,提高了分析的准确性,方便用户进行决策。
【IPC分类】G06F17/30
【公开号】CN105512195
【申请号】CN201510837522
【发明人】费思邈
【申请人】中国航空工业集团公司沈阳飞机设计研究所
【公开日】2016年4月20日
【申请日】2015年11月26日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1