一种基于综合刺激度的工艺知识评价方法与流程

文档序号:17550156发布日期:2019-04-30 18:12阅读:154来源:国知局
一种基于综合刺激度的工艺知识评价方法与流程

本发明利用工艺知识间的抽象关联关系,基于工艺案例知识库展开知识的综合刺激度计算,并根据计算结果评价工艺知识对当前工艺编制任务的适用性,属于案例知识重用技术领域。



背景技术:

知识推送是一种信息系统主动向知识使用者提供所需知识内容的服务形式,是案例知识重用领域的重要技术途径。由于案例知识具有结构化程度低、知识数量巨大、知识冗余度高等特点,因此传统的面向规则类知识的推送技术难以有效处理这些知识。当前,案例推理技术(case-basedreasoning,cbr)是解决案例类知识重用的主要技术方案。典型的案例推理过程包括案例检索、案例复用、案例修正和案例保存四个环节。其中,案例检索环节是依据案例知识与当前问题之间的关联度或相似性,从海量案例中获取匹配度最高的案例子集的过程。传统的知识过滤技术主要可分为三类,分别是基于分类的知识过滤、基于行为的知识过滤和基于相似度的知识过滤。其中,基于分类的知识过滤又可以根据知识类别是否已知细分为知识分类技术和知识聚类技术。对于工艺案例知识而言,由于工艺编制过程的复杂性和工艺编制结果的多样性,知识类别是不可预知的,因而此类技术不适用;而知识聚类技术随着知识类别的增加、知识案例量的增大而算法效率明显下降,亦不适用。基于行为的知识过滤则是通过刻画用户特征、用户行为特征以及知识特征,通过算法匹配这些特征间的相似性,从而实现知识推送。对于工艺知识重用而言,由于案例知识相关的用户行为信息通常未被搜集,因而此类技术在该领域面临严重的冷启动问题。基于相似度的知识过滤技术往往以相似度作为唯一评价指标,对于冗余度较高的工艺知识案例集合而言,势必导致过滤结果的高冗余性,降低检索结果的可用性。



技术实现要素:

为解决案例知识重用技术中知识检索环节以相似度作为唯一评价依据带来的所获取知识集合冗余度高的问题,本发明提出一种基于综合刺激度的工艺知识评价方法,具体技术方案如下:

首先构建工艺案例知识间的抽象关联关系模型,进而评价工艺案例知识间的抽象相关性、案例知识与当前工艺编制任务之间的相似度、以及当前检索获得案例知识子集所包含的信息量,综合上述三个方面的评价结果得出当前检索所得工艺案例知识集合的可用性评价值,以此作为是否停止知识检索的判断依据。

在构建知识抽象关联关系模型方面,由于工艺案例知识作为人类知识的一个子类,符合知识产生的一般规律,适用描述知识间内在关联的一般方法。而知识是人类认识客观事物活动中所产生的抽象物,知识之间存在着天然的内在抽象关系。以抽象关系描述工艺案例知识间的内在关联具有合理性。本发明将工艺案例知识间的抽象关联根据抽象活动发生的领域划分为客体(object)域抽象关联、情境(context)域抽象关联和主体(subject)域抽象关联,并根据相对抽象性升高或降低进一步将抽象活动划分为情境减弱抽象、情境增强抽象、主体泛化抽象、主体深化抽象、客体概化抽象和客体细化抽象六类,如图1所示。以三元组形式描述工艺案例知识间的抽象关系,如下式:

其中:

(1)v={v1,v2,…,vn}为数目有限的顶点集合,对应工艺案例知识集;

(2)e={e1,e2,...,em}为数目有限的支路集合,对应工艺案例知识抽象活动;

(3)函数ψ:e→{c,s,o}为支路域函数,其中,

ψ(ek)=c,ek∈e,表示抽象活动发生在情境域;

ψ(ek)=s,ek∈e,表示抽象活动发生在主体域;

ψ(ek)=o,ek∈e,表示抽象活动发生在客体域;

(4)函数为支路符号函数,其中,

表示知识在对应域上的抽象性升高;

表示知识在对应域上的抽象性降低。

为图g的邻接矩阵,其中为顶点vi邻接到顶点vj边的条数,则r≥1中元素代表g中由顶点vi到vj长度为r的通路数,其中i=1,2,...,n;j=1,2,...,n。记r≥1,则表示vi代表的工艺案例知识可经种不同抽象过程获得vj代表的工艺案例知识。包含n个顶点的有向图中任何基本链的长度不大于n-1,因此计算bn-1即可获得工艺案例知识集中所有知识元素间的联通关系。称g中与顶点vi联通的所有顶点构成的集合为vi的抽象关联域,记作

基于上述工艺案例知识抽象关系模型,对工艺案例知识的可用性采取人工免疫算法中的综合刺激度评价方法。该评价方法主要包括以下三部分:

(1)抗原-抗体亲和度计算。本发明处理对象为由多特征属性集合构成的工艺案例知识,选取基于欧几里得距离的亲和度计算方法,如下式。

ωk∈[0,1]

nattr-ag∈n+

式中所用符号说明如下:

ab——某时间截面下的抗体种群;

sim(abik,agk)——抗原-抗体第k个特征属性的匹配度;

abik——抗体abi的特征属性;

agk——抗原ag的特征属性;

ωk——抗原-抗体第k个特征属性相似度权值;

nattr-ag——抗原特征属性总数目。

其中,ωk的设置提高了算法柔性,允许用户根据知识需求动态调整知识推送策略。例如,若对某些特征属性的匹配度要求较为严格,可适当增大相应权值;反之若希望放宽某些特征属性要求,只需减小对应权值。这使得在算法内在机理不变的情况下可以动态适应用户知识需求变更。

sim(abik,agk)函数依据属性数据类别分为以下两种计算方式:

a)对于数值型、字符型、时间型、字典型等除长文本类型之外的特征属性:

b)对于长文本类特征属性,采用基于字重叠的相似度算法中的jaccard相似度系

数法计算:

(2)抗体-抗体亲和度计算。

由知识推送目标可知,最终形成的工艺知识方案应当在满足与当前工艺编制任务匹配度较高的前提下,尽可能提高方案多样性。由于抽象相联的工艺方案具有较高相似度,因而以相似度作为抗体-抗体亲和度评价指标将导致最终推送的知识集合元素之间多数存在抽象关联,这与方案多样性目标相违背。因此,提出以抽象关联性作为抗体-抗体亲和度的评价依据,以提高解集多样性。具体计算公式如下:

式中所用符号说明如下:

ab——某时间截面下的抗体种群;

co(abi,abj)——抗体abi,abj的抽象相联性度量;

——抗体abi到抗体abj之间长度为k的有向链的数目;

——抗体abi可经由种不同抽象过程得到抗体abj。

(3)抗体-抗体排斥度计算。

抗体-抗体排斥度函数是对抗体之间协同程度的度量,使得在知识抽象关系建立不充分的情况下,解的多样性仍然可以得到保证,以此提高算法鲁棒性。当解集中抗体之间的关联度高时,解的多样性差,抗体相互之间的相似度大,因而获得该解集所需要的总体信息量大。本发明引入信息熵理论,通过对形成解集所需信息量的量化评估,得到抗体之间排斥度的度量。计算公式如下:

其中plk为抗体l的第k个特征属性在等位特征属性集中取当前值的概率。若k的等位特征属性集中所有值均相等,则plk=1。

综合上述三个综合刺激度评价子式,得到归一化的工艺案例知识综合刺激度算式,如下:

基于上式评价结果可开展工艺案例知识的过滤。

本发明的优点在于:

1)可以克服针对存在大量相似、冗余工艺案例知识集展开知识过滤时面临的解集趋同问题、提高解集中解的多样性;

2)可以在提高解的多样性的同时,保证解与工艺设计问题的匹配性,即保证获得的工艺案例知识可用。

附图说明

下面结合附图及实施方式对本发明作进一步详细的说明:

图1为工艺案例知识间的六类基本抽象活动示意。

具体实施方式

基于综合刺激度的工艺知识评价方法包括如下步骤:

1)在构建结构化或半结构化工艺案例知识集的基础上,构建工艺知识抽象关联模型;

2)针对获取的工艺知识子集,计算抗原-抗体亲和度,即计算工艺案例与当前工艺设计问题之间的亲和度;

3)根据当前工艺知识子集中案例知识间的抽象关联性,计算抗体-抗体亲和度;

4)根据当前工艺知识子集所包含的信息量进行量化评估,计算抗体-抗体排斥度;

5)综合抗原-抗体亲和度、抗体-抗体亲和度和抗体-抗体排斥度三个方面的计算结果,得到当前工艺知识子集的综合刺激度,并根据综合刺激度评价结果是否满足知识获取需求,判断是否对当前工艺知识子集中所包含的个体案例进行替换。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1