一种新的基于数据挖掘技术的智能冲压工艺设计方法

文档序号:10553112阅读:549来源:国知局
一种新的基于数据挖掘技术的智能冲压工艺设计方法
【专利摘要】本发明公开了一种新的基于数据挖掘技术的智能冲压工艺设计方法,涉及到数据挖掘、知识工程、冲压工艺等技术,属于多学科交叉领域。方法包括六个过程:过程一:建立支持本系统构建的统一的特征信息模型,过程二:建立关联性知识表达模型,过程三:构建用于数据挖掘建模的推理系统,过程四:研究数据挖掘模型评价技术,过程五:局部过程的智能化集成,过程六:系统的总体集成、测试、完善。本发明主要用于改造提升传统的冲压工艺设计方法,提高冲压工艺设计的准确性和效率。
【专利说明】
一种新的基于数据挖掘技术的智能冲压工艺设计方法
技术领域
[0001] 本方法(技术)涉及到数据挖掘、知识工程、冲压工艺等技术,属于多学科交叉领 域,主要用于改造提升传统的冲压工艺设计方法,提高冲压工艺设计的准确性和效率。
【背景技术】
[0002] 随着信息技术的飞速发展,CAPP(Computer Aided Process Planning,计算机辅 助工艺规划)在制造企业中的应用越来越广泛,越来越深入,新的知识技术例如K B E (Knowledge Based Engineering,基于知识的工程)技术、数据挖掘技术等和新的信息技术 例如本体技术、网络技术等不断涌现和迅猛发展。在全球经济一体化趋势日益增强的背景 下,各行各业迫切要求不断吸收利用新的知识技术、信息技术加快对传统产业的改造提升, 实现传统产业的知识化,信息化以及智能化,从而在剧烈的全球竞争下立于不败之地。
[0003] 冲压技术作为工业支柱产业一一制造业的一种重要产品加工方法,尤其迫切需要 利用知识技术、信息技术改造提升传统手段与技术,实现高度智能化生产加工。即将专家的 经验知识和专家人本身分开来,使其能够独立发挥决策作用,达到摆脱对工艺专家的依赖、 便于工艺知识的继承和集成、拥有更强大解决问题能力的目标。
[0004] 目前,数据挖掘技术已成为冲压件智能工艺设计研究的热点,国内外已进行大量 研究及应用实践,也出了不少成果,数据挖掘技术已充分展示出其获取工艺知识的优越性: 只要提供完备、准确、可靠的数据,数据挖掘技术就可以获取需要的知识,不但避免了对领 域专家的严重依赖,而且获得的知识比传统的知识更优质,更容易和自动化系统衔接。因为 这些知识是通过严格、科学的算法从数据(事物的现象)推理出的事物内在联系(知识本 质),很精确,易于转化成量化知识,从而作为控制知识实现基于知识驱动的自动化工艺CAD 设计;但是这些研究和应用实践也显示,数据挖掘技术在冲压件工艺设计领域的应用仍存 在严重不足:冲压件工艺设计呈局部智能化状态,整体智能化、自动化程度仍然较低,导致 系统准确性、效率以及解决问题的能力大大受限,距离学术界和工业所期待的目标尚有很 大距离。具体表现在两个方面:
[0005] 第一、当前数据挖掘技术在冲压件工艺设计中的应用研究多是局部性应用研究, 要么单独地将数据挖掘技术用于工艺设计数据的挖掘以完成初始工艺设计,要么单独地用 于处理仿真数据以获取知识实现对初次设计的修正,没有将两个阶段的数据挖掘集成起来 形成一个有机统一过程,从而造成系统智能化、自动化程度受限,进而影响二者有机协作, 妨碍了工艺设计的准确性和效率的提高。
[0006] 第二、数据挖掘过程的进行依然强烈依靠经验丰富的专家的参与,不但妨碍了系 统的智能化、自动化程度,而且严重削弱了系统解决问题的能力。

【发明内容】

[0007] 针对冲压件工艺设计领域智能化、自动化程度较低,妨碍工艺设计的准确性和效 率,同时削弱系统解决问题的能力等问题,本发明提出一种新的基于数据挖掘技术的智能 冲压工艺设计方法。
[0008] 本发明采用的技术方案为:一种新的基于数据挖掘技术的智能冲压工艺设计方 法,包括以下过程:
[0009] 过程一:建立支持本系统构建的统一的特征信息模型;
[0010]研究当前基于数据挖掘的冲压工艺设计专家系统特征信息表达模型的基础上,研 究融入KBE技术、本体技术所新增的特征信息,建立整个工艺设计过程完整、统一的特征概 念定义。
[0011] 过程二:建立关联性知识表达模型;
[0012] 在分析冲压工艺设计中基于数据挖掘的CAD过程和基于数据挖掘的CAE过程所涉 及的功能、数据、特征参数设置(对成形质量目标函数有影响的参数)以及形状特征和工艺 知识的因果关系的基础上,采用基于本体语义的知识表示法建立两个过程的关联性知识表 达模型。
[0013] 过程三:构建用于数据挖掘建模的推理系统;
[0014] 过程四:研究数据挖掘模型评价技术;
[0015] 研究数据挖掘模型的评价指标,构建准确、完备的评价指标体系;确定指标权重的 计算方法以及指标量化值的计算方法;建立综合利用这些指标定量度量数据挖掘模型性能 的方法。
[0016] 过程五:局部过程的智能化集成;
[0017] 此过程包含两个方面:一是基于智能数据挖掘技术和关联知识模型的初始设计过 程集成,二是基于智能数据挖掘技术和关联知识模型的仿真反馈设计过程集成。
[0018] 过程六:系统的总体集成、测试、完善。
[0019] 系统分为四层:用户界面层、功能模块层、技术平台层、数据层。
[0020] 进一步,所述的过程一中的特征信息模型包括:零件特征信息模型、制造资源特征 信息模型、工艺规划特征信息模型。
[0021] 进一步,所述的过程三又分为三个步骤:
[0022] 步骤一:设计任务的分解技术及确定用于挖掘的相关数据集。利用KBE技术的RBR 实现形式完成将复杂任务分解成若干可执行性子任务,并确定该子任务相关的数据集;
[0023] 步骤二:构建面向冲压工艺设计的基于本体语义的数据挖掘事例库:首先,从领域 中收集丰富的词汇、术语,并将业内广泛认可的词汇、术语作为本体的概念,同时将本体概 念分类为背景概念和结果概念;其次,分析领域内概念之间的相互联系,准确获取领域本体 的各种关系;最后,将本体的所有概念通过它们之间的关系进行连接,形成一个树状网络结 构,即是本体事例知识库的数据结构;
[0024]步骤三:确定数据挖掘建模子系统的知识推理方案:首先,确定系统总体检索方 案,本项目采用知识导引和最近邻算法相结合的二级检索方案;其次,确定事例的相似度算 法;最后,验证相似度算法的效果以及检索方案的效果。
[0025] 进一步,所述过程六中的功能模块层包括6个基本的功能模块:知识检索模块、数 据挖掘事例检索模块、数据挖掘事例修改模块、数据挖掘与知识发现模块、工艺知识学习模 块和数据挖掘事例学习模块。
[0026] 本发明的有益效果为:显著提高冲压工艺设计过程的智能化、自动化程度,克服对 设计者经验的依赖,大幅提高专家系统解决实际问题的能力以及设计质量和效率,极大地 促进我国制造工业特别是冲压模具制造业的发展;另外,本发明大大降低数据挖掘技术的 应用门槛,使数据挖掘技术更易于和具体应用领域结合,从而促进其在各个领域广泛深入 应用。
【附图说明】
[0027]图1 一种新的基于数据挖掘技术的智能冲压工艺设计方法流程图;
[0028]图2零件特征信息模型;
[0029]图3制造资源特征信息模型;
[0030]图4加工工艺特征信息模型;
[0031]图5基于本体的数据挖掘事例库;
[0032]图6概念Ci',Ci和leaves(C〇的关系;
[0033] 图7数据挖掘模型性能评估指标的本体结构体系;
[0034] 图8基于本体和CBR的数据挖掘模型评价过程伪代码;
[0035]图9系统总体架构;
[0036]图10知识检索模块;
[0037]图11数据挖掘事例检索模块;
[0038]图12数据挖掘事例修改模块;
[0039]图13数据挖掘模块;
[0040]图14工艺知识学习模块;
[0041]图15数据挖掘事例学习模块。
【具体实施方式】
[0042]下面结合附图和实施例对本发明作进一步说明。
[0043] 图1为本发明设计方法流程图,具体详述如下:
[0044] (1)建立支持本系统构建的统一的特征信息模型;
[0045] 研究当前基于数据挖掘的冲压工艺设计专家系统特征信息表达模型的基础上,研 究融入KBE技术、本体技术所新增的特征信息,建立整个工艺设计过程完整、统一的特征概 念定义。
[0046] 根据特征建模思想,通过特征提取技术,建立支持本系统建构的零件特征信息模 型,制造资源特征信息模型,工艺规划特征信息模型。在每一个特征信息模型构建过程中, 采用逐层分解策略将特征从抽象到具体逐级剖析表达。在零件特征信息模型中,比较抽象 的特征如形状特征、精度特征、材料特征、性能特征等,这些抽象的特征可以具体分解成很 多子特征,以此类推,如图2所示。同理,在制造资源特征信息模型中,比较抽象的特征是机 床、夹具、量具、刀具等,这些抽象的特征可以具体分解成很多子特征,以此类推,如图3所 示;在工艺规划特征信息模型中,比较抽象的特征是加工方法选择、加工设备选择、零件加 工顺序、工步等,这些抽象的特征可以具体分解成很多子特征,以此类推,如图4所示。
[0047] (2)建立关联性知识表达模型;
[0048] 在分析冲压工艺设计中基于数据挖掘的CAD过程和基于数据挖掘的CAE过程所涉 及的功能、数据、特征参数设置(对成形质量目标函数有影响的参数)以及形状特征和工艺 知识的因果关系的基础上,采用基于本体语义的知识表示法建立两个过程的关联性知识表 达模型。
[0049] (3)构建用于数据挖掘建模的推理系统;这一环节包括三步骤:
[0050]步骤一:设计任务的分解技术及确定用于挖掘的相关数据集。利用KBE技术的RBR 实现形式完成将复杂任务分解成若干可执行性子任务,并确定该子任务相关的数据集。
[0051] 步骤二:构建面向冲压工艺设计的基于本体语义的数据挖掘事例库:
[0052] 首先,从领域中收集丰富的词汇、术语,并将业内广泛认可的词汇、术语作为本体 的概念,同时将本体概念分类为背景概念和结果概念;
[0053]其次,分析领域内概念之间的相互联系,准确获取领域本体的各种关系;
[0054] 最后,将本体的所有概念通过它们之间的关系进行连接,形成一个树状网络结构, 即是本体事例知识库的数据结构,概念越抽象,其位置越在树的顶端。树的最顶端是最抽象 最笼统的概念"工艺规划数据挖掘事例",最底端即树的末梢是最具体的概念例如材料 "PS"、"PPS"等,在本体树形结构中,树叶部分(叶节点)的概念同时也是一个数据库的标签, 里面可以存储相应概念的特征值。这些叶节点可以看做一个集合,而现实世界的每一个具 体事例,实际就是对这组叶节点进行赋值,从而成为整个本体Case的一个实例,如图5所示。 这样,将大量现实世界的实例的具体特征值存入对应的数据库就构成事例库,储存了领域 知识。
[0055] 步骤三:确定数据挖掘建模子系统的知识推理方案:
[0056] 首先,确定系统总体检索方案,事例检索是利用检索彳目息从源事例库中检索并选 择潜在可用的源事例,并对新事例与源事例之间的相似度做出合理评判,其核心技术包括 检索策略和相似算法的设计与选择。通常采用的策略是最近邻法和知识导引法的结合。本 发明采用知识导引和最近邻算法相结合的二级检索方案,第一级检索是基于本体的语义理 解检索,其功能相当于知识导引法,首先将问题的解缩小到一个适当的解空间;第二级是利 用最近邻算法的数值计算,并通过设置一定的阂值控制所返回的结果事例个数;如何访问 本体事例库和语义相似度的计算是基于本体语义理解检索的两个核心环节,它决定着检索 的成败与否。
[0057]其次,确定事例的相似度算法;
[0058]本发明构建的语义相似度算法如下:
[0059]综合考虑ND(Node Distance)和IC(Information Content)相似度,以恰当的方式 结合,能有效提高语义相似度计算准确性。在这一理念的启发下,本发明提出了新的ND-IC 相似度计算法即W-IC_ND(Weighted Information Content and Node Distance)。假定概 念簇 C =[(^,C2',. . . ,. . .,&/ ]来自于用户询问,概念簇 C=[C1,C2, . . .,Ci,..., Cn]来自于匹配的本体词汇库。概念簇和C的总体相似度表示为SimlCH^KC/,C)。为计算 SimKH^KC/,C),首先计算这两组概念簇中每一个概念对(CV,Ci)的相似度 NDKV,Ci)。当计算SimIC-NDKV,Ci)时,我们首先用1C相似度计算法计算,记为SimIC (CV,Ci),再用ND法计算,记为SimND(CV,Ci),最后再将二者加权求和。其详细过程描述如 下:
[0060] 1)计算SimKXCi',Ci)的值
[0061]两个概念的1C相似度值指其拥有共同信息的程度。假定概念cr是概念CV和Ci的 最近共同祖先。在本体结构中,所有来自概念cr的概念和分类(包括概念cn定义为概念 0;[~的叶,记作163¥68(0;0。概念0;[ /,0;[,0;[~和163¥68(0;0的关系如图6所示。
[0062] 显然,一个概念的叶比单纯的一个概念包含更丰富和全面的语义内容,更能区分 出它和别的概念的不同。这样,在一个领域本体内,一个概念叶更能精确定义一个概念。于 是本发明用概念叶作为定义1C相似度的唯一指标。
[0063]目前,1C相似度的值通过估计概念在文献集中出现的频率获得,根据信息理论中 的理念,概念C的1C值能通过公式来计算这样,我们用概念叶来计算1C相似度的话,公式相 应地表示为,
(1 )
[0065] 其中P(leaVeS(Cn)是概念叶中任何一个实例出现的几率。
[0066]于是,相似度SimKXCV,Ci)的值计算公式为:
[0068]最后,标准化1C相似度的值,如公式(3)所示。
(3)
[0070] 2)计算SimNDKV,Ci)的值
[0071] 定义1在本体层次结构中,若有两个概念节点CV,,Ci,记ler^CV,,Ci)为CV,Ci 之间的最短路径。
[0072]定义2在本体层次结构中,若有一节点Ci,记其深度为depth(Ci) = len(root,Ci), 其中r 〇〇 t为结构中的根节点。
[0073]那么,在本体层次结构中,对任意两个节点CV,,Ci,则定义其ND相似度为:
(4)
[0075]当利用公式(4)计算出所有的概念对的ND相似度后,利用公式(5)进行标准化。
(5)
[0077] 3)计算SimlC-NDKi',Ci)和SimIC-NDW,C)的值
[0078] 当SimIC(CV,Ci)和SimND(CV,Ci)的值求出并标准化后,通过公式(6)求出 SimIC-NDKV,Ci),通过公式(7)求出SimIC-NDK',C)的值。
[0079] Sim,, } - k^Simjc(C',Ci) + ) (6)
[0080] Sim^iC^C) - J: u)SimlL_,L,{(:;,C,) (7) fel.
[0081] 最后,验证相似度算法的效果以及检索方案的效果。
[0082] (4)研究数据挖掘模型评价技术
[0083] 首先,研究数据挖掘模型的评价指标,构建准确、完备的评价指标体系。
[0084] 数据挖掘模型指标仅仅是从不同角度量化了挖掘模型的特征,而如何明确这些指 标对于模型的影响程度,即怎样综合处理各项特征,获得能够体现模型优点与缺点的度量, 需要模型的综合评价体系。根据数据挖掘模型性能评价的具体分析以及建立评估指标体系 所遵循的原则和过程,本发明建立了挖掘模型性能评估指标的本体结构体系,如图7所示。
[0085] 本发明的本体编码采用0WL语言。0WL适用于这样的应用:在这些应用中,不仅仅需 要提供给用户可读的文档内容,而且希望处理文档内容信息。0WL能够被用于清晰地表达词 汇表中的词条(term)的含义以及这些词条之间的关系。而这种对词条和它们之间的关系的 表达就称作本体。0WL相对XML、RDF和RDFSchema拥有更多的机制来表达语义,从而0WL超越 了 XML、RDF和RDFSchema仅仅能够表达网上机器可读的文档内容的能力。本体开发工具采用 Stanford的protege2000〇
[0086] 数据挖掘模型评价本体的每个概念类包括9个主要属性描述:ClassName,Weight, HaschiId,Value Type,Effect Type,EvaluateMethod,EstimateFunction,NodeValue, Unit。
[0087] ClassName为该概念类的名称,以概念名称为唯一标志,各评价因子之间不允许有 重名。
[0088] Weight是评价因子的权值,同时评价本体上节点的权重有以下约束条件:
[0089]根节点的权重为1;
[0090] 任意一个评价因子节点的权重是它的所有子节点权重的总和;
[0091] Haschild标明是否有子节点,若有子节点则其本身没有独立的指标值,由其子指 标共同表征。
[0092] Value Type代表取值类型(数值型、区间型、语言型、布尔型等)。
[0093] Effect Type代表因子的质量影响,其中效益型因子如可用性,标明指标值越大越 好,而成本型因子如价格,指标值越小越好。
[0094] EvaluateMethod标明指标取值方法(固定型、统计型、计算型、设定型)。
[0095] EstimateFunction为计算性指标的估算函数。
[0096] NodeValue为评价因子的取值。
[0097] Unit为指标取值的单位。
[0098]利用0WL语言实现本文的数据挖掘性能指标评价体系,部分代码显示如下: <qwI: Class rdf: ID ^ ^weight5^ <rdf's: Propcrlyot> <o\vj:(:h:issrd!':]D-'A'al:」c'rypc"> <owl: Glass rdf: Correlation ^ ";NodeWue,,> <rdfs: ObjCctPropcrtyot> <o\vl: Object rdf: function "iiLStinuUcrunctlorr'^ </rdfs; ObjcciPropcrtyof> </rdls: Pix>pcrtv〇t>
[0099] ' <rdts: Proportyofi> <ovvl: Constraliu. rdf: Object - "HascMId,5> <o\vi: (.'onsiralnt rdf: C^orrclaiion - "liiiicct Jypc^> <fdfe: OtyeGtPropertyofi> <o'vvl: Object rdf: function …"EstimateFunetion"〉 </rdfs: ()bjcctPropcriyoi> </rdfs: Propertyof> </o\v 1; Constraint> <owi: Constraint rdf': SD …''.NodeVaiue"> <rd ts; Propoilyo I> <owi: Constraint rdf^ Object - ^E¥aluateMethod,?> <rdfs: ObjeclPropcrty〇[> <owl: Object rdf; fisnction ~ ""Unit''>
[0100] ' </rdfs; C)bjcct[^r0pcrtyof> </rd fs; Properiyof> </0vvI: Constra\ni>
[0101] 然后,确定指标权重的计算方法以及指标量化值的计算方法。
[0102] 求权重是综合评价的关键。数据挖掘技术是面向应用领域的,在同一应用领域,不 同的评价因子对数据挖掘模型性能的影响程度也不相同;对于同一评价指标来说,应用的 挖掘业务不同,可能关注的程度也会有所差异。这样,指标权重需要根据应用业务及评价因 子本身的特点来获得,需要考虑客观及主观两个方面。因此,本发明采用主客观综合集成赋 权法将本体结构计算权重法和AHP法结合起来。
[0103] 结合评价体系的应用特点,选用层次分析(Analytic Hierarchy Process,AHP)法 作为补充。层次分析法(Analytic Hierarchy Process,AHP),是从定性分析到定量分析综 合集成的一种典型的系统工程方法,它将复杂系统的思维过程数学化,将主观判断为主的 定性分析进行定量化,将各种判断要素之间的差异数值化,从而,保持思维过程的一致性, 适用于复杂的模糊综合评价应用。这样,附加上层次分析法,我们能把外在的专家对评价指 标重要性的主观评价来作为对权重的一个重要调整因素,从而大大提高了结果的准确性。 [0104]本发明提出的0s_Ahp(0ntology Structure-Analytic hierarchy process)法, 即加权本体结构法和层次分析法过程如下:首先利用本体结构法计算出各个数据挖掘评价 指标的权重,再利用层次分析法(Analytic Hierarchy Process-AHP)计算出各个指标的权 重,最后加权求出最终的指标权重。这样,从客观因素方面来讲,即从本体的内在结构来确 定数据挖掘评价指标的权重;从主观因素方面来讲,即通过外在的专家对评价指标重要性 的主观评价来确定其权重。
[0105] 详细过程如下:
[0106] 1)利用本体结构法确定指标权重
[0107] 设本体结构法确定的权重记作Wo,其分为两部分即W〇 = Wm+Ws;Wm表示主要部分 (Main part),Ws表不次要部分(Secondary part)。
[0108] Wm的计算方法:
[0109] 法则1:如果父概念A的权重为a,且有n个子概念,则每个子概念权重的主要部分Wm = a/m。定义本体根节点权重为I即W(root) = 1 [0110] Ws的计算方法:Wm = 0Sim( ?,?);
[0111] Sim( .,.)表示该概念与其父概念的相似度,其计算方法见本文第三章两概念相似 度求法;0表示调整系数,目前主要是经验确定。
[0112] 2)利用AHP法求权重
[0113]层次分析法确定权重的做法如下:①建立多层次的递阶结构。按目标的不同、实现 功能的差异,将系统分为递阶层次结构体系。②构造判断矩阵。在建立多层次递阶结构体系 后,通过各层中元素两两比较,构造比较判断矩阵,确定下一层对于上一层次某因素的相对 重要性,并赋予一定分值。通常采用的标度准则为T ? L ? Saaty教授提出的标度表,如表1所 不。
[0114] 指标判断矩阵的比较标度表及其含义
[0115] 表1指标判断矩阵的比较标度表及其含义
[0117]倒数:因素 ui与uj比较得判断ui j,则ui与uj比较得判断uji = lAii j,根据标度表 可构造判断矩阵T:
[0118] rt;;f |
[0119] ③计算指标权重。根据判别矩阵T,利用线性代数知识,可以精确地求出其最大特 征根及对应的特征向量。将特征向量归一化处理即得到该层次评价因素对父因素影响程度 的大小。最大向量的求解有多种方法例如和积法,方根近似法等,由于方根近似法更为常 用,故本文采用方根近似法进行求解,步骤如下:
[0120] Step 1计算判断矩阵每一行元素的乘积Mi,
[0121 ] Mi = Iluij,(i,j = 1,2,*"m)
[0122] Step 2计算Mi的m次方根
[0123]
[0124] Step 3对向量# =(W1,W2, ? ? ?,Wm)归一化处理。 f m -
[0125] W rWj \ / L fei _
[0126] WA=(wl,w2,. . .,wm)即为所求指标的权重
[0127] Step 4-致性检验
[0128] 求出权重后,需要对判别矩阵进行一致性检验,公式如下:
[0129] CR = CI/RI
[0130] CR为判断矩阵的随机一致性比率,CI为判断矩阵一致性指标,计算公式如下:
[0131] CI = (Amax-m)/(m-1)
[0132] RI的值可以根据Saaty标度结果和CI的值计算得出。
[0133] 式中,Amax为判断矩阵的最大特征根。
[0134] 二者加权求和即得到最终权重W
[0135] ff=klffo+k2WA
[0136] (kl,k2 为二者权重,且 kl+k2 = l)
[0137] 最后,建立综合利用这些指标定量度量数据挖掘模型性能的方法。
[0138] 具体步骤如下:
[0139] Step 1建立挖掘模型评估指标集
[0140] 建立合理的数据挖掘模型指标评估体系,是挖掘模型性能有效评估的基础,也是 最关键的问题。没有科学的评估指标体系,评估工作就无法正确进行。DMME-0AF指标评价体 系的设计遵循以下基本原则:
[0141] (1)全面性原则,在模型性能评价研究中,全面考虑模型的各类指标,综合精确度、 效益、运行效率等各个方面,尽可能全面地评价挖掘模型工作性能。
[0142] (2)平衡性原则,在挖掘模型性能评价因素的考察中,需要考察能够反映模型能力 的正确性因素,也需要考虑模型的资源消耗因素。即需要关注挖掘模型的业务能力,也不能 忽略模型各个方面的代价。
[0143] (3)实用性原则,挖掘模型的设计最终的目标是为应用服务,而不仅仅正确性上比 较哪个模型的建模方法深奥或者复杂,挖掘模型的评价同样需要考察能够为挖掘业务带来 的效益,因此,评价体系需要综合价值方面的因素。
[0144] 本发明在建立挖掘模型性能指标评估体系结构的基础上实现了DMME-0AF的数据 挖掘评价模型设计。应用时有两点说明:
[0145] (1)层次的指标可以扩展,当需要考虑更多方面的因素,根据实际需要可以扩展评 估指标。
[0146] (2)最终用来作为决策的指标集是该指标体系的一个子集,可以根据实际况选择 不同的指标集。例如:
[0147] 可以将U={提升度效益覆盖度契合度命中率运行时间复杂度H乍为决策指 标集,也可以将指标"契合度"换成它的子集{简洁性确定性实用性感兴趣度新颖性可 解释性可视化},即IT ={提升度效益覆盖度简洁性确定性实用性感兴趣度新颖性 可解释性可视化命中率运行时间复杂度}。
[0148] 当测试情况允许时,可以将指标分得更细化,这样结果更准确,当测试条件不充分 的话,可以用较笼统的指标粗略评价。本文采用1/作为评价指标集。
[0149] Step 2设计挖掘模型性能评语集
[0150]在所有的评价指标中,不是所有的指标都可以定量计算,部分指标是定性描述,SP 通过专家评价获得评语,作为模糊语言值。评语集是对评价对象可能做出的评价结果所组 成的集合,表示为V= {>1,¥2,¥3,一,¥11}。考虑评价等级的合理密度,在挖掘模型评价体系中 采用五级评语集,即
[0151] V={很好,较好,中,较差,很差}。
[0152] Step 3求解挖掘模型各个评价因素的评语
[0153] 对于挖掘模型的各个评价因素,系统给出具体量化。当所有的定性指标给出定性 评价后,需要将定性评价量化,并建立隶属度函数。定性评价量化赋值按表2进行。
[0154] 表2定性评价量化赋值
[0156]相应的隶属度函数式如下:
[0158] 其中a表示矩阵元素 Xlj的上限阂值;b矩阵元素 Xlj的下限阂值。 1 通过评语的量化和隶属度函数,能得出评价指标矩阵(隶属度矩阵)R: % …:Fm r , ry hi %2 ??? t:2n.
[0160] R二 ; . . .* .? ? ? ? .? F T T -ml 9ml " ? mn
[0161] 令
[0163] 将各因素进行归一化处理,得到RQ为: ~ 0 0: 0 ~ % ;12 …fin
[0164] If= ^ i i ?.-? & 9' r0r0r0 ini f m2 …1 mn …
[0165] Step 4利用上面的求权重的方法求出权重集W [0166] Step 5计算评判结果矩阵B
[0167] 将权重矩阵W与归一化处理后的评判矩阵Rq相乘,即可得评判结果矩阵BB=W ? Rq。 根据最大隶属度原则,选出最优方案。
[0168] 整个基于本体和CBR建模的数据挖掘模型评价过程伪代码如图8所示。
[0169] (5)局部过程的智能化集成
[0170] 此过程包含两个方面:一是基于智能数据挖掘技术和关联知识模型的初始设计过 程集成,二是基于智能数据挖掘技术和关联知识模型的仿真反馈设计过程集成,有利于系 统最终的集成和完善。
[0171] (6)系统的总体集成、测试、完善
[0172] 本发明系统的总体架构如图9所示,可以看出,系统分四层:用户界面层、功能模块 层、技术平台层、数据层。
[0173] 用户界面层:用户界面层也叫事务层,是用户和计算机进行交流的窗口,包括信息 输入和信息输出。信息输入的方式主要有以下三种:产品CAD三维视图直接加载;人工交互 (界面向导提示);基于UDF特征信息识别与提取。
[0174] 技术平台层:这一层主要说明了实现本系统的结构和功能所用的各种主要技术及 平台例如本体实现所用的0WL语言,存储数据所用的数据库Access,存储数据所用的接口技 术 ADO .Net 等。
[0175] 数据层:以数据和文档形式保存各种信息,包含有五个数据库:零件信息库、制造 资源库、工艺规划知识库、数据挖掘事例库。
[0176] 功能模块层:本发明系统中定义了 6个基本功能模块,分别是:知识检索模块、数据 挖掘事例检索模块、数据挖掘事例修改模块、数据挖掘与知识发现模块、工艺知识学习模块 和数据挖掘事例学习模块(即知识存储模块)。
[0177] (D知识检索模块
[0178] 知识检索模块即工艺规划知识查询模块,其界面如图10所示。当利用系统进行工 艺规划时,首先根据设计任务进行工艺知识的查询,如果能直接获得相应的知识,则系统运 行至此为止,如果不能查询到满意的知识,则进入数据挖掘模块,通过数据挖掘获取想要的 知识。
[0179] (2)数据挖掘事例检索模块
[0180] 当在知识检索模块中不能直接获得满意的知识时,就不得不通过数据挖掘技术来 获取所需的知识,这时可以由界面向导导入数据挖掘事例检索模块,如图11所示。
[0181] 在这个模块,根据界面向导提示输入相关信息,进行相似事例的检索。数据挖掘事 例的检索和知识检索是不相同的。知识的检索是具体实例信息的匹配,精确度要求较高(阂 值a>0.9500);数据挖掘事例的检索是概念层次上的抽象匹配,精确度要求比知识检索的 要低(阂值a<0.9500)。通过数据挖掘事例检索返回通常是一组事例,这就要求通过数据挖 掘评价机制进行评价以获得最佳事例。如果由检索评价获得的事例达不到最低阂值(阂值a =0.9000 ),这时,不得不进入事例修改模块,通过事例修改,以获得满意的数据挖掘事例。
[0182] (3)数据挖掘事例修改模块
[0183] 数据挖掘事例修改模块如图12所示。目前,在数据挖掘事例修改模块,主要通过修 改相关概念的权重,以及加减概念特征来调节的。每次修改完毕,都要通过模块的事例评估 功能来进行评估,如果达不到阂值(a = 0.9000)以上,则根据评估提示继续调整,直到检索 相似度的值达到0.9000以上为止,然后进入下一个模块即数据挖掘与知识发现模块。
[0184] (4)数据挖掘与知识发现模块
[0185] 当已经获得一个满意的数据挖掘事例时,也即意味着建立了一个满意的数据挖掘 模型,可以进行数据挖掘和知识发现了。数据挖掘与知识发现模块如图13所示,直接点击 "执行数据挖掘"按钮,即可以获得满足设计任务所需要的知识。为了更精确起见,在这个模 块设置了知识评价功能,可以对获取的知识进行评价,然后再应用。如果评价结果是"Yes" 还可以从这个界面进入知识学习模块和事例学习模块。如果评价结果是"No",则要重新返 回数据挖掘事例检索模块,一个新的循环过程重新开始,直到评价结果是"Yes"为止。
[0186] (5)工艺知识学习模块
[0187] 在数据挖掘与知识发现模块中,当最后挖掘出的工艺知识经评价是满意即显示 "Yes"字样时,说明了数据挖掘出的工艺知识是准确的,那么这个知识就可以存入知识库, 以供下次检索使用。于是,由工艺知识学习界面如图14所示,将知识存入知识库。
[0188] (6)数据挖掘事例学习模块
[0189] 在数据挖掘与知识发现模块中,当知识评价为"Yes"时,不但证明了挖掘所获的知 识是准确的,同时也证明了数据挖掘建模是恰当的,因此,这个成功的事例应该被存入数据 挖掘事例库,完成事例的学习。于是,由数据挖掘事例学习界面如图15所示,将事例存入事 例库。
【主权项】
1. 一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特征在于,包括以下过程: 步骤一:建立支持本系统构建的统一的特征信息模型;研究当前基于数据挖掘的冲压 工艺设计专家系统特征信息表达模型的基础上,研究融入KBE技术、本体技术所新增的特征 信息,建立整个工艺设计过程完整、统一的特征概念定义; 步骤二:建立关联性知识表达模型;在分析冲压工艺设计中基于数据挖掘的CAD过程和 基于数据挖掘的CAE过程所涉及的功能、数据、特征参数设置以及形状特征和工艺知识的因 果关系的基础上,采用基于本体语义的知识表示法建立两个过程的关联性知识表达模型; 步骤三:构建用于数据挖掘建模的推理系统; 步骤四:研究数据挖掘模型评价技术;研究数据挖掘模型的评价指标,构建准确、完备 的评价指标体系;确定指标权重的计算方法以及指标量化值的计算方法;建立综合利用这 些指标定量度量数据挖掘模型性能的方法; 步骤五:局部过程的智能化集成;此过程包含两个方面:一是基于智能数据挖掘技术和 关联知识模型的初始设计过程集成,二是基于智能数据挖掘技术和关联知识模型的仿真反 馈设计过程集成; 步骤六:系统的总体集成、测试、完善;该系统分为四层:用户界面层、功能模块层、技术 平台层、数据层。2. 根据权利要求1所述的一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特 征在于:所述的步骤一中的特征信息模型包括:零件特征信息模型、制造资源特征信息模 型、工艺规划特征信息模型。3. 根据权利要求1所述的一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特 征在于:所述的步骤三包括以下步骤: 步骤3.1:设计任务的分解技术及确定用于挖掘的相关数据集;利用KBE技术的RBR实现 形式完成将复杂任务分解成若干可执行性子任务,并确定该子任务相关的数据集; 步骤3.2:构建面向冲压工艺设计的基于本体语义的数据挖掘事例库:首先,从领域中 收集丰富的词汇、术语,并将业内广泛认可的词汇、术语作为本体的概念,同时将本体概念 分类为背景概念和结果概念;其次,分析领域内概念之间的相互联系,准确获取领域本体的 各种关系;最后,将本体的所有概念通过它们之间的关系进行连接,形成一个树状网络结 构,即是本体事例知识库的数据结构; 步骤3.3:确定数据挖掘建模子系统的知识推理方案:首先,确定系统总体检索方案,本 项目米用知识导引和最近邻算法相结合的二级检索方案;其次,确定事例的相似度算法;最 后,验证相似度算法的效果以及检索方案的效果。4. 根据权利要求1所述的一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特 征在于:所述步骤六中的功能模块层包括6个基本的功能模块:知识检索模块、数据挖掘事 例检索模块、数据挖掘事例修改模块、数据挖掘与知识发现模块、工艺知识学习模块和数据 挖掘事例学习模块。
【文档编号】G06F17/50GK105912773SQ201610218800
【公开日】2016年8月31日
【申请日】2016年4月8日
【发明人】郭渊, 蒋志远, 王匀, 陈炜, 朱英霞
【申请人】江苏大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1