一种对象增量式目标信息系统的分布约简算法

文档序号:6630228阅读:173来源:国知局
一种对象增量式目标信息系统的分布约简算法
【专利摘要】本发明公开了一种对象增量式目标信息系统的分布约简算法,本发明借助矩阵求约简中在数据集增加时,动态更新矩阵中和新增数据相关的部分矩阵元素,从而获取新约简结果的思想,基于最大分布约简算法,通过研究以论域中的划分为桥梁,通过构建新增数据与划分之间的关系,和划分改变对最大分布协调集的影响,设计了增量式不协调信息系统的最大分布约简算法,本发明算法的有益效果是能快速更新分布协调集,从而导出分布约简。
【专利说明】-种对象增量式目标信息系统的分布约简算法

【技术领域】
[0001] 本发明属于计算机数据挖掘【技术领域】,涉及一种对象增量式目标信息系统的分布 约简算法。

【背景技术】
[0002] 粗趟集理论[1]是一种处理不精确、不确定和模糊知识的数学工具。它已被广泛 应用于数据挖掘、人工智能、模式识别与智能信息处理等巧-4]领域。知识约简[引是粗趟 集理论的一个核也,所谓知识约简,就是在特定的标准下,删除其中不必要的知识[6]。
[0003] 众所周知,现实世界中的数据集,通常是不协调的,而且伴随信息化时代的发展, 数据集本身呈现出海量式增长。近年来,海量数据增长下知识约简和不协调信息系统知识 约简问题成为研究的热点。
[0004] 面对数据集海量增长的问题,如何将原有的知识和新产生数据相结合,避免重复 计算原有的数据,从而直接获取新的知识是有意义和必要的。文献[7]提出了一种基于分 辨矩阵元素集的增量式Pawlak约简算法,该算法根据新增对象的不同情况快速更新分辨 矩阵元素集。文献[引提出了在动态求解核的基础上,利用原有的属性约简有效地进行属 性约简的增量式更新。面对数据集的不协调性,Kryszkiewicz[9]提出了不协调目标信息 系统中基于对象的约简的概念。文献[10]中提出了基于对象的约简的判断定理和相应的 可辨识矩阵及辨识公式,为不协调目标信息系统知识约简提供新的方法。文献[11]在序信 息系统中引入了优势矩阵和目标分布矩阵的概念,建立了此类信息系统中分布约简的矩阵 算法。
[0005] 基于最大分布约简算法,对处理含有噪声和信息缺失等原因而造成的不协调的数 据集具有的优势。最大分布约简要求条件弱于分布约简,最大分布约简克服了分配约简可 能产生与原系统不相容的命题规则的缺陷[12]。本发明通过研究对象增加对论域划分的改 变,和划分改变对分布协调集的影响,设计了增量式不协调信息系统的最大分布约简算法。
[0006] 因此,通过改进了原有的最大分布约简算法,借助于矩阵求约简的思想,设计了动 态增量目标信息系统下最大分布约简的算法,解决了不协调信息系统增量式约简的问题。


【发明内容】

[0007] 本发明的目的在于提供一种对象增量式目标信息系统的分布约简算法,解决了现 有的增量式约简算法无法有效处理信息表中数据的不协调性。
[0008] 本发明所采用的技术方案是按照W下步骤进行:
[0009] 步骤1 ;输入决策表扣,R,d),未增加对象之前的区分矩阵V,
[0010]

【权利要求】
1. 一种对象增量式目标信息系统的分布约简算法,其特征在于按照以下步骤进行: 步骤1 :输入决策表(U,R,d),未增加对象之前的区分矩阵V,
分布划分信息Cmap,及准备加入决策表的对象xn+1,并记加入xn+1的U为U' ; 步骤2 :计算而新增对象xn+1与原有分类的可区分性P, P= [PE (Ci,xn+1), ,Pe (Ct,xn+1)], 其中以(>"1,) = _丨"以1./_(.\:,,1,":^/(.1',"),外<,.丨_,1彡1:^,1?为条件属性集 ; 步骤3 :遍历P内元素,判断是否会因增加对象xn+1产生新的划分Ck+1,若是,则调用步 骤7,若否,返回为巧(Cu,x"+1) = 0对应的划分Ctl及xn+1决策属性值所属的决策集合Dtl,调用 步骤4 ; 步骤4 :获取步骤3传输来的Ctl,根据公式 =彳D,"IZXDJQ=maxD(D,IC;),丨计算可区分函数rR(Cq)的值,然后将、存 入划分Q1,形成新的(V,相应地决策分类Dtl更新为D;,更新划分信息Cmap下条件属性划分 信息G中的(V=CtlU{xn+1},同时更新决策属性信息H中对象xn+1的决策属性值(D,n(V) =(D〇nc〇)u{xn+1},Id0'nc〇' | = |D〇nc〇|+i; 步骤5 :判断是否因增加了对象xn+1而影响了原有划分之间的可区分性,即rK((V)是 否等于rK (Ctl),若不相等,则跳转步骤6,若相等,则跳转步骤9 ; 步骤6 :遍历Cmap中按条件属性划分G内的对象集Cj,CjGU/R,若rK (Cj) =rK (Ci)但rK (Cj)关;rK((V),贝UV=VUPk (Cj,C0'),若;rK (Cj)关;rK (Ci)但rK (Cj) =rK((V),贝UV=V/ Pk (Cj,C0),遍历结束,跳转步骤9 ; 步骤7 :将对象xn+1存入新的划分Ct+1中,同时更新Cmap中G的信息和H的信息;更新Cmap中G的信息是将Ct+1作为一个对象集加入到G内,更新Cmap中H的信息是将Ct+1中对 象的决策d信息更新到H中; 步骤8 :遍历Cmap中按条件属性划分G内的对象集,若CiGU/R,且rK (Ci)尹rK (Ct+1), 则V=VUPk (Ci,Ct+1),遍历结束,跳转步骤9 ; 步骤9 :令V' =V,更新最大分布协调集集合为V',完成整个算法。
【文档编号】G06F17/30GK104503964SQ201410544512
【公开日】2015年4月8日 申请日期:2014年10月15日 优先权日:2014年10月15日
【发明者】吴正江, 张江丽, 雒芬, 孙江峰, 吴岩, 王希璠 申请人:河南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1