一种粗糙近似表示系统中da近似表示加速模块计算方法

文档序号:10687051阅读:183来源:国知局
一种粗糙近似表示系统中da近似表示加速模块计算方法
【专利摘要】本发明公开了一种数据挖掘用DA粗糙近似表示的加速模块计算方法,包括构建粗糙近似表示系统,形成数据映射,输入数据,构建DA数据加速运行模块,数据运算及数据输出等六步。本发明较传统的智能信息识别计算方式有效的简化了数据计算的过程,提高了数据运算效率。特别是在大数据处理环境下,本模块可以有效地降低识别过程对计算系统硬件的要求,为提高各分系统活性,降低各分系统之间通讯开销提供了有效的解决方案。
【专利说明】
一种粗糙近似表示系统中DA近似表示加速模块计算方法
技术领域
[0001] 本发明属于智能数据辨识处理技术领域,具体涉及一种粗糙近似表示系统中DE近 似表示的加速模块计算方法。
【背景技术】
[0002] 在搜索引擎、邮件分类等数据分类过程中,人们会使用多种判别方法将其所得数 据进行分类整理。这种分类的形成就是数据挖掘出来知识,使用这种知识,人们可以探索, 如Google使用其搜索引擎探索量子计算机构建的可能性等。
[0003] 使用拟单层覆盖粗糙集理论构建的知识表示系统可用于存储整理分类知识,并其 分类知识应用于识别未知信息。随着数据的快速增加存储及识别过程速度也会降低,那么 在源数据数量日益增加的今天,快速地将未知数据集在已有数据集的基础上进行表示、识 别是我们面临的挑战。
[0004] -个需刻画集在粗糙近似表示系统中DA近似表示主要依赖于近似表示系统中数 据集的覆盖及系统中点集与覆盖集的关系这两部分内容。正是因为依赖性,在数据量比较 大的时候,DA近似表示模块也面临着计算效能不高的情况,因此有必要发明一种新模块, 在不改变运算结果前提下,提高运算效率。

【发明内容】

[0005] 本发明目的就在于克服上述不足,提供一种粗糙近似表示系统中DE近似表示的加 速模块。
[0006] 为实现上述目的,本发明是通过以下技术方案来实现: 一种数据挖掘用DA粗糙近似表示的加速模块计算方法,包括如下步骤: 第一步,构建粗糙近似表示系统,根据处理目标数据内容及特点,构建粗糙近似值表示 系统,从该系统中选取相应的向量数据组,并将所选取的数据向量组进行分类汇总构成数 据集覆盖数据阵列; 第二步,形成数据映射,基于粗糙近似表示系统,形成与数据集覆盖数据阵列集合U与 待处理数据的一对多映射,即整理系统中包含的所有覆盖及覆盖所对应有数据元素; 第三步,构建DE数据加速运行模块,根据第二步生成的数据集覆盖数据阵列,并结合待 处理目标数据在糙近似表示系统中构建DE数据运算加速模块; 第四步,输入数据,根据待处理目标数据,输入需近似表示集X,并根据与X相关集的DE 近似表示结果可以生成X的DA近似表示; 第五步,数据运算,使用DE近似表示加速模块计算p-释(1!一X)的DE上下近似表示,分 别记为-沿及篇楚- 淀m - jth 第六步,数据输出,令X的DA下近似表示綱高^#:-焉^〇〇 ==辽--幻 ,X的DA上近似表示%:_:子嚴--爲^⑶=以--幻,并将数据输出。
[0007] 进一步的,所述的近似表示集X中,与X相关的特定集合为X在近似空间中所有数据 对象形成集合U中的X的补集,即I:-U - X;::下繼~ -鱗__ 土議鑛秦_ S的M下近似表示=y 姻Si:上近似表示;E觀縫麵顿^|11 -時__卞_纖筆 S的上近似表示=y- ({/ -JY)的DE下近似表示。
[0008] 本发明较传统的智能信息识别计算方式有效的简化了数据计算的过程,提高了数 据运算效率。特别是在大数据处理环境下,本模块可以有效地降低识别过程对计算系统硬 件的要求,为提高各分系统活性,降低各分系统之间通讯开销提供了有效的解决方案。
【附图说明】
[0009] 图1是本发明系统总体流程图; 图2是本发明中DA近似表示生模块示意图。 图3是本发明中DA下近似集使用算法1与算法2的计算速度对比示意图。 图4是本发明中DA上近似集使用算法1与算法2的计算速度对比示意图。
【具体实施方式】
[0010] 下面将结合本发明的附图及具体实施例,对本发明的技术方案进行清楚、完整地 描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发 明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施 例,都属于本发明保护的范围。
[0011] 实施例1 实施用例数据来源: 红酒数据集(Wine Data),该集合包含173个对象,有13个条件属性,1个决策属性; 如图1和2所述,一种数据挖掘用DA粗糙近似表示的加速模块计算方法,包括如下步骤: 第一步,构建粗糙近似表示系统,根据红酒数据集(Wine Data)内容及特点,构建粗糙 近似值表示系统,从该系统中选取相应的向量数据组,并将所选取的数据向量组进行分类 汇总构成数据集覆盖数据阵列, 第二步,形成数据映射,基于粗糙近似表示系统,形成与数据集覆盖数据阵列集合U与 待处理数据的一对多映射,即整理系统中包含的所有覆盖及覆盖所对应有数据元素;

第三步,构建DE数据加速运行模块,根据第二步生成的数据集覆盖数据阵列,并结合待 处理目标数据在糙近似表示系统中构建DE数据运算加速模块,随机生成一个需表示集
第四步,输入数据,根据待处理目标数据,输入需近似表示集X,并根据与X相关集的DE 近似表示结果可以生成X的DA近似表示,计算得到
第五步,数据运算,使用DE近似表示加速模块计算_-X)的DE上下近似表示,分 别记为设-幻及__ -者贫-幻, -1) = {ft 128,2,130,132,5, 7:, 136,9,10,13?, 11,12,13,141,1417,18, 第六步,数据输出,令X的DA下近似表示綱高^#:-焉^〇0 ==辽--幻 ,X的DA上近似表示%:_:子嚴-gs# -爲^⑶=以--幻,并将数据输出,
得到X的DA似表示
实施例2 实施例2 森林覆盖类型数据(Forest Covertype Data)的部分数据,Forest Covertype Data其 中包含581012个对象,有54个条件属性,1个决策属性; 如图1和2所述的一种粗糙近似表示系统中DE近似表示加速模块计算方法,包括如下步 骤: 第一步,构建粗糙近似表示系统,根据处理目标数据内容及特点,构建粗糙近似值表示 系统,从该系统中选取相应的向量数据组,并将所选取的数据向量组进行分类汇总构成数 据集覆盖数据阵列,此处选用Forest Covertype Data中较2_1/2_的对象,约2906个对 象,条件属性选取前6个条件属性。
[0012]第二步:形成数据映射,基于粗糙近似表示系统,形成与数据集覆盖数据阵列与待 处理数据的一对多映射,即整理系统中包含的所有覆盖及覆盖所对应有数据元素;
第三步:输入数据,根据待处理目标数据,输入需近似表示集X,在数据中随机选取 25%-35%的数据对象组成一个测试用"需刻画集",选取100个"需刻画集X"(局部); 第四步:数据判断,任选覆盖集中一个覆盖K,判断K是否属于X。若是,则K属于X的DEI 下近似表示,若否,则判断K是否与X相交。若是,则K属于X的DE上近似表示,若否,则K即不属 于X的上近似表示,也不属于X的下近似表示。
[0013]第五步:数据输出,遍历覆盖集中覆盖,重复第三步、第四步即可完整刻画X的DEI 下近似表示并输出。
[0014] 基于上述步骤进行计算,传统的粗糙近似表示空间中DA近似表示计算算法(简记 为算法1)与本发明DA表示加速算法(简记为算法2)计算100组需表示集X的DE近似表示。其 中,X中各个需要表示集的DA下近似集使用算法1与算法2的计算速度如图3所示,其中由于 计算度量方面的考虑,将算法2的时间放大100倍进行表示: DA上近似集使用算法1与算法2的计算速度如图4所示,其中由于计算度量方面的考虑, 将算法2的时间放大1000倍进行表示: 本发明较传统的智能信息识别计算方式有效的简化了数据计算的过程,提高了数据运 算效率。特别是在大数据处理环境下,本模块可以有效地降低识别过程对计算系统硬件的 要求,为提高各分系统活性,降低各分系统之间通讯开销提供了有效的解决方案。
[0015] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1. 一种数据挖掘用DA粗糙近似表示的加速模块计算方法,其特征在于:所述的数据挖 掘用DA粗糙近似表示的加速模块计算方法包括如下步骤: 第一步,构建粗糙近似表示系统,根据处理目标数据内容及特点,构建粗糙近似值表示 系统,从该系统中选取相应的向量数据组,并将所选取的数据向量组进行分类汇总构成数 据集覆盖数据阵列; 第二步,形成数据映射,基于粗糙近似表示系统,形成与数据集覆盖数据阵列集合U与 待处理数据的一对多映射,即整理系统中包含的所有覆盖及覆盖所对应有数据元素; 第三步,构建DE数据加速运行模块,根据第二步生成的数据集覆盖数据阵列,并结合待 处理目标数据在糙近似表示系统中构建DE数据运算加速模块; 第四步,输入数据,根据待处理目标数据,输入需近似表示集X,并根据与X相关集的DE 近似表示结果可以生成X的DA近似表示; 第五步,数据运算,使用DE近似表示加速模块计算p-導淡一X)的DE上下近似表示,分 别记为_隹卞暴'龙-幻及云(班-'動.^ 第六步,数据输出,令x的da下近似表示条锣-沿, x的da上近似表示%_}辛:y,蒙kOO =泛-&饵-幻,并将数据输出。2. 根据权利要求1所述的一种粗糙近似表示系统中DE近似表示的加速模块计算方法, 其特征在于:所述的近似表示集X中,与X相关的特定集合为X在近似空间中所有数据对象 形成集合u中的x的补集,即!^ IU - & x的:極卞近攸兼_€忍-:猶-系的:癒:土旌M蒹示 X的迦下近似表示-掛-苟的應上近似表示; x的:盤土近似案素备e - II的:癒:¥近狱秦示 X的魅上近似表示-療-苟的施下近似表示。
【文档编号】G06N5/02GK106055551SQ201610234460
【公开日】2016年10月26日
【申请日】2016年4月15日
【发明人】吴正江, 雒芬, 陈如校
【申请人】河南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1