数据挖掘算法动态插入到数据挖掘平台的方法及系统的制作方法

文档序号:6506786阅读:342来源:国知局
数据挖掘算法动态插入到数据挖掘平台的方法及系统的制作方法
【专利摘要】本发明提供一种数据挖掘算法动态插入到数据挖掘平台的方法及系统,包括:构建数据挖掘平台;其中,数据挖掘平台包括基本功能框架;构建数据挖掘算法插入容器,将数据挖掘算法插入容器植入数据挖掘平台;并且,数据挖掘算法插入容器预留有数据挖掘算法插入容器接口;设置算法组件动态插入标准,以及,构建算法插入组件,算法插入组件用于选择符合预设要求的新算法组件;按照所述算法组件动态插入标准,将算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。数据挖掘平台开发过程中,具有开发简单灵活的优点;在数据挖掘平台开发结束后,还可以动态插入新的数据挖掘算法,从而提高了数据挖掘平台的可扩展性和兼容性。
【专利说明】数据挖掘算法动态插入到数据挖掘平台的方法及系统

【技术领域】
[0001]本发明属于数据挖掘【技术领域】,具体涉及一种数据挖掘算法动态插入到数据挖掘平台的方法及系统。

【背景技术】
[0002]数据挖掘,又称为数据库中知识发现(Knowledge Discovery from Database,简称KDD),是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。在数据挖掘过程中,根据数据挖掘目的或实际业务需求,需要使用不同的数据挖掘算法。
[0003]现有技术中,在数据挖掘平台设计初期,为提高数据挖掘平台的处理能力,使数据挖掘平台满足各种数据挖掘目的,常常需要在数据挖掘平台中引入多个固定的数据挖掘算法。
[0004]上述方法存在的主要问题为:(1)在数据挖掘平台设计过程中,需要尽可能设计多种数据挖掘算法,一方面,延长了数据挖掘平台设计周期;另一方面,由于数据挖掘算法的整体设计工作复杂,也增大了数据挖掘平台设计的工作量;(2)在数据挖掘平台开发结束后,当出现改进的数据挖掘算法时,所改进的数据挖掘算法无法适用于原来的数据挖掘平台,开发人员需要重新设计数据挖掘平台,因此,原数据挖掘平台具有可扩展性和兼容性差的问题。


【发明内容】

[0005]针对现有技术存在的缺陷,本发明提供一种数据挖掘算法动态插入到数据挖掘平台的方法及系统,数据挖掘平台开发过程中,具有开发简单灵活的优点;在数据挖掘平台开发结束后,还可以动态插入新的数据挖掘算法,从而提高了数据挖掘平台的可扩展性和兼容性。
[0006]本发明采用的技术方案如下:
[0007]本发明提供一种数据挖掘算法动态插入到数据挖掘平台的方法,包括以下步骤:
[0008]S1,构建数据挖掘平台;其中,所述数据挖掘平台包括基本功能框架;
[0009]S2,构建数据挖掘算法插入容器,将所述数据挖掘算法插入容器植入所述数据挖掘平台;并且,所述数据挖掘算法插入容器预留有数据挖掘算法插入容器接口 ;
[0010]S3,设置算法组件动态插入标准,以及,构建算法插入组件,所述算法插入组件用于选择符合预设要求的新算法组件;
[0011]S4,按照所述算法组件动态插入标准,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。
[0012]优选的,S3中,所述算法组件动态插入标准包括:算法组件初始化标准、算法插入参数调整标准、算法插入过程中的中间结果反馈标准以及算法异常的处理机制。
[0013]优选的,S3中,所述算法插入组件选择符合预设要求的新算法组件具体包括以下步骤:
[0014]S31,接收外界输入的一个以上新算法组件;
[0015]S32,对接收到的一个以上新算法组件进行选择,获得第一次循环对应的新算法组件;
[0016]S33,对第一次循环对应的新算法组件进行算法测试,得到测试结果;
[0017]S34,对得到的所述测试结果进行检验,判断本次所选择的新算法组件是否符合预设要求,如果符合,则本次所选择的新算法组件即为最终的算法组件;如果不符合,则选择下一个新算法组件,对所述新算法组件进行算法测试过程和结果检验过程,循环该过程,直到选择到符合预设要求的最优新算法组件,该最优新算法组件即为最终的算法组件;
[0018]S35,向数据挖掘算法插入容器接口输出所述最终的算法组件。
[0019]优选的,S4中,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口,具体包括以下步骤:
[0020]S41,将所述新算法组件导入到指定路径下;
[0021]S42,通过所述指定路径,读取所述新算法组件,然后将读取到的所述新算法组件配置到所述数据挖掘算法插入容器接口;
[0022]S43,所述数据挖掘算法插入容器接口向所述数据挖掘平台基本功能框架发送配置新算法的通知消息;
[0023]S43,所述数据挖掘平台基本功能框架根据该通知消息,读取所述新算法组件;
[0024]S44,所述数据挖掘平台基本功能框架对所述新算法组件进行测试,当测试成功后,所述新算法组件成功插入到所述数据挖掘平台基本功能框架。
[0025]本发明提供一种数据挖掘算法动态插入到数据挖掘平台的系统,包括:
[0026]数据挖掘平台;其中,所述数据挖掘平台包括数据挖掘基本功能框架;
[0027]数据挖掘算法插入容器,所述数据挖掘算法插入容器被植入所述数据挖掘平台;并且,所述数据挖掘算法插入容器预留有数据挖掘算法插入容器接口 ;
[0028]动态插入标准设置模块,用于设置算法组件动态插入标准;
[0029]算法插入组件,用于选择符合预设要求的新算法组件;
[0030]导入模块,用于按照所述算法组件动态插入标准,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。
[0031]优选的,所述动态插入标准设置模块所设置的算法组件动态插入标准包括:算法组件初始化标准、算法插入参数调整标准、算法插入过程中的中间结果反馈标准以及算法异常的处理机制。
[0032]优选的,所述算法插入组件包括:
[0033]算法接收子模块,用于接收外界输入的一个以上新算法组件;
[0034]算法选择子模块,用于根据业务需求,对接收到的一个以上新算法组件进行选择,获得第一次循环对应的新算法组件;
[0035]算法测试子模块,用于对第一次循环对应的新算法组件进行算法测试,得到测试结果;
[0036]算法结果检验子模块,用于对得到的所述测试结果进行检验,判断本次所选择的新算法组件是否符合预设要求,如果符合,则本次所选择的新算法组件即为最终的算法组件;如果不符合,则选择下一个新算法组件,对所述新算法组件进行算法测试过程和结果检验过程,循环该过程,直到选择到符合预设要求的最优新算法组件,该最优新算法组件即为最终的算法组件;
[0037]算法输出子模块,用于向数据挖掘算法插入容器接口输出所述最终的算法组件。
[0038]优选的,所述导入模块包括:
[0039]导入子模块,用于将所述新算法组件导入到指定路径下;
[0040]第一读取子模块,用于通过所述指定路径,读取所述新算法组件;
[0041]配置子模块,用于将读取到的所述新算法组件配置到所述数据挖掘算法插入容器接口 ;
[0042]通知子模块,用于向所述数据挖掘平台基本功能框架发送配置新算法的通知消息;
[0043]所述数据挖掘平台基本功能框架包括:
[0044]通知接收子模块,用于接收所述通知子模块发送的配置新算法的通知消息;
[0045]第二读取子模块,用于根据所述通知消息,读取所述新算法组件;
[0046]新算法组件测试子模块,用于对所述第二读取子模块读取到的所述新算法组件进行测试,当测试成功后,所述新算法组件成功插入到所述数据挖掘平台基本功能框架。
[0047]本发明的有益效果如下:
[0048](1)数据挖掘平台开发初期,只需要集中典型的数据挖掘算法,而整体框架固定,尤其是算法组件结构固定;在数据挖掘平台使用过程中,当需要通过该数据挖掘平台使用新的算法时,只需要依据算法组件动态插入标准把每一种算法按照固定要求加入即可,因此,减少了数据挖掘平台开发初期的准备工作量以及代码量,从而缩短了数据挖掘平台开发周期。
[0049](2)动态向数据挖掘平台插入新的数据挖掘算法,提高了数据挖掘平台的可扩展性和兼容性。
[0050](3)维护人员只需要根据算法组件动态插入标准对出现问题的算法组件进行处理即可,具有工作量小、所需开发知识少的优点,从而降低了对维护人员的技术要求。
[0051](4)采用算法组件动态插入标准向数据挖掘平台插入算法,原有数据挖掘平台的基本功能框架均保留,极大地增强了平台的复用性;而且,新算法依照算法组件动态插入标准可简单方便的插入到数据挖掘平台,节约了人力、物力和时间。

【专利附图】

【附图说明】
[0052]图1为本发明提供的数据挖掘算法动态插入到数据挖掘平台的方法流程示意图;
[0053]图2为本发明提供的数据挖掘算法动态插入到数据挖掘平台的一种系统结构示意图;
[0054]图3为本发明提供的数据挖掘算法动态插入到数据挖掘平台的另一种系统结构示意图;
[0055]图4为本发明提供的算法插入组件选择符合预设要求的新算法组件的示意图。

【具体实施方式】
[0056]以下结合附图对本发明进行详细说明:
[0057]如图1所示,本发明提供一种数据挖掘算法动态插入到数据挖掘平台的方法,包括以下步骤:
[0058]S1,构建数据挖掘平台基本功能框架;
[0059]本发明中,数据挖掘平台基本功能框架与传统数据挖掘平台基本功能框架基本相同,主要用于实现数据挖掘基本功能,包括但不限于:查看数据、修改数据、特征提取等数据的预处理功能;以及,数据源可视化、数据预处理可视化、挖掘算法可视化、挖掘结果表示可视化等可视化展示功能。另外,在数据挖掘平台基本功能框架中植入固定数据挖掘算法,例如,SVM、EM、C4.5等一些泛化性能好、学习精度高的固定算法。
[0060]S2,构建数据挖掘算法插入容器,将所述数据挖掘算法插入容器植入所述数据挖掘平台基本功能框架;并且,所述数据挖掘算法插入容器预留有数据挖掘算法插入容器接Π ;
[0061 ] 通过数据挖掘算法插入容器接口,实现算法名称传送、算法调用、处理文件路径以及算法相关设置等功能。
[0062]S3,设置算法组件动态插入标准,以及,构建算法插入组件,所述算法插入组件用于选择符合预设要求的新算法组件;
[0063]其中,算法组件动态插入标准包括:算法组件初始化标准、算法插入参数调整标准、算法插入过程中的中间结果反馈标准以及算法异常的处理机制。
[0064]如图4所示,算法插入组件选择符合预设要求的新算法组件具体包括以下步骤:
[0065]S31,接收外界输入的一个以上新算法组件;
[0066]在数据挖掘平台已开发结束后,根据实际业务变更需求、标准规范、数据挖掘目标、特征数据等情况,开发人员又设计出若干个新算法组件,通过算法插入组件,选择最符合某种需求的算法组件。本发明中,算法组件是指开发帮助文档和算法共同构成的组件。
[0067]S32,对接收到的一个以上新算法组件进行选择,获得第一次循环对应的新算法组件;
[0068]新算法组件选择标准包括:实际业务变更需求、标准规范、数据挖掘目标、特征数据、管理人员指定的参数以及设备环境等。
[0069]S33,对第一次循环对应的新算法组件进行算法测试,得到测试结果;
[0070]S34,对得到的所述测试结果进行检验,判断本次所选择的新算法组件是否符合预设要求,如果符合,则本次所选择的新算法组件即为最终的算法组件;如果不符合,则选择下一个新算法组件,对所述新算法组件进行算法测试过程和结果检验过程,循环该过程,直到选择到符合预设要求的最优新算法组件,该最优新算法组件即为最终的算法组件;
[0071]S35,向数据挖掘算法插入容器接口输出所述最终的算法组件。
[0072]S4,按照所述算法组件动态插入标准,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。
[0073]本步骤中,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口,具体包括以下步骤:
[0074]S41,将所述新算法组件导入到指定路径下;
[0075]S42,通过所述指定路径,读取所述新算法组件,然后将读取到的所述新算法组件配置到所述数据挖掘算法插入容器接口;
[0076]S43,所述数据挖掘算法插入容器接口向所述数据挖掘平台基本功能框架发送配置新算法的通知消息;
[0077]S43,所述数据挖掘平台基本功能框架根据该通知消息,读取所述新算法组件;
[0078]S44,所述数据挖掘平台基本功能框架对所述新算法组件进行测试,当测试成功后,所述新算法组件成功插入到所述数据挖掘平台基本功能框架。
[0079]如图2-3所示,本发明还提供一种数据挖掘算法动态插入到数据挖掘平台的系统,包括:
[0080]数据挖掘平台,所述数据挖掘平台包括基本功能框架;
[0081]数据挖掘算法插入容器,所述数据挖掘算法插入容器被植入所述数据挖掘平台;并且,所述数据挖掘算法插入容器预留有数据挖掘算法插入容器接口 ;
[0082]动态插入标准设置模块,用于设置算法组件动态插入标准;其中,算法组件动态插入标准包括:算法组件初始化标准、算法插入参数调整标准、算法插入过程中的中间结果反馈标准以及算法异常的处理机制。
[0083]算法插入组件,用于选择符合预设要求的新算法组件;
[0084]算法插入组件包括:
[0085]算法接收子模块,用于接收外界输入的一个以上新算法组件;
[0086]算法选择子模块,用于根据业务需求,对接收到的一个以上新算法组件进行选择,获得第一次循环对应的新算法组件;
[0087]算法测试子模块,用于对第一次循环对应的新算法组件进行算法测试,得到测试结果;
[0088]算法结果检验子模块,用于对得到的所述测试结果进行检验,判断本次所选择的新算法组件是否符合预设要求,如果符合,则本次所选择的新算法组件即为最终的算法组件;如果不符合,则选择下一个新算法组件,对所述新算法组件进行算法测试过程和结果检验过程,循环该过程,直到选择到符合预设要求的最优新算法组件,该最优新算法组件即为最终的算法组件;
[0089]算法输出子模块,用于向数据挖掘算法插入容器接口输出所述最终的算法组件。
[0090]导入模块,用于按照所述算法组件动态插入标准,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。
[0091]导入模块包括:
[0092]导入子模块,用于将所述新算法组件导入到指定路径下;
[0093]第一读取子模块,用于通过所述指定路径,读取所述新算法组件;
[0094]配置子模块,用于将读取到的所述新算法组件配置到所述数据挖掘算法插入容器接口 ;
[0095]通知子模块,用于向所述数据挖掘平台基本功能框架发送配置新算法的通知消息;
[0096]所述数据挖掘平台基本功能框架包括:
[0097]通知接收子模块,用于接收所述通知子模块发送的配置新算法的通知消息;
[0098]第二读取子模块,用于根据所述通知消息,读取所述新算法组件;
[0099]新算法组件测试子模块,用于对所述第二读取子模块读取到的所述新算法组件进行测试,当测试成功后,所述新算法组件成功插入到所述数据挖掘平台基本功能框架。
[0100]本发明提供的数据挖掘算法动态插入到数据挖掘平台的方法及系统,具有以下优占-
^ \\\.
[0101](1)数据挖掘平台开发初期,只需要集中典型的数据挖掘算法,而整体框架固定,尤其是算法组件结构固定;在数据挖掘平台使用过程中,当需要通过该数据挖掘平台使用新的算法时,只需要依据算法组件动态插入标准把每一种算法按照固定要求加入即可,因此,减少了数据挖掘平台开发初期的准备工作量以及代码量,从而缩短了数据挖掘平台开发周期。
[0102](2)动态向数据挖掘平台插入新的数据挖掘算法,提高了数据挖掘平台的可扩展性和兼容性。
[0103](3)维护人员只需要根据算法组件动态插入标准对出现问题的算法组件进行处理即可,具有工作量小、所需开发知识少的优点,从而降低了对维护人员的技术要求。
[0104](4)采用算法组件动态插入标准向数据挖掘平台插入算法,原有数据挖掘平台的基本功能框架均保留,极大地增强了平台的复用性;而且,新算法依照算法组件动态插入标准可简单方便的插入到数据挖掘平台,节约了人力、物力和时间。
[0105]以上所述仅是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
【权利要求】
1.一种数据挖掘算法动态插入到数据挖掘平台的方法,其特征在于,包括以下步骤: Si,构建数据挖掘平台;其中,所述数据挖掘平台包括基本功能框架; S2,构建数据挖掘算法插入容器,将所述数据挖掘算法插入容器植入所述数据挖掘平台;并且,所述数据挖掘算法插入容器预留有数据挖掘算法插入容器接口 ; S3,设置算法组件动态插入标准,以及,构建算法插入组件,所述算法插入组件用于选择符合预设要求的新算法组件; S4,按照所述算法组件动态插入标准,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。
2.根据权利要求1所述的数据挖掘算法动态插入到数据挖掘平台的方法,其特征在于,S3中,所述算法组件动态插入标准包括:算法组件初始化标准、算法插入参数调整标准、算法插入过程中的中间结果反馈标准以及算法异常的处理机制。
3.根据权利要求1所述的数据挖掘算法动态插入到数据挖掘平台的方法,其特征在于,S3中,所述算法插入组件选择符合预设要求的新算法组件具体包括以下步骤: S31,接收外界输入的一个以上新算法组件; S32,对接收到的一个以上新算法组件进行选择,获得第一次循环对应的新算法组件; S33,对第一次循环对应的新算法组件进行算法测试,得到测试结果; S34,对得到的所述测试结果进行检验,判断本次所选择的新算法组件是否符合预设要求,如果符合,则本次所选择的新算法组件即为最终的算法组件;如果不符合,则选择下一个新算法组件,对所述新算法组件进行算法测试过程和结果检验过程,循环该过程,直到选择到符合预设要求的最优新算法组件,该最优新算法组件即为最终的算法组件; S35,向数据挖掘算法插入容器接口输出所述最终的算法组件。
4.根据权利要求1所述的数据挖掘算法动态插入到数据挖掘平台的方法,其特征在于,S4中,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口,具体包括以下步骤: S41,将所述新算法组件导入到指定路径下; S42,通过所述指定路径,读取所述新算法组件,然后将读取到的所述新算法组件配置到所述数据挖掘算法插入容器接口; S43,所述数据挖掘算法插入容器接口向所述数据挖掘平台基本功能框架发送配置新算法的通知消息; S43,所述数据挖掘平台基本功能框架根据该通知消息,读取所述新算法组件; S44,所述数据挖掘平台基本功能框架对所述新算法组件进行测试,当测试成功后,所述新算法组件成功插入到所述数据挖掘平台基本功能框架。
5.一种数据挖掘算法动态插入到数据挖掘平台的系统,其特征在于,包括: 数据挖掘平台;其中,所述数据挖掘平台包括数据挖掘基本功能框架; 数据挖掘算法插入容器,所述数据挖掘算法插入容器被植入所述数据挖掘平台;并且,所述数据挖掘算法插入容器预留有数据挖掘算法插入容器接口; 动态插入标准设置模块,用于设置算法组件动态插入标准; 算法插入组件,用于选择符合预设要求的新算法组件; 导入模块,用于按照所述算法组件动态插入标准,将所述算法插入组件所选择的新算法组件导入到所述数据挖掘算法插入容器接口。
6.根据权利要求5所述的数据挖掘算法动态插入到数据挖掘平台的系统,其特征在于,所述动态插入标准设置模块所设置的算法组件动态插入标准包括:算法组件初始化标准、算法插入参数调整标准、算法插入过程中的中间结果反馈标准以及算法异常的处理机制。
7.根据权利要求5所述的数据挖掘算法动态插入到数据挖掘平台的系统,其特征在于,所述算法插入组件包括: 算法接收子模块,用于接收外界输入的一个以上新算法组件; 算法选择子模块,用于根据业务需求,对接收到的一个以上新算法组件进行选择,获得第一次循环对应的新算法组件; 算法测试子模块,用于对第一次循环对应的新算法组件进行算法测试,得到测试结果; 算法结果检验子模块,用于对得到的所述测试结果进行检验,判断本次所选择的新算法组件是否符合预设要求,如果符合,则本次所选择的新算法组件即为最终的算法组件;如果不符合,则选择下一个新算法组件,对所述新算法组件进行算法测试过程和结果检验过程,循环该过程,直到选择到符合预设要求的最优新算法组件,该最优新算法组件即为最终的算法组件; 算法输出子模块,用于向数据挖掘算法插入容器接口输出所述最终的算法组件。
8.根据权利要求5所述的数据挖掘算法动态插入到数据挖掘平台的系统,其特征在于,所述导入模块包括: 导入子模块,用于将所述新算法组件导入到指定路径下; 第一读取子模块,用于通过所述指定路径,读取所述新算法组件; 配置子模块,用于将读取到的所述新算法组件配置到所述数据挖掘算法插入容器接Π ; 通知子模块,用于向所述数据挖掘平台基本功能框架发送配置新算法的通知消息; 所述数据挖掘平台基本功能框架包括: 通知接收子模块,用于接收所述通知子模块发送的配置新算法的通知消息; 第二读取子模块,用于根据所述通知消息,读取所述新算法组件; 新算法组件测试子模块,用于对所述第二读取子模块读取到的所述新算法组件进行测试,当测试成功后,所述新算法组件成功插入到所述数据挖掘平台基本功能框架。
【文档编号】G06F9/44GK104346376SQ201310330159
【公开日】2015年2月11日 申请日期:2013年7月31日 优先权日:2013年7月31日
【发明者】谭远华, 朱平, 赵永生 申请人:克拉玛依红有软件有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1