数据挖掘方法及装置的制造方法

文档序号:9826293阅读:462来源:国知局
数据挖掘方法及装置的制造方法
【技术领域】
[0001 ] 本发明实施例涉及数据分析技术,尤其涉及一种数据挖掘方法及装置。
【背景技术】
[0002]数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系的信息过程,包括数据准备、关系寻找和结果显示三个步骤。
[0003]现有的数据挖掘过程具体为确定待处理的目标数据,依据目标数据的数据类型确定数据挖掘算法,依据数据挖掘算法对目标数据进行计算处理,具体可以为寻找目标数据中的关联关系,将确定的关联关系进行结果显示。
[0004]由于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,导致数据挖掘对目标数据进行数据处理的灵活性较低。

【发明内容】

[0005]本发明实施例提供一种数据挖掘方法及装置,以提高数据挖掘对目标数据进行数据处理的灵活性。
[0006]本发明实施例的一个方面是提供一种数据挖掘方法,包括:
[0007]确定待处理的目标数据;
[0008]依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;
[0009]将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;
[0010]显示所述第一处理结果和/或第二处理结果,以供用户选择。
[0011]本发明实施例的另一个方面是提供一种数据挖掘装置,包括:
[0012]目标数据确定模块,用于确定待处理的目标数据;
[0013]数据处理模块,用于依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;
[0014]显示模块,用于显示所述第一处理结果和/或第二处理结果,以供用户选择。
[0015]本发明实施例提供的数据挖掘方法及装置,通过至少两种数据挖掘算法分别对目标数据进行数据处理,获取到至少两个处理结果,并且将第一次处理的结果作为第二次处理的输入数据,形成循环的数据处理过程,相比于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,增强了数据挖掘对目标数据进行数据处理的灵活性。
【附图说明】
[0016]图1为本发明实施例提供的数据挖掘方法流程图;
[0017]图2为本发明实施例提供的数据挖掘装置的结构图;
[0018]图3为本发明另一实施例提供的数据挖掘装置的结构图。
【具体实施方式】
[0019]图1为本发明实施例提供的数据挖掘方法流程图。本发明实施例针对数据挖掘对目标数据进行数据处理的灵活性低的问题,提出了一种新的数据挖掘方法,该方法的具体步骤如下:
[0020]步骤S101、确定待处理的目标数据;
[0021]所述确定待处理的目标数据包括:将多个文件和/或多个数据库中的数据进行合并;对合并后的数据进行数据选择获得数据集合;从所述数据集合中选择出适用于所述至少两种数据挖掘算法进行处理的所述目标数据。
[0022]利用数据挖掘算法进行数据处理之前,先要确定待处理的目标数据,具体地将多个文件和/或多个数据库中的数据进行合并,以便获取到足够多的数据,从足够多的数据中依据数据处理的需求进行数据选择获得数据集合,再依据预定的至少两种数据挖掘算法从该数据集合中选择出适用于数据挖掘的目标数据。
[0023]步骤S102、依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;
[0024]确定出目标数据后,依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,每一种数据挖掘算法对目标数据进行处理后将获得一个处理结果,则经过至少两种数据挖掘算法进行处理将至少获得两个处理结果即第一处理结果。
[0025]步骤S103、将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;
[0026]返回到步骤S101,将获得的第一处理结果再次作为所述目标数据,继续执行步骤S102,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果。即数据挖掘的处理结果还可以作为数据挖掘的输入数据进行再次数据处理,形成循环的数据处理。
[0027]步骤S104、显示所述第一处理结果和/或第二处理结果,以供用户选择。
[0028]将所述第一处理结果和/或第二处理结果进行显示,即循环的数据处理结果可以直接输入供用户选择,也可以不输出进行后续的循环处理。
[0029]本发明实施例不限制循环处理的次数,且数据挖掘算法至少包括:决策树、关联规贝U、贝叶斯、神经网络、规则学习、遗传算法、粗糙集和模糊逻辑。
[0030]本发明实施例通过至少两种数据挖掘算法分别对目标数据进行数据处理,获取到至少两个处理结果,并且将第一次处理的结果作为第二次处理的输入数据,形成循环的数据处理过程,相比于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,增强了数据挖掘对目标数据进行数据处理的灵活性。
[0031]在上述实施例的基础上,所述依据至少两种数据挖掘算法分别对所述目标数据进行数据处理包括:依据所述至少两种数据挖掘算法和初始优先级分别对所述目标数据进行数据处理,所述初始优先级是依据所述目标数据对应的数据类型与所述数据挖掘算法的适用度确定的。
[0032]本发明实施例预定有三种数据挖掘算法分别为A算法、B算法、C算法,所述A算法、B算法、C算法可以分别由不同的服务器执行,也可以由同一个服务器同时运行,在初始条件下,A算法、B算法、C算法对不同类型的数据进行处理的优先级不同,假设对同一类目标数据,A算法、B算法、C算法对应的优先级分别是高、中、低。当该类型的目标数据输入到服务器后,通过A算法、B算法、C算法依次对目标数据进行处理,合理假设通过A算法、B算法、C算法对目标数据的处理速度相同,则通过A算法对目标数据进行处理的结果a将最先显示,其次是通过B算法对目标数据进行处理的结果b,最后显示通过C算法对目标数据进行处理的结果C。
[0033]所述显示所述第一处理结果之后,还包括:获取用户对所述第一处理结果的反馈信息,依据所述反馈信息调整所述目标数据对应的数据类型与所述数据挖掘算法的适用度。
[0034]弟一处理结果包括结果a、结果b和结果C,且结果a、结果b和结果c先后显不。用户对结果a、结果b和结果c的点击率以及满意度都不同,该点击率以及满意度均可以作为反馈信息,在本发明实施例中,除了执行数据挖掘算法的服务器外,还有一个起到调度作用的调度服务器,该调度服务器用于记录用户对处理结果的反馈信息,具体记录处理结果、反馈信息、数据挖掘算法和数据类型的对应关系。如果反馈信息表示用户对处理结果的点击率超出了阈值,或用户对处理结果的平均评分超出了阈值,则说明该数据类型适用于依据该数据挖掘算法进行数据处理,即该数据类型与该数据挖掘算法的适用度高,并提高该数据挖掘算法对该数据类型的处理优先级。例如,通过反馈信息确定出用户对结果b的满意度最高,则提高B算法对该数据类型的优先级,后续若有属于该数据类型的目标数据输入到服务器,则通过B算法最先处理该目标数据。
[0035]本发明实施例通过用户对数据处理结果的反馈信息来调整至少两种数据挖掘算法对目标数据的处理优先级,可以实现对处理结果的显示顺序进行调整,增强了显示处理结果的灵活性。
[0036]在上述实施例的基础上,所述至少两种数据挖掘算法包括第一数据挖掘算法和第二数据挖掘算法;所述依据至少两种数据挖掘算法分别对所述目标数据进行数据处理包括:依据所述第一数据挖掘算法对所述目标数据进行数据处理获得中间处理结果;依据所述第二数据挖掘算法对所述中间处理结果进行数据处理获得所述第一处理结果。
[0037]本发明实施例预定有三种数据挖掘算法分别为A算法、B算法、C算法,通过A算法、B算法、C算法分别对目标数据进行处理获得结果a、结果b和结果C,同时结果b作为中间处理结果还可以是C算法的输入数据,即结果b还可以通过C算法进行再次数据处理获得结果d,即本发明实施例提供的A算法、B算法、C算法可以衍生出B+C算法即先执行B算法后执行C算法,相应的产生结果d。同理,还可以衍生出C+B算法即先执行C算法后执行B算法,或者A+B+C算法等。
[0038]本发明实施例将多个数据挖掘算法中的两个或者多个进行结合获得新的组合算法,进一步增加了数据挖掘算法的多样性,以及数据挖掘对目标数据进行数据处理的灵活性。
[0039]图2为本发明实施例提供的数据挖掘装置的结构图。本发明实施例提供的数据挖掘装置可以执行数据挖掘方法实施例提供的处理流程,如图2所示,数据挖掘装置20包括目标数据确定模块21、数据处理模块22和显示模块23,其中,目标数据确定模块21用于确定待处理的目标数据;数据处理模块22用于依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;显示模块23用于显示所述第一处理结果和/或第二处理结果,以供用户选择。
[0040]本发明实施例通过至少两种数据挖掘算法分别对目标数据进行数据处理,获取到至少两个处理结果,并且将第
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1