数据挖掘方法及设备的制作方法

文档序号:6340134阅读:396来源:国知局
专利名称:数据挖掘方法及设备的制作方法
技术领域
本发明涉及数据挖掘领域,尤其涉及一种数据挖掘方法及设备。
背景技术
数据挖掘(data mining),是一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。利用数据挖掘算法对数据进行挖掘,可以得到数据挖掘结果,而根据数据挖掘结果,就能做到分类(Classification)、估值(Estimation)、预言(Prediction)、相关性分组或关联规贝1J (Affinity grouping or association rules)、聚集(Clustering)、描述禾口可视化(Description and Visualization)、复杂数据类型挖掘等后续处理。在现有技术中,为了进行上述后续处理,会采用不同数据挖掘算法分别进行多次挖掘和调校,最终选取一种效果最好的数据挖掘算法来进行数据挖掘计算并得到相应的数据挖掘结果。然而,由于不同数据挖掘算法可能会针对数据不同的属性来进行数据挖掘,因此,上述后续处理若只针对某一种数据挖掘算法得到的数据挖掘结果来进行,会存在片面性的问题。然而,现有技术中还没有给出对不同数据挖掘算法得到的数据挖掘结果进行融合以克服上述缺陷的方案。

发明内容
本发明实施例提供一种数据挖掘方法及设备,用以提供一种融合不同数据挖掘算法得到的数据挖掘结果的方案。本发明实施例采用以下技术方案—种数据挖掘方法,包括获取至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘结果;并根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先针对所述数据确定的对应于不同数据挖掘算法的权重值以及获取的数据挖掘结果,确定数据挖掘结果融和值。一种数据挖掘设备,包括获取单元,用于获取至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘结果;融合值确定单元,用于根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先针对所述数据确定的对应于不同数据挖掘算法的权重值以及获取单元获取的数据挖掘结果,确定数据挖掘结果融和值。本发明实施例的有益效果如下本发明实施例提供一种上述方案通过对不同数据挖掘算法得到的结果进行融合, 使得多种数据挖掘算法得到的数据挖掘结果能够以一个数据挖掘结果融和值的方式进行体现。


图1为本发明实施例提供的一种数据挖掘方法的具体流程示意5
图2为本发明实施例提供的一种数据挖掘结果的融合设备的具体结构示意图;图3为本发明实施例提供的方案在实际中的一种实现架构示意图;图4为本发明实施例提供的方案用于确定用户标签的值的具体过程示意图;图5为本发明实施例中在融合模块中执行的处理流程示意图。
具体实施例方式本发明实施例提供一种数据挖掘方案,实现将多种数据挖掘算法得到的数据挖掘结果以一个数据挖掘结果融和值进行体现。以下结合附图,对本发明实施例提供的方案进行详细描述。首先,本发明实施例提供一种数据挖掘方法,该方法的具体流程示意图如图1所示,包括下述步骤步骤11,获取至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘
结果;步骤12,根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先针对上述数据确定的对应于不同数据挖掘算法的权重值与获取的数据挖掘结果,确定数据挖掘结果融和值。在上述方法中,任一数据挖掘算法所对应的数据挖掘结果有效范围的确定方式可以但不限于采用下述步骤首先,确定完全满足该数据挖掘算法的逻辑表达式的数据挖掘结果;然后,将确定的数据挖掘结果确定为该数据挖掘算法对应的数据挖掘结果有效范围。较佳地,对应于不同数据挖掘算法的权重值的确定方式可以但不限于采用下述步骤首先,获取至少两种不同数据挖掘算法中的各算法针对样本数据分别挖掘得到的样本数据挖掘结果;然后,根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、获取的样本数据挖掘结果和预先分别为各算法分配的多个第一权重值,确定分别对应于不同第一权重值的样本数据挖掘结果融和值;最后,从样本数据挖掘结果融和值中,选取一个数据挖掘结果融和值,并将选取的样本数据挖掘结果融和值对应的各第一权重值,分别确定为相应的数据挖掘算法的权重值。在本发明实施例中,可以采用下述公式[1]完成根据不同数据挖掘算法的数据挖掘结果有效范围和权重值实现对数据挖掘结果的融合
权利要求
1.一种数据挖掘方法,其特征在于,包括获取至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘结果;并根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先针对所述数据确定的对应于不同数据挖掘算法的权重值以及获取的数据挖掘结果,确定数据挖掘结果融和值。
2.如权利要求1所述的方法,其特征在于,任一数据挖掘算法所对应的数据挖掘结果有效范围的确定方式为确定完全满足所述任一数据挖掘算法的逻辑表达式的数据挖掘结果;并将确定的数据挖掘结果确定为该数据挖掘算法对应的所述有效范围。
3.如权利要求1所述的方法,其特征在于,所述对应于不同数据挖掘算法的权重值的确定方式为获取所述至少两种不同数据挖掘算法中的各算法针对样本数据分别挖掘得到的样本数据挖掘结果;并根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先分别为所述各算法分配的多个第一权重值和获取的样本数据挖掘结果,确定分别对应于不同第一权重值的样本数据挖掘结果融和值;并从所述样本数据挖掘结果融和值中,选取一个数据挖掘结果融和值,并将选取的样本数据挖掘结果融和值对应的各第一权重值,分别确定为相应的数据挖掘算法的权重值。
4.如权利要求1所述的方法,其特征在于,根据所述数据挖掘结果有效范围、所述对应于不同数据挖掘算法的权重值、获取的数据挖掘结果,确定所述融和值具体为根据下述公式,确定数据挖掘结果融和值L 其中,N为所述至少两种不同数据挖掘算法所挖掘得到的数据挖掘结果总个数,i为数据挖掘结果在所述总个数中的排列序号,i满足1 < i < N,Li为在所述至少两种不同数据挖掘算法所挖掘得到的数据挖掘结果中的第i位数据挖掘结果,Wi为与得到Li的数据挖掘算法对应的权重值,OiS与得到Li的数据挖掘算法对应的数据挖掘结果有效范围, (VK)Ii^,表示当Li被Oi包含时该项取值为Li · WyOI1^,表示当Li不被Oi包含时该项取值为0,巧Ιζ^Φ,表示当Li被Oi包含时该项取值为W”
5.如权利要求1 4任一所述的方法,其特征在于,获取所述至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘结果,具体包括获取所述至少两种不同数据挖掘算法针对同一数据分别挖掘得到的第一挖掘结果;并按照预设的挖掘结果与不同数值的对应关系,分别确定获取的第一挖掘结果对应的数值;以及分别执行对确定的各数值的归一化操作,并将归一化后的各数值分别确定为相应的数据挖掘结果。
6.一种数据挖掘设备,其特征在于,包括获取单元,用于获取至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘结果;融合值确定单元,用于根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先针对所述数据确定的对应于不同数据挖掘算法的权重值以及获取单元获取的数据挖掘结果,确定数据挖掘结果融和值。
7.如权利要求6所述的设备,其特征在于,还包括数据挖掘结果确定单元,用于确定完全满足所述任一数据挖掘算法的逻辑表达式的数据挖掘结果;有效范围确定单元,用于将数据发掘结果确定单元确定的数据挖掘结果确定为该数据挖掘算法对应的所述有效范围;所述融合值确定单元具体用于根据所述有效范围确定单元确定的数据挖掘结果有效范围、预先针对所述数据确定的对应于不同数据挖掘算法的权重值、获取单元获取的数据挖掘结果,确定数据挖掘结果融和值。
8.如权利要求6所述的设备,其特征在于,还包括样本数据挖掘结果获取单元,用于获取所述至少两种不同数据挖掘算法中的各算法针对样本数据分别挖掘得到的样本数据挖掘结果;样本数据挖掘结果融合值确定单元,用于根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先分别为所述各算法分配的多个第一权重值和获取的样本数据挖掘结果,确定分别对应于不同第一权重值的样本数据挖掘结果融和值;权重值确定单元,用于从样本数据挖掘结果融合值确定单元确定的融和值中选取一个融和值,并将选取的融和值对应的各第一权重值,分别确定为相应的数据挖掘算法的权重值;以及所述融合值确定单元具体用于根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预权重值确定单元确定的对应于不同数据挖掘算法的权重值、获取单元获取的数据挖掘结果,确定数据挖掘结果融和值。
9.如权利要求6所述的设备,其特征在于,所述融合值确定单元根据所述数据挖掘结果有效范围、所述对应于不同数据挖掘算法的权重值、获取单元获取的数据挖掘结果,确定所述融和值具体为根据下述公式,确定数据挖掘结果融和值L
10.如权利要求6 9任一所述的设备,其特征在于,所述获取单元具体包括 获取模块,用于获取所述至少两种不同数据挖掘算法针对同一数据分别挖掘得到的第一挖掘结果;数值确定模块,用于按照预设的挖掘结果与不同数值的对应关系,分别确定获取模块获取的第一挖掘结果对应的数值;归一化模块,用于对数值确定模块确定的数值分别执行归一化操作,得到归一化后的各数值;数据挖掘结果确定模块,用于将归一化模块得到的归一化后的各数值分别确定为相应的数据挖掘结果。
全文摘要
本发明实施例公开了一种数据挖掘方法及设备,用以提供一种融合不同数据挖掘算法得到的数据挖掘结果的方案。该方法包括获取至少两种不同数据挖掘算法针对同一数据分别挖掘得到的数据挖掘结果;并根据预先确定的对应于不同数据挖掘算法的数据挖掘结果有效范围、预先针对所述数据确定的对应于不同数据挖掘算法的权重值以及获取的数据挖掘结果,确定数据挖掘结果融和值。
文档编号G06F17/30GK102567375SQ20101060815
公开日2012年7月11日 申请日期2010年12月27日 优先权日2010年12月27日
发明者周华 申请人:中国移动通信集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1