一种基于分布式的数据统计的方法

文档序号:9235449阅读:443来源:国知局
一种基于分布式的数据统计的方法
【技术领域】
[0001]本发明涉及互联网技术领域,具体涉及一种基于分布式的数据统计的方法及装置。
【背景技术】
[0002]随着大数据时代的到来,面对海量数据信息,如何从这些信息中提取有效的数据显得尤为重要。
[0003]现有技术中有一种方法,该方法将任一数据集合中的数据按照属性构造决策树,通过统计该决策树中的叶子节点的数量即可获取统计结果。
[0004]该方法实现了对预设数据源中数据的统计,但是无法解决分布式计算环境下多个节点的数据统计的安全问题。

【发明内容】

[0005]本发明实施例提供了基于分布式的数据统计的方法及装置,可以解决基于分布式的多个节点的数据统计的安全问题。
[0006]本发明实施例的第一方面公开了基于分布式的数据统计的方法,所述方法包括:
[0007]第二节点接收至少两个第一节点发送的加密的数据集合,所述第一节点以及所述第二节点均为分布式网络中的节点;所述第二节点根据预设的数据属性,利用所述加密的数据集合构造决策树;所述第二节点根据所述预设的数据属性和所述决策树,获取数据的统计结果。
[0008]结合第一方面,在第一方面的第一种实现方式中,所述第二节点接收至少两个第一节点发送的加密的数据集合之前,还包括:
[0009]所述第二节点向所述第一节点发送公开密钥,以使得所述第一节点根据所述公开密钥对数据集合进行加密获得加密的数据集合。
[0010]结合第一方面的第一种实现方式,在第一方面的第二种实现方式中,所述第二节点根据预设的数据属性,利用所述加密的数据集合构造决策树之前,还包括:
[0011]所述第二节点按照预设的排列规则,将所述加密的数据集合中的至少一列数据进行重新排列,以获得第一数据集合;
[0012]所述第二节点根据私有密钥,对所述第一数据集合进行解密,获得第二数据集合,所述私有密钥与所述公有密钥对应;
[0013]所述第二节点根据预设的数据属性,利用所述数据集合构造决策树包括:
[0014]所述第二节点根据预设的数据属性,利用所述第二数据集合构造决策树。
[0015]结合第一方面或第一方面的第一种实现方式或第一方面的第二种实现方式,在第一方面的第三种实现方式中,所述第二节点根据预设的数据属性,利用所述加密的数据集合构造决策树包括:
[0016]所述第二节点确定所述预设的数据属性的值;
[0017]所述第二节点按照预设的方式从所述加密的数据集合中逐条获取数据,并确定所述数据的关键属性值;
[0018]所述第二节点将所述预设的数据属性的值与所述数据的关键属性值进行比较,并获取比较的结果;
[0019]所述第二节点根据所述比较的结果,将所述获取的数据作为叶子节点插入到所述决策树中。
[0020]结合第一方面的第三种实现方式,在第一方面的第四种实现方式中,所述第二节点根据所述预设的数据属性和所述决策树,获取数据的统计结果包括:
[0021]所述第二节点根据所述预设的数据属性以及所述预设的数据属性的值,确定在所述决策树中需要遍历的叶子节点;
[0022]所述第二节点对所述需要遍历的叶子节点进行统计,获取统计的结果。
[0023]本发明实施例的第二方面公开了一种基于分布式的数据统计的装置,所述装置包括:
[0024]接收单元,用于接收至少两个第一节点发送的加密的数据集合,所述第一节点以及所述第二节点均为分布式网络中的节点;
[0025]构造单元,用于根据预设的数据属性,利用所述加密的数据集合构造决策树;
[0026]获取单元,用于根据所述预设的数据属性和所述决策树,获取数据的统计结果。
[0027]结合第二方面,在第二方面的第一种实现方式中,所述装置还包括发送单元,
[0028]所述发送单元,用于向所述第一节点发送公开密钥,以使得所述第一节点根据所述公开密钥对数据集合进行加密获得加密的数据集合;
[0029]所述接收单元,用于接收至少两个第一节点发送的加密的数据集合。
[0030]结合第二方面或第二方面的第一种实现方式,在第二方面的第二种实现方式中,
[0031]所述装置还包括排列单元,解密单元;
[0032]所述排列单元,具体用于按照预设的排列规则,将所述接收单元接收的加密的数据集合中的至少一列数据进行重新排列,以获得第一数据集合;
[0033]所述解密单元,具体用于根据私有密钥,对所述第一数据集合进行解密,获得第二数据集合,所述私有密钥与所述公有密钥对应;
[0034]所述构造单元,具体用于根据预设的数据属性,利用所述第二数据集合构造决策树。
[0035]结合第二方面或第二方面的第一种实现方式或第二方面的第二种实现方式,在第二方面的第三种实现方式中,所述生成单元具体包括第一确定子单元,第二确定子单元,t匕较子单元以及插入子单元;
[0036]所述第一确定子单元,具体用于确定所述预设的数据属性的值;
[0037]所述第二确定子单元,具体用于按照预设的方式从所述加密的数据集合中逐条获取数据,并确定所述数据的关键属性值;
[0038]所述比较子单元,具体用于将所述预设的数据属性的值与所述数据的关键属性值进行比较,并获取比较的结果;
[0039]所述插入子单元,具体用于根据所述比较的结果,将所述获取的数据作为叶子节点插入到所述决策树中。
[0040]结合第二方面的第三种实现方式,在第二方面的第四种实现方式中,所述获取单元包括第三确定子单元和统计子单元;
[0041]所述第三确定子单元,具体用于根据所述预设的数据属性以及所述第一确定子单元确定的预设的数据属性的值,确定在所述决策树中需要遍历的叶子节点;
[0042]所述统计子单元,具体用于对所述需要遍历的叶子节点进行统计,获取统计的结果O
[0043]从本发明实施例提供的以上技术方案可以看出,使用本发明实施例提供的基于分布式的数据统计方法及装置,根据预设的数据属性,利用加密的数据集合构造决策树,使得数据在加密的情况下完成了数据统计,从而保证了数据的安全性。
【附图说明】
[0044]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0045]图1为本发明一实施例提供的基于分布式的数据统计的方法流程图;
[0046]图2为本发明另一实施例提供的基于分布式的数据统计的方法流程图;
[0047]图3为本发明另一实施例提供的基于分布式的数据统计的方法流程图;
[0048]图4为本发明另一实施例提供的基于分布式的数据统计的方法流程图;
[0049]图5为本发明一实施例提供的基于分布式的数据统计的装置结构图;
[0050]图6为本发明另一实施例提供的基于分布式的数据统计的装置结构图;
[0051]图7为本发明另一实施例提供的基于分布式的数据统计的装置结构图;
[0052]图8为本发明另一实施例提供的基于分布式的数据统计的装置结构图;
[0053]图9为本发明另一实施例提供的基于分布式的数据统计的装置结构图。
【具体实施方式】
[0054]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055]下面根据图1,描述本发明实施例的一种基于分布式的数据统计的方法,该方法具体包括:
[0056]如图1描述本发明实施例的基于分布式的数据统计的方法步骤包括101至103。
[0057]101、第二节点接收至少两个第一节点发送的加密的数据集合,所述第一节点以及所述第二节点均为分布式网络中的节点;
[0058]其中,第二节点可以是分布式网络中接收数据并进行计算的一类可信赖的服务器或者终端,可以是一个也可以有多个。
[0059]其中,第一节点可以是分布式网络中的一台服务器或者一部终端。
[0060]可选的,如图4所述,在所述步骤101之前还包括步骤104 ;
[0061]所述步骤104具体为:
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1