技术总结
本申请公开了一种数据处理方法及装置,用以提高对数据处理的效率。所述数据处理方法包括:第一处理节点接收至少一个第二处理节点发送的数据信息,所述数据信息中包含第一数据集合和所述第一数据集合对应的索引信息,所述索引信息用于表征所述第一数据集合中包含的待处理数据的公共特征向量;根据所述数据信息中包含的所述索引信息,从第一处理节点的数据集合库中,查找到与所述索引信息不相同的至少一个第二数据集合;在确定所述第一数据集合与至少一个所述第二数据集合中包含至少一个相同的待处理数据时,将所述第一数据集合与至少一个所述第二数据集合聚合为一个数据集合。
技术研发人员:郭真林
受保护的技术使用者:阿里巴巴集团控股有限公司
文档号码:201510463292
技术研发日:2015.07.31
技术公布日:2017.02.15