对象的分类方法、业务的推送方法及服务器的制造方法_5

文档序号:9579278阅读:来源:国知局
理,得到第四集合包括: 步骤1 :从所述第二集合中选取第一特征向量的值,将所述第一特征向量的值加入中 间集合,并将所述第二集合中所述第一特征向量的值删除; 步骤2:从所述第二集合中选取第二特征向量的值,将所述第二特征向量的值与所述 中间集合中的特征向量的值进行比对,将比对不一致的第二特征向量的值加入所述中间集 合中,并将所述第二集合中所述第二特征向量的值删除;将比对一致的第二特征向量的值 直接从所述第二集合中删除; 步骤3 :重复执行步骤2,直至将所述第二集合中特征向量的值删除完毕,将所述中间 集合作为第四集合。4. 根据权利要求1-3任一所述的方法,其特征在于,在所述对所述第二集合中特征向 量的值进行去重处理,得到第四集合之后,所述方法还包括: 根据笛卡尔积的连接方式,对所述第三集合中特征向量的值与所述第四集合中特征向 量的值进行组合。 所述计算所述任一特征向量的值与所述第四集合中各特征向量的值的相似度包括: 对组合的所述任一特征向量的值与所述第四集合中各特征向量的值计算相似度。5. 根据权利要求1所述的方法,其特征在于,在所述对所述第一集合中特征向量的值 进行去重处理,得到第三集合之后,在所述对所述第二集合中特征向量的值进行去重处理, 得到第四集合之前,所述方法还包括: 统计所述第三集合中各特征向量的值在所述第二集合中重复出现的次数。6. 根据权利要求5所述的方法,其特征在于,在所述计算所述任一特征向量的值与所 述第四集合中各特征向量的值的相似度之后,所述方法还包括: 将所述多个相似度之和与所述任一特征向量的值在所述第二集合中重复出现的次数 相乘,得到目标相似度和; 所述当所述多个相似度之和大于预设的阈值时,则识别所述任一特征向量的值对应的 待分类的对象与所述目标对象集合中的目标对象为同一类对象包括: 当所述目标相似度和大于预设的阈值时,则识别所述任一特征向量的值对应的待分类 的对象与所述目标对象集合中的目标对象为同一类对象。7. -种业务的推送方法,其特征在于,所述方法包括: 识别第一对象与目标对象集合中的对象为同一类对象,包括: 获取所述第一对象的特征向量的值; 获取所述目标对象集合以及所述目标对象集合中各个对象的特征向量的值,并将所述 各个对象的特征向量的值构成第一集合; 对所述第一集合中特征向量的值进行去重处理,得到第二集合; 计算所述第一对象的特征向量的值与所述第二集合中各特征向量的值的相似度,得到 与所述第一对象的特征向量的值对应的多个相似度; 当所述多个相似度之和大于预设的阈值时,则识别所述第一对象与所述目标对象集合 中的对象为同一类对象; 向所述第一对象,推送与所述目标对象集合中的对象相同的业务。8. 根据权利要求7所述的方法,在所述对所述第一集合中特征向量的值进行去重处 理,得到第二集合之后,所述方法还包括: 根据笛卡尔积的连接方式,对所述第一对象的特征向量的值与所述第四集合中特征向 量的值进行组合; 所述计算所述第一对象的特征向量的值与所述第二集合中各特征向量的值的相似度 包括: 对组合的所述第一对象的特征向量的值与所述第二集合中各特征向量的值计算相似 度。9. 一种服务器,其特征在于,该服务器包括:第一获取单元、第二获取单元、处理单元、 计算单元和识别单元; 所述第一获取单元,用于获取待分类的对象集合以及所述待分类的对象集合中各个待 分类的对象的特征向量的值,并将所述各个待分类的对象的特征向量的值构成第一集合; 所述第二获取单元,用于获取目标对象集合以及所述目标对象集合中各个目标对象的 特征向量的值,并将所述各个目标对象的特征向量的值构成第二集合; 所述处理单元,用于对所述第一集合中特征向量的值进行去重处理,得到第三集合,以 及对所述第二集合中特征向量的值进行去重处理,得到第四集合; 所述计算单元,用于对所述处理单元得到的所述第三集合中任一特征向量的值,计算 所述任一特征向量的值与所述第四集合中各特征向量的值的相似度,得到与所述任一特征 向量的值对应的多个相似度; 所述识别单元,用于当所述计算单元得到的所述多个相似度之和大于预设的阈值时, 则识别所述任一特征向量的值对应的待分类的对象与所述目标对象集合中的目标对象为 同一类对象。10. 根据权利要求9所述的服务器,其特征在于,所述处理单元具体用于: 步骤1 :从所述第一集合中选取第一特征向量的值,将所述第一特征向量的值加入中 间集合,并将所述第一集合中所述第一特征向量的值删除; 步骤2:从所述第一集合中选取第二特征向量的值,将所述第二特征向量的值与所述 中间集合中的特征向量的值进行比对,将比对不一致的第二特征向量的值加入所述中间集 合中,并将所述第一集合中所述第二特征向量的值删除;将比对一致的第二特征向量的值 直接从所述第一集合中删除; 步骤3 :重复执行步骤2,直至将所述第一集合中特征向量的值删除完毕,将所述中间 集合作为第三集合。11. 根据权利要求9所述的服务器,其特征在于,所述处理单元具体用于: 步骤1 :从所述第二集合中选取第一特征向量的值,将所述第一特征向量的值加入中 间集合,并将所述第二集合中所述第一特征向量的值删除; 步骤2:从所述第二集合中选取第二特征向量的值,将所述第二特征向量的值与所述 中间集合中的特征向量的值进行比对,将比对不一致的第二特征向量的值加入所述中间集 合中,并将所述第二集合中所述第二特征向量的值删除;将比对一致的第二特征向量的值 直接从所述第二集合中删除; 步骤3:重复执行步骤2,直至将所述第二集合中特征向量的值删除完毕,将所述中间 集合作为第四集合。12. 根据权利要求9-11任一所述的服务器,其特征在于,所述服务器还包括:组合单 元,用于根据笛卡尔积的连接方式,对所述第三集合中特征向量的值与所述第四集合中特 征向量的值进行组合。 所述计算单元具体用于:对组合的所述任一特征向量的值与所述第四集合中各特征向 量的值计算相似度。13. 根据权利要求9所述的服务器,其特征在于,所述服务器还包括:统计单元,用于统 计所述第三集合中各特征向量的值在所述第二集合中重复出现的次数。14. 根据权利要求13所述的服务器,其特征在于,所述服务器还包括:乘法单元,用于 将所述多个相似度之和与所述任一特征向量的值在所述第二集合中重复出现的次数相乘, 得到目标相似度和; 所述识别单元具体用于:当所述目标相似度和大于预设的阈值时,则识别所述任一特 征向量的值对应的待分类的对象与所述目标对象集合中的目标对象为同一类对象。15. -种服务器,其特征在于,所述服务器包括:识别单元和推送单元; 所述识别单元,用于识别第一对象与目标对象集合中的对象为同一类对象,包括: 获取所述第一对象的特征向量的值; 获取所述目标对象集合以及所述目标对象集合中各个对象的特征向量的值,并将所述 各个对象的特征向量的值构成第一集合; 对所述第一集合中特征向量的值进行去重处理,得到第二集合; 计算所述第一对象的特征向量的值与所述第二集合中各特征向量的值的相似度,得到 与所述第一对象的特征向量的值对应的多个相似度; 当所述多个相似度之和大于预设的阈值时,则识别所述第一对象与所述目标对象集合 中的对象为同一类对象; 所述推送单元,用于向所述第一对象,推送与所述目标对象集合中的对象相同的业务。16.根据权利要求15所述的服务器,其特征在于,所述服务器还包括:组合单元,用于 根据笛卡尔积的连接方式,对所述第一对象的特征向量的值与所述第四集合中特征向量的 值进行组合; 所述识别单元具体用于:对组合的所述第一对象的特征向量的值与所述第二集合中各 特征向量的值计算相似度。
【专利摘要】本申请实施例涉及一种对象的分类方法、业务的推送方法及服务器,包括:获取待分类的对象集合中各个待分类的对象的特征向量的值,构成第一集合;获取目标对象集合中各个目标对象的特征向量的值,构成第二集合;对第一集合进行去重处理,得到第三集合,以及对第二集合进行去重处理,得到第四集合;对第三集合中任一特征向量的值,计算任一特征向量的值与第四集合中各特征向量的值的相似度,得到与任一特征向量的值对应的多个相似度;当多个相似度之和大于预设的阈值时,则识别任一特征向量的值对应的待分类的对象与目标对象集合中的目标对象为同一类对象。由此,可以解决在将目标用户分类的过程中,存在的计算量过大,而严重耗费计算机资源的问题。
【IPC分类】G06Q30/02, G06F17/30
【公开号】CN105335390
【申请号】CN201410325913
【发明人】于兴彬, 李学升, 陈前进
【申请人】阿里巴巴集团控股有限公司
【公开日】2016年2月17日
【申请日】2014年7月9日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1