对象的分类方法、业务的推送方法及服务器的制造方法_3

文档序号:9579278阅读:来源:国知局
对所述第二集合中特征向量的值进行去重处理,得到第四集合之 后,所述方法还包括:
[0071] 根据笛卡尔积的连接方式,对所述第三集合中特征向量的值与所述第四集合中特 征向量的值进行组合。
[0072] 所述计算所述任一特征向量的值与所述第四集合中各特征向量的值的相似度包 括:
[0073] 对组合的所述任一特征向量的值与所述第四集合中各特征向量的值计算相似度。
[0074] 如前述例子中,第三集合为:,…,a37},,…,c37}},第四集合为:{x^ x2,…,x37},根据笛卡尔积的连接方式,对所述第三集合中特征向量的值与所述第四集合中 特征向量的值进行组合后为 ···,&;"}, …,(^,{叉!, x2,…,X37H。对第三集合中任一特征向量的值:…,a37},计算{a^a;;,…,a37}与{xpXr...,x37}的相似度S1〇
[0075] 其中,{a!,a2,…,a37}与{x!,x2,…,x37}的相似度计算公式如下:
[0076]
[0077]a;为{a!,a2,…,a37}中任一值,为{x!,x2,…,x37}中任一值。
[0078] 需要说明的是,当上述组合还包括:{{a^a;;,…七?}与{zpz;;,…,z37}}时,则对 第三集合中任一特征向量的值:{a^a;;,···,&;"},还需计算{a^a;;,···,&;"}与{z^z;;,…,z37}的相似度&,从而可以得到与任一特征向量的值:{ai,a2,…,a37}对应的两个相似度Si 和S2。
[0079] 步骤150,当所述多个相似度之和大于预设的阈值时,则识别所述任一特征向量的 值对应的待分类的对象与所述目标对象集合中的目标对象为同一类对象。
[0080] 优选地,将所述多个相似度之和与所述任一特征向量的值在所述第二集合中重复 出现的次数相乘,得到目标相似度和;
[0081] 所述当所述多个相似度之和大于预设的阈值时,则识别所述任一特征向量的值对 应的待分类的对象与所述目标对象集合中的目标对象为同一类对象包括:
[0082] 当所述目标相似度和大于预设的阈值时,则识别所述任一特征向量的值对应的待 分类的对象与所述目标对象集合中的目标对象为同一类对象。
[0083] 如前述例子中,对第三集合中任一特征向量的值:{apa2,…,a37},计算出{ap 3<2,···,8*37}与(Xl,X2,···,X37}的相似度Si,并计算出{?3·ι,3*2,···,8*37}与(Zi,Z2,···,Z37} 的相似度s2之后,将Si与S2相加得到Sadd ;而在步骤130中统计出{ai,a2,…,a37}在第二 集合中重复出现的次数为2,将Sadd与2相乘得到目标相似度和为2*Sadd ;而假设2*Sadd大于 预设的阈值,则识别{apa2,…,a37}对应的用户A与目标对象集合中的用户X和用户Y为 同一类对象。而由于&1 = 131,其中,1彡i彡37,因此,也可以识别{bplv.",b37}对应的 用户B与目标对象集合中的用户X和用户Y为同一类对象。类似地,可以识别{Cl,c2,…, C37}对应的用户C与目标对象集合中的用户X和用户Y为同一类对象或者不为同一类对象。
[0084] 在支付宝中,当待分类的用户为2亿,而目标用户为80万,且需要将2亿待分类的 用户进行分群时,通过本申请的方法,可以将计算量从2亿*80万(这个计算量在12小时 内未能完成)降为2000*1500,而2000*1500的计算量可以分钟级完成。由此,本申请实施 例提供的对象的分类方法可以大大减小计算量,从而保证待分类的对象的分类过程能够在 可接受的时间范围内完成。
[0085] 本申请实施例提供的对象的分类方法,在获取到第一集合和第二集合后,分别对 第一集合中特征向量的值和第二集合中特征向量的值进行去重处理,然后将去重处理后得 到的第三集合中特征向量的值与第四集合中特征向量的值计算相似度,最后根据计算得到 的相似度对待分类的对象进行分类,由此,可以大大减小计算量,从而保证待分类的对象的 分类过程能够在可接受的时间范围内完成。
[0086] 图2为本申请实施例二提供的业务的推送方法流程图。该实施例二中根据实施例 一提供的对象的分类方法,识别第一对象与目标对象集合中的对象为同一类对象时,向第 一对象推送与目标对象集合中的对象相同的业务。关于识别第一对象与目标对象集合中的 对象为同一类对象的部分,可以参照实施例一。所述方法的执行主体可以为具有处理能力 的设备:服务器或者系统或者装置,如图2所示,所述方法具体可包括以下步骤:
[0087] 步骤210,识别第一对象与目标对象集合中的对象为同一类对象。
[0088] 需要说明的是,本实施例中的第一对象为实施例一中的待分类的对象集合中任一 待分类的对象。第一对象的定义同待分类的对象,在此不作赘述。
[0089] 其中,如图2所示,所述识别第一对象与目标对象集合中的对象为同一类对象,包 括:
[0090] 步骤2101,获取所述第一对象的特征向量的值;
[0091] 步骤2102,获取所述目标对象集合以及所述目标对象集合中各个对象的特征向量 的值,并将所述各个对象的特征向量的值构成第一集合;
[0092] 步骤2103,对所述第一集合中特征向量的值进行去重处理,得到第二集合;
[0093] 步骤2104,计算所述第一对象的特征向量的值与所述第二集合中各特征向量的值 的相似度,得到与所述第一对象的特征向量的值对应的多个相似度;
[0094] 步骤2105,当所述多个相似度之和大于预设的阈值时,则识别所述第一对象与所 述目标对象集合中的对象为同一类对象;
[0095]步骤220,向所述第一对象,推送与所述目标对象集合中的对象相同的业务。
[0096] 可选地,所述对所述第一集合中特征向量的值进行去重处理,得到第二集合包 括:
[0097] 步骤1 :从所述第一集合中选取第一特征向量的值,将所述第一特征向量的值加 入中间集合,并将所述第一集合中所述第一特征向量的值删除;
[0098] 步骤2:从所述第一集合中选取第二特征向量的值,将所述第二特征向量的值与 所述中间集合中的特征向量的值进行比对,将比对不一致的第二特征向量的值加入所述中 间集合中,并将所述第一集合中所述第二特征向量的值删除;将比对一致的第二特征向量 的值直接从所述第一集合中删除;
[0099] 步骤3:重复执行步骤2,直至将所述第一集合中特征向量的值删除完毕,将所述 中间集合作为第二集合。
[0100] 可选地,在所述对所述第一集合中特征向量的值进行去重处理,得到第二集合之 后,所述方法还包括:
[0101] 根据笛卡尔积的连接方式,对所述第一对象的特征向量的值与所述第四集合中特 征向量的值进行组合。
[0102] 所述计算所述第一对象的特征向量的值与所述第二集合中各特征向量的值的相 似度包括:
[0103] 对组合的所述第一对象的特征向量的值与所述第二集合中各特征向量的值计算 相似度。
[0104] 可选地,在所述对所述第一集合中特征向量的值进行去重处理,得到第二集合之 后,所述方法还包括:
[0105] 统计所述第一对象的特征向量的值在所述第二集合中重复出现的次数。
[0106] 可选地,在计算所述第一对象的特征向量的值与所述第二集合中各特征向量的值 的相似度之后,得到与所述第一对象的特征向量的值对应的多个相似度所述方法还包括:
[0107] 将所述多个相似度之和与所述第一对象的特征向量的值在所述第二集合中重复 出现的次数相乘,得到目标相似度和;
[0108] 所述当所述多个相似度之和大于预设的阈值时,则识别所述第一对象与所述目标 对象集合中的对象为同一类对象包括:
[0109] 当所述目标相似度和大于预设的阈值时,则识别所述第一对象与所述目标对象集 合中的对象为同一类对象。
[0110] 本申请实施例提供的业务的推送方法,在获取到第一集合后,对第一集合中特征 向量的值进行去重处理,然后将第一对象的特征向量的值与去重处理后得到的第二集合中 特征向量的值计算相似度,由此,可以大大减小计算量,节约计算机资源,并且可以保证准 确地向第一对象推送业务。
[0111] 与上述对象的分类方法对应地,本申请实施例还提供的一种服务器,如图3所示, 该服务器包
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1