对象的分类方法、业务的推送方法及服务器的制造方法_2

文档序号:9579278阅读:来源:国知局
的用户、账户和账号等。在此说明书中,以待分类的对象为待分类的用户为例进行说 明。在支付宝中,待分类的用户为近一年的活跃用户,这些用户的爱好和习惯是不明确的, 可以由服务器直接从支付宝的后台数据库中获取。
[0046] 在对待分类的用户进行分类之前,将待分类的用户通过5个一级特征向量表示, 该5个一级特征向量分别为:年龄、职业、所在城市、消费能力和理财能力;上述每个一级特 征向量又可以再细分为二级特征向量,其中,年龄划分为7个区间,则得到7个二级特征向 量;职业划分为学生、教师和未知等8类,则可以得到8个二级特征向量;所在城市按级别 划分为6类,则可以得到6个二级特征向量;消费能力划分为10档,则可以得到10个二级 特征向量;理财能力划分为6档,则可以得到6个二级特征向量,综上,根据上述一级特征向 量可以得到37个二级特征向量。
[0047] 可以理解的是,对任一待分类的用户,都可以将其通过37个二级特征向量表示, 但是对不同的待分类的用户,其对应的37个二级特征向量的值是不相同的。
[0048]需要说明的,上述二级特征向量的值均为布尔值。举例来说,一级特征向量:年 龄划分的7个区间,也即根据一级特征:年龄,得到的二级特征向量为[1,18],(18, 25], (25, 30],(30, 40],(40, 60],(60, 70],(70, 100],则当待分类的用户的年龄为20岁时,则该 待分类的用户对应的上述7个特征向量的值为:0,1,0,0,0,0,0。
[0049] 举例来说,从支付宝后台数据库中获取三个目标用户:用户A、用户B和用户C,则 待分类的对象的集合为:{用户A,用户B,用户C},待分类的对象为:用户A、用户B和用户 C,且获取到待分类的对象:用户A的37个二级特征向量的值为:{ai,a2,…,a37},获取到待 分类的对象:用户B的37个二级特征向量的值为:{bpb2,…,b37},获取到待分类的对象: 用户C的37个二级特征向量的值为:{Cl,c2,…,c37},其中,或者Cl(l彡i彡37)为 0或1。最后将用户A的37个二级特征向量的值、用户B的37个二级特征向量的值和用户 C的37个二级特征向量的值构成第一集合,即第一集合为:{{ap a2,…,a37},{bpb2,…, ^37},{。1,。2,···,C37}1。
[0050] 步骤120,获取目标对象集合以及所述目标对象集合中各个目标对象的特征向量 的值,并将所述各个目标对象的特征向量的值构成第二集合。
[0051] 需要说明的是,目标对象的定义与待分类的对象的定义是相同的。在此说明书中, 同样以目标对象为目标用户为例进行说明。在支付宝中,目标用户为支付宝中使用理财等 功能的优质用户,这些用户的爱好和习惯是明确的,也可以由服务器直接从支付宝的后台 数据库中获取。
[0052] 对任一目标用户,同样将其通过37个二维特征向量表示。
[0053] 如前述例子,从支付宝后台数据库中获取两个种子用户:用户X,用户Y,则获取到 目标对象的集合为:{用户X,用户Y},目标对象为:用户X,用户Y,且获取到目标对象:用户 X的37个二级特征向量的值为:{Xl,x2,…,x37},获取到目标对象:用户Y的37个二级特 征向量的值为:{yi,y2,…,y37},其中,Xi或者yjl彡i彡37)为0或1。最后将用户X的 37个二级特征向量的值和用户Y的37个二级特征向量的值构成第二集合,即第二集合为: Ηχι,X〗,…,χ3?},{y"i,y〗,…,5^37}}。
[0054] 步骤130,对所述第一集合中特征向量的值进行去重处理,得到第三集合,以及对 所述第二集合中特征向量的值进行去重处理,得到第四集合。
[0055] 其中,对所述第一集合中特征向量的值进行去重处理,得到第三集合包括:
[0056] 步骤1 :从所述第一集合中选取第一特征向量的值,将所述第一特征向量的值加 入中间集合,并将所述第一集合中所述第一特征向量的值删除;
[0057] 步骤2:从所述第一集合中选取第二特征向量的值,将所述第二特征向量的值与 所述中间集合中的特征向量的值进行比对,将比对不一致的第二特征向量的值加入所述中 间集合中,并将所述第一集合中所述第二特征向量的值删除;将比对一致的第二特征向量 的值直接从所述第一集合中删除;
[0058] 步骤3:重复执行步骤2,直至将所述第一集合中特征向量的值删除完毕,将所述 中间集合作为第三集合。
[0059]如前述例子中,第一集合为:{{a^a;;,.··,&;"},{b!,b2,…,b37},{cpC;;,…,c37}}, 假设ai =h,其中,1 <i< 37,即用户A的37个特征向量的值与用户B的37个特征向量 的值是相同的。则得到第三集合的过程具体为:预先设定中间集合M,M为空;然后从第一集 合中选取第一特征向量的值,第一特征向量的值可以为第一集合中任一待分类的对象的特 征向量的值,例如,{apa;;,···,&;"};将{apa;;,···,&;"}加入M,则···,&;"}}, 并将第一集合中"·,α37}删除,即第一集合更新为^{bpb;;,…, c37}};之后从第一集合中选取第二特征向量的值,第二特征向量的值为更新后的第一集合 中任一待分类的对象的特征向量的值,例如,{(^,c2,…,c37},将{Cl,c2,…,c37}与Μ中 的{a^a2,…,a37}进行比对,若任一q弇ajl彡i彡37),则说明上述第二特征向量的值 与Μ中特征向量的值不一致,将{Cl,c2,…,c37}加入Μ中,Μ更新为:{{ai,a2,…,a37}, {cpC;;,...,c37}},并将第一集合中{cpC;;,...,(337}删除,即第一集合更新为:{{bpb;;,…, b37}};因为第一集合中特征向量的值还没有删除完毕,所以再次从第一集合中选取第二特 征向量的值,例如,,…,b37},因为= 所以直接将,…,b37}从第一集合 中删除。因为第一集合中特征向量的值已经删除完毕,所以将M={{ai,a2,…,a37},{Cl,c2,.",(337}}作为第三集合。
[0060] 在上述将第二特征向量的值与中间集合中特征向量的值进行比对的过程中,如果 Μ中还有其他特征向量的值,则还需要将第二特性向量的值与其他特征向量的值进行比对, 当第二特征向量的值与中间集合中所有特征向量的值均不一致时,才将第二特征向量的值 加入中间集合中。
[0061] 可选地,在所述对所述第一集合中特征向量的值进行去重处理,得到第三集合之 后,在所述对所述第二集合中特征向量的值进行去重处理,得到第四集合之前,所述方法还 包括:
[0062] 统计所述第三集合中各特征向量的值在所述第二集合中重复出现的次数。
[0063] 如前述例子中,得到的第二集合为:{{χ^Χ2,…,x37},{y^y2,…,y』,而第三 集合为:{{apa2,…,a37},{c!,c2,…,c37}},假设a;=Xi=y;,其中,1 彡i彡 37,则{a!, a2,一437}在第二集合中重复出现的次数为2,而{Cl,c2,…,c37}在第二集合中重复出现 的次数为〇。
[0064] 其中,对所述第二集合中特征向量的值进行去重处理,得到第四集合包括:
[0065] 步骤1 :从所述第二集合中选取第一特征向量的值,将所述第一特征向量的值加 入中间集合,并将所述第二集合中所述第一特征向量的值删除;
[0066]步骤2:从所述第二集合中选取第二特征向量的值,将所述第二特征向量的值与 所述中间集合中的特征向量的值进行比对,将比对不一致的第二特征向量的值加入所述中 间集合中,并将所述第二集合中所述第二特征向量的值删除;将比对一致的第二特征向量 的值直接从所述第二集合中删除;
[0067] 步骤3 :重复执行步骤2,直至将所述第二集合中特征向量的值删除完毕,将所述 中间集合作为第四集合。
[0068] 前述例子中,第二集合为:{{χ^χζ,…,,iri,y2,…,,假设Xi=yi,其中, 1 <i< 37,即用户X的37个特征向量的值与用户Y的37个特征向量的值是相同的。贝1J 根据上述步骤得到的第四集合为:{Χι,χ2,…,χ37}。
[0069] 步骤140,对所述第三集合中任一特征向量的值,计算所述任一特征向量的值与 所述第四集合中各特征向量的值的相似度,得到与所述任一特征向量的值对应的多个相似 度。
[0070] 可选地,在所述
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1