一种确定社交网络平台中用户属性的方法和系统的制作方法_3

文档序号:8380939阅读:来源:国知局
回执行步骤303,计算下一个网页短URL的属性。
[0124]实施例四:
[0125]本实施例介绍计算用户属性的一种方式,如图4为本实施例的实现流程图,包括如下步骤:
[0126]步骤401:搜集用户与网页短URL的互动流水数据,确定与网页短URL互动的用户。
[0127]之所以只选取与网页短URL互动的用户进行计算,是为了缩小计算的范围。可以以一天为单位,由自学习系统不断地积累用户属性。
[0128]步骤402:为了避免质量不合格的网页短URL对计算结果的影响,对质量不合格的网页短URL进行过滤。
[0129]这里提出一个简单的算法来确定网页短URL的质量是否合格。该算法是:1)计算网页短URL的转播比,即:网页短URL转播次数/网页短URL原创次数;2)如果转播比小于预先设定的阀值,则认为该网页短URL的质量不合格。
[0130]步骤403:判断互动关系中涉及的用户的属性是否计算完毕,如果没有,则执行步骤404 ;如果计算完毕,则输出本次计算的所有用户属性的计算结果,结束本次计算。
[0131]步骤404:获取互动关系中涉及的一个用户。
[0132]步骤405:查询该用户以及该用户所收听的用户(以下简称为“该用户的收听用户”)互动的网页短URL,获取每个网页短URL的互动次数及属性。由于步骤402已经对质量不合格的网页短URL进行过滤,本步骤只涉及质量合格的网页短URL。
[0133]对于网页短URL属性的查询,有的网页短URL可能尚没有属性,则返回空即可,不影响整体计算的准确性。
[0134]步骤406:根据步骤405中查询的结果计算所述用户属性的中间结果。
[0135]具体计算方式可以包括以下步骤:
[0136]I)将每个网页短URL的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
[0137]2)将各个属性的比率值相加;
[0138]3)针对各个属性,将该属性的比率值除以步骤2)中的相加结果,得到该属性的权值;
[0139]4)取权值最大的3个属性作为该用户属性的中间结果。
[0140]例如,用户A的收听用户有2个,包括用户B和用户C ;
[0141]与用户A、B和C中至少一个用户存在互动的网页短URL包括URLl和URL2,其中,URLl的属性为:a (权值50%),b (权值30%),c (权值10%),互动次数为3次;URL2的属性为:d (权值70%),b (权值20%),a (权值5%),互动次数为2次;
[0142]根据上述查询结果,计算结果如下:
[0143]属性a 的比率值=50%*3+5%*2=1.6 ;
[0144]属性b 的比率值=30%*3+20%*2=1.3 ;
[0145]属性c的比率值=10%*3=0.3 ;
[0146]属性d的比率值=70%*2=1.4 ;
[0147]属性a 的权值=1.6/ (1.6+1.3+0.3+1.4) =35% ;
[0148]属性b 的权值=1.3/ (1.6+1.3+0.3+1.4) =28% ;
[0149]属性c 的权值=0.3/ (1.6+1.3+0.3+1.4) =7% ;
[0150]属性d 的权值=1.4/ (1.6+1.3+0.3+1.4) =30% ;
[0151]取权值最大的3个作为该用户A属性的中间结果,即:a (权值35%)、d (权值30%)、b (权值 28%)。
[0152]步骤407:采用步骤406中计算的中间结果、以及上次计算的该用户的属性,计算该用户属性的最终结果,返回执行步骤403。
[0153]例如,上次计算的用户A的属性为:a (权值20%)、c (权值30%)和d (权值40%);本次计算的用户A属性的中间结果为:a (权值35%)、d (权值30%)、b (权值28%);则可以将上次计算的属性的权值乘以固定的值(例如,0.5,该值应小于1),并将相乘的结果与本次计算的中间结果的属性权值相加,取权值最大的3个属性作为用户A属性的最终结果。就本例而言,计算结果如下:
[0154]属性a 的权值=20%*0.5+35%=45% ;
[0155]属性b的权值=28%;
[0156]属性c 的权值=30%*0.5=15% ;
[0157]属性d 的权值=40%*0.5+30%=50% ;
[0158]根据上述计算结果,取权值最大的3个属性作为用户A属性的最终结果,即:d (权值50%)、a (权值45%)和b (权值28%)。
[0159]或者,也可以直接将步骤406中计算的中间结果作为用户属性的最终结果,也就是说,如果之前已经确定过用户属性,则直接采用采用步骤406中计算的中间结果覆盖之前确定的用户属性。
[0160]上述四个实施例是以网页短URL作为确定社交网络平台中用户属性的桥梁。本发明也可以采用用户在使用时主观意愿强的其他因素代替网页短URL。所谓主观意愿强,是指用户主动、需要有记忆成本的做一件事情,那么这件事情就能在一定程度上反映用户属性。例如,用户参与一个话题的讨论,则可以认为该用户与该话题存在互动关系,将该话题作为确定社交网络平台中用户属性的桥梁;或者,用户发表、阅读或转发一个消息,则可以认为该用户与该消息存在互动关系,将该消息作为确定社交网络平台中用户属性的桥梁,等等。
[0161]本发明还提出一种确定社交网络平台中用户属性的系统,包括:
[0162]种子培育子系统,用于确定社交网络平台中种子用户的属性,将所述种子用户的属性发送至自学习子系统;
[0163]自学习子系统,用于根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;还用于根据所述社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
[0164]上述系统中,社交网络平台功能可以为:网页短URL、话题、消息、活动、投票或应用;
[0165]用户参与互动网页短URL的方式可以为:用户访问网页短URL或者发表或转播的消息中包含网页短URL。
[0166]上述系统中,种子培育子系统确定社交网络平台中种子用户属性的方式可以:
[0167]确定社交网络平台中的种子用户;
[0168]获取所述种子用户填写的用户标签;
[0169]根据所述用户标签以及预先存储的用户标签与属性的对应关系,确定该种子用户的属性;
[0170]对所述种子用户的属性进行审核及修正。
[0171]上述系统中,自学习子系统包括:
[0172]用户属性数据库,用于接收并保存种子培育子系统发送的种子用户的属性,还用于接收并保存用户属性计算模块发送的用户属性;
[0173]网页短URL属性计算模块,用于根据所述用户属性数据库中保存的用户属性,确定用户参与互动的社交网络平台功能的属性,将社交网络平台功能的属性发送至网页短URL属性数据库;
[0174]网页短URL属性数据库,用于接收并保存网页短URL属性计算模块发送的社交网络平台功能的属性;
[0175]用户属性计算模块,用于根据所述网页短URL属性数据库保存的社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性,并将用户属性发送至用户属性数据库。
[0176]上述系统中,网页短URL属性计算模块确定用户参与互动的社交网络平台功能的属性的方式可以为:
[0177]获取预先设定的时间段内用户参与互动的社交网络平台功能;
[0178]针对每个获取的社交网络平台功能分别执行以下步骤:
[0179]Al、查询与该社交网络平台功能存在互动关系的用户的属性;
[0180]B1、将所述查询结果中出现次数最多的N个属性作为该社交网络平台功能的属性的中间结果,并且将每个属性的出现次数与N个属性出现总次数的比值作为该属性的权值;其中,N为预先设定的整数;
[0181]Cl、将所述中间结果作为社交网络平台功能的属性的最终结果;或者,将之前计算的所述社交网络平台功能的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为社交网络平台功能的属性的最终结果O
[0182]用户属性计算模块确定参与互动网页短URL、话题或消息的用户的属性的方式为:
[0183]获取预先设定的时间段内参与互动社交网络平台功能的用户的属性的方式可以为:
[0184]获取预先设定的时间段内参与互动社交网络平台功能的用户;
[0185]针对每个获取的用户分别执行以下步骤:
[0186]A2、查询该用户及其收听用户互动的社交网络平台功能,获取每个社交网络平台功能的互动次数及属性;
[0187]B2、根据所述获取的结果计算所述用户属性的中间结果;
[0188]C2、将所述中间结果作为用户属性的最终结果;或者,将之前计算的所述用户
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1