一种确定社交网络平台中用户属性的方法和系统的制作方法_2

文档序号:8380939阅读:来源:国知局
功能作为确定用户属性的桥梁,从而准确确定用户的属性。
【附图说明】
[0070]图1为本发明实施例一的结构示意图;
[0071]图2为本发明实施例二所使用的存储系统示意图;
[0072]图3为本发明实施例三的实现流程图;
[0073]图4为本发明实施例四的实现流程图。
【具体实施方式】
[0074]本发明提出一种确定社交网络平台中用户属性的方法,包括:
[0075]确定社交网络平台中种子用户的属性;
[0076]根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;
[0077]根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
[0078]以下结合附图,举具体的实施例详细介绍。
[0079]在以下的实施例中,以网页短URL作为计算用户属性的桥梁为例进行介绍。本发明也可以采用用户使用时主观意愿强的其他社交网络平台功能代替该桥梁,例如话题、消息、活动、投票或应用等。
[0080]首先需要说明的是,以下实施例中所述的用户与网页短URL互动是指:用户发表包含网页短URL的消息、用户转发包含网页短URL的消息、或者用户点击网页短URL等。用户进行这些互动的主观意愿强,因此网页短URL的属性在一定程度上能够反映出与其存在互动的用户的属性,反之亦然。
[0081]除上述互动方式外,其他能够体现用户主观意愿的方式也可以作为互动方式,本发明对此不作限制。
[0082]实施例一:
[0083]在本实施例中,整个用户属性计算模型分为两部分,如图1所示。图1左侧部分是用户属性自学习子系统,自学习子系统负责根据用户与网页短URL的互动,不断学习计算网页短URL的属性,以及用户属性;右侧部分为种子培育子系统,该系统确定一批初始的种子用户,并确定种子用户的属性,将种子用户的属性作为左侧自学习子系统的学习特征。
[0084]下面分别介绍上述两部分:
[0085]第一部分:种子培育子系统,包括种子用户属性计算模块。
[0086]首先确定种子用户。
[0087]然后,根据种子用户输入的用户标签、以及预先保存的用户标签与用户属性的对应关系确定种子用户的属性。例如,种子用户输入的用户标签为“互联网”时,确定该种子用户的属性为“科技”;种子用户输入的用户标签为“云技术”时,确定该种子用户的属性也为“科技”;从而保证确定的用户属性统一且不产生冲突。
[0088]最后,进行必要的人工审核及修正,以保证种子用户的属性尽可能准确。
[0089]第二部分:自学习子系统,包括用户属性数据库、用户属性计算模块、网页短URL属性数据库和网页短URL属性计算模块。
[0090]其中,用户属性数据库首先获取种子培育系统计算出的种子用户的属性;网页短URL属性计算模块根据用户与网页短URL的互动关系、以及用户属性数据库中保存的用户属性,计算网页短URL的属性,将计算结果发送至网页短URL属性数据库;用户属性计算模块根据用户与网页短URL的互动关系、以及网页短URL属性数据库中保存的网页短URL的属性,计算用户的属性,将计算结果发送至用户属性数据库。用户属性计算模块和网页短URL属性计算模块周期性地进行计算,从而计算出社交网络平台中用户的属性。
[0091]自学习子系统,由两步计算流程组成:
[0092]I)网页短URL属性计算,是根据互动该网页短URL的用户属性,汇总取最大值计算得出。例如:网页短URL被A,B, C三个用户互动,A用户的属性是a和b,B用户的属性是b和c,C用户的属性是a、b及C,那么该短URL的用户属性是b。
[0093]2)用户属性计算,可以根据该用户互动的网页短URL的属性确定,也可以根据该用户互动的网页短URL的属性以及该用户的收听好友所互动的网页短URL的属性共同确定。例如:A用户互动的网页短URL的属性为b,A的收听好友互动的网页短URL的属性中,c和b出现次数最多,那么确定A用户的用户属性为b。
[0094]上面计算模型中,网页短URL的属性和用户属性两者相互佐证双方数据的准确性,从而使属性数据随着用户基于网页短URL的互动进行动态调整。
[0095]实施例二:
[0096]本实施例介绍确定种子用户属性的一种方式。如图2为本实施例所使用的存储系统示意图。本实施例包括以下步骤:
[0097]步骤201:确定种子用户,将种子用户的ID保存在种子用户数据库中。这里的种子用户为资料填写最完整的高质量用户,本实施例中,取资料填写完整的VIP用户作为种子用户。
[0098]步骤202:使用种子用户ID查询用户资料数据库,获取种子用户填写的用户标签。
[0099]步骤203:根据用户标签查询模糊匹配数据库,获取用户标签所对应的用户属性,将种子用户的属性保存在种子用户结果数据库中。
[0100]模糊匹配数据库预先存储了用户标签与用户属性的对应关系,该步骤可以避免用户填写的用户标签不标准。例如,用户填写的用户标签为“美剧”,根据预先存储的“美剧”与“电影爱好者”的对应关系,可以确定该用户的属性为“电影爱好者”。
[0101]模糊匹配数据库中保存的对应关系可以周期性地进行计算,根据计算结果做必要的修订及扩充。
[0102]步骤204:对种子用户结果数据库中的数据进行人工审核及修正。
[0103]为降低人工审核的工作量,在选择种子用户时,应尽量筛选资料填写可信的用户。
[0104]种子培育系统确定出的种子用户属性是标准的、可以信赖的用户属性;且要求培育出来的种子用户必须足够的活跃,以有足够的社交数据参与自学习系统的计算。
[0105]实施例三:
[0106]本实施例介绍计算网页短URL的属性的一种方式,如图3为本实施例的实现流程图,包括如下步骤:
[0107]步骤301:搜集用户与网页短URL的互动流水数据,确定用户与网页短URL的互动关系。
[0108]这里可以以一天为时间切片,搜集流水数据。如每天搜集前一天的互动流水数据;这样的计算每天例行一次,不需要每次都计算所有的流水数据。
[0109]步骤302:互动关系去重。具体方式为:如果一个用户与某网页短URL存在多次互动,则仅保留该用户与该网页短URL的一次互动关系。本步骤是为了避免某些用户疯狂转发网页短URL,造成网页短URL属性计算不准确。
[0110]步骤303:判断互动关系中涉及的网页短URL的属性是否计算完毕,如果没有,则执行步骤304 ;如果计算完毕,则输出本次计算的所有网页短URL属性的计算结果,结束本次计算。
[0111]步骤304:获取互动关系中涉及的一个网页短URL。
[0112]步骤305:查询与该网页短URL存在互动关系的所有用户的属性。对于用户属性的查询,有的用户可能尚没有用户属性,则返回空即可,不影响整体计算的准确性。
[0113]步骤306:根据步骤305中查询的结果,计算该网页短URL属性的中间结果。
[0114]可以取查询结果中出现次数最多的3个(个数可任意规定,本发明不作限制)属性作为该网页短URL属性的中间结果,并将属性出现次数与3个属性出现总次数的比值作为该属性的权值。例如,本次查询结果中,与某网页短URL存在互动关系的用户中,用户属性出现次数最多的属性为a、b、c ;其中,a出现的次数为50次,b出现的次数为40次,c出现的次数为10次;则该网页短URL属性的中间结果为:a (权值50%)、b (权值40%)和c (权值 10%)。
[0115]步骤307:采用步骤306中计算的中间结果、以及上次计算的该网页短URL的属性,计算网页短URL属性的最终结果。
[0116]例如,上次计算的该网页短URL的属性为:a (权值30%)、b (权值60%)和d (权值10%);本次计算的该网页短URL属性的中间结果为:a (权值50%)、b (权值40%)和c (权值10%);则可以将上次计算的属性的权值乘以固定的值(例如,0.5,该值应小于1),并将相乘的结果与本次计算的中间结果的属性权值相加,取权值最大的3个属性作为该网页短URL属性的最终结果。就本例而言,计算结果如下:
[0117]属性a 的权值=30%*0.5+50%=65% ;
[0118]属性b 的权值=60%*0.5+40%=70% ;
[0119]属性c的权值=10%;
[0120]属性d 的权值=10%*0.5=5%;
[0121]根据上述计算结果,取权值最大的3个属性作为该网页短URL属性的最终结果,即:b (权值70%)、a (权值65%)和c (权值10%)。
[0122]或者,也可以直接将步骤306中计算的中间结果作为网页短URL属性的最终结果,也就是说,如果之前已经确定过网页短URL的属性,则直接采用步骤306中计算的中间结果覆盖之前确定的网页短URL属性。
[0123]该网页短URL属性的最终结果计算完成之后,返
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1