一种移动用户数据处理、推送方法及相应的系统的制作方法_3

文档序号:8498717阅读:来源:国知局
下降。
[0083]这里提取出的关键词可以是网页中直接存在的词,也可以是对网页中存在的词进行聚类后得到的关键词,如,将别克、君威、桑塔纳等聚类为汽车,将都市芳园、二手房、样板房等归类为房产。
[0084]步骤三,对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
[0085]例如,如果获取的所有网页的数目为100,而某一关键词在5个网页中出现,在各网页中的第一权重分别为0.14,0.3,0.21,0.32,0.08,则代表该关键词被关注度的第二权重可以按下式计算:(0.14+0.3+0.21+0.32+0.08) X 5/100 = 0.0525。
[0086]步骤四,将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
[0087]本步骤中,在该用户对应的特征信息集可以将获取的所有关键词按照第二权重从大到小的顺序排序,并记录各关键词的第二权重信息。
[0088]步骤130,根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。
[0089]本步骤可以包括以下步骤:
[0090]步骤一,从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
[0091 ] 步骤二,确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
[0092]方式一,将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
[0093]方式二,对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息;
[0094]其中,M为正整数。
[0095]上述方式一中,特别将团体行为所特定的一些关键词,如注的房产、汽车、教育、育儿等,作为家庭这一团体的行为类别的关键词。
[0096]上述方式二中,加权计算如可以是加权平均,加权累加等,由于同时考虑了该关键词对应于团体中每一用户的第二权重,因而可以避免该关键词对于单个用户的第二权重较小而不被视为该用户关注的关键词,作为一个团体的成员,对团体行为模式的分析也有助于深入挖掘单个用户的关注点及其实际存在的需求。
[0097]相应地,本实施例还提供了一种移动用户数据处理系统,如图2所示,包括:
[0098]通信记录采集模块10,用于采集设定时间段内移动用户的通信记录;
[0099]第一数据处理模块20,用于根据所述移动用户的通信记录,确定所述移动用户的密切联系人;
[0100]上网记录采集模块30,用于采集设定时间段内所述移动用户及其密切联系人的移动用户上网记录;这里,上网记录采集模块30并不需要事先知道移动用户的密切联系人,如果没有采集到密切联系人的上网记录,则将所述密切联系人的上网记录视为空。
[0101]第二数据处理模块40,用于对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
[0102]第三数据处理模块50,用于根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。
[0103]上述模块在实体上,可以包括一个或多个执行相应功能的装置/设备。
[0104]可选地,
[0105]所述第一数据处理模块20根据移动用户的通信记录,确定所述移动用户的密切联系人,包括:
[0106]根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
[0107]根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
[0108]将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’ =min {N,N”},N”为设定的密切联系人上限值,N”= 1,或者N”为大于I的正整数。
[0109]可选地,
[0110]所述第二数据处理模块40根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
[0111]对该用户的移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
[0112]对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
[0113]将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
[0114]可选地,
[0115]所述第三数据处理模块50根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
[0116]从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
[0117]确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
[0118]将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
[0119]对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
[0120]实施例二
[0121]本实施例的数据处理及推送方法如图3所示,包括:
[0122]步骤210,采用实施例一步骤110至130所述的移动用户数据处理,确定移动用户及其密切联系人共同关注的特征信息并保存;
[0123]步骤220,根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
[0124]相应地,如图4所示,本实施例的数据处理及推送系统包括:
[0125]移动用户数据处理系统80,采用实施例一中的移动用户数据处理系统,用于根据移动用户的通信记录和移动用户上网记录,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
[0126]信息推送系统90,用于根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
[0127]上述信息的推送可以是个性化页面的推送,此时,可以在所述移动用户或密切联系人访问网站时,将找到的资源的信息和其访问的网页内容一起反馈给用户;也可以是将找到的资源的信息通过短信、彩信等方式推送给用户。等等。举例来说,如果共同关注的关键词为“二手房”,可以向所述移动用户及其密切联系人推送房产信息或相关的售房信息的软件;如果关键词为“小时工”,可以向所述移动用户及其密切联系人推送提供室内清洁工作的单位的联系方式或者提供相应的网址链接等。
[0128]上述实施例中的各模块/功能模块/功能
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1