一种移动用户数据处理、推送方法及相应的系统的制作方法_2

文档序号:8498717阅读:来源:国知局
定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’ =min {N,N”},N”为设定的密切联系人上限值,N”= 1,或者N”为大于I的正整数。
[0044]可选地,
[0045]所述第二数据处理模块根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
[0046]对该用户的移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
[0047]对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
[0048]将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
[0049]可选地,
[0050]所述第三数据处理模块根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
[0051]从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
[0052]确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
[0053]将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
[0054]对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
[0055]有鉴于此,本发明还提供了一种数据处理及推送系统,包括:
[0056]如上所述的移动用户数据处理系统,用于根据移动用户的通信记录和移动用户上网记录,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
[0057]信息推送系统,用于根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
[0058]上述方案将移动用户的通信记录和上网记录相结合,将对单个移动用户行为的分析扩展到对移动用户及其紧密联系人的行为分析,找到移动用户及其紧密联系人共同关注的特征信息,从而可以准确刻画移动用户所在团体如一个家庭的行为模式,进而针对该团体进行相关信息的推送,是对现有移动用户数据处理和推送方式的有效补充。
【附图说明】
[0059]图1为本发明实施例一移动用户数据处理方法的流程图;
[0060]图2为本发明实施例一移动用户数据处理系统的模块图;
[0061]图3是本发明实施例二移动用户数据处理及推送方法的流程图;
[0062]图4是本发明实施例二移动用户数据处理及推送系统的模块图。
【具体实施方式】
[0063]为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0064]实施例一
[0065]本发明的发明人经研宄发现,在现实生活中,除了存在用户的个人行为外,还大量存在着团体行为,最为常见的是,用户所在家庭的行为,例如,购房、买车等,这些行为不仅仅是与用户个人相关,而是与用户所在家庭息息相关。而在行为模式上,个人的行为模式与团体的行为模式并不一定相同,例如,家庭中可能只有爸爸经常上网查找购房信息,而妈妈可能查找得并不多,但因为这是一个家庭行为,妈妈实际上仍非常关注或者有关注的需求。如果仅从个人上网记录,并不能够得到准确的信息,进而进行有效的推送。
[0066]为此,本实施例提供了一种移动用户数据处理方法,将移动用户的通信记录和上网记录相结合,将对单个移动用户行为的分析扩展到对移动用户及其紧密联系人的行为分析,从而找到移动用户及其紧密联系人共同关注的特征信息。
[0067]本实施例以对一个移动用户的数据处理为例进行说明,如图1所示,该移动用户数据处理方法包括:
[0068]步骤110,根据移动用户的通信记录,确定所述移动用户的密切联系人;
[0069]本步骤可以包括以下步骤:
[0070]步骤一,根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
[0071]通信记录可以是通话记录、短消息记录等方式,移动用户及其联系人均可以用其使用的手机号码来标识。设定时间段如可设定为最近一年、最近一个月或最近一周等。
[0072]步骤二,根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
[0073]对于通信次数和通信时长可以分别设定一个加权系数,该加权系数可以根据需要进行调整。对于不同通信方式,如通话、短信,可以赋予相同或不同的加权系数,如通话的加权系数更高。对于同一通信方式下的呼入或呼出,也可以赋予相同或不同的加权系数。
[0074]步骤三,将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人。
[0075]其中,N’ = min{N,N”},min{N,N”}表示取N和N”中的较小值,也即N彡N”时,min{N,N,,} = N” ;N〈N”时,min{N,N” } = N。N”为设定的密切联系人上限值,N” = 1,或者N”为大于I的正整数。、当N”取I时,主要是针对家庭行为来找出相应的密切联系人。但本发明针对的团体也可以是工作团队等,N”可以有不同设置。
[0076]步骤120,对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
[0077]本步骤可以包括以下步骤:
[0078]步骤一,采集设定时间段内该用户的移动用户上网记录;
[0079]移动用户上网记录的采集如可以是:在各省分的GGSN分光并将采集到的数据进行协议分析,分析出移动用户上网记录url,mobile, ip,等信息,将这些数据发送到数据中心集中存储,再通过入库软件将这些数据集中入到Hbase数据库中,将移动用户的上网记录按照mobile号进行导出。但本发明不局限于此。
[0080]步骤二,对所述移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
[0081]本步骤中,可以用“爬虫”分析每个url对应的网页内容,得到其对应的网页内容字符串content,再对content进行分词,提取出网页中的关键词。但本发明不局限于此,也可以使用任何网页文本分类算法提取关键词。
[0082]关键词对于该网页内容的第一权重可以使用TF-1DF算法计算。TF-1DF(termfrequency -1nverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术,用于评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1