移动互联网内容的用户偏好推送方法与装置制造方法

文档序号:6487052阅读:183来源:国知局
移动互联网内容的用户偏好推送方法与装置制造方法
【专利摘要】本发明提供一种移动互联网内容的用户偏好推送方法与装置,用于根据用户的访问获取用户的互联网内容偏好信息,同时根据该偏好信息向用户进行有针对性的内容推送。该移动互联网内容的用户偏好推送方法包括:基于用户的访问行为获取所述用户访问的第一信息;对所述第一信息所涉及的网络内容进行分类处理,得到第二信息;针对所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息,根据所述偏好信息向相应的用户推送与所述偏好信息相对应的网络内容。采用本发明的技术方案,通过网络获取用户的偏好信息,并根据该偏好信息可以定位出潜在客户,提高了网络业务推广的效率。
【专利说明】移动互联网内容的用户偏好推送方法与装置
【技术领域】
[0001]本发明涉及移动互联网领域,更具体的,涉及一种移动互联网内容的用户偏好推送方法与装置。
【背景技术】
[0002]传统的电信系统以语音为主,基本不考虑阅读内容形式的处理,因此无法支撑互联网内容偏好的分析;而现有的内容分析技术以文本处理技术为主,需要深入到信息主体进行关键字匹配等文本识别处理,才能分析出用户的具体内容偏好。这种方案对于运营商上亿级用户量,无论是开发还是维护,都需要投入大量的资源。
[0003]根据当前互联网内容分析相关的学术论文和项目建设调研,总结现有的系统或方案,主要存在以下几个缺点:
[0004]首先是技术较为复杂,开发难度高。传统的方案是需要利用爬虫技术抓取一定量的文本内容,然后利用关键字匹配技术对文本进行分类。对于爬虫技术和文本分类技术,虽然在学术界已经是一个热门课题,但其技术大部分基于理论,对于移动互联网业务应用,其实际的开发难度较高、开发周期较长。
[0005]其次是资源要求较高,推广成本高。根据某省份的项目建设经验,为了实现全省的互联网内容分析,需要配置4台爬虫服务集群服务器,4台分析服务集群服务器,6台搜索服务器集群,还有至少28T的存储空间,而且这些服务器还和其现有的运营平台有直接的依赖,其推广成本很高,加上技术复杂,其推广可行性变得更低。
[0006]然后是分析层面单一,偏好识别的可信度和健壮性较低。由于互联网内容提供商经常会通过采用内容捆绑、弹出页面、自动跳转等各种手段来达到增加访问流量的目的,因此各种日志信息中包含了大量的噪声,用户阅读的内容中也会包含很多非用户真实偏好的具体内容。现有的分析主要建立在用户手机上网的阅读的网页内容上,其分析得到的用户内容偏好是包含噪声的内容偏好,其可信任程度较低。另外,网页分类精确度容易受到网页形式变化(如分类名称关键字的修改)的影响,而且其内容偏好标签的含义随着内容形式也会对应变化,现有技术依赖关键字识别等技术来对内容进行分类,分析出来的偏好相对狭义,其健壮性较低。实际上,更健壮的内容偏好应该是建立在多个不同性质,甚至是不同粒度的业务内容的分析之上的。
[0007]最后是应用范围较窄,业务拓展的实时效率较低。即使平台分析出的用户偏好是非常精确的,但对于不同性质或不同粒度的业务(如拓展到其他如手机游戏、全曲音乐等的内容业务时),甚至是同一业务增加新的内容分类时(如手机上网增加新网站或新内容分类时),现有技术需要积累一定量的用户之后,才能利用这些内容偏好标签分析存量用户的行为特征,进而开发专门的潜在用户挖掘模型,一方面应用范围较窄,而另一方面,对于内容发展如此迅速的互联网时代,现有技术的实时效率较低。在应用层面,更好的内容偏好分析系统设计,应该是能充分考虑并解决新增业务或内容时潜在用户的拓展问题。
[0008]根据上述分析,可以发现,现有技术中存在互联网内容用户的偏好信息获取及推送存在困难的问题。

【发明内容】

[0009]本发明提供一种移动互联网内容的用户偏好推送方法与装置,用于解决现有技术中存在互联网内容用户的偏好信息获取及推送存在困难的问题。
[0010]为实现上述目的,根据本发明的第一个方面,提供一种移动互联网内容的用户偏好推送方法,并采用以下技术方案:
[0011]移动互联网内容的用户偏好推送方法包括:基于用户的访问行为获取所述用户访问的第一信息;对所述第一信息中所述用户所涉及的网络内容进行分类处理,得到第二信息;根据所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息;根据所述偏好信息向相应的用户推送与所述偏好信息相对应的网络内容。
[0012]进一步地,所述基于用户的访问行为获取所述用户访问的第一信息包括:根据所述用户的访问行为从移动互联网的服务器中得到所述用户访问的基础数据;根据所述基础数据获取所述用户访问的业务内容,并根据所述基础数据的增加,对所述业务内容进行扩展,生成所述第一信息。
[0013]进一步地,所述对所述第一信息中用户所所涉及的网络内容进行分类处理包括:基于用户的访问行为获取所述用户访问的第一信息;判断所述第一信息中每一业务内容是否具有预设的第一分类规则,并得一判断结果;对所述判断结果为具有所述第一分类规则的业务内容,按照所述第一分类规则对所述业务内容进行分类;对所述判断结果为不具有所述第一分类规则的业务内容,按照第二分类规则对所述业务内容进行分类;根据所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息。
[0014]进一步地,所述第二分类规则为临时构建的分类规则,且所述构建的方法参照所述第一分类规则的构建方法。
[0015]进一步地,所述第一分类规则的构建方法采用URL匹配法或文本匹配法,并且对所述业务内容分类后所产生的网络内容的分类粒度控制在预定级别以内。
[0016]进一步地,所述根据所述第二信息对所述用户的偏好进行评分包括:获取所述第二信息所对应的用户的访问数据;按照预设的分类标准对所述访问数据进行分类处理,并得一处理结果;根据所述处理结果对所述网络内容进行用户偏好评分。
[0017]进一步地,所述按照预设的分类标准对所述访问数据进行分类处理包括:将所述访问数据按照频度、粘度以及额度三个维度进行分类;其中,所述频度是指用户投入的时间,所述粘度是指用户用去的流量,所述额度是指用户投入的费用。
[0018]进一步地,所述根据所述处理结果对所述网络内容进行用户偏好评分包括:计算所述三个维度的每一维度变量的权重系数;根据所述变量的权重系数得到所述每一维度的综合评分公式;计算所述三个维度的每一维度的权重系数;根据所述权重系数以及所述综合评分公式对所述第二信息所涉及的每一个网络内容进行评分。
[0019]进一步地,移动互联网内容的用户偏好推送方法还包括:根据关联算法对所述偏好信息进行关联计算,获取所述用户对同一网络业务的网络内容的关联偏好信息或不同网络业务的网络内容的关联偏好信息。
[0020]进一步地,所述根据关联算法对所述偏好信息进行关联计算,获取所述用户对同一网络业务的网络内容的关联偏好信息包括:根据所述偏好信息构建所述同一网络业务的网络内容的关联网络;计算所述关联网络的每一边的偏好关联强度;根据预设的检测标准对所述偏好关联强度进行检测,获取可信任度高的关联偏好信息。
[0021]进一步地,所述计算所述关联网络的每一边的偏好关联强度的计算方法为:通过公式:
[0022]
【权利要求】
1.一种移动互联网内容的用户偏好推送方法,其特征在于,包括: 基于用户的访问行为获取所述用户访问的第一信息; 对所述第一信息中所述用户所涉及的网络内容进行分类处理,得到第二信息; 根据所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息; 根据所述偏好信息向所述用户推送与所述偏好信息相对应的网络内容。
2.如权利要求1所述的用户偏好推送方法,其特征在于,所述基于用户的访问行为获取所述用户访问的第一信息包括: 根据所述用户的访问行为从移动互联网的服务器中得到所述用户访问的基础数据;根据所述基础数据获取所述用户访问的业务内容,并根据所述基础数据的增加,对所述业务内容进行扩展,生成所述第一信息。
3.如权利要求1所述的用户偏好推送方法,其特征在于,所述对所述第一信息中用户所所涉及的网络内容进行分类处理包括: 基于用户的访问行为获取所述用户访问的第一信息; 判断所述第一信息中每一业务内容是否具有预设的第一分类规则,并得一判断结果;对所述判断结果为具有所述第一分类规则的业务内容,按照所述第一分类规则对所述业务内容进行分类; 对所述判断结果为不具有所述第一分类规则的业务内容,按照第二分类规则对所述业务内容进行分类; 根据所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息。
4.如权利要求3所述的用户偏好推送方法,其特征在于,所述第二分类规则为临时构建的分类规则,且所述构建的方法参照所述第一分类规则的构建方法。
5.如权利要求4所述的用户偏好推送方法,其特征在于,所述第一分类规则的构建方法采用URL匹配法或文本匹配法,并且对所述业务内容分类后所产生的网络内容的分类粒度控制在预定级别以内。
6.如权利要求5所述的用户偏好推送方法,其特征在于,所述根据所述第二信息对所述用户的偏好进行评分包括: 获取所述第二信息所对应的用户的访问数据; 按照预设的分类标准对所述访问数据进行分类处理,并得一处理结果; 根据所述处理结果对所述网络内容进行用户偏好评分。
7.如权利要求6所述的用户偏好推送方法,其特征在于,所述按照预设的分类标准对所述访问数据进行分类处理包括: 将所述访问数据按照频度、粘度以及额度三个维度进行分类; 其中,所述频度是指用户投入的时间,所述粘度是指用户用去的流量,所述额度是指用户投入的费用。
8.如权利要求1所述的用户偏好推送方法,其特征在于,所述根据所述处理结果对所述网络内容进行用户偏好评分包括: 计算所述三个维度的每一维度变量的权重系数; 根据所述变量的权重系数得到所述每一维度的综合评分公式; 计算所述三个维度的每一维度的权重系数;根据所述权重系数以及所述综合评分公式对所述第二信息所涉及的每一个网络内容进行评分。
9.如权利要求8所述的用户偏好推送方法,其特征在于,还包括: 根据关联算法对所述偏好信息进行关联计算,获取所述用户对同一网络业务的网络内容的关联偏好信息或不同网络业务的网络内容的关联偏好信息。
10.如权利要求9所述的用户偏好推送方法,其特征在于,所述根据关联算法对所述偏好信息进行关联计算,获取所述用户对同一网络业务的网络内容的关联偏好信息包括: 根据所述偏好信息构建所述同一网络业务的网络内容的关联网络; 计算所述关联网络的每一边的偏好关联强度; 根据预设的检测标准对所述偏好关联强度进行检测,获取可信任度高的关联偏好信肩、O
11.如权利要求10所述的用户偏好推送方法,其特征在于,所述计算所述关联网络的每一边的偏好关联强度的计算方法为: 通过公式:
12.如权利要求10所述的用户偏好推送方法,其特征在于,所述根据预设的检测标准对所述偏好关联强度进行检测,获取可信任度高的关联偏好信息包括: 将所述偏好关联强度带入不等式公式
13.如权利要求9所述的用户偏好推送方法,其特征在于,所述根据关联算法对所述偏好信息进行关联计算,获取所述用户对不同网络业务的网络内容的关联偏好信息包括: 根据所述偏好信息构建所述不同网络业务的网络内容的关联网络; 计算所述关联网络的每一边的偏好关联强度; 根据预设的检测标准对所述偏好关联强度进行检测,获取可信任度高的关联偏好信肩、O
14.如权利要求13所述的用户偏好推送方法,其特征在于,在所述不同网络业务中存在一新网络业务时,所述获取所述用户对不同网络业务的网络内容的关联偏好信息包括: 对所述新网络业务的网络内容进行分类; 根据预设虚关联标准为任一分类网络内容虚关联一已有网络业务内容;计算所述分类网络内容与任一已有网络业务的网络内容的关联强度。
15.如权利要求14所述的用户偏好推送方法,其特征在于,所述计算所述分类网络内容与任一已有网络业务的网络内容的关联强度包括: 通过公式WBYik = WXYjk^ffBXij计算所述新网络业务的任一分类网络内容与所述已有网络业务的网络内容的关联强度; 其中,任一分类网络内容为Bi,已有网络业务的网络内容为Xj,WBXij通过初始化方式获取,Yk为任一分类网络内容与所述已有网络业务的网络内容的偏好。
16.一种移动互联网内容的用户偏好推送装置,其特征在于,包括: 获取模块,用于基于用户的访问行为从移动互联网的服务器中获取所述用户访问的第一信息; 分类模块,用于对所述第一信息中所述用户所涉及的网络内容进行分类处理,得到第二信息; 评分模块,用于针对所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息; 推送模块,用于根据所述偏好信息向相应的用户推送与所述偏好信息相对应的网络内容。
17.如权利要求16所`述的用户偏好推送装置,其特征在于,所述获取模块还用于:根据所述用户的访问行为从所述服务器中得到所述用户访问的基础数据;根据所述基础数据获取所述用户访问的业务内容,并根据所述基础数据的增加,对所述业务内容进行扩展,生成所述第一信息。
18.如权利要求16所述的用户偏好推送装置,其特征在于,所述分类模块包括: 判断模块,用于判断所述第一信息中每一业务内容是否具有预设的第一分类规则,并得一判断结果; 第一分类模块,用于对所述判断结果为具有所述第一分类规则的业务内容,按照所述第一分类规则对所述业务内容进行分类; 第二分类模块,用于对所述判断结果为不具有所述第一分类规则的业务内容,按照第二分类规则对所述业务内容进行分类。
19.如权利要求18所述的用户偏好推送装置,其特征在于,还包括: 第一构建模块,用于临时构建所述第二分类规则,且所述构建的方法参照所述第一分类规则的构建方法。
20.如权利要求19所述的用户偏好推送装置,其特征在于,所述评分模块还用于: 获取所述第二信息所对应的用户的访问数据; 按照预设的分类标准对所述访问数据进行分类处理,并得一处理结果; 根据所述处理结果对所述网络内容进行用户偏好评分。
21.如权利要求20所述的用户偏好推送装置,其特征在于,所述评分模块用于 计算所述三个维度的每一维度变量的权重系数; 根据所述变量的权重系数得到所述每一维度的综合评分公式; 计算所述三个维度的每一维度的权重系数; 根据所述权重系数以及所述综合评分公式对所述第二信息所涉及的每一个网络内容进行评分。
22.如权利要求21所述的用户偏好推送装置,其特征在于,还包括: 关联模块,用于根据关联算法对所述偏好信息进行关联计算,获取所述用户对同一网络业务的网络内容的关联偏好信息或不同网络业务的网络内容的关联偏好信息。
23.如权利要求22所述的用户偏好推送装置,其特征在于,所述关联模块包括: 第二构建模块,用于根据所述偏好信息构建所述同一网络业务的网络内容的关联网络; 计算模块,用于计算所述关联网络的每一边的偏好关联强度; 检测模块,用于根据预设的检测标准对所述偏好关联强度进行检测,获取可信任度高的关联偏好息。
24.如权利要求22所述的用户偏好推送装置,其特征在于,所述计算模块还用于:通过公式:
25.如权利要求22所述的用户偏好推送装置,其特征在于,所述检测模块还用于: 将所述偏好关联强度带入不等式公式
26.如权利要求22所述的用户偏好推送装置,其特征在于,所述关联模块还用于: 根据所述偏好信息构建所述不同网络业务的网络内容的关联网络; 计算所述关联网络的每一边的偏好关联强度; 根据预设的检测标准对所述偏好关联强度进行检测,获取可信任度高的关联偏好信肩、O
27.如权利要求26所述的用户偏好推送装置,其特征在于,在所述不同网络业务中存在一新网络业务时,所述关联模块还用于: 对所述新网络业务的网络内容进行分类; 根据预设虚关联标准为任一分类网络内容虚关联一已有网络业务内容; 计算所述分类网络内容与任一已有网络业务的网络内容的关联强度。
28.如权利要求27所述的用户偏好推送装置,其特征在于,所述关联模块还用于: 通过公式WBYik = WXYjk^ffBXij计算所述新网络业务的任一分类网络内容与所述已有网络业务的网络内容的关联强度; 其中,任一分类网络内容为Bi,已有网络业务的网络内容为Xj,WBXij通过初始化方式获取,Yk为任一分类网络内`容与所述已有网络业务的网络内容的偏好。
【文档编号】G06F17/30GK103544188SQ201210248221
【公开日】2014年1月29日 申请日期:2012年7月17日 优先权日:2012年7月17日
【发明者】张湛梅, 叶始新, 罗芸, 陈东明, 屈强 申请人:中国移动通信集团广东有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1