一种互联网内容推荐方法及装置的制作方法

文档序号:6422877阅读:94来源:国知局
专利名称:一种互联网内容推荐方法及装置的制作方法
技术领域
本发明涉及互联网的数据挖掘技术,特别涉及一种互联网内容推荐方法及装置。
背景技术
现有的互联网内容推荐模式大部分是基于“为业务寻找合适的目标客户”这一出发点,通常是利用关联分析、决策树、神经网络及逻辑回归等数据挖掘算法工具,发现具体业务的目标潜在客户,然后采取短信、彩信或广告等形式向客户推荐业务,以达到精确营销的战略目标。这种推荐模式的结果往往有两个极端一方面,为某些客户推荐了过多的业务,对客户的接触过于频繁,由于相同的客户被多次接触,客户容易产生反感的情绪,其营销效果可能是适得其反;另一方面,对于有些客户,则从来未尝给他推荐业务。互联网领域应用广泛的协同过滤技术从客户的角度出发,能够解决上述推荐模式的问题。其原理是根据客户当前使用业务的情况,推算其对未使用业务的偏好程度,从而可 以得到客户使用业务的可能性评分值,最后根据评分值的排序可以得出一个业务推荐优先级的列表。互联网推荐技术中运用最成熟、最有效的两种协同过滤算法是基于用户(User-Based)算法和基于项目(Item-Base)算法,其中User-based协同过滤技术是根据评分相似的最近邻居的评分数据向目标客户产生推荐,而Item-based协同过滤技术依赖于项目的相似度来决定是否推荐。发明人在实现本发明的过程中,发现现有技术至少存在如下缺点无论是User-based算法还是Item-based算法,都是基于客户之间或者业务之间的相似性原理,但并没有考虑客户之间的互相影响作用,这导致了对业务的推荐效率不高。

发明内容
本发明的目的是提供一种互联网内容推荐方法及装置,实现面向群体的互联网内容的推荐,从而提高推荐效率。为实现上述目的,本发明提供技术方案如下一种互联网内容推荐方法,包括根据客户之间的通信紧密性和/或偏好相似性,从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体;计算所述局部群体对各种互联网内容类型的渗透速度;计算每一对互联网内容类型的相似度;根据所述渗透速度和所述相似度计算所述局部群体所涉及到的互联网内容类型的评分值,所述评分值用于表征客户访问相应互联网内容类型的倾向大小;根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型。一种互联网内容推荐装置,包括局部群体抽取模块,用于根据客户之间的通信紧密性和/或偏好相似性,从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体;渗透速度计算模块,用于计算所述局部群体对各种互联网内容类型的渗透速度;相似度计算模块,用于计算每一对互联网内容类型的相似度;评分值计算模块,用于根据所述渗透速度和所述相似度计算所述局部群体所涉及到的互联网内容类型的评分值,所述评分值用于表征客户访问相应互联网内容类型的倾向大小;推荐模块,用于根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型。 与现有技术相比,本发明的有益效果是对比于现有的关联规则、协同过滤等推荐技术,本发明的技术方案面向的是紧密·联系的、有互相影响作用的群体,具有病毒营销的效应作用,能够显著提高互联网内容的推荐效率。


图I为本发明实施例的互联网内容推荐方法流程图;图2为图I所示的方法中步骤101的具体流程图;图3为本发明实施例中局部群体的抽取示意图;图4为本发明实施例的互联网内容推荐装置结构图。
具体实施例方式无论是User-based算法还是Item-based算法,都是基于客户之间或者业务之间的相似性原理,但并没有考虑客户之间的互相影响作用,这导致了对业务的推荐效率不高。实际上,利用客户之间的影响力,推动客户之间互相推荐是提高业务渗透的一个高效手段;另外一方面,这两种技术大部分应用都只针对个人进行推荐,但所谓人以群分,面向紧密联系的群体同时进行同一互联网内容的推荐也是一个很值得推广的方案。基于此,本发明设计出一种面向群体而非个人的互联网内容推荐技术,并将其融合到一个系统,实现互联网内容的智能适配。本技术方案可命名为基于群体(Group-Base)算法,其思想是在适配时,是同时推向彼此之间有联系、有影响作用的群体。为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。参照图1,本发明实施例的互联网内容推荐方法,包括如下步骤步骤101 :根据客户之间的通信紧密性和/或偏好相似性,从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体;步骤102 :计算所述局部群体对各种互联网内容类型的渗透速度;步骤103 :计算每一对互联网内容类型的相似度;步骤104 :根据所述渗透速度和所述相似度计算所述局部群体所涉及到的互联网内容类型的评分值,所述评分值用于表征客户访问相应互联网内容类型的倾向大小;步骤105 :根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型。
步骤101的目的是从第一客户与其交往圈所构成的第一群体中抽取一个局部群体,使得所述局部群体中的客户之间具有相互影响力,具体是根据客户之间的通信紧密性和/或偏好相似性进行抽取。本发明实施例提供如下七种抽取方式。方式一从所述第一群体中剔除满足第一预设条件的第二客户,得到所述局部群体,所述第一预设条件为所述第二客户与所述第一客户之间的通信次数低于第一阈值。方式二从所述第一群体中剔除满足第二预设条件的第二客户,得到所述局部群体,所述第二预设条件为所述第二客户访问的互联网内容类型的集合与所述第一客户访问的互联网内容类型的集合之间不存在交集。方式三计算所述第一群体的通信紧密度;当所述通信紧密度小于或等于第二阈值时,对于所述第一群体中的每个客户,统计与其有通信联系的客户的第一数目;从所述第一群体中剔除第一数目最小的客户,得到更新后的第一群体;对更新后的第一群体反复执行上述过程,直到所述通信紧密度大于第二阈值,或者,更新后的第一群体中的客户数目小于或等于第三阈值时,得到所述局部群体;其中,采用如下公式计算通信紧密度TIGHTNESS
权利要求
1.一种互联网内容推荐方法,其特征在于,包括 根据客户之间的通信紧密性和/或偏好相似性,从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体; 计算所述局部群体对各种互联网内容类型的渗透速度; 计算每一对互联网内容类型的相似度; 根据所述渗透速度和所述相似度计算所述局部群体所涉及到的互联网内容类型的评分值,所述评分值用于表征客户访问相应互联网内容类型的倾向大小; 根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型。
2.如权利要求I所述的互联网内容推荐方法,其特征在于,所述从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体,具体包括 从所述第一群体中剔除满足预设条件的第二客户,得到所述局部群体; 所述预设条件为 所述第二客户与所述第一客户之间的通信次数低于第一阈值;和/或所述第二客户访问的互联网内容类型的集合与所述第一客户访问的互联网内容类型的集合之间不存在交集。
3.如权利要求I所述的互联网内容推荐方法,其特征在于,所述从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体,具体包括 计算所述第一群体的通信紧密度; 当所述通信紧密度小于或等于第二阈值时,对于所述第一群体中的每个客户,统计与其有通信联系的客户的第一数目; 从所述第一群体中剔除第一数目最小的客户,得到更新后的第一群体; 对更新后的第一群体反复执行上述过程,直到所述通信紧密度大于第二阈值,或者,更新后的第一群体中的客户数目小于或等于第三阈值时,得到所述局部群体; 其中,采用如下公式计算通信紧密度TIGHTNESS
4.如权利要求I所述的互联网内容推荐方法,其特征在于,所述从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体,具体包括 从所述第一群体中剔除满足预设条件的第二客户,得到第二群体; 所述预设条件为 所述第二客户与所述第一客户之间的通信次数低于第一阈值;和/或所述第二客户访问的互联网内容类型的集合与所述第一客户访问的互联网内容类型的集合之间不存在交集; 计算所述第二群体的通信紧密度; 当所述通信紧密度小于或等于第二阈值时,对于所述第二群体中的每个客户,统计与其有通信联系的客户的第一数目; 从所述第二群体中剔除第一数目最小的客户,得到更新后的第二群体;对更新后的第二群体反复执行上述过程,直到所述通信紧密度大于第二阈值,或者,更新后的第二群体中的客户数目小于或等于第三阈值时,得到所述局部群体; 其中,采用如下公式计算通信紧密度TIGHTNESS
5.如权利要求I所述的互联网内容推荐方法,其特征在于,按照如下公式计算所述局部群体对各种互联网内容类型的渗透速度
6.如权利要求I所述的互联网内容推荐方法,其特征在于,所述计算所述局部群体对各种互联网内容类型的渗透速度,具体包括 计算所述局部群体中访问第一互联网内容类型的客户数占比,将所述客户数占比作为所述局部群体对所述第一互联网内容类型的渗透速度。
7.如权利要求I所述的互联网内容推荐方法,其特征在于,所述计算所述局部群体对各种互联网内容类型的渗透速度,具体包括 统计所述局部群体中的客户对第一互联网内容类型的访问次数; 计算所述访问次数与所述局部群体中的客户数的比值,将计算得到的比值作为所述局部群体对所述第一互联网内容类型的渗透速度。
8.如权利要求I所述的互联网内容推荐方法,其特征在于,按照如下公式计算互联网内容类型i与互联网内容类型j的相似度sim(i,j)
9.如权利要求I所述的互联网内容推荐方法,其特征在于,按照如下公式计算局部群体u中互联网内容类型s的评分值Pus
10.如权利要求9所述的互联网内容推荐方法,其特征在于,互联网内容类型s的相似互联网内容类型集合为 与互联网内容类型s的相似度大于第四阈值的互联网内容类型构成的集合;或者按照与互联网内容类型S的相似度从大到小的顺序选取的第一预定数目个互联网内容类型构成的集合。
11.如权利要求I所述的互联网内容推荐方法,其特征在于,所述根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型,具体包括 将评分值大于第五阈值的互联网内容类型作为向所述局部群体中的客户推荐的互联网内容类型;或者 将按照评分值从大到小的顺序选取的第二预定数目个互联网内容类型作为向所述局部群体中的客户推荐的互联网内容类型。
12.一种互联网内容推荐装置,其特征在于,包括 局部群体抽取模块,用于根据客户之间的通信紧密性和/或偏好相似性,从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体; 渗透速度计算模块,用于计算所述局部群体对各种互联网内容类型的渗透速度; 相似度计算模块,用于计算每一对互联网内容类型的相似度; 评分值计算模块,用于根据所述渗透速度和所述相似度计算所述局部群体所涉及到的互联网内容类型的评分值,所述评分值用于表征客户访问相应互联网内容类型的倾向大小;推荐模块,用于根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型。
13.如权利要求12所述的互联网内容推荐装置,其特征在于,所述局部群体抽取模块进一步用于 从所述第一群体中剔除满足预设条件的第二客户,得到所述局部群体; 所述预设条件为 所述第二客户与所述第一客户之间的通信次数低于第一阈值;和/或所述第二客户访问的互联网内容类型的集合与所述第一客户访问的互联网内容类型的集合之间不存在交集。
14.如权利要求12所述的互联网内容推荐装置,其特征在于,所述局部群体抽取模块进一步用于 计算所述第一群体的通信紧密度; 当所述通信紧密度小于或等于第二阈值时,对于所述第一群体中的每个客户,统计与其有通信联系的客户的第一数目; 从所述第一群体中剔除第一数目最小的客户,得到更新后的第一群体; 对更新后的第一群体反复执行上述过程,直到所述通信紧密度大于第二阈值,或者,更新后的第一群体中的客户数目小于或等于第三阈值时,得到所述局部群体; 其中,采用如下公式计算通信紧密度TIGHTNESS 上述公式中,V是第一群体包括的客户数目,E是第一群体中存在通信联系的客户对数。
15.如权利要求12所述的互联网内容推荐装置,其特征在于,所述局部群体抽取模块进一步用于 从所述第一群体中剔除满足预设条件的第二客户,得到第二群体; 所述预设条件为 所述第二客户与所述第一客户之间的通信次数低于第一阈值;和/或所述第二客户访问的互联网内容类型的集合与所述第一客户访问的互联网内容类型的集合之间不存在交集; 计算所述第二群体的通信紧密度; 当所述通信紧密度小于或等于第二阈值时,对于所述第二群体中的每个客户,统计与其有通信联系的客户的第一数目; 从所述第二群体中剔除第一数目最小的客户,得到更新后的第二群体; 对更新后的第二群体反复执行上述过程,直到所述通信紧密度大于第二阈值,或者,更新后的第二群体中的客户数目小于或等于第三阈值时,得到所述局部群体; 其中,采用如下公式计算通信紧密度TIGHTNESS 上述公式中,V是第二群体包括的客户数目,E是第二群体中存在通信联系的客户对数。
16.如权利要求12所述的互联网内容推荐装置,其特征在于,所述渗透速度计算模块进一步用于,按照如下公式计算所述局部群体对各种互联网内容类型的渗透速度 其中,SPEED (site)是所述局部群体对互联网内容类型site的渗透速度,Rate是所述局部群体中访问互联网内容类型site的客户数占比,FirstTime是所述局部群体中第一个访问互联网内容类型site的客户的第一次访问时间,LastTime是所述局部群体中最后一个访问互联网内容类型site的客户的第一次访问时间。
17.如权利要求12所述的互联网内容推荐装置,其特征在于,所述渗透速度计算模块进一步用于 计算所述局部群体中访问第一互联网内容类型的客户数占比,将所述客户数占比作为所述局部群体对所述第一互联网内容类型的渗透速度。
18.如权利要求12所述的互联网内容推荐装置,其特征在于,所述渗透速度计算模块进一步用于 统计所述局部群体中的客户对第一互联网内容类型的访问次数; 计算所述访问次数与所述局部群体中的客户数的比值,将计算得到的比值作为所述局部群体对所述第一互联网内容类型的渗透速度。
19.如权利要求12所述的互联网内容推荐装置,其特征在于,所述相似度计算模块进一步用于,按照如下公式计算互联网内容类型i与互联网内容类型j的相似度sim(i,j)
20.如权利要求12所述的互联网内容推荐装置,其特征在于,所述评分值计算模块进一步用于,按照如下公式计算局部群体u中互联网内容类型s的评分值Pus
21.如权利要求20所述的互联网内容推荐装置,其特征在于,互联网内容类型s的相似互联网内容类型集合为 与互联网内容类型s的相似度大于第四阈值的互联网内容类型构成的集合;或者按照与互联网内容类型s的相似度从大到小的顺序选取的第一预定数目个互联网内容类型构成的集合。
22.如权利要求12所述的互联网内容推荐装置,其特征在于,所述推荐模块进一步用于 将评分值大于第五阈值的互联网内容类型作为向所述局部群体中的客户推荐的互联网内容类型;或者 将按照评分值从大到小的顺序选取的第二预定数目个互联网内容类型作为向所述局部群体中的客户推荐的互联网内容类型。
全文摘要
本发明提供一种互联网内容推荐方法及装置。所述互联网内容推荐方法包括根据客户之间的通信紧密性和/或偏好相似性,从第一客户与其交往圈所构成的第一群体中抽取一个包括所述第一客户的局部群体;计算所述局部群体对各种互联网内容类型的渗透速度;计算每一对互联网内容类型的相似度;根据所述渗透速度和所述相似度计算所述局部群体所涉及到的互联网内容类型的评分值,所述评分值用于表征客户访问相应互联网内容类型的倾向大小;根据所述评分值产生向所述局部群体中的客户推荐的互联网内容类型。本发明实现了面向群体的互联网内容的推荐,能够显著提高推荐效率。
文档编号G06F17/30GK102750288SQ201110101229
公开日2012年10月24日 申请日期2011年4月21日 优先权日2011年4月21日
发明者刘鹏, 屈强, 张湛梅, 杨旭, 陈广宇 申请人:中国移动通信集团广东有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1