一种应用推荐方法和系统的制作方法

文档序号:6400424阅读:119来源:国知局
专利名称:一种应用推荐方法和系统的制作方法
技术领域
本申请涉及网络技术领域,特别是涉及一种应用推荐方法,以及,一种应用推荐装置。
背景技术
随着人们对网络应用需求的不断增加,个性化推荐服务已经慢慢进入人们的生活中,个性化推荐服务是指针对不同的来访者进行具有针对性的推荐。目前,许多新兴网站纷纷采用个性化推荐服务去吸引消费者的浏览,具体而言,通过对每个来访者的访问行为进行分析,根据分析结果分别给予来访者个性化的推荐。目前,比较常用的推荐方法主要包括以下两种:1、基于内容过滤方法(CB, Content-Based Filtering)该方法是根据目标用户(即视频推荐的对象)的访问数据来筛选与之相关的信息进行推荐,例如,提取目标用户在过去浏览过的一些视频的相关信息,根据相关信息筛选出一些视频进行推荐。2、协同过滤方法(COL, Collaborative Filtering)该方法是基于与目标用户具有相似兴趣的其他用户的偏好信息生成对目标用户的推荐,具体而言,查找与目标用户看过相似视频的其他用户,找出这些用户看过的,而目标用户没看过的候选视频,依据与目标用户观看视频相似度较高的用户对候选视频的打分,或是依据与候选视频相似度较高的视频的打分,对各个候选视频进行打分,并对打分较高的候选视频进行推荐。以上背景技术中存在的问题是:采用内容过滤方法时,由于部分视频的相关信息比较有限,很难找到可以推荐的视频;协同过滤方法不需要依据视频的相关信息进行判断,可以解决内容过滤方法的这些问题,但采用背景技术中的协同过滤方法,需要筛选出相似度较高的其他用户或视频,以预测候选视频的打分,这些操作占用了大量的系统资源,并且,某些视频可能没有相关用户的打分,无法进一步预测该视频的打分,使得这些视频无法被推荐出去。

发明内容
本申请实施例提供了一种应用推荐方法,以减少应用推荐时对系统资源的占用。本申请实施例还提供了一种应用推荐装置,用以保证上述方法在实际中的应用及实现。为了解决上述问题,本申请实施例公开了一种应用推荐方法,包括:获取多个参考用户对预置的多个应用的访问行为数据,并按照所述访问行为数据对所述多个参考用户进行分组,各个应用具备相应的应用类别;按照目标用户对多个应用的访问行为数据,确定目标用户所属分组,并统计目标用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别;在目标用户所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户。优选地,在目标用户所属分组的各参考用户所访问的多个应用中,提取所述兴趣应用类别的应用推荐给目标用户之前,所述方法还包括:按照各参考用户对多个应用的访问行为数据,统计各参考用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别;计算目标用户的兴趣应用类别,与所属分组的各参考用户的兴趣应用类别的相似度,并确定相似度大于预设值的参考用户。优选地,所述在目标用户所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户的步骤为:查找目标用户所属分组的各参考用户中,相似度大于预设值的参考用户所访问的多个应用;在查找的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户。优选地,所述参考用户的划分的多个分组按照所包含的参考用户的访问行为数据,分为高价值分组和低价值分组;针对所述低价值分组,还提取至少一个预设应用类别的应用与属于所述兴趣应用类别的应用,一同推荐给目标用户。优选地,所述访问行为数据中包括访问时间和访问应用所属的应用类别,所述按照访问行为数据对多个参考用户进行分组的步骤包括:针对各个参考用户,按照访问行为数据中所包含的访问时间和访问应用所属的应用类别,计算距离当前最近的访问时间、访问频率和访问应用的个数;统计所有参考用户的最近的访问时间的平均值、访问频率的平均值,以及访问应用的个数的平均值;针对各个参考用户,将最近的访问时间、访问频率和访问应用的个数分别与对应的平均值进行比较,将按照三个数值的比较结果相同的参考用户划分到一个分组中。优选地,所述按照目标用户对多个应用的访问行为数据,确定目标用户所属分组的步骤包括:针对目标用户,按照访问行为数据中所包含的应用访问时间和访问应用所属的应用类别,计算距离当前最近的访问时间、访问频率和访问应用的个数;将目标用户的最近的访问时间、访问频率和访问应用的个数,分别与所有参考用户的最近的访问时间的平均值、访问频率的平均值和访问应用的个数的平均值进行比较,将比较结果相同的分组作为目标用户所属分组。 优选地,所述统计目标用户对不同的应用类别的访问权重值,将访问权重值满足范围的应用类别作为兴趣应用类别的步骤包括:针对目标用户所访问的每个应用类别,按照预设算法和应用类别的类别权重值,统计各应用类别的访问权重值;去除访问权重值小于预设权重值的应用类别,将任意两个应用类别组成二项类别;
按照所述预设算法和二项类别的类别权重值,统计所访问的每个二项类别的访问权重值;提取访问权重值大于预设权重值的二项类别作为兴趣应用类别。优选地,所述针对目标用户所访问的每个应用类别,按照预设算法和应用类别的类别权重值,统计各应用类别的访问权重值的步骤包括:步骤11,针对目标用户的各应用类别,提取距离当前最近的jXN个访问行为数据,j和N均为正整数,j的初始值为I ;步骤12,按照所述访问行为数据确定对各应用类别的访问次数,按照预设算法和应用类别的类别权重值Wj,更新各应用类别的访问权重值WSj,WSj的初始值为O ;步骤13,若所述类别权重值小于等于预设权重值或所述访问行为数据已取完,则停止操作;若所述类别权重值大于预设权重值且所述访问行为数据未取完,则令j = j+1,并返回步骤11。优选地,所述按照预设算法和二项类别的类别权重值,统计所访问的每个二项类别的访问权重值的步骤包括:步骤21,针对目标用户的各二项类别,提取距离当前最近的jXN个访问行为数据,j和N均为正整数,j的初始值为I ;步骤22,按照所述访问行为数据确定对各二项类别的访问次数,按照预设算法和二项类别的类别权重值Wj,,更新各二项类别的访问权重值WSj ,,WSj ,的初始值为O ;步骤23,若所述类别权重值小于等于预设权重值或所述访问行为数据已取完,则停止操作;若所述类别权重值大于预设权重值且所述访问行为数据未取完,则令j = j+1,并返回步骤21。优选地,所述计算目标用户的兴趣应用类别,与所属分组的各参考用户的兴趣应用类别的相似度的步骤包括:针对所属分组中的各参考用户,按照目标用户的兴趣应用类别与参考用户的兴趣应用类别分别建立对应的规则向量;计算参考用户的规则向量与参考用户的规则向量的相似度,作为参考用户与目标用户的兴趣应用类别的相似度。优选地,在获取多个参考用户对预置的多个应用的访问行为数据的步骤之前,所述方法还包括:在参考用户对预置的多个应用进行访问时,记录参考用户的访问行为数据。本发明实施例还提供了一种应用推荐装置,包括:数据获取模块,用于获取多个参考用户对预置的多个应用的访问行为数据;分组确定模块,用于按照所述访问行为数据对所述多个参考用户进行分组,并按照目标用户对多个应用的访问行为数据,确定目标用户所属分组,各个应用具备相应的应用类别;兴趣应用类别确定模块,用于统计目标用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别;应用推荐模块,用于在目标用户所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户。
与背景技术相比,本申请包括以下优点:相比于背景技术在对目标用户进行推荐的时候,需要先筛选相似度高的参考用户或应用,本申请预先通过对多个参考用户的访问行为数据进行分析,将参考用户进行分组,在针对目标用户进行推荐时,只确定所属的分组以及访问权重较高的兴趣应用类别,然后在目标用户所属分组的参考用户所访问的多个应用中,提取符合兴趣应用类别的应用推荐给用户,大大简化了推荐的步骤,减轻了对系统资源的占用。本申请在确定目标用户所属分组后,还可以进一步从所属分组中,用相似向量矩阵计算用户之间的相似度进行相似聚集,进一步筛选出与目标用户相似度较高的参考用户,将这些用户所访问的应用推荐给用户,从而增加了应用推荐的准确性。本申请在确定用户的兴趣应用类别时,权重增量挖掘方法加入到Apriori算法中,以增量增加观看数据量的方式来挖掘最近兴趣规则,而不需要将全部历史数据做分析,这样就可以节省计算成本、时间。本申请中,可以按照访问行为数据将参考用户分为高价值组和低价值组,对于低价值分组可以提取预设类别的应用进行推荐,同时,由于本申请在进行应用推荐时,无需用户对应用的打分,从而使得各个应用都可能被推荐给用户。当然,实施本申请的任一产品不一定需要同时达到以上所述的所有优点。


图1是本申请实施例所述一种应用推荐方法的流程图;图2是本申请实施例所述一种应用推荐装置的结构框图;图3是本申请实施例中应用推荐的过程示意图。
具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本申请作进一步详细的说明。网站在提供个性化推荐服务时,需要对当前用户的访问行为进行分析挖掘,通过数据挖掘的结果给用户推荐一些感兴趣的应用,以此来提高用户在网站上的观看率。常用的推荐方法包括基于内容过滤方法和协同过滤方法。基于内容过滤方法是基于文件的关联性进行推荐,是对访问数据的所包含的内容信息的延伸,具体而言,根据当前用户的历史信息(如评价、分享、收藏过的文档)构造用户偏好文档,计算推荐应用与用户偏好文档的相似度,将最相似的应用推荐给当前用户。例如,在电影推荐中,首先分析当前用户已经看过的打分比较高的电影的共性(演员、导演、风格等),再推荐与这些用户感兴趣的电影内容相似度高的其他电影。协同过滤方法是基于用户间的关联性进行的推荐,是一种基于一组兴趣相同的用户或应用进行的推荐,它根据邻居用户(与目标用户兴趣相似的用户)的偏好信息产生对目标用户的推荐列表。主要分为基于用户的协同过滤方法和基于应用的协同过滤方法。基于用户的(User based)协同过滤方法基于这样一个假设:如果一些用户对某一类应用的打分比较接近,则他们对其它类应用的打分也比较接近。首先搜索与用户观看过相似视频的相似用户,依据相似用户和当前用户对共同观看过的视频的打分,筛选出一些打分相似度比较高的相似用户;然后将这些用户看过的视频而访问者没有看过的视频作为指定视频,依据这些相似用户对指定视频的评分,预测当前用户对该指定视频的打分,将指定视频和打分情况反馈给当前用户。基于用户的协同过滤方法的主要工作内容是用户或应用的相似性度量和预测评分。基于应用的(Item based)协同过滤方法基于这样一个假设:如果大部分用户对某些项目的打分比较相近,则当前用户对这些项的打分也会比较接近。首先依据各个用户分别对各个视频的打分,计算视频与视频之间的相似性,搜索目标应用的最近的应用,然后根据用户对目标应用的最近邻居的评分信息预测目标应用的评分,最后产生前N个推荐信
息O 参见下表1,给出了基于内容过滤方法和协同过滤方法比较:
权利要求
1.一种应用推荐方法,其特征在于,包括: 获取多个参考用户对预置的多个应用的访问行为数据,并按照所述访问行为数据对所述多个参考用户进行分组,各个应用具备相应的应用类别; 按照目标用户对多个应用的访问行为数据,确定目标用户所属分组,并统计目标用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别; 在目标用户 所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户。
2.根据权利要求1所述的方法,其特征在于,在目标用户所属分组的各参考用户所访问的多个应用中,提取所述兴趣应用类别的应用推荐给目标用户之前,所述方法还包括: 按照各参考用户对多个应用的访问行为数据,统计各参考用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别; 计算目标用户的兴趣应用类别,与所属分组的各参考用户的兴趣应用类别的相似度,并确定相似度大于预设值的参考用户。
3.根据权利要求2所述的方法,其特征在于,所述在目标用户所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户的步骤为: 查找目标用户所属分组的各参考用户中,相似度大于预设值的参考用户所访问的多个应用; 在查找的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户。
4.根据权利要求1或3所述的方法,其特征在于,所述参考用户的划分的多个分组按照所包含的参考用户的访问行为数据,分为高价值分组和低价值分组; 针对所述低价值分组,还提取至少一个预设应用类别的应用与属于所述兴趣应用类别的应用,一同推荐给目标用户。
5.根据权利要求1所述的方法,其特征在于,所述访问行为数据中包括访问时间和访问应用所属的应用类别,所述按照访问行为数据对多个参考用户进行分组的步骤包括: 针对各个参考用户,按照访问行为数据中所包含的访问时间和访问应用所属的应用类别,计算距离当前最近的访问时间、访问频率和访问应用的个数; 统计所有参考用户的最近的访问时间的平均值、访问频率的平均值,以及访问应用的个数的平均值; 针对各个参考用户,将最近的访问时间、访问频率和访问应用的个数分别与对应的平均值进行比较,将按照三个数值的比较结果相同的参考用户划分到一个分组中。
6.根据权利要求5所述的方法,其特征在于,所述按照目标用户对多个应用的访问行为数据,确定目标用户所属分组的步骤包括: 针对目标用户,按照访问行为数据中所包含的应用访问时间和访问应用所属的应用类别,计算距离当前最近的访问时间、访问频率和访问应用的个数; 将目标用户的最近的访问时间、访问频率和访问应用的个数,分别与所有参考用户的最近的访问时间的平均值、访问频率的平均值和访问应用的个数的平均值进行比较,将比较结果相同的分组作为目标用户所属分组。
7.根据权利要求1所述的方法,其特征在于,所述统计目标用户对不同的应用类别的访问权重值,将访问权重值满足范围的应用类别作为兴趣应用类别的步骤包括: 针对目标用户所访问的每个应用类别,按照预设算法和应用类别的类别权重值,统计各应用类别的访问权重值; 去除访问权重值小于预设权重值的应用类别,将任意两个应用类别组成二项类别; 按照所述预设算法和二项类别的类别权重值,统计所访问的每个二项类别的访问权重值; 提取访问权重值大于预设权重值的二项类别作为兴趣应用类别。
8.根据权利要求7所述的方法,其特征在于,所述针对目标用户所访问的每个应用类另IJ,按照预设算法和应用类别的类别权重值,统计各应用类别的访问权重值的步骤包括: 步骤11,针对目标用户的各应用类别,提取距离当前最近的j X N个访问行为数据,j和N均为正整数,j的初始值为I ; 步骤12,按照所述 访问行为数据确定对各应用类别的访问次数,按照预设算法和应用类别的类别权重值Wj,更新各应用类别的访问权重值WSj,WSj的初始值为O ; 步骤13,若所述类别权重值小于等于预设权重值或所述访问行为数据已取完,则停止操作;若所述类别权重值大于预设权重值且所述访问行为数据未取完,则令j = j+1,并返回步骤11。
9.根据权利要求7所述的方法,其特征在于,所述按照预设算法和二项类别的类别权重值,统计所访问的每个二项类别的访问权重值的步骤包括: 步骤21,针对目标用户的各二项类别,提取距离当前最近的j X N个访问行为数据,j和N均为正整数,j的初始值为I ; 步骤22,按照所述访问行为数据确定对各二项类别的访问次数,按照预设算法和二项类别的类别权重值Wj /,更新各二项类别的访问权重值WSj /,WSj /的初始值为O ; 步骤23,若所述类别权重值小于等于预设权重值或所述访问行为数据已取完,则停止操作;若所述类别权重值大于预设权重值且所述访问行为数据未取完,则令j = j+1,并返回步骤21。
10.根据权利要求2所述的方法,其特征在于,所述计算目标用户的兴趣应用类别,与所属分组的各参考用户的兴趣应用类别的相似度的步骤包括: 针对所属分组中的各参考用户,按照目标用户的兴趣应用类别与参考用户的兴趣应用类别分别建立对应的规则向量; 计算参考用户的规则向量与参考用户的规则向量的相似度,作为参考用户与目标用户的兴趣应用类别的相似度。
11.根据权利要求1所述的方法,其特征在于,在获取多个参考用户对预置的多个应用的访问行为数据的步骤之前,所述方法还包括: 在参考用户对预置的多个应用进行访问时,记录参考用户的访问行为数据。
12.—种应用推荐装置,其特征在于,包括: 数据获取模块,用于获取多个参考用户对预置的多个应用的访问行为数据; 分组确定模块,用于按照所述访问行为数据对所述多个参考用户进行分组,并按照目标用户对多个应用的访问行为数据,确定目标用户所属分组,各个应用具备相应的应用类别;兴趣应用类别确定模块,用于统计目标用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别; 应用推荐模块,用于在目标用户所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应 用推荐给目标用户。
全文摘要
本申请提供了一种应用推荐方法和系统。所述方法包括获取多个参考用户对预置的多个应用的访问行为数据,并按照所述访问行为数据对所述多个参考用户进行分组,各个应用具备相应的应用类别;按照目标用户对多个应用的访问行为数据,确定目标用户所属分组,并统计目标用户对不同的应用类别的访问权重值,将访问权重值满足预设范围的应用类别作为兴趣应用类别;在目标用户所属分组的各参考用户所访问的多个应用中,提取属于所述兴趣应用类别的应用推荐给目标用户。本申请可以减少应用推荐时对系统资源的占用。
文档编号G06Q30/02GK103198418SQ201310084568
公开日2013年7月10日 申请日期2013年3月15日 优先权日2013年3月15日
发明者郑巍, 罗峰, 黄苏支, 李娜 申请人:北京亿赞普网络技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1