一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法

文档序号:9810710阅读:2399来源:国知局
一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法
【技术领域】
[0001] 本发明涉及一种基于协同过滤推荐算法与K最近邻分类算法相结合的App推荐方 法,是属于移动互联网应用领域。
【背景技术】
[0002] 随着技术的发展,智能电视、智能机顶盒、智能手机等智能化产品越来越受到消费 者的青睐。相应的,应用商店中的软件也如雨后春笋般快速地增长。如何将优质的应用通过 排名准确地呈现给智能化产品的用户,让用户花费最少的成本及时间选择到适合自己的优 质应用,成为维持应用商店健康发展的重点。第三方软件公司经常采用恶意下载方式,以此 提升该应用排名。因此,需要改进应用排名方式,防止粗制软件占据榜单,以使得更好地保 障应用商店的健康发展。
[0003] 传统的应用商店按照"发布时间"、"排名上升速度"、"评分高低"、"评论次数"、"下 载次数"、"检索次数"、"激活量"、"卸载次数"等属性分发应用。
[0004] 在传统应用商店的分发模式下,70%的下载量都被0.1%的Top热门应用所占据, 而99.9%不常使用的低频应用仅仅占到了总下载量的30%,即便有很好的工具、很好的服 务,却没有好的方法触及自己的目标客户,居于不利位置。应用商店的展现形式是优先展示 下载量最大的Top热门应用,形成强者恒强的局面,如果要搜索,前提是必须要知道这个应 用的名字,很多需求无法有效对接给开发者。
[0005] 并且,在传统应用商店分发模式下,第三方软件公司经常采用恶意下载方式,以此 提升该应用排名。
[0006] 最后,附近的人往往是相同的群体,其行为习惯也大体相同。但自己身边周围的人 常用的一些应用常常因为排名靠后而不能被发现,互联网的长尾效应无法得到释放,没有 很好的实现app的智能检索排序。
[0007] 当前的应用商店按照传统分类方式将应用分类,未充分考虑用户之间的关系。因 而需要设计适合的推荐算法来提高app搜索时的搜索效率。

【发明内容】

[0008] 本发明的目的在于提供一种基于协同过滤推荐算法与K最近邻分类算法的App推 荐方法,主要用于解决基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化以 及不能很好解决冷门App的推荐问题,从而提高App推荐的精度。
[0009] 为解决上述的技术问题,本发明采用的方案如下:
[0010] 第一步,采集用户注册信息,包括年龄、爱好、账号等信息;
[0011] 第二步,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户 装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删 除;
[0012] 第三步,采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户 兴趣相似度较大的集合Μ;将集合Μ中的用户所有App信息存储到集合N中;统计集合N中各个 App出现的次数,按照次数多少的顺序返回给用户;
[0013] 采用基于协同过滤推荐算法分类的具体过程如下:
[0014] 第一步,根据用户兴趣,采用KNN算法,分为Μ个集合。其中,用户的兴趣来自用户安 装的App信息以及用户注册时填写的兴趣;
[0015] 第二步,将Μ个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中 各个App出现的次数,按照次数多少的顺序返回给用户;
[0010]其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第 一步中KNN算法过程如下:
[0017] 1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元 组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元 组的距离,设用户仏与用户山兴趣相似度为仏,则该距离计算公式为:
[0019] 2.遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级 队列中的最大距离Lmax;
[0020] 3.进行比较。若L> = Lmax,则舍弃该元组,遍历下一个元组。若L〈Lmax,删除优先级 队列中最大距离的元组,将当前训练元组存入优先级队列;
[0021] 4.遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
[0022] 5.测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取 误差率最小的k值进行的分类。
[0023]有益效果
[0024]本发明对比已有的App推荐方法,具有以下创新点:
[0025] a.将用户兴趣相似度与KNN结合,找出与该用户基本上相似的其他用户集合U;
[0026] b.采用基于协同过滤的推荐算法,找到集合U中其他用户所有App信息,按照各个 App出现次数排序,使推荐更具人性化;
[0027]本发明对比已有定位方法具有以下显著优点:
[0028] 1、改进了基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化问题,
[0029] 2、改进了冷门App的推荐问题,
[0030] 3、提高App推荐的精准度。
【附图说明】
[0031]附图1是基于协同过滤推荐算法与K最近邻分类算法的总体流程图。
[0032]具体的实施方式
[0033]下面结合说明书附图和【具体实施方式】对本发明作进一步的说明。
[0034] 为解决上述的技术问题,本发明采用的技术方案是:基于协同过滤推荐算法与K最 近邻分类算法的App推荐方法,包括以下的步骤:
[0035] S1、采集用户注册信息,包括年龄、爱好、账号等信息;
[0036] S2、采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载 或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
[0037] S3、采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣 相似度较大的集合M;将集合Μ中的用户所有App信息存储到集合N中;统计集合N中各个App 出现的次数,按照次数多少的顺序返回给用户;
[0038] 采用基于协同过滤推荐算法分类的具体过程如下:
[0039] 第一步,根据用户兴趣,采用KNN算法,分为Μ个集合。其中,用户的兴趣来自用户安 装的App信息以及用户注册时填写的兴趣;
[0040] 第二步,将Μ个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中 各个App出现的次数,按照次数多少的顺序返回给用户;
[0041 ]其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第 一步中KNN算法过程如下:
[0042] 1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元 组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元 组的距离,设用户仏与用户山兴趣相似度为仏,则该距离计算公式为:
[0044] 2.遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级 队列中的最大距离Lmax;
[0045] 3.进行比较。若L> = Lmax,则舍弃该元组,遍历下一个元组。若L〈Lmax,删除优先级 队列中最大距离的元组,将当前训练元组存入优先级队列;
[0046] 4.遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
[0047] 5.测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取 误差率最小的k值进行的分类。
【主权项】
1. 一种基于协同过滤推荐算法与κ最近邻分类算法的App推荐方法,其特征在于,采用 基于协同过滤推荐算法与K最近邻法相结合的算法实现App推荐,具体的步骤如下: 51、 采集用户注册信息,包括年龄、爱好、账号等信息; 52、 采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸 载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除; 53、 采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似 度较大的集合M;将集合Μ中的用户所有App信息存储到集合N中;统计集合N中各个App出现 的次数,按照次数多少的顺序返回给用户。2. 根据权利要求1所述的基于协同过滤推荐算法与K最近邻分类算法的App推荐方法, 其特征在于,利用采集的数据,实现训练分类,然后采用协同过滤算法处理训练分类后的数 据集,具体的步骤如下: 第一步,根据用户兴趣,采用K順算法,分为Μ个集合。其中,用户的兴趣来自用户安装的 App信息W及用户注册时填写的兴趣; 第二步,将Μ个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个 App出现的次数,按照次数多少的顺序返回给用户; 其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步 中K順算法过程如下: 1) .维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。 随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到运k个元组的 距离,设用户化与用户&兴趣相似度为化,则该距离计算公式为:2) .遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队 列中的最大距离Lmax; 3) .进行比较。若L〉= Lmax,则舍弃该元组,遍历下一个元组。若IXLmax,删除优先级队 列中最大距离的元组,将当前训练元组存入优先级队列; 4) .遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别; 5) .测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误 差率最小的k值进行的分类。
【专利摘要】一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法。本发明采用一种支持向量机与KNN算法相结合的方法实现室内定位,旨在改善App推荐的精准度,其实现推荐的主要过程如下,第一,采集用户注册信息,包括年龄、爱好、账号等信息;第二,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;第三,采用基于协同过滤的推荐算法,根据KNN原理,利用用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户。
【IPC分类】G06F17/30, G06K9/62
【公开号】CN105574183
【申请号】CN201510973710
【发明人】刘海亮, 宋聪颖, 黄鹏
【申请人】中山大学深圳研究院
【公开日】2016年5月11日
【申请日】2015年12月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1