个性化的移动应用app推荐方法

文档序号:9667463阅读:578来源:国知局
个性化的移动应用app推荐方法
【技术领域】
[0001] 本发明提出了一种移动应用推荐方法,特别涉及个性化的移动应用APP推荐方 法。
【背景技术】
[0002] 手机APP的发展给予了用户更多的便利,方便了用户的生活。但是,APP的不计其 数和品种繁多也给用户造成了一些问题。研究发现仅仅通过浏览和简单的查询来寻找有用 且用户偏好的APP变得相当困难,在某种程度上过量的信息意味着信息缺乏,因此就需要 某种工具来迅速找到用户所需要的并且偏好的信息来辅助决策,防止用户迷失。于是,出现 了许多APP推荐方法。
[0003] 在本发明作出之前,传统的推荐方法如协同过滤技术(CF)致力于通过在用户群 中找到与指定用户有相似兴趣的用户,综合这些相似用户对某一信息的评价,形成系统对 该指定用户对此信息的喜好程度预测来推荐APP。然而,随着个性化的商业应用延展到用户 生活信息流的方方面面,个性化推荐技术也在日新月异不断发展,类似于协同过滤这样的 早期技术已经不能满足新环境下的要求,例如在用户和商品愈见增多的情况下,系统的性 能会越来越低亦或是当用户对商品的评价非常稀疏时,这样基于用户的评价所得到的用户 间的相似性可能不准确甚至导致商品不被推荐。除此以外,当前大多数技术只考虑单个元 素,然而在用户对商品有更高需求的同时,对于APP推荐来说,除了功能,还应该考虑到其 APP属性、种类、地理位置及用户情感的影响,比如在地理位置方面,诸如美团、大众点评、谷 歌地图这样基于地理位置的软件,他们所涉及的区域大小会影响到是否该推荐这个APP。

【发明内容】

[0004] 本发明的目的是克服上述缺陷,开发一种个性化的APP推荐方法。
[0005] 本发明的技术方案是:
[0006] 个性化的移动应用APP推荐方法,其特征在于步骤如下:
[0007] 步骤1).数据收集:从应用市场获取用户及移动应用即APP的信息,包括功能描述 及评论信息;
[0008] 步骤2).对获取的原始APP数据进行预处理来避免出现冷启动问题;
[0009] 步骤3).利用情感-方面-地区即SAR模型,将APP的评论信息作为输入文档,分 别得到用户对于APP的情感、APP的方面以及APP的使用地区,由此得到用户对APP不同属 性的潜在偏好并预测用户选择APP的概率值;
[0010] 步骤4).对步骤2)得到的数据作进一步处理,分别转换为APP索引文件和用户索 引文件;
[0011] 步骤5).利用协相关主题即CTM模型,输入前述步骤4)的两份文件,得到 User-App的推荐分数矩阵;
[0012] 步骤6).将SAR模型与CTM模型分别得到的概率值与推荐分数线性结合,然后用 Top-N在线推荐算法进行排序,将预测评分较高的APP推荐给相应的用户。
[0013] 所述步骤1)中,在应用商店GooglePlay里,用户对他所使用过的APP的评级是 公开可见的,一旦获得用户的ID就能看到用户所评论过的所有APP,由此通过爬数据工具 将所有原始数据检索出来。
[0014] 所述步骤2)中原始数据的预处理过程包括:
[0015] a)清除写少于2条评论的用户以及过滤用户后没有任何评论的APP;
[0016] b)托肯化:去除标点符号,去除数字;
[0017]c)去除停用词:去除英文停用词,包括介词、代词、冠词;
[0018] d)词干化:将每个单词转化为它的原型,过去时转化为原型,现在进行时转化为 原型。
[0019] 所述步骤3)中计算推荐概率的计算公式:
[0020]
ra
[0021] 即表示用户u喜欢APPt并且给其评级的概率,其中,t,s+,u,r,a,(^分别代表 APP,正面情感,用户,地区,APP的方面以及APP的种类。
[0022] 所述步骤4)中的数据处理,其分为以下几个步骤:
[0023] a)对步骤2)中所获得的所有APP进行编号,依次为0,1,2, 3,4,…,n,每一个编 号对应其APP信息,即为步骤3)中SAR模型所过滤得到的信息;
[0024] b)对步骤2)中所获得的所有用户进行编号,依次为0,1,2,3,4,...,11,每一个编 号对应其用户信息,即为步骤3)中SAR模型所过滤得到的信息;
[0025] c)将所收集的数据整理成一份用户索引输入文件,格式要求:一行为一个用户的 信息,行首即为用户的编码+1,第二列为用户所评级过的APP数量,余下列为用户评级过的 所有APP编号;
[0026] d)将所收集的数据整理成一份APP索引输入文件,格式要求:一行为一个APP的 信息,行首即为APP的编码+1,第二列为给此APP进行评级的用户数量,余下列为所有给 APP评级的用户编号;
[0027]e)将以上两份文件输入CTM模型,得到一个User-App推荐分数矩阵,推荐值为正 则表示可推荐,值越大越值得推荐,反之,推荐值为负则表示此APP对该用户是没有推荐价 值的,矩阵行为APP,列为用户。
[0028] 7.根据权利要求1所述的APP多属性推荐方法,其特征在于步骤6)中将SAR模型 得到的概率p(t,S+|u)及GTM模型得到的推荐值rut的线性结合计算公式,如下:设定两个 参数α,β,则合并推荐分数Score为:
[0029] Score=ap(t,s+1u) +βrut
[0030] 其中,α,β是输入参数权重。
[0031] 本发明的优点和效果在于综合考虑评论里的方面、情感、种类及地区达到个性化 推荐的目的。主要有以下一些优点:
[0032] 1.此推荐方法综合考虑评论里的方面、情感、种类及地区来发现用户的潜在偏好, 更符合用户的实际需求。
[0033] 2.此推荐方法能解决传统协同过滤技术即CF无法解决的冷启动问题。
[0034] 3.传统推荐方法如CF不使用APP的内容,它是基于所选的APP有相似模式的用户 而推荐的,而此推荐方法是同时基于内容和用户评级的,结果预测是基于内容还是用户评 级取决于多少用户对APP进行评级。
[0035] 4.此推荐方法是一种个性化推荐,所推荐的应用会考虑用户的兴趣、所处地区等。
[0036] 5.此推荐方法提出了对APP属性的全新分类方法,将APP的属性划分得更详细,由 此探索用户对APP各属性的偏好程度,更好地了解用户需求与APP特征。
【附图说明】
[0037] 图1--本发明的总体流程不意图。
[0038] 图2--本发明GoogleMaps的功能描述信息示意图。
[0039] 图3--本发明用户Sarah对YellowPages的评论信息示意图。
[0040] 图4--本发明用户Sarah对CommanderCompassLite的评论信息不意图。
[0041] 图5--本发明预处理过后的GoogleMaps的功能描述信息示意图。
[0042] 图6--本发明预处理过后的用户Sarah对YellowPages的评论信息示意图。
[0043] 图7--本发明预处理过后的用户Sarah对CommanderCompassLite的评论信息 示意图。
[0044] 图8-一本发明情感-方面-地区模型的初步输出结果示意图。
[0045] 图9一一本发明协相关模型的用户索引输入文件的格式要求示意图。
[0046] 图10--本发明协相关模型的APP索引输入文件的格式要求示意图。
[0047] 图11--本发明协相关模型User-App推荐分数矩阵的输出格式不意图。
【具体实施方式】
[0048] 本发明的技术思路是:
[0049] 本发明考虑结合方面、情感、种类以及地区对推荐技术的影响,对APP属性进行了 比较详尽的分类,比如界面、地理位置、功能菜单、卸载量与激活量之比、设置,以此更加详 细地了解用户对APP不同属性的要求及偏好,从而使推荐效果更好。还利用协相关主题模 型这种个性化推荐,以保证这种推荐方法能够得到广泛应用。
[0050] 本发明结合CTM模型和SAR模型对用户评论信息进行建模,以此发现用户的潜在 偏好并进行详尽的推荐。
[0051] 下面结合附图对本发明的技术方案进行详细说明:
[0052] 步骤 1).
[0053] 数据收集:在应用商店如GooglePlay里,用户对他所使用过的APP的评级是公开 可见的,一旦获得用户的ID就能看到用户所评论过的所有APP。由此可以通过爬数据工具 将所有原始数据如用户评论及功能描述检索出来。举例如下:假设用户Sarah想要找一款 导航APP,在此之前用户使用过YellowPages与CommanderCompassLite两款导航APP, 图2为GoogleMaps的功能描述信息,此APP是用户Sarah未使用过的,图3为Sarah对 YellowPages的用户评论信息,图4为Sarah对CommanderCompassLite的用户评论信 息。
[0054] 步骤 2) ·
[0055] 对获取的原始APP数据进行预处理来避免出现冷启动问题。首先,清除写少于2 条评论的用户以及过滤用户后没有任何评论的APP。其次,进行托肯化即tokenization,分 另IJ去除标点符
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1