面向移动广告用户的手机游戏推荐方法

文档序号:10687065阅读:265来源:国知局
面向移动广告用户的手机游戏推荐方法
【专利摘要】本发明公开了一种面向移动广告用户的手机游戏推荐方法,手机用户在使用手机应用的时候,经常会点击一些手机应用推送的广告。手机用户的广告点击行为从某种程度上反映了手机用户的兴趣偏好。通过对广告介绍文档进行实体提取,根据手机用户的广告点击记录,构造出手机用户偏爱的广告实体集合。针对移动广告用户中具有游戏记录的用户,进一步提取用户偏爱的游戏实体集合、游戏集合,和广告实体集合共同刻画用户的兴趣偏好。针对具有游戏记录的移动广告用户,通过对用户模型进行余弦相似度计算,构建近邻用户集合,进行个性化推荐;针对没有游戏记录的移动广告用户,计算这些用户与具有游戏记录的广告用户的余弦相似度,构建近邻用户集合,从而进行个性化推荐。
【专利说明】
面向移动广告用户的手机游戏推荐方法
技术领域
[0001] 本发明涉及手机游戏推荐的技术领域,尤其是指一种面向移动广告用户的手机游 戏推荐方法。
【背景技术】
[0002] 随着互联网的飞速发展,人们日常生活中面临的信息与日倶增。为解决人们面对 海量信息的无所适从,推荐系统应运而生。当前的推荐算法分为三种:基于协同过滤的推荐 系统、基于内容的推荐系统、以及混合的推荐系统。基于协同过滤的推荐系统主要包括 User-Based、Item-Based和Model-Based等技术。亚马逊购物网站主要使用Item-Based技 术,通过对用户的历史记录分析,给用户进行个性化推荐。基于内容的推荐系统,主要是构 建物品、用户的特征向量,通过计算特征向量的相似度进行个性化推荐。当前一些新闻网站 主要使用基于内容的推荐系统。混合型推荐系统,是将基于协同过滤的推荐系统和基于内 容的推荐系统进行结合,吸取两者的优点,具有更广的适应范围。
[0003] 手机用户的与日倶增以及手机游戏独特的吸引力,使得给手机用户个性化推荐游 戏成为大势所趋。然而,手机游戏推荐领域具有与传统推荐所不同的特点:用户游戏周期 长、手机用户游戏记录少。因此,手机游戏推荐与传统推荐相比,数据具有更大的稀疏性。而 在移动互联网中,移动广告是普遍存在的,很多用户在安装和使用移动应用时常常会点击 到推送的广告,从而成为移动广告用户。从移动广告用户挖掘潜在的手机游戏用户,为他们 推荐合适的手机游戏,在推动手机游戏营销的同时,使得移动广告的推送更加精准化,有利 于促进手机游戏行业和移动广告行业的共赢发展。
[0004] 手机用户在不同领域的行为隐含着用户的兴趣偏好,并且具有一定的相关性。相 比使用单一游戏领域的用户数据进行手机游戏推荐,结合用户在广告领域的行为数据,能 更好地刻画用户的兴趣,从而进一步提升手机游戏推荐的准确性以及多样性。

【发明内容】

[0005] 本发明的目的在于克服现有技术的不足,提供一种面向移动广告用户的手机游戏 推荐方法,通过利用移动用户在广告领域的行为数据以及在游戏领域的行为数据,更加完 整地刻画用户兴趣偏好,进而更好地对用户进行建模和游戏推荐。该方法具有良好的扩展 性,并且可以应用在其他推荐领域。
[0006] 为实现上述目的,本发明所提供的技术方案为:面向移动广告用户的手机游戏推 荐方法,包括以下步骤:
[0007] 1)通过对广告和游戏的介绍内容进行分词,利用基于图的关键词提取技术,获取 广告和游戏介绍内容中的标志性名词,即实体;
[0008] 2)针对具有游戏记录的移动广告用户,构建用户的广告集合和游戏集合,基于广 告和游戏介绍内容中的实体,构建用户的实体偏好集合;针对没有游戏记录的移动广告用 户,构建用户的广告集合,基于广告介绍内容中的实体,构建用户的实体偏好集合;
[0009] 3)针对具有游戏记录的移动广告用户,根据移动用户登录游戏的频率,构建移动 广告用户的游戏偏爱集合;
[0010] 4)针对具有游戏记录的移动广告用户,结合用户的实体偏好及用户的游戏偏好集 合,构建用户的特征向量;针对没有游戏记录的移动广告用户,基于用户的实体偏好,构建 用户的特征向量;
[0011] 5)针对具有游戏记录的移动广告用户,结合游戏实体、广告实体、游戏偏好集合三 个部分计算用户的近邻用户;针对没有游戏记录的移动广告用户,基于广告实体从具有游 戏记录的移动广告用户中寻找近邻用户;
[0012] 6)基于User-Based的推荐算法给用户提供游戏推荐列表。
[0013] 在步骤1)中,对游戏的介绍数据,使用带有词性标注的常用分词工具进行分词,这 样就将游戏介绍数据分解成文档-词的形式;在分词的过程中,过滤掉非名词性词汇;基于 图论中计算节点重要度的方法来计算各个实体节点的重要性;根据实体集合中实体的邻接 关系建立图,图中边的权重都为1,然后使用重启动的随机游走计算每个节点的rank值,公 式如1-1所示;
[0015]其中,rank(ei)表示实体ei在文档中的重要程度,a表示随机游走的重启动参数,In (e〇指的是实体ei的邻居集合,|〇ut(幻)|指的是实体幻邻居数目;
[0016]最后,根据每个实体的rank值,提取出每个游戏介绍数据rank值前N的实体;同理, 能够使用同样的方法计算出每个广告介绍数据的前N个实体。
[0017] 在步骤3)中,针对具有游戏记录的广告用户,在游戏数据集中,找出每个用户玩过 的游戏,将用户一周游戏登录记录超过两次的游戏,放入用户的游戏偏好集合;游戏偏好集 合作为用户特征的一部分,体现了用户在游戏选择上的偏好。
[0018] 在步骤4)中,针对在有过游戏记录的广告用户,将用户的广告实体集合、游戏实体 集合和游戏记录融合,从多个维度刻画用户的偏好情况,最终构建一个反映用户整体偏好 的特征向量,维度是用户游戏实体、广告实体以及游戏记录长度之和,形式如下所示:
[0019] 用户特征={{游戏实体1、游戏实体2……},{广告实体1、广告实体2……},{游戏 记录1、游戏记录2......}}
[0020] 针对没有游戏记录的广告用户,使用用户的广告实体集合构建用户特征向量,维 度是用户广告实体集合的长度,形式如下所示:
[0021] 用户特征={广告实体丨、广告实体2……}。
[0022] 在步骤5)中,计算两种不同广告用户的近邻列表,针对有过游戏记录的广告用户, 用户的相似度计算分为三部分:游戏实体的相似度、广告实体的相似度、游戏记录的相似 度,每一部分得出的相似度以不同的权重W1,W2,W3进行综合加权,计算出用户的最终相似 度;其中,W1,W2,W3根据实验需要进行调整,初始化为1/3、1/3、1/3,即三部分相似度计算结 果所占比重相同;计算公式如5-1所示:
[0023] Similar(ui,U2) =wi 氺 cosine(gameEntityi,gameEntity2)
[0024] +w2*cosine(adEntityi ,adEntity2)
[0025] +w3*cosine(gameListi,gameList2) (5-1)
[0026]其中,gameEntity是游戏实体集合,adEntity是广告实体集合,gameList是用户游 戏记录集合;其中cosine为余弦相似度,计算公式如5-2所示:
[0028]最终,根据余弦相似度的高低,找出用户的Top-N个近邻用户;
[0029] 针对没有游戏记录的广告用户,通过计算该用户与具有游戏记录的广告用户的余 弦相似度,来构建该用户的近邻用户列表,计算公式如下5-3所示:
[0030] Similar(ui,U2) = cosine(adEntityi,adEntity2) (5-3)
[0031] 其中,m是没有游戏记录的广告用户,u2是有游戏记录的广告用户,最终m的近邻 用户都是有游戏记录的广告用户。
[0032] 在步骤6)中,针对每个用户,根据其近邻用户中的游戏记录,使用以下公式进行推 荐:
[0034] 其中,Neigh(Ui)是Ui的Top-N近邻用户,gameList是用户游戏记录;
[0035]最终,根据grade的值从大到小,找出用户的前Top-K个游戏作为推荐列表。
[0036] 本发明与现有技术相比,具有如下优点与有益效果:
[0037] 1、针对没有游戏记录的移动广告用户,本发明利用该部分用户与具有游戏记录的 移动广告用户的相似性进行手机游戏推荐,克服了传统手机游戏推荐中的冷启动问题。
[0038] 2、针对具有游戏记录的广告用户,本发明从用户的广告实体偏好、游戏实体偏好 及游戏偏好集合出发,更加完整的刻画了用户偏好,在克服传统手机游戏推荐算法所面临 的数据稀疏性问题同时,提升了推荐的准确性和多样性。
【附图说明】
[0039] 图1为发明的手机游戏推荐方法流程图。
[0040] 图2为本发明的广告或游戏实体提取流程图。
[0041] 图3为本发明的广告介绍文档-实体二分图。
【具体实施方式】
[0042]下面结合具体实施例对本发明作进一步说明。
[0043] 如图1所示,本实施例所述的面向移动广告用户的手机游戏推荐方法,包括以下步 骤:
[0044] 1)通过对广告和游戏的介绍内容进行分词,利用基于图的关键词提取技术,获取 广告和游戏介绍内容中的标志性名词,即实体。
[0045] 实体指的是一些标志性的名词,在游戏中可以是一些朝代名(如三国、战国)、人名 (曹操、宋江)、地名(赤壁)等;在广告领域可以是一些领域名词(如金融、体育)、角色(潮爸、 辣妈)等。对游戏的介绍数据,使用带有词性标注的常用分词工具如HandLP、OpenCLAS等进 行分词,这样就将游戏介绍数据分解成文档-词的形式。在分词的过程中,过滤掉非名词性 词汇。此时由于文档的实体数仍然较多,故基于图论中计算节点重要度的方法来计算各个 实体节点的重要性。根据实体集合中实体的邻接关系建立图,图中边的权重都为1,然后使 用重启动的随机游走计算每个节点的rank值,公式如1-1所示。最后,根据每个实体的rank 值,提取出每个游戏介绍数据rank值前N的实体。使用同样的方法计算出每个广告介绍数据 的前N个实体。该步骤的流程如图2所示。
[0047] 其中,rank(ei)表示实体ei在文档中的重要程度,a表示随机游走的重启动参数,In (e〇指的是实体 ei的邻居集合,|〇ut(幻)|指的是实体幻邻居数目。
[0048] 2)针对具有游戏记录的移动广告用户,构建用户的广告集合和游戏集合,基于广 告和游戏介绍内容中的实体,构建用户的实体偏好集合;针对没有游戏记录的移动广告用 户,构建用户的广告集合,基于广告介绍内容中的实体,构建用户的实体偏好集合。
[0049] 移动广告中的用户分为两种:一种是具有游戏记录的用户;另一种是没有游戏记 录的用户。针对两种不同的广告用户,我们采用的推荐方法有所不同。但是在广告实体偏好 的构建上,采用相同的方法。
[0050] 一个用户如果对某个广告实体感兴趣,有很大可能性这个广告实体会出现在该用 户的点击过的多个广告介绍文档。根据手机用户的广告点击记录,构建广告-实体图,如图3 所示。其中顶点包括广告顶点、和实体顶点~、以及两类顶点之间的边E,边的权重计算采 用公式2-1。
[0052]广告-实体间的边E(Va,Ve)在两个方向上的权重不一样。从广告到实体的边权w (va, ve)由步骤1计算的rank值确定,体现了实体在广告介绍文档中的重要性;从实体到广告 的边权w(v e,va)定义为实体出度的倒数即1 /Out (v)。基于该图,使用随机游走算法找出rank 值最高的kl个节点,即用户喜欢的Top-kl个广告实体。
[0053]针对那些有过游戏记录的广告用户,对其玩过的游戏,使用相同的方法,得到这类 广告用户偏爱的Top_k2个游戏实体。
[0054] 3)针对具有游戏记录的移动广告用户,根据移动用户登录游戏的频率,构建移动 广告用户的游戏偏爱集合。具体是:针对具有游戏记录的广告用户,在游戏数据集中,找出 每个用户玩过的游戏,将用户一周游戏登录记录超过两次的游戏,放入用户的游戏偏好集 合。游戏偏好集合作为用户特征的一部分,体现了用户在游戏选择上的偏好。
[0055] 4)针对具有游戏记录的移动广告用户,结合用户的实体偏好及用户的游戏偏好集 合,构建用户的特征向量;针对没有游戏记录的移动广告用户,基于用户的实体偏好,构建 用户的特征向量。
[0056] 针对在有过游戏记录的广告用户,将用户的广告实体集合、游戏实体集合和游戏 记录融合,从多个维度刻画用户的偏好情况,最终构建一个反映用户整体偏好的特征向量, 维度是用户游戏实体、广告实体以及游戏记录长度之和。形式如下所示:
[0057] 用户特征={{游戏实体1、游戏实体2……},{广告实体1、广告实体2……},{游戏 记录1、游戏记录2......}}
[0058] 针对没有游戏记录的广告用户,使用用户的广告实体集合构建用户特征向量,维 度是用户广告实体集合的长度。形式如下所示:
[0059] 用户特征={广告实体丨、广告实体2……}。
[0060] 5)针对具有游戏记录的移动广告用户,结合游戏实体、广告实体、游戏偏好集合三 个部分计算用户的近邻用户;针对没有游戏记录的移动广告用户,基于广告实体从具有游 戏记录的移动广告用户中寻找近邻用户。
[0061] 计算两种不同广告用户的近邻列表。针对有过游戏记录的广告用户,用户的相似 度计算分为三部分:游戏实体的相似度、广告实体的相似度、游戏记录的相似度,每一部分 得出的相似度以不同的权重W1,W2,W3进行综合加权,计算出用户的最终相似度。其中,Wl,W2, W3根据实验需要进行调整,初始化为1/3、1/3、1/3,即三部分相似度计算结果所占比重相 同。计算公式如5-1所示:
[0062] Similar(ui,U2) =wi 氺 cosine(gameEntityi,gameEntity2)
[0063] +w2*cosine(adEntityi ,adEntity2)
[0064] +w3*cosine(gameListi,gameList2) (5-1)
[0065]其中,gameEntity是游戏实体集合,adEntity是广告实体集合,gameList是用户游 戏记录集合。其中cosine为余弦相似度,计算公式如5-2所示:
[0067]最终,根据余弦相似度的高低,找出用户的Top-N个近邻用户。
[0068] 针对没有游戏记录的广告用户,我们通过计算该用户与具有游戏记录的广告用户 的余弦相似度,来构建该用户的近邻用户列表,计算公式如下5-3所示:
[0069] Similar(ui,U2) = cosine(adEntityi,adEntity2) (5-3)
[0070] 其中,m是没有游戏记录的广告用户,u2是有游戏记录的广告用户,最终m的近邻 用户都是有游戏记录的广告用户。
[0071] 6)基于User-Based的推荐算法给用户提供游戏推荐列表。
[0072] 针对每个用户,根据其近邻用户中的游戏记录,使用以下公式进行推荐:
[0074] 其中,Neigh(Ui)是Ui的Top-N近邻用户,gameList是用户游戏记录;
[0075]最终,根据grade的值从大到小,找出用户的前Top-K个游戏作为推荐列表。
[0076]以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故 凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
【主权项】
1. 面向移动广告用户的手机游戏推荐方法,其特征在于,包括以下步骤: 1) 通过对广告和游戏的介绍内容进行分词,利用基于图的关键词提取技术,获取广告 和游戏介绍内容中的标志性名词,即实体; 2) 针对具有游戏记录的移动广告用户,构建用户的广告集合和游戏集合,基于广告和 游戏介绍内容中的实体,构建用户的实体偏好集合;针对没有游戏记录的移动广告用户,构 建用户的广告集合,基于广告介绍内容中的实体,构建用户的实体偏好集合; 3) 针对具有游戏记录的移动广告用户,根据移动用户登录游戏的频率,构建移动广告 用户的游戏偏爱集合; 4) 针对具有游戏记录的移动广告用户,结合用户的实体偏好及用户的游戏偏好集合, 构建用户的特征向量;针对没有游戏记录的移动广告用户,基于用户的实体偏好,构建用户 的特征向量; 5) 针对具有游戏记录的移动广告用户,结合游戏实体、广告实体、游戏偏好集合三个部 分计算用户的近邻用户;针对没有游戏记录的移动广告用户,基于广告实体从具有游戏记 录的移动广告用户中寻找近邻用户; 6) 基于User-Based的推荐算法给用户提供游戏推荐列表。2. 根据权利要求1所述的面向移动广告用户的手机游戏推荐方法,其特征在于:在步骤 1)中,对游戏的介绍数据,使用带有词性标注的常用分词工具进行分词,这样就将游戏介绍 数据分解成文档-词的形式;在分词的过程中,过滤掉非名词性词汇;基于图论中计算节点 重要度的方法来计算各个实体节点的重要性;根据实体集合中实体的邻接关系建立图,图 中边的权重都为1,然后使用重启动的随机游走计算每个节点的rank值,公式如1-1所示;其中,rank(ei)表示实体&在文档中的重要程度,a表示随机游走的重启动参数,In(ei) 指的是实体ei的邻居集合,|〇ut(ej) |指的是实体幻邻居数目; 最后,根据每个实体的rank值,提取出每个游戏介绍数据rank值前N的实体;同理,能够 使用同样的方法计算出每个广告介绍数据的前N个实体。3. 根据权利要求1所述的面向移动广告用户的手机游戏推荐方法,其特征在于:在步骤 3) 中,针对具有游戏记录的广告用户,在游戏数据集中,找出每个用户玩过的游戏,将用户 一周游戏登录记录超过两次的游戏,放入用户的游戏偏好集合;游戏偏好集合作为用户特 征的一部分,体现了用户在游戏选择上的偏好。4. 根据权利要求1所述的面向移动广告用户的手机游戏推荐方法,其特征在于:在步骤 4) 中,针对在有过游戏记录的广告用户,将用户的广告实体集合、游戏实体集合和游戏记录 融合,从多个维度刻画用户的偏好情况,最终构建一个反映用户整体偏好的特征向量,维度 是用户游戏实体、广告实体以及游戏记录长度之和,形式如下所示: 用户特征={{游戏实体1、游戏实体2……},{广告实体1、广告实体2……},{游戏记录 1、游戏记录2……}} 针对没有游戏记录的广告用户,使用用户的广告实体集合构建用户特征向量,维度是 用户广告实体集合的长度,形式如下所示: 用户特征={广告实体1、广告实体2……}。5. 根据权利要求1所述的面向移动广告用户的手机游戏推荐方法,其特征在于:在步骤 5) 中,计算两种不同广告用户的近邻列表,针对有过游戏记录的广告用户,用户的相似度计 算分为三部分:游戏实体的相似度、广告实体的相似度、游戏记录的相似度,每一部分得出 的相似度以不同的权重W1,W2,W3进行综合加权,计算出用户的最终相似度;其中,W1,W2,W3根 据实验需要进行调整,初始化为1/3、1/3、1/3,即三部分相似度计算结果所占比重相同;计 算公式如5-1所示: Similar(ui,U2) =wi 氺 cosine (gameEntityi,gameEntity2) +W2*cosine(adEntityi,adEntity2) +W3*cosine(gameListi,gameList2) (5-1) 其中,gameEntity是游戏实体集合,adEntity是广告实体集合,gameList是用户游戏记 录集合;其中cosine为余弦相似度,计算公式如5-2所示:最终,根据余弦相似度的高低,找出用户的Top-N个近邻用户; 针对没有游戏记录的广告用户,通过计算该用户与具有游戏记录的广告用户的余弦相 似度,来构建该用户的近邻用户列表,计算公式如下5-3所示: Similar(ui,U2) = cosine (adEntityi,adEntity2) (5-3) 其中,m是没有游戏记录的广告用户,u2是有游戏记录的广告用户,最终m的近邻用户 都是有游戏记录的广告用户。6. 根据权利要求1所述的面向移动广告用户的手机游戏推荐方法,其特征在于:在步骤 6) 中,针对每个用户,根据其近邻用户中的游戏记录,使用以下公式进行推荐:其中,Neigh(m)是m的Top-N近邻用户,gameList是用户游戏记录; 最终,根据grade的值从大到小,找出用户的前Top-K个游戏作为推荐列表。
【文档编号】G06F17/30GK106055566SQ201610333697
【公开日】2016年10月26日
【申请日】2016年5月19日
【发明人】董守斌, 魏向前, 胡金龙, 袁华, 董守玲
【申请人】华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1