基于三维时序动态模型的手机游戏推荐系统的制作方法

文档序号:10553078阅读:356来源:国知局
基于三维时序动态模型的手机游戏推荐系统的制作方法
【专利摘要】本发明公开了一种基于三维时序动态模型的手机游戏推荐系统,包括用户行为数据获取模块、游戏信息获取模块、用户行为分析模块、游戏标签模块、时序动态模型模块、游戏推荐模块。本发明系统根据获取的用户行为数据进行用户动态行为分析,并追踪新老用户的兴趣变化,在用户兴趣发生变化或可能流失时,综合考虑与用户兴趣游戏相似度较高的游戏以及游戏的热门度,给用户最优的推荐结果。本发明结合游戏和用户的时效性,制定了基于时间窗的用户活跃度评分计算方法。并引用游戏标签来对用户进行相应的映射,从而丰富了游戏推荐的多样性,让用户感受不断有新元素变化的游戏推荐,增强了游戏推荐的新颖性。
【专利说明】
基于三维时序动态模型的手机游戏推荐系统
技术领域
[0001] 本发明涉及产品推荐的技术领域,尤其是指一种基于三维时序动态模型的手机游 戏推荐系统。
【背景技术】
[0002] 随着大数据时代的到来和手机游戏越来越盛行,手机游戏用户呈现爆炸式增长。 游戏运营平台一般直接把热门游戏推荐给用户,并未充分利用用户的信息,进行针对性的 个性化推荐。盲目的推荐结果会给用户带来困扰,并增加企业的推广费用,这使得目前游戏 运营平台的游戏用户流失率很高。手机游戏运营平台竞争激烈,如何吸引新用户并且继续 留住平台的老用户是游戏运营平台的核心问题。因此结合大数据分析用户行为,捕捉用户 的动态兴趣变化,利用用户的动态行为信息具有重大的意义。本发明利用张量模型的优势, 提出三维时序动态推荐方法,深入挖掘用户的潜在时间行为信息,提高推荐效果,将有利于 改善用户的体验感,减少用户的流失率。
[0003] 传统的协同过滤的推荐算法,存在用户的冷启动问题和数据稀疏性问题,但基于 张量分解的推荐算法能够很好的处理上述问题,于是张量分解模型开始被各个领域所应 用,例如医学上的药品个性化推荐,基于用户信任的社会网络推荐等;张量模型中张量分解 方法分为CP分解和Tucker分解两种方法。本发明引用张量Tucker分解方法,张量Tucker分 解方法是将一个张量表示成一个核心张量,沿着不同维度乘上因子矩阵,简单来讲就是将 复杂的矩阵,分解为多个简单矩阵的乘积,减少计算量。目前游戏运营平台也同样存在着数 据稀疏性的问题,引用张量模型结合时间信息在游戏领域应用是一个新领域的尝试,与此 同时还能够利用张量模型的另外一个优点,不破坏数据的结构特性,减少信息的丢失,并能 够减缓数据稀疏问题,提高推荐性能,增加游戏收益。

【发明内容】

[0004] 本发明的目的在于克服现有技术的不足,提供一种基于三维时序动态模型的手机 游戏推荐系统,能够实时捕捉用户的动态兴趣变化并结合用户的历史兴趣进行相应的游戏 推荐。
[0005] 为实现上述目的,本发明所提供的技术方案为:基于三维时序动态模型的手机游 戏推荐系统,包括:
[0006] 用户行为数据获取模块,从相关游戏运营平台获取用户行为日志;
[0007] 游戏信息获取模块,通过对相应手机游戏推荐平台的官网对游戏的简介信息进行 爬取与数据预处理;
[0008] 用户行为分析模块,在导入用户行为日志后,对日志进行数据分析、数据向量化, 构成用户的特征向量;
[0009] 游戏标签模块,通过相关的游戏内容简介进行相应游戏标签标注,并将标签转换 为向量形式;
[0010]时序动态模型模块,根据游戏标签模块和用户行为分析模块,基于张量模型建立 相应的三维时序动态模型,挖掘潜在用户,分析用户的动态兴趣与热门的游戏标签随时间 的变化发生变化;
[0011]游戏推荐模块,根据时序动态模型进行相应的计算,得到用户的动态兴趣和当时 游戏标签的热门度,与此同时结合用户的历史兴趣,给出相应的游戏标签推荐,并发布在游 戏运营平台上。
[0012] 所述用户行为数据获取模块,从游戏运营平台采集用户行为数据,并以日志的形 式存储,而游戏运营平台通过游戏用户对游戏产生的行为,生成相应的游戏日志传输到相 应游戏平台的服务器端;
[0013] 所述用户行为数据,包括:
[0014] 用户的手机硬件信息,包括imei、手机型号、手机卡的运营商、手机的屏幕大小;
[0015] 用户对游戏的登陆信息:登陆时间,登陆的游戏;
[0016] 用户玩游戏的信息:等级变化的时间,玩游戏的等级;
[0017] 用户的充值信息:充值的时间、充值额。
[0018] 所述游戏信息获取模块,通过对相应的游戏运营平台,对相应的游戏利用检索爬 虫系统,爬取相应的游戏内容简介,并整理数据。
[0019] 所述用户行为分析模块,对每个日志进行相应的数据分析处理,初始化日志用于 分析用户硬件信息的字段有:imei、time、bd、cn、sw、sh,其中imei是用户的手机唯一标识, 进行了保护用户隐私处理,用该字段分析用户的依据是游戏平台推广的统一,time是记录 相应时刻的时间戳字段,然后通过时间戳转化成年、月、日、时、周,bd是用户的机型品牌,cn 是运营商名称字段,sw和sh分别是用户手机屏幕的宽和高,将文字信息量化,方便模型的分 析,登陆日志用于分析用户活跃度评分的字段:加^、^!11 6、&1(1,其中&1(1是游戏的1(1,将游 戏量化的一种编号,计算用户活跃度评分;
[0020] 用户活跃度评分计算,根据当前时间窗,用户在时间窗内,最高分记为M,最低分记 为1;计算公式:
[0021 ] ffDUrating =UMax_UMin
[0022] 其中,WDUrating表不为用户的周活跃度评分,UMax为用户在时间窗最后一次登陆的 分数,UMin为用户在时间窗第一次登陆的分数,分数就是相应的天数,时间窗内以第一天登 录的记为分数1;这样划分的依据是能够发现潜在信息,并不影响评分;同时也能够很好的 将活跃用户和不活跃用户即只出现一次的登录用户区别开;另外一个目的是减少计算量, 推进一天,大部分信息对第二个评分窗具有参考意义,时间衔接时,评分规则一样,另外考 虑手游的特性,需要将用户活跃度评分最高的分值对应的游戏存取作为用户参考的历史兴 趣;随着用户的活跃度的提升,不影响模型的稳定性;等级日志用于分析用户对游戏喜爱度 评分的字段有:丨1116;[、1:;[1116、31(1、坪抑(16,其中坪抑(16是用户玩游戏的相应等级,用户对游戏 的喜爱度评分,通过用户玩家对游戏的等级来说明用户对该游戏的一种喜爱度,设置多个 用户等级阈值,评分范围在1-M;结合用户活跃度评分进行数据互相填补,用户同时出现在 两个表的取最大分数作为用户对游戏的评分,将用户喜爱度评分表与用户活跃度表进行表 融合并成为用户活跃度评分表,将对应的游戏存储作为用户的历史兴趣;消费日志用于分 析用户的历史兴趣的字段有:imei、create_time、aid、pay_realmoney,其中pay_realmoney 是用户充值真实额,对用户pay_realmoney大于0的作为用户对游戏喜爱的历史兴趣存储。
[0023]所述游戏标签模块,包含游戏标签、游戏相似列表、热门游戏标签列表;其中游戏 标签是根据游戏内容简介中游戏的关键词,作为相应游戏的标签;然后根据游戏标签的频 率,对游戏标签赋予不同的权值,根据相应的标签的最高频率值进行单位化使得所有标签 权值范围在〇-1;将游戏名称和标签名称相应的量化,游戏根据游戏日志中aid对应起来,并 建立游戏标签的向量,(Bi,Wi,…,B n,Wn),Bi为标签,Wi为对于标签的权值;某个游戏的相似 列表根据某个游戏的aid对应的标签向量,根据余弦相似度计算,得到该游戏的相应游戏相 似列表;相似度计算公式:
[0025]其中,Sim为余弦相似度,(a,b)为a的向量与b的向量内积,| |a| |,| |b| |分别为a向 量的模长,b向量的模长,a、b是游戏aid的特征向量,相似度计算都是以余弦相似度计算为 准,热门游戏标签列表是时间窗内对游戏标签频率前n个最高,求出时间窗内热门游戏标签 列表。
[0026] 所述时序动态模型模块,包含时间窗、用户行为的特征、游戏标签,时间窗是指一 个时间段的窗口,根据不同数据集特性改变;用户行为的特征是根据用户对游戏的活跃度 评分结合用户对游戏的喜爱度评分融合的表,并结合游戏标签的向量表,然后引用张量模 型根据用户、游戏、游戏标签建立时序动态模型,并通过张量Tucker分解方法,调节张量分 解相关参数,利用用户-游戏,游戏_游戏标签信息,得到用户对某个游戏某些标签新的评分 估值;利用张量模型中的用户对游戏某些标签权值,整合为用户对标签的相应的特征向量, 然后结合游戏-标签两个维度,对用户-标签与游戏-标签求相似度就能够得到用户评分高 的前N个游戏标签列表;张量的定义:设%,…,V N为维数分别为h,…,In的N个有限维欧几里 得空间,对于N个向量uiGVi,'",unGVN,定义ViX…XVn上的线性映射(ur"u n)计算如下:
[0027] (ur-'Un) (xr"XN) = <Ul,Xl>Vr'-<Un,XN>VN
[0028] 其中,<m,Xi> Vi为Vi上的标量积,Xi为Vi上的任意向量(i = 1,i = 2,…,N),则整 个(ur"un)构成的空间称为Vi,…,Vn的张量空间,此张量空间上的兀素称为Vi X…X Vn上的 N阶张量;如果匕=#,《 = …,#,则此张量空间分别称为N阶Ii,…,IN维实张量空间,记为 i?/lX '〃、;而对于N阶张量,其矩阵展开形式^张量的元素(h,i2,…, N' iN)映射到矩阵元素(in,j),映射关系为= 1 + 张量Tucker分解方法是一种高 阶的主成分分析方法,它将原始张量分解为核心张量和一系列矩阵乘积的形式,张量分解 在求解过程中能够进行降维处理;Tucker分解方法,一个张量尤按下面公式去理 解:
[0029] X ~YXU(1)XU(2)X."XU(n)
[0030]其中,Y为核心张量;U(1),U(2),…,U(N)为一系列正交矩阵,根据投影矩阵U的正交性 UUT = E,其中UT为U的转置矩阵,E为单位矩阵;从而能够根据上面的张量X公式,两边乘以U(1 )T,U (2)T,…,U(N)T,求得核心张量Y:
[0031] y^xxu(1)txu(2)t---xu(n)t
[0032] 时序动态模型的建立,数据是一个四维的数据元组(u,g,k,t),是一个用户u,g是 一个游戏,k是一个标签,t是某个时间窗;模型根据用户-游戏-标签建立一个三阶张量 x ~'n〇〇是用户的集合,n⑷是游戏的集合,是某一游戏的标签集合;在某个 时间窗内,得到一个用户-游戏-标签的三元权值Wu,g,k,根据三元权值建立张量模型,模型张 量公式:
[0033]
[0034] 其中,Yt 是核心张量,表示用户、游戏、标签之间的关系;U丨u) eRn~u) 表示用户的相关矩阵,Gf e iT表示游戏的相关矩阵,Kf1 e 表示标签的相关矩 阵;在某个时间窗内,Wu,g,k的计算根据用户对该游戏的活跃度评分乘以标签的权值得到, 1,{^ =八11,0811,{^,其中11£1^^£1^,1^1 1?^,{;表示用户对某个游戏的活跃度评分, Bu,g,k表示对于给定用户u、游戏g、标签k在标签向量中的权重值,并且满足约束条件 Za.w 1=11 k 。
[0035] 所述游戏推荐模块,包含用户喜欢的游戏标签列表、游戏对应的标签、用户喜欢的 游戏、游戏平台对用户进行相应游戏应用推荐,用户喜爱的游戏标签列表是由时序动态模 型模块得到,游戏对应的标签是由游戏标签模块得到,用户喜欢的游戏列表是通过用户喜 欢的游戏标签表和游戏对应的标签,映射得到的结果表,用户喜欢的游戏是通过筛选和权 值得到,筛选和权值考虑是根据用户喜欢的游戏列表结合该用户的历史兴趣游戏列表和热 门的游戏标签列表,对用户喜欢的游戏列表赋予权值a,对用户的历史兴趣游戏列表赋予权 值0,且满足a+P=l,调节的权值,得到一个新的用户喜欢的游戏列表,再结合热门的游 戏标签进行优先筛选,游戏列表中有游戏的标签包含热门标签的优先推荐,达到推荐更具 新颖性结果;从而得到用户喜欢的游戏,游戏平台对用户进行相应游戏应用推荐是根据用 户喜欢的游戏转换为游戏应用推荐,从而达到最后根据用户兴趣变化与当前游戏热门度给 出推荐。
[0036] 本发明与现有技术相比,具有如下优点与有益效果:
[0037] 1、本发明的基于三维时序动态模型的手机游戏推荐系统,根据获取的用户行为数 据进行用户动态行为分析,并追踪新老用户的兴趣变化,在用户兴趣发生变化或可能流失 时,综合考虑与用户兴趣游戏相似度较高的游戏以及游戏的热门度,给用户最优的推荐结 果。
[0038] 2、本发明结合游戏和用户的时效性,制定了基于时间窗的用户活跃度评分计算方 法。并引用游戏标签来对用户进行相应的映射,从而丰富了游戏推荐的多样性,让用户感受 不断有新元素变化的游戏推荐,增强了游戏推荐的新颖性。
[0039] 3、本发明引用张量模型建立三维时序动态模型,是一个创新亮点,而引用张量模 型的优势是,不破坏数据的结构特性,减少信息的丢失。本发明的技术方案根据不同时间段 用户对游戏标签不同的偏爱,了解用户的兴趣变化,能够在很好地留住老用户的同时减少 新用户的流失,并改善用户的体验感。并通过针对性的游戏推荐使得游戏运营公司可根据 用户的行为习惯做出相应的策略调整,并减少营销推广费用。
【附图说明】
[0040] 图1为本发明的手机游戏推荐系统的原理框图。
[0041] 图2为本发明的用户行为分析模块的原理框图。
[0042]图3为本发明的游戏标签模块的原理框图。
[0043]图4为本发明的时序动态模型模块的原理框图。
[0044] 图5为本发明的游戏推荐模块的原理框图。
[0045] 图6为用户活跃度评分计算的原理框图。
[0046]图7为张量Tucker分解的原理框图。
【具体实施方式】
[0047]下面结合具体实施例对本发明作进一步说明。
[0048]如图1所示,本实施例所述的基于三维时序动态模型的手机游戏推荐系统,包括用 户行为数据获取模块、游戏信息获取模块、用户行为分析模块、游戏标签模块、时序动态模 型模块、游戏推荐模块。所述的用户行为数据获取模块是从相关游戏运营平台获取用户行 为日志;所述的游戏信息获取模块,通过对相应手机游戏推荐平台的官网对游戏的简介信 息进行爬取与数据预处理;所述的用户行为分析模块在导入用户行为日志后,对日志进行 数据分析、数据向量化,构成用户的特征向量;所述的游戏标签模块,通过相关的游戏内容 简介进行相应游戏标签标注,并将标签转换为向量形式;所述的时序动态模型模块,根据游 戏标签模块和用户行为分析模块,基于张量模型建立相应的三维时序动态模型,挖掘潜在 用户,分析用户的动态兴趣与热门的游戏标签随时间的变化发生变化;所述的游戏推荐模 块,根据时序动态模型进行相应的计算,得到用户的动态兴趣和当时游戏标签的热门度,与 此同时结合用户的历史兴趣,给出相应的游戏标签推荐,并发布在游戏运营平台上。
[0049] 下面对各个模块的具体实现原理进行阐述:
[0050] 所述的用户行为数据获取模块,是从游戏运营平台采集用户行为数据,并以日志 的形式存储,而游戏运营平台通过游戏用户对游戏产生的行为,生成相应的游戏日志传输 到相应游戏平台的服务器端。用户行为数据包括:用户的手机硬件信息,包括imei(用户的 手机唯一标示符)、手机型号、手机卡的运营商、手机的屏幕大小等;用户对游戏的登陆信 息:登陆时间,登陆的游戏等;用户玩游戏的信息:等级变化的时间,玩游戏的等级等;用户 的充值信息:充值的时间、充值额等。
[0051] 所述的游戏信息获取模块,通过对相应的游戏运营平台,对相应的游戏利用一般 的检索爬虫系统,爬取相应的游戏内容简介,并整理数据。
[0052]如图2所示,所述的用户行为分析模块,对每个日志进行相应的数据分析处理,初 始化日志用于分析用户硬件信息的字段有:imei、time、bd、cn、sw、sh,其中imei是用户的手 机唯一标识,进行了保护用户隐私处理,用该字段分析用户的依据是游戏平台推广的统一, time是记录相应时刻的时间戳字段,然后通过时间戳转化成年、月、日、时、周,bd是用户的 机型品牌,cn是运营商名称字段,sw和sh分别是用户手机屏幕的宽和高,我们需要将文字信 息量化,方便模型的分析,登陆日志用于分析用户活跃度评分的字段:加^、^!11 6、&1(1,其中 aid是游戏的id,将游戏量化的一种编号,计算用户活跃度评分。
[0053] 如图6所示,为本发明用户活跃度评分计算,根据当前时间窗,用户在时间窗内,最 高分记为M,最低分记为1;计算公式:
[0054] ffDUrating =UMax_UMin
[0055] 其中,WDUrating表不为用户的周活跃度评分,UMax为用户在时间窗最后一次登陆的 分数,UMin为用户在时间窗第一次登陆的分数,分数就是相应的天数,时间窗内以第一天登 录的记为分数1;这样划分的依据是能够发现潜在信息,并不影响评分(例如:用四个特征去 存取这样的信息,第一个特征存取参考基准,第二个记录评分的当天是周几,第三个基于参 考点的间隔天数,第四个基于评分规则评分,发掘用户的潜在信息,并有利于分析用户行 为);同时也能够很好的将活跃用户和不活跃用户(只出现一次的登录用户)区别开;另外一 个目的是减少计算量,推进一天,大部分信息对第二个评分窗具有参考意义,时间衔接时, 评分规则一样,另外考虑手游的特性,需要将用户活跃度评分最高的分值对应的游戏存取 作为用户参考的历史兴趣;随着用户的活跃度的提升,不影响模型的稳定性;等级日志用于 分析用户对游戏喜爱度评分的字段有:丨11?3;[、1:;[1116、31(1、找抑(16,其中找抑(16是用户玩游戏 的相应等级,用户对游戏的喜爱度评分,例如,通过用户玩家对游戏的等级来说明用户对该 游戏的一种喜爱度,设置多个用户等级阈值,评分范围在1-M;结合用户活跃度评分进行数 据互相填补,用户同时出现在两个表的取最大分数作为用户对游戏的评分,将用户喜爱度 评分表与用户活跃度表进行表融合并成为用户活跃度评分表,将他对应的游戏存储作为用 户的历史兴趣;消费日志用于分析用户的历史兴趣的字段有:imei、create_time、aid、pay_ realmoney,其中pay_realmoney是用户充值真实额,对用户pay_realmoney大于0的作为用 户对游戏喜爱的历史兴趣存储。
[0056]如图3所示,所述的游戏标签模块,该模块包含游戏标签、游戏相似列表、热门游戏 标签列表;其中游戏标签是根据游戏内容简介中游戏的关键词,作为相应游戏的标签;然后 根据游戏标签的频率,对游戏标签赋予不同的权值,根据相应的标签的最高频率值进行单 位化使得所有标签权值范围在0-1;将游戏名称和标签名称相应的量化,游戏根据游戏日志 中aid对应起来,并建立游戏标签的向量,浪力,…,B n,Wn),Bi为标签,Wi为对于标签的权 值;某个游戏的相似列表根据某个游戏的aid对应的标签向量,根据余弦相似度计算,得到 该游戏的相应游戏相似列表;相似度计算公式:
[0058]其中,Sim为余弦相似度,(a,b)为a的向量与b的向量内积,| |a| |,| |b| |分别为a向 量的模长,b向量的模长,a、b是游戏aid的特征向量,本发明中的相似度计算都是以余弦相 似度计算为准,热门游戏标签列表是时间窗内对游戏标签频率前n个最高,求出时间窗内热 门游戏标签列表。
[0059]如图4所示,所述的时序动态模型模块,该模块包含时间窗、用户行为的特征、游戏 标签,时间窗是指例如一个星期为一个时间段的窗口,根据不同数据集特性改变;用户行为 的特征是根据用户对游戏的活跃度评分结合用户对游戏的喜爱度评分融合的表,并结合游 戏标签的向量表,然后引用张量模型根据用户、游戏、游戏标签建立时序动态模型,并通过 张量Tucker分解方法如图7,调节张量分解相关参数(例如:核心张量的维度)利用用户-游 戏,游戏_游戏标签信息,得到用户对某个游戏某些标签新的评分估值。利用张量模型中的 用户对游戏某些标签权值,整合为用户对标签的相应的特征向量,然后结合游戏-标签两个 维度,对用户-标签与游戏-标签求相似度就可以得到用户评分高的前N个游戏标签列表;张 量的定义:设h,…,VN为维数分别为h,…,In的N个有限维欧几里得空间,对于N个向量m e Vi,…,uneVn,定义Vi X…XVn上的线性映射(ur"un)计算如下:
[0060] (Ul.._Un) (XI…XN) = <Ul,Xl>Vl…<Uii,XN>Vn
[0061] 其中,<Ui,Xi>Vi为Vi上的标量积,xi为Vi上的任意向量(i = l,i = 2,…,N),则整 个(U1…un)构成的空间称为Vi,…,Vn的张量空间,此张量空间上的兀素称为Vi X…X Vn上的 N阶张量。如果匕=i?iR,n = 1,…,N,则此张量空间分别称为N阶Ii,…,In维实张量空间,记为 而对于N阶张量d 其矩阵展开形式& e 张量的元素(h,i2,…, N iN)映射到矩阵元素(in,j),映射关系为= ] + - HA张量Tucker分解方法是一种高阶 i=1 :; 的主成分分析方法,它将原始张量分解为核心张量和一系列矩阵乘积的形式,张量分解在 求解过程中可以进行降维处理;Tucker分解方法,一个张量可以按下面公式和 图7去理解:
[0062] X^YXU(1)XU(2)X---XU(n)
[0063]其中,Y为核心张量;U(1),U(2),…,U(N)为一系列正交矩阵,根据投影矩阵U的正交性 UUT = E,其中UT为U的转置矩阵,E为单位矩阵;我们从而可以根据上面的张量X公式,两边乘 以U(1)T,U (2)T,…,U(N)T,可以求得核心张量Y:
[0064] Y^XXU(1)tXU(2)t---XU(n)t
[0065] 时序动态模型的建立,数据是一个四维的数据元组(u,g,k,t),是一个用户u,g是 一个游戏,k是一个标签,t是某个时间窗;模型根据用户-游戏-标签建立一个三阶张量 〇〇是用户的集合,n(g〉是游戏的集合,n (k〉是某一游戏的标签集合;在某个 时间窗内,可以得到一个用户-游戏-标签的三元权值Wu,g,k,根据三元权值建立张量模型,模 型张量公式:
[0066] xK\k)
[0067] 其中,Yt elT(uW(sVW是核心张量,表示用户、游戏、标签之间的关系; 表示用户的相关矩阵,Gf e 表示游戏的相关矩阵,Kf1eiTltW(k>表示标签的相关矩 阵;在某个时间窗内,Wu,g,k的计算根据用户对该游戏的活跃度评分乘以标签的权值得到, 1,{^ =八11,0811,{^,其中11£1^^£1^,1^1 1?^,{;表示用户对某个游戏的活跃度评分, Bu,g,k表示对于给定用户u、游戏g、标签k在标签向量中的权重值,并且满足约束条件 1X^1 k 〇
[0068] 如图5所示,所述的游戏推荐模块,该模块包含用户喜欢的游戏标签列表、游戏对 应的标签、用户喜欢的游戏、游戏平台对用户进行相应游戏应用推荐,用户喜爱的游戏标签 列表是由时序动态模型模块得到,游戏对应的标签是由游戏标签模块得到,用户喜欢的游 戏列表是通过用户喜欢的游戏标签表和游戏对应的标签,映射得到的结果表,用户喜欢的 游戏是通过筛选和权值得到,筛选和权值考虑是根据用户喜欢的游戏列表结合该用户的历 史兴趣游戏列表和热门的游戏标签列表,对用户喜欢的游戏列表赋予权值a,对用户的历史 兴趣游戏列表赋予权值0,且满足a+0=l,调节的权值,得到一个新的用户喜欢的游戏列 表,再结合热门的游戏标签进行优先筛选,游戏列表中有游戏的标签包含热门标签的优先 推荐,达到推荐更具新颖性结果;从而得到用户喜欢的游戏,游戏平台对用户进行相应游戏 应用推荐是根据用户喜欢的游戏转换为游戏应用推荐,从而达到最后根据用户兴趣变化与 当前游戏热门度给出推荐。
[0069]以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故 凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
【主权项】
1. 基于=维时序动态模型的手机游戏推荐系统,其特征在于,包括: 用户行为数据获取模块,从相关游戏运营平台获取用户行为日志; 游戏信息获取模块,通过对相应手机游戏推荐平台的官网对游戏的简介信息进行爬取 与数据预处理; 用户行为分析模块,在导入用户行为日志后,对日志进行数据分析、数据向量化,构成 用户的特征向量; 游戏标签模块,通过相关的游戏内容简介进行相应游戏标签标注,并将标签转换为向 量形式; 时序动态模型模块,根据游戏标签模块和用户行为分析模块,基于张量模型建立相应 的=维时序动态模型,挖掘潜在用户,分析用户的动态兴趣与热口的游戏标签随时间的变 化发生变化; 游戏推荐模块,根据时序动态模型进行相应的计算,得到用户的动态兴趣和当时游戏 标签的热口度,与此同时结合用户的历史兴趣,给出相应的游戏标签推荐,并发布在游戏运 营平台上。2. 根据权利要求1所述的基于=维时序动态模型的手机游戏推荐系统,其特征在于:所 述用户行为数据获取模块,从游戏运营平台采集用户行为数据,并W日志的形式存储,而游 戏运营平台通过游戏用户对游戏产生的行为,生成相应的游戏日志传输到相应游戏平台的 服务器端; 所述用户行为数据,包括: 用户的手机硬件信息,包括imei、手机型号、手机卡的运营商、手机的屏幕大小; 用户对游戏的登陆信息:登陆时间,登陆的游戏; 用户玩游戏的信息:等级变化的时间,玩游戏的等级; 用户的充值信息:充值的时间、充值额。3. 根据权利要求1所述的基于=维时序动态模型的手机游戏推荐系统,其特征在于:所 述游戏信息获取模块,通过对相应的游戏运营平台,对相应的游戏利用检索爬虫系统,爬取 相应的游戏内容简介,并整理数据。4. 根据权利要求1所述的基于=维时序动态模型的手机游戏推荐系统,其特征在于:所 述用户行为分析模块,对每个日志进行相应的数据分析处理,初始化日志用于分析用户硬 件信息的字段有:ime i、t ime、bd、cn、SW、sh,其中ime i是用户的手机唯一标识,进行了保护 用户隐私处理,用该字段分析用户的依据是游戏平台推广的统一,time是记录相应时刻的 时间戳字段,然后通过时间戳转化成年、月、日、时、周,bd是用户的机型品牌,cn是运营商名 称字段,SW和Sh分别是用户手机屏幕的宽和高,将文字信息量化,方便模型的分析,登陆日 志用于分析用户活跃度评分的字段:山日1、^111日、日1(1,其中日1(1是游戏的1(1,将游戏量化的一 种编号,计算用户活跃度评分; 用户活跃度评分计算,根据当前时间窗,用户在时间窗内,最高分记为M,最低分记为1; 计算公式: 胖 DUrating 二 UMax-UMin 其中,WDUrating表示为用户的周活跃度评分,UMax为用户在时间窗最后一次登陆的分数, UMin为用户在时间窗第一次登陆的分数,分数就是相应的天数,时间窗内W第一天登录的记 为分数I;运样划分的依据是能够发现潜在信息,并不影响评分;同时也能够很好的将活跃 用户和不活跃用户即只出现一次的登录用户区别开;另外一个目的是减少计算量,推进一 天,大部分信息对第二个评分窗具有参考意义,时间衔接时,评分规则一样,另外考虑手游 的特性,需要将用户活跃度评分最高的分值对应的游戏存取作为用户参考的历史兴趣;随 着用户的活跃度的提升,不影响模型的稳定性;等级日志用于分析用户对游戏喜爱度评分 的字段有:11116;[、1:;[1116、曰1(1^旨脚(16,其中'旨^(16是用户玩游戏的相应等级,用户对游戏的喜 爱度评分,通过用户玩家对游戏的等级来说明用户对该游戏的一种喜爱度,设置多个用户 等级阔值,评分范围在1-M;结合用户活跃度评分进行数据互相填补,用户同时出现在两个 表的取最大分数作为用户对游戏的评分,将用户喜爱度评分表与用户活跃度表进行表融合 并成为用户活跃度评分表,将对应的游戏存储作为用户的历史兴趣;消费日志用于分析用 户的历史兴趣的字段有:imei、^6日*6_1:;[1116、日1(1、9日7_的日11]1〇]1巧,其中9日7_的日11]1〇]1巧是用 户充值真实额,对用户pay_realmoney大于O的作为用户对游戏喜爱的历史兴趣存储。5. 根据权利要求1所述的基于=维时序动态模型的手机游戏推荐系统,其特征在于:所 述游戏标签模块,包含游戏标签、游戏相似列表、热口游戏标签列表;其中游戏标签是根据 游戏内容简介中游戏的关键词,作为相应游戏的标签;然后根据游戏标签的频率,对游戏标 签赋予不同的权值,根据相应的标签的最高频率值进行单位化使得所有标签权值范围在O- 1;将游戏名称和标签名称相应的量化,游戏根据游戏日志中aid对应起来,并建立游戏标签 的向量,(Bi,Wi,…,Bn,Wn) ,Bi为标签,Wi为对于标签的权值;某个游戏的相似列表根据某个 游戏的aid对应的标签向量,根据余弦相似度计算,得到该游戏的相应游戏相似列表;相似 度计算公式:其中,Sim为余弦相似度,(a,b)为a的向量与b的向量内积,MaM,I IbM分别为a向量的 模长,b向量的模长,a、b是游戏aid的特征向量,相似度计算都是W余弦相似度计算为准,热 口游戏标签列表是时间窗内对游戏标签频率前n个最高,求出时间窗内热口游戏标签列表。6. 根据权利要求1所述的基于=维时序动态模型的手机游戏推荐系统,其特征在于:所 述时序动态模型模块,包含时间窗、用户行为的特征、游戏标签,时间窗是指一个时间段的 窗口,根据不同数据集特性改变;用户行为的特征是根据用户对游戏的活跃度评分结合用 户对游戏的喜爱度评分融合的表,并结合游戏标签的向量表,然后引用张量模型根据用户、 游戏、游戏标签建立时序动态模型,并通过张量化Cker分解方法,调节张量分解相关参数, 利用用户-游戏,游戏-游戏标签信息,得到用户对某个游戏某些标签新的评分估值;利用张 量模型中的用户对游戏某些标签权值,整合为用户对标签的相应的特征向量,然后结合游 戏-标签两个维度,对用户-标签与游戏-标签求相似度就能够得到用户评分高的前N个游戏 标签列表;张量的定义:设Vi,…,Vn为维数分别为Ii,…,In的N个有限维欧几里得空间,对于 N个向量山GVi,…,化GVn,定义ViX…XVn上的线性映射(山…化)计算如下: ("1 ...W")(X ....Yy)=< 社1,义1 >巧…< M",.Tv 其中,为Vi上的标量积,xi为Vi上的任意向量(i = l,i = 2,…,N),则整个(ur-- Un)构成的空间称为Vi,…,Vn的张量空间,此张量空间上的元素称为Vi X…X Vn上的N阶张 量;如果巾;聚%n = l,…,N,则此张量空间分别称为N阶Ii,…,In维实张量空间,记为 ;而对于N阶张量,其矩阵展开形式>张量的元素…, iN)映射到矩阵元素(in, j),映射关系关张量化Cker分解方法是一种高 阶的主成分分析方法,它将原始张量分解为核屯、张量和一系列矩阵乘积的形式,张量分解 在求解过程中能够进行降维处理;Tucker分解方法,一个张量义e护1'一/''按下面公式去理 解: X^YXU(i)XU(2)X... XU(N) 其中,Y为核屯、张量;U(",U(2),... ,uW为一系列正交矩阵,根据投影矩阵U的正交性UUT = E,其中UT为U的转置矩阵,E为单位矩阵;从而能够根据上面的张量X公式,两边乘WuWT,u(2>T,…,UWT,求得核屯、张量Y: Y^XXU(i)TxU(2)t... XU(N)T 时序动态模型的建立,数据是一个四维的数据元组(u,g,k,t),是一个用户u,g是一个 游戏,k是一个标签,t是某个时间窗;模型根据用户-游戏-标签建立一个=阶张量 X, 是用户的集合,nW是游戏的集合,nW是某一游戏的标签集合;在某个 时间窗内,得到一个用户-游戏-标签的=元权值Wu,g,k,根据=元权值建立张量模型,模型张 量公式:其中,Yt GRfi""是核屯、张量,表示用户、游戏、标签之间的关系;巧W e民表示 用户的相关矩阵,G严G 表示游戏的相关矩阵,Kf > € 表示标签的相关矩阵; 在某个时间窗内,Wu,g,k的计算根据用户对该游戏的活跃度评分乘W标签的权值得到,Wu,g,k = Au,gXBu,g,k,其中uGn(u),gGn(g),kGn化),Au,g表示用户对某个游戏的活跃麼评分,B,l.口.k 表示对于给定用户U、游戏g、标签k在标签向量中的权重值,并且满足约束条件7.根据权利要求1所述的基于=维时序动态模型的手机游戏推荐系统,其特征在于:所 述游戏推荐模块,包含用户喜欢的游戏标签列表、游戏对应的标签、用户喜欢的游戏、游戏 平台对用户进行相应游戏应用推荐,用户喜爱的游戏标签列表是由时序动态模型模块得 到,游戏对应的标签是由游戏标签模块得到,用户喜欢的游戏列表是通过用户喜欢的游戏 标签表和游戏对应的标签,映射得到的结果表,用户喜欢的游戏是通过筛选和权值得到,筛 选和权值考虑是根据用户喜欢的游戏列表结合该用户的历史兴趣游戏列表和热口的游戏 标签列表,对用户喜欢的游戏列表赋予权值〇,对用户的历史兴趣游戏列表赋予权值e,且满 足曰+0=1,调节a, 0的权值,得到一个新的用户喜欢的游戏列表,再结合热口的游戏标签进 行优先筛选,游戏列表中有游戏的标签包含热口标签的优先推荐,达到推荐更具新颖性结 果;从而得到用户喜欢的游戏,游戏平台对用户进行相应游戏应用推荐是根据用户喜欢的 游戏转换为游戏应用推荐,从而达到最后根据用户兴趣变化与当前游戏热口度给出推荐。
【文档编号】G06F17/30GK105912729SQ201610333731
【公开日】2016年8月31日
【申请日】2016年5月19日
【发明人】董守斌, 王进, 董守玲, 胡金龙, 张晶
【申请人】华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1