关键用户识别方法、装置、可读存储介质和计算机设备与流程

文档序号:26306645发布日期:2021-08-17 13:47阅读:113来源:国知局
关键用户识别方法、装置、可读存储介质和计算机设备与流程

本申请涉及计算机技术领域,特别是涉及一种关键用户识别方法、装置、计算机可读存储介质和计算机设备。



背景技术:

新游戏上线初期或者老游戏想要寻找新用户时,会给相关玩家推送广告消息。新游戏希望获取最初的、早期的有影响力的游戏玩家;老游戏希望获取潜在的有影响力的游戏玩家,或者获取相似游戏当中有影响力的游戏玩家,这些有影响力的游戏玩家作为游戏的拉新阶段的关键用户,是决定能否获取足量的游戏玩家,或者让游戏玩家邀请更多游戏玩家加入进来关键因素之一。但由于广告资源有限,如何精准地找到游戏的关键用户,尤其是热爱分享的关键用户,是游戏拉新的核心问题。

而目前主要是基于游戏知识图谱的拉新,是针对不同游戏划分出游戏的子系统,让专家和用户对各游戏子系统做问卷调查和打分,设计数百维的游戏特征,从而每个游戏都有一个游戏特征可以表示;进一步的,玩家玩过哪些游戏,将这些游戏特征按玩家的游戏时长为权重,加权求和得到玩家基于游戏的特征,最后对玩家特征和游戏特征,构建机器学习的训练集和预测集,采用机器学习方法训练;并对新游戏给出的新的游戏特征,预测玩家是否会去玩,获得对应的关键用户用于拉新。而游戏的属性不同,如全民向游戏、小众游戏等,针对为不同属性的游戏识别关键用户时,准确率较低。



技术实现要素:

基于此,有必要针对为不同属性的游戏识别关键用户时,准确率较低的问题,提供一种关键用户识别方法、装置、计算机可读存储介质和计算机设备。

一种关键用户识别方法,包括:

根据数据库中游戏玩家的活跃数据,提取出所述游戏玩家的活跃维度的特征;

根据数据库中所述游戏玩家的社交数据,提取出所述游戏玩家的社交维度的特征;

根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征;

根据所述游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得所述游戏玩家多维度交叉后的组合特征;

根据所述游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得所述游戏玩家在预设维度的用户画像;

根据接收到的识别条件的关注维度,基于所述游戏玩家在预设维度的用户画像,从所述游戏玩家中识别出对应的关键用户。

在其中一个实施例中,所述根据接收到的识别条件的关注维度,基于所述游戏玩家在预设维度的用户画像,从所述游戏玩家中识别出对应的关键用户的步骤,包括:

根据接收到的识别条件,确定识别关键用户的关注维度;

获取所述游戏玩家在关注维度的用户画像;

根据所述接收到的识别条件和所述游戏玩家在关注维度的用户画像对所述游戏玩家进行过滤得到关键用户。

在其中一个实施例中,所述根据所述接收到的识别条件和所述游戏玩家在关注维度的用户画像对所述游戏玩家进行过滤得到关键用户的步骤,包括:

根据所述接收到的识别条件和所述游戏玩家在所述关注维度的用户画像对所述游戏玩家进行过滤,从所述游戏玩家中过滤得到预选用户;

根据所述预选用户在预设维度的用户画像分析出所述预选用户玩目标游戏的概率,将所述预选用户中玩目标游戏的概率大于预设值的用户确定为关键用户。

在其中一个实施例中,所述根据接收到的识别条件的关注维度,基于所述游戏玩家在预设维度的用户画像,从所述游戏玩家中识别出对应的关键用户的步骤,包括:

当接收到的识别条件中提供了种子用户时,获取所述种子用户在预设维度的用户画像;

根据所述种子用户在预设维度的用户画像,确定关注维度和关注维度对应的用户画像;

根据关注维度和关注维度对应的用户画像从所述游戏玩家中确定和种子用户具有相似用户画像的用户作为关键用户。

在其中一个实施例中,所述根据所述游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得所述游戏玩家在预设维度的用户画像的步骤,包括:

根据所述游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征分别进行聚类分析,获得所述游戏玩家在各维度的用户画像;

根据所述游戏玩家的活跃维度的特征,获取所述游戏玩家登录过的游戏的游戏特征;

根据所述游戏玩家过的游戏的游戏特征进行聚类,获得所述游戏玩家的游戏偏好画像。

在其中一个实施例中,所述方法还包括:

采用图嵌入方法和图表示学习方法对所述游戏玩家的社交维度的特征进行处理,获得所述游戏玩家的网络嵌入特征;

增加所述游戏玩家的网络嵌入特征作为所述游戏玩家的社交维度的特征。

在其中一个实施例中,所述根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征的步骤,包括以下任意一种以上:

第一种:根据多个子系统维度构建各游戏的n维向量,获取各游戏的游戏特征;

第二种:根据各游戏的游戏知识图谱,将各游戏表示成基于网络嵌入的向量,获得各游戏的游戏特征;

第三种:通过相关的相似性计算方法,找到并排序当前游戏的相似游戏,获得各游戏的游戏特征。

一种关键用户识别装置,包括:

活跃特征提取模块,用于根据数据库中游戏玩家的活跃数据,提取出所述游戏玩家的活跃维度的特征;

社交维度的特征提取模块,用于根据数据库中所述游戏玩家的社交数据,提取出所述游戏玩家的社交维度的特征;

游戏特征提取模块,用于根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征;

特征交叉组合模块,用于根据所述游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得所述游戏玩家多维度交叉后的组合特征;

聚类模块,用于根据所述游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得所述游戏玩家在预设维度的用户画像;

关键用户识别模块,用于根据接收到的识别条件的关注维度,基于所述游戏玩家在预设维度的用户画像,从所述游戏玩家中识别出对应的关键用户。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述方法的步骤。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如所述方法的步骤。

上述关键用户识别方法、装置、计算机可读存储介质和计算机设备,通过根据数据库中游戏玩家的活跃数据、社交数据,提取出游戏玩家的活跃维度的特征、社交维度的特征;根据游戏知识图谱获得各游戏的游戏特征;对游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征;根据游戏玩家多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像;从而根据不同的游戏,确定对应的识别条件,根据识别条件的关注维度,和基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出游戏对应的关键用户,从而提高了为不同的游戏识别关键用户的准确率。

附图说明

图1为一个实施例中关键用户识别方法的应用环境图;

图2为一个实施例中关键用户识别方法的流程示意图;

图3为一个实施例中关键用户识别方法其中一个步骤的流程示意图;

图4为一个实施例中关键用户识别方法的数据整合的架构示意图;

图5为一个实施例中关键用户识别装置的结构框图;

图6为另一个实施例中关键用户识别装置的结构框图;

图7为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

图1为一个实施例中关键用户识别方法的应用环境图。参照图1,该关键用户识别方法应用于服务器120。终端110和服务器120通过网络连接。当该关键用户识别方法应用于终端110时,终端110根据数据库中游戏玩家的活跃数据,提取出游戏玩家的活跃维度的特征;根据数据库中游戏玩家的社交数据,提取出游戏玩家的社交维度的特征;根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征;对游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征;根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像;终端110根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户。

当该关键用户识别方法应用于服务器120时,服务器120根据数据库中游戏玩家的活跃数据,提取出游戏玩家的活跃维度的特征;根据数据库中游戏玩家的社交数据,提取出游戏玩家的社交维度的特征;根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征;对游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征;根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像;服务器120接收终端110发送的识别条件,根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户。

终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

如图2所示,在一个实施例中,提供了一种关键用户识别方法。本实施例主要以该方法应用于上述图1中的终端110来举例说明。参照图2,该关键用户识别方法具体包括如下步骤:

步骤s220,根据数据库中游戏玩家的活跃数据,提取出游戏玩家的活跃维度的特征。

其中,数据库存储有所有游戏玩家在各游戏中产生的活跃数据、社交数据等。游戏玩家可以是在游戏大盘中登录过任意一个游戏或多个游戏的用户,游戏大盘是所有游戏的总和。游戏玩家的活跃数据指的是游戏玩家登录过的游戏信息、登录天数信息、登录时长信息。游戏玩家的活跃维度的特征对游戏玩家登录过的游戏信息、登录天数信息、登录时长信息进行处理整合获得的特征。

从数据库中获取预设时间段内游戏玩家登录过的游戏信息、登录天数信息、登录时长信息,预设时间段内可以是按实际的需求确定,可以是近30天内,近7天内,近14天内等等,游戏信息可以是游戏的名称等标识信息,登录天数信息是游戏玩家登录各游戏时产生的登录记录,登录时长信息是游戏玩家登录各游戏后在线时长记录。对游戏玩家登录过的游戏信息、登录天数信息、登录时长信息进行处理,如:根据游戏玩家登录过的游戏信息,确定游戏玩家所玩的游戏名称;在游戏玩家登录各游戏时产生的登录记录中,去除重复的登录时间,计算获得游戏玩家在预设时间段内玩游戏的总天数;根据游戏玩家登录各游戏后在线时长记录,计算获得游戏玩家在预设时间段内在各游戏的在线时长的总和;游戏玩家的活跃维度的特征则包括游戏玩家所玩的游戏名称、在预设时间段内玩游戏的总天数、在预设时间段内在各游戏的在线时长的总和等等。

步骤s240,根据数据库中游戏玩家的社交数据,提取出游戏玩家的社交维度的特征。

其中,游戏玩家的社交数据包括:游戏玩家在每款游戏中的游戏好友、与每个游戏好友的亲密度值、与游戏好友的交互数据等等,交互数据包括分享、点赞、赠送等等。根据数据库中游戏玩家的社交数据,提取出游戏玩家的社交维度的特征,如:从数据库中获取游戏玩家在每款游戏中的游戏好友、以及与每个游戏好友的亲密度值;根据游戏玩家在每款游戏中的游戏好友,确定游戏玩家的好友个数;根据游戏玩家在每款游戏中的游戏好友、以及游戏玩家与每个游戏好友的亲密度值,确定游戏玩家与各游戏好友的总亲密值;游戏玩家的好友个数、游戏玩家与各游戏好友的总亲密值为游戏玩家的社交维度的特征。游戏玩家的社交维度的特征还可以包括游戏玩家的好友交互信息,从数据库中获取游戏玩家与游戏好友的交互数据,交互数据包括分享、点赞、赠送;根据游戏玩家与游戏好友的交互数据提取特征,获得游戏玩家的好友交互信息。

根据游戏玩家在每款游戏中的游戏好友、以及游戏玩家与每个游戏好友的亲密度值,确定游戏玩家与各游戏好友的总亲密值,如:当游戏玩家与某个游戏好友涉及在单个游戏的多个区服是好友关系时,如:玩家a和b可能在几个区服里是好友,则取玩家a和b在几个区服里的亲密度值求和。当游戏玩家与某个游戏好友涉及多款游戏时,先要将游戏玩家的唯一识别id从单游戏中,统一到与qq或者微信相关的一个识别id。然后不同游戏的亲密度值需要映射到0~1之间,并且去掉极度异常值,让各个游戏的亲密度中位数值校准到相近的数值,再次基于qq或微信平台相关的识别id,对游戏玩家与游戏好友的亲密度值求和。

在一个实施例中,关键用户识别方法还包括:采用图嵌入方法和图表示学习方法对游戏玩家的社交维度的特征进行处理,获得游戏玩家的网络嵌入特征;增加游戏玩家的网络嵌入特征作为游戏玩家的社交维度的特征。

其中,图嵌入方法指的是图表示学习中一种典型的方法,将图上的特征表示成压缩了的向量或者矩阵的形式的方法。图表示学习方法是将图上的特征表示成其他形态的方法。通过采用图嵌入方法和图表示学习方法对游戏玩家的社交维度的特征进行处理后,将获得的游戏玩家的网络嵌入特征也作为游戏玩家的社交维度的特征的一部分,进一步补充了游戏玩家的社交维度的特征,从而丰富游戏玩家的用户画像,提高了识别游戏对应的关键用户的准确性。

步骤s260,根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征。

其中,游戏知识图谱是一种存储和表示数据的结构,核心是三元组关系,例如:qq飞车→属于→竞速品类的游戏;qq飞车→开发商→腾讯公司。采用这种三元组形式即称为图谱的形式,方便存储,也方便自动获得复杂的知识。

在一个实施例中,根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征的步骤,包括以下任意一种以上:

第一种:根据多个子系统维度构建各游戏的n维向量,获取各游戏的游戏特征;第二种:根据各游戏的游戏知识图谱,将各游戏表示成基于网络嵌入的向量,获得各游戏的游戏特征;第三种:通过相关的相似性计算方法,找到并排序当前游戏的相似游戏,获得各游戏的游戏特征。

其中,子系统是根据不同游戏进行划分确定的。将各游戏表示成基于网络嵌入的向量,是通过网络嵌入方法将各游戏表示成网络嵌入的向量,网络嵌入方法可以是word2vec(用来产生词向量的相关模型),deepwalk(一种学习网络中节点的表示的新的方法),node2vec(用来产生网络中节点向量的模型),gcn(图卷积网络)等等。相似性计算方法可以是余弦相似度计算,欧氏距离大小等等。通过相关的相似性计算方法,找到并排序当前游戏的相似游戏,获得各游戏的游戏特征,在通过相关的相似性计算方法,找到并排序当前游戏的相似游戏基础上,还可以基于相似度计算方法,进一步将相似游戏扩散到相似游戏的相似游戏,扩充相似游戏的范围,获得各游戏的游戏特征。

根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征,可以是采用第一种、第二种和第三种中的任意一种特征提取方式,获得各游戏的游戏特征,也可以是从第一种、第二种和第三种任意选择其中两种分别进行特征提取,获得各游戏的游戏特征,也可以分别采用第一种、第二种和第三种进行特征提取,获得各游戏的游戏特征。

步骤s280,根据游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征。

其中,对游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,如:根据游戏玩家的活跃维度的特征和社交维度的特征进行组合,可以获得游戏玩家在活跃+社交的维度的特征;根据游戏玩家的活跃维度的特征和各游戏的游戏特征进行特征交叉组合,可以体现出游戏玩家活跃于哪些游戏,游戏的游戏特征是什么,即活跃+游戏特征的维度的特征;游戏玩家的社交维度的特征和各游戏的游戏特征,可以体现出游戏玩家的社交能力,游戏玩家所玩游戏的游戏特征是什么,可以获得游戏玩家在社交+游戏特征的维度的特征;游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行组合,根据玩家的活跃维度的特征、各游戏的游戏特征可以确定游戏玩家活跃的游戏之间相似性,进一步可以体现出游戏玩家在相似游戏中的社交能力,可以获得游戏玩家在相似游戏的社交维度的特征。通过进一步组合提炼,得到对目标人群更加丰富和完善的多模态特征。

步骤s300,根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像。

其中,聚类分析可以是采用k-means算法、k-medoids算法、clarans算法等等,根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征,分别从不同维度进行聚类分析,从而将游戏玩家在不同维度进行分类,根据游戏玩家在不同维度的分类结果,为游戏玩家在不同维度进行用户画像。预设维度可以根据游戏玩家的特征以及业务需要确定,以游戏玩家的特征为基础,在不同的维度为游戏玩家进行用户画像。

在一个实施例中,根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像的步骤,包括:

根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征分别进行聚类分析,获得游戏玩家在各维度的用户画像;根据游戏玩家的活跃维度的特征,获取游戏玩家登录过的游戏对应的游戏特征;根据游戏玩家过的游戏对应游戏特征进行聚类,获得游戏玩家的游戏偏好画像。

其中,根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征分别进行聚类分析,是分别在游戏玩家的活跃维度、社交维度、及各交叉后的组合特征形成的维度上进行聚类分析。游戏玩家在各维度的用户画像包括游戏玩家在活跃维度的用户画像、社交维度的用户画像、各交叉后的组合特征形成的维度的用户画像,各交叉后的组合特征形成的维度的用户画像即:活跃+社交维度的用户画像、活跃+游戏维度的用户画像、社交+游戏特征的维度的用户画像和相似游戏的社交维度的用户画像。根据游戏玩家的活跃维度的特征,根据游戏玩家登录过的游戏,进一步获取游戏的游戏特征,根据游戏玩家过的游戏的游戏特征进行聚类,可以确定该游戏玩家玩的游戏都有哪些特点,从而获得游戏玩家的游戏偏好画像。

根据游戏玩家的活跃维度的特征在活跃维度进行聚类,可以将游戏玩家进行分类,不同的类别分别代表不同程度的活跃度,为各个类别的游戏玩家进行用户画像,同类别的游戏玩家的活跃维度的用户画像相同。根据游戏玩家的各交叉后的组合特征形成的维度的组合特征分别在各维度进行聚类,可以将游戏玩家进行分类,不同的类别分别代表不同程度的体现游戏玩家各个度,为各个类别的游戏玩家进行用户画像,同类别的游戏玩家的用户画像相同。

根据游戏玩家的社交维度的特征在社交维度进行聚类,可以将游戏玩家进行分类,不同的类别分别代表不同程度的社交度,为各个类别的游戏玩家进行用户画像,同类别的游戏玩家的社交维度的用户画像相同。进一步地,还可以基于品类游戏(比如moba,rpg,竞速类,休闲类等等游戏的类别)、相似游戏(基于游戏知识图谱,每款游戏形成一个特征向量,然后计算不同游戏的特征向量的余弦相似度(或者其他相似度),再按照余弦相似度从大到小排列,确定的相似游戏)、游戏大盘等不同尺度下,对玩家的关系链做聚类,得到多款游戏形成的多重关系链,得到游戏玩家在多种范围大小下的社交关系,构建游戏玩家在不同范围下的社交维度的用户画像。

在一个场景中,以qq飞车手游需要拉新用户为例,qq飞车手游的品类是竞速类游戏,可以基于竞速类游戏为游戏玩家构建社交维度的用户画像,可以体现出游戏玩家在竞速类游戏中的社交程度;同样的,基于qq飞车手游的相似游戏为游戏玩家构建社交维度的用户画像,可以体现出游戏玩家在qq飞车手游的相似游戏中的社交程度。

步骤s320,根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户。

其中,识别条件包括需获取关键用户的数量、关注维度、用户来源(qq号/微信号/手机号)、目标游戏的标识、种子用户等等中的一种或多种信息。目标游戏是需要获取关键用户的游戏,目标游戏的标识可以是游戏名称。关注维度指的是在识别关键用户时,侧重于游戏玩家在预设维度中的哪一个或多个维度。关键用户指的是游戏内外最核心、影响力最大、号召力最强的用户,通过将这些用户引入游戏中,他们会将加入游戏的消息分享给别人,带动他人也加入游戏的用户。可以通过识别出的关键用户,向关键用户投放游戏广告,用于游戏业务的用户拉新、用户召回等,也适用于鼓励用户社交分享传播的营销运营活动。

在一个实施例中,请参阅图3,根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户的步骤,包括:

步骤s322,根据接收到的识别条件,确定识别关键用户的关注维度。

步骤s324,获取游戏玩家在关注维度的用户画像。

步骤s326,根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤得到关键用户。

其中,关注维度可以是预设维度中的一个或多个维度。根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤得到关键用户,如:假设获取目标游戏a的关键用户,关键用户需要在活跃维度的活跃度达90,则识别关键用户的关注维度为活跃维度,获取所以游戏玩家在关注维度的用户画像,在所以游戏玩家中筛选出活跃度达90的游戏玩家作为关键用户。当识别条件除关注维度外的其他条件,根据其他条件进一步筛选获得关键用户。

在一个实施例中,根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤得到关键用户的步骤,包括:

根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤,从游戏玩家中过滤得到预选用户;根据预选用户在预设维度的用户画像分析出预选用户玩目标游戏的概率,将预选用户中玩目标游戏的概率大于预设值的用户确定为关键用户。

其中,将预选用户在预设维度的用户画像分析出预选用户玩目标游戏的概率,可以是将预选用户在预设维度的用户画像输入关键用户识别模型,通过关键用户识别模型分析出预选用户玩目标游戏的概率,关键用户识别模型是根据收集游戏玩家的用户数据,将用户数据按照时间顺序拆分为训练集和预测集,基于游戏玩家在相似游戏中是否登录为训练目标,在进一步扩展到在目标游戏上预测,关键用户识别模型可采用树模型分类算法(randomforest,xgboost,多层感知机,logisticregression等),深层神经网络算法(deepinterestnetwork,wideanddeep、networkembedding、gcn等)进行预测。将预选用户在预设维度的用户画像分析出预选用户玩目标游戏的概率,将预选用户中玩目标游戏的概率大于预设值的用户确定为关键用户,可以进一步增加关键用户识别的准确度。

在一个实施例中,据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户的步骤,包括:

当接收到的识别条件中提供了种子用户时,获取种子用户在预设维度的用户画像;根据种子用户在预设维度的用户画像,确定关注维度和关注维度对应的用户画像;根据关注维度和关注维度对应的用户画像从游戏玩家中确定和种子用户具有相似用户画像的用户作为关键用户。

其中,种子用户指的是已经玩过目标游戏的用户。根据种子用户在预设维度的用户画像,可以得出种子用户在一个或多个维度的用户画像相同,从而确定用户画像相同的维度为关注维度,以及关注维度对应的用户画像,根据关注维度和关注维度对应的用户画像,可以从所有游戏玩家中筛选出在关注维度中与种子用户具有相似用户画像的用户作为关键用户。

当识别条件中提供了种子用户时,还可以根据游戏玩家的社交特征,在所有游戏玩家中筛选出与种子用户是好友关系的用户,根据游戏玩家与种子用户的总亲密值达到预设值,或者是游戏玩家的游戏好友中是种子用户的个数关键用户,来确定是否可以为关键用户。用户容易受到好友的影响去玩一款游戏,因此,根据种子用户来确定关键用户,也可以提高关键用户识别的准确性。

上述关键用户识别方法,通过根据数据库中游戏玩家的活跃数据、社交数据,提取出游戏玩家的活跃维度的特征、社交维度的特征;根据游戏知识图谱获得各游戏的游戏特征;对游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征;根据游戏玩家多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像;从而根据不同的游戏,确定对应的识别条件,根据识别条件的关注维度,和基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出游戏对应的关键用户,从而提高了为不同的游戏识别关键用户的准确率。

在一个实施例中,一种关键用户识别方法,针对亿级游戏玩家,基于tdw(tencentdistributedwarehouse:腾讯分布式数据仓库)离线数据,通过sql(结构化查询语言(structuredquerylanguage))运行或spark(专为大规模数据处理而设计的快速通用的计算引擎)上运行实现为例进一步说明:

从多个数据源(数据库)整合采集游戏玩家等近期(30天、7天或14天等)的登录过的游戏信息、登录天数信息、登录时长信息,获得游戏玩家的活跃维度的特征,根据游戏玩家的活跃维度的特征进行聚类,获得游戏玩家在活跃维度的用户画像。根据游戏玩家的活跃维度的特征,根据游戏玩家登录过的游戏,进一步获取游戏的游戏特征,根据游戏玩家过的游戏对应游戏特征进行聚类,可以确定该游戏玩家玩的游戏都有哪些特点,从而获得游戏玩家的游戏偏好画像。

从多个数据源(数据库)整合采集游戏用户在每款游戏中的游戏好友,与每个游戏好友的亲密度值,根据游戏玩家在每款游戏中的游戏好友,确定游戏玩家的好友个数;根据游戏玩家在每款游戏中的游戏好友、以及游戏玩家与每个游戏好友的亲密度值;从而获得游戏玩家的社交维度的特征;进一步的,采用图嵌入方法和图表示学习方法对游戏玩家的社交维度的特征进行处理,获得游戏玩家的网络嵌入特征;增加游戏玩家的网络嵌入特征作为游戏玩家的社交维度的特征。根据游戏玩家的社交维度的特征进行聚类,获得游戏玩家在社交维度的用户画像。

进一步地,还可以基于品类游戏(比如moba,rpg,竞速类,休闲类等等游戏的类别)、相似游戏(基于游戏知识图谱,每款游戏形成一个特征向量,然后计算不同游戏的特征向量的余弦相似度(或者其他相似度),再按照余弦相似度从大到小排列,确定的相似游戏)、游戏大盘等不同尺度下,对玩家的关系链做聚类,得到多款游戏形成的多重关系链,得到游戏玩家在多种范围大小下的社交关系,构建游戏玩家在不同范围下的社交维度的用户画像。进一步地,还可以依次将各游戏作为目标游戏,将已经玩过目标游戏的用户作为种子用户,基于该种子集用户在品类游戏、相似游戏、游戏大盘等不同尺度下做扩散,扩散时基于两个玩家之间亲密度权重排序,得到种子玩家的二度好友,构建游戏玩家基于种子用户的社交维度的用户画像。如果目标游戏没有提供种子集用户,则不考虑。

根据多个子系统维度构建各游戏的n维向量,获取各游戏的游戏特征;根据各游戏的游戏知识图谱,将各游戏表示成基于网络嵌入的向量,获得各游戏的游戏特征;通过相关的相似性计算方法,找到并排序当前游戏的相似游戏,获得各游戏的游戏特征。还可以基于相似度计算方法,进一步将相似游戏扩散到相似游戏的相似游戏,扩充相似游戏的范围,获得各游戏的游戏特征。

请参阅图4,根据游戏玩家的活跃维度的特征和社交维度的特征进行组合,可以获得游戏玩家在活跃+社交的维度的特征;根据游戏玩家的活跃维度的特征和各游戏的游戏特征进行特征交叉组合,可以体现出游戏玩家活跃于哪些游戏,游戏的游戏特征是什么,即活跃+游戏特征的维度的特征;游戏玩家的社交维度的特征和各游戏的游戏特征,可以体现出游戏玩家的社交能力,游戏玩家所玩游戏的游戏特征是什么,可以获得游戏玩家在社交+游戏特征的维度的特征;游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行组合,根据玩家的活跃维度的特征、各游戏的游戏特征可以确定游戏玩家活跃的游戏之间相似性;进一步可以体现出游戏玩家在相似游戏中的社交能力,可以获得游戏玩家在相似游戏的社交维度的特征。根据游戏玩家在活跃+社交的维度的特征进行聚类,获得活跃+社交维度的用户画像;根据活跃+游戏特征的维度的特征进行聚类,获得活跃+游戏维度的用户画像;根据游戏玩家在社交+游戏特征的维度的特征进行聚类,获得游戏玩家在社交+游戏特征的维度的用户画像;根据游戏玩家在相似游戏的社交维度的特征进行聚类,获得相似游戏的社交维度的用户画像。

在游戏业务的用户拉新、用户召回、鼓励用户社交分享传播的营销运营活动等场景需要获取关键用户时,根据游戏业务的场景确定识别条件,关键用户识别装置根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户。

关键用户识别装置根据接收到的识别条件确定识别关键用户的步骤,当识别条件中包括:关注维度及关注维度对应的画像条件(以活跃维度为关注维度为例,活跃维度的活跃程度达到90,活跃程度达到90为画像条件)时,根据识别关键用户的关注维度,获取游戏玩家在关注维度的用户画像,根据接收到的识别条件中关注维度对应的画像条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤得到关键用户。如需进一步过滤关键用户,可以将根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤,从游戏玩家中过滤得到关键用户作为预选用户;将预选用户在预设维度的用户画像输入关键用户识别模型分析出预选用户玩目标游戏的概率,将预选用户中玩目标游戏的概率大于预设值的用户确定为关键用户。

当识别条件中包括:目标游戏的标识时,可以通过将游戏玩家在预设维度的用户画像输入关键用户识别模型分析出游戏玩家玩目标游戏的概率,将游戏玩家中玩目标游戏的概率大于预设值的用户确定为关键用户。

上述关键用户识别方法,基于多维度的对游戏玩家进行用户画像,可以不同游戏提供用于判断是否为关键用户的画像,可针对新游戏确定识别条件,从而获取关键用户用于用户拉新,可针对老游戏确定识别条件,从而获取关键用户用于用户拉新;可以对全民向的热门游戏确定识别条件,从而获取关键用户用于拉新,也可针对小众的、偏门的游戏确定识别条件,从而获取关键用户用于拉新;可对某一游戏品类确定识别条件,从而获取关键用户用于用户拉新,也可对相似游戏确定识别条件,从而获取关键用户用于用户拉新等等。

图2-3为一个实施例中关键用户识别方法的流程示意图。应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,请参阅图5,一种关键用户识别装置,包括:活跃特征提取模块310、社交特征提取模块320、游戏特征提取模块330、特征交叉组合模块340、聚类模块350和关键用户识别模块360。

活跃特征提取模块310,用于根据数据库中游戏玩家的活跃数据,提取出游戏玩家的活跃维度的特征;

社交特征提取模块320,用于根据数据库中游戏玩家的社交数据,提取出游戏玩家的社交维度的特征;

游戏特征提取模块330,用于根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征;

特征交叉组合模块340,用于根据所述游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征;

聚类模块350,用于根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像;

关键用户识别模块360,用于根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户。

在一个实施例中,关键用户识别模块360还用于:根据接收到的识别条件,确定识别关键用户的关注维度;获取游戏玩家在关注维度的用户画像;根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤得到关键用户。

在一个实施例中,关键用户识别模块360还用于:根据接收到的识别条件和游戏玩家在关注维度的用户画像对游戏玩家进行过滤,从游戏玩家中过滤得到预选用户;根据预选用户在预设维度的用户画像分析出预选用户玩目标游戏的概率,将预选用户中玩目标游戏的概率大于预设值的用户确定为关键用户。

在一个实施例中,关键用户识别模块360还用于:当接收到的识别条件中提供了种子用户时,获取种子用户在预设维度的用户画像;根据种子用户在预设维度的用户画像,确定关注维度和关注维度对应的用户画像;根据关注维度和关注维度对应的用户画像从游戏玩家中确定和种子用户具有相似用户画像的用户作为关键用户。

在一个实施例中,聚类模块350还用于:根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征分别进行聚类分析,获得游戏玩家在各维度的用户画像;根据游戏玩家的活跃维度的特征,获取游戏玩家登录过的游戏的游戏特征;根据游戏玩家过的游戏的游戏特征进行聚类,获得游戏玩家的游戏偏好画像。

在一个实施例中,如图6所示,关键用户识别装置还包括社交特征处理模块370,用于采用图嵌入方法和图表示学习方法对游戏玩家的社交维度的特征进行处理,获得游戏玩家的网络嵌入特征;增加游戏玩家的网络嵌入特征作为游戏玩家的社交维度的特征。

在一个实施例中,游戏特征提取模块330还用于:根据多个子系统维度构建各游戏的n维向量,获取各游戏的游戏特征;根据各游戏的游戏知识图谱,将各游戏表示成基于网络嵌入的向量,获得各游戏的游戏特征;通过相关的相似性计算方法,找到并排序当前游戏的相似游戏,获得各游戏的游戏特征。

上述关键用户识别装置,通过活跃特征提取模块310和社交特征提取模块320分分别根据数据库中游戏玩家的活跃数据、社交数据,提取出游戏玩家的活跃维度的特征、社交维度的特征;游戏特征提取模块330根据游戏知识图谱获得各游戏的游戏特征;特征交叉组合模块340对游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征;聚类模块350根据游戏玩家多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像;从而关键用户识别模块360根据不同的游戏,确定对应的识别条件,根据识别条件的关注维度,和基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出游戏对应的关键用户,从而提高了为不同的游戏识别关键用户的准确率。

图7示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或服务器120。如图7所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现关键用户识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行关键用户识别方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的关键用户识别装置可以实现为一种计算机程序的形式,计算机程序可在如图7所示的计算机设备上运行。计算机设备的存储器中可存储组成该关键用户识别装置的各个程序模块,比如,图5所示的活跃特征提取模块310、社交特征提取模块320、游戏特征提取模块330、特征交叉组合模块340、聚类模块350和关键用户识别模块360。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的关键用户识别方法中的步骤。

例如,图7所示的计算机设备可以通过如图5所示的关键用户识别装置中的活跃特征提取模块310执行据数据库中游戏玩家的活跃数据,提取出游戏玩家的活跃维度的特征。计算机设备可通过社交特征提取模块320执行根据数据库中游戏玩家的社交数据,提取出游戏玩家的社交维度的特征。计算机设备可通过游戏特征提取模块330执行根据游戏知识图谱对各游戏进行特征提取,获得各游戏的游戏特征。计算机设备可通过特征交叉组合模块340执行根据所述游戏玩家的活跃维度的特征、社交维度的特征和各游戏的游戏特征进行特征交叉组合,获得游戏玩家多维度交叉后的组合特征。计算机设备可通过聚类模块350执行根据游戏玩家的活跃维度的特征、社交维度的特征、及多维度交叉后的组合特征进行聚类分析,获得游戏玩家在预设维度的用户画像。计算机设备可通过关键用户识别模块360执行根据接收到的识别条件的关注维度,基于游戏玩家在预设维度的用户画像,从游戏玩家中识别出对应的关键用户。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述关键用户识别方法的步骤。此处关键用户识别方法的步骤可以是上述各个实施例的关键用户识别方法中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述关键用户识别方法的步骤。此处关键用户识别方法的步骤可以是上述各个实施例的关键用户识别方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1