一种用户流失预测模型生成方法及相关装置与流程

文档序号:12124596阅读:200来源:国知局
一种用户流失预测模型生成方法及相关装置与流程

本发明涉及数据处理技术领域,具体涉及一种用户流失预测模型生成方法及相关装置。



背景技术:

随着互联网业务的发展,应用程序的数量越来越多,随之出现的是,应用程序的用户流失现象。为实现用户的留存,需要分析出用户流失状况,辅助应用程序的改进和更新。

现有分析用户流失状况的方式,主要是对应用程序产生的海量用户行为数据进行定期抽取,然后将定期抽取的用户行为数据导入到预先训练好的用户流失预测模型中,基于用户流失预测模型对定期抽取的用户行为数据进行预测分析,得到用户流失预测结果。

然而,现有技术中的用户行为数据可能会与预先训练好的用户流失预测模型不适配,导致预先训练好的用户流失预测模型无法对用户行为数据进行预测分析,或者存在得到的用户流失预测结果不准确的问题。



技术实现要素:

有鉴于此,本发明实施例提供一种用户流失预测模型生成方法及相关装置,解决了现有技术中用户行为数据可能会与预先训练好的用户流失预测模型不适配,导致预先训练好的用户流失预测模型无法对用户行为数据进行预测分析,或者存在得到的用户流失预测结果不准确的问题。

为实现上述目的,本发明实施例提供如下技术方案:

一种用户流失预测模型生成方法,所述方法包括:

读取用户行为日志中的用户行为数据;

判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;

如果所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配,则依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。

一种用户流失预测模型生成装置,所述装置包括:

用户行为数据读取模块,用于读取用户行为日志中的用户行为数据;

数据特性判断模块,用于判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;

用户流失预测模型训练模块,用于在所述数据特性判断模块判断出所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配的情况下,依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。

基于上述技术方案,本发明实施例中公开了一种用户流失预测模型生成方法及相关装置,所述方法包括:读取用户行为日志中的用户行为数据;判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;如果所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配,则依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。由此可知,本发明实施例中在用户行为数据的数据特性与训练用户流失预测模型所用的预定数据特性不匹配的情况下,会依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型,解决了现有技术中用户行为数据可能会与预先训练好的用户流失预测模型不适配,导致的预先训练好的用户流失预测模型无法对用户行为数据进行预测分析,或者存在得到的用户流失预测结果不准确的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种用户流失预测模型生成方法流程图;

图2为本发明实施例提供的另一种用户流失预测模型生成方法流程图;

图3为本发明实施例提供的又一种用户流失预测模型生成方法流程图;

图4为本发明实施例提供的一种用户流失预测模型生成装置的结构框图;

图5为本发明实施例提供的一种用户流失预测模型生成装置的硬件结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的一种用户流失预测模型生成方法流程图,该方法可应用于服务器,参照图1,所述方法可以包括:

步骤S100、读取用户行为日志中的用户行为数据;

需要说明的是,在用户与应用程序进行交互的过程中,会产生大量的用户行为日志,用户行为日志中记录有用户与应用程序进行交互过程中产生的用户行为数据,例如:游戏玩家在操作各类手机游戏或电脑游戏过程中产生的玩家行为日志,玩家行为日志中记录有玩家在游戏运行过程中产生的各种玩家行为数据。

本发明实施例中读取用户行为日志中记录的用户与应用程序进行交互过程中产生的用户行为数据,用于对用户流失进行预测。

步骤S110、判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;如果否,则执行步骤S120;如果是,则依据训练用户流失预测模型所用的预定数据特性,训练得到预定用户流失预测模型;

需要说明的是,本发明实施例中,用户行为数据的数据特性可以指的是数据结构,或者是数据统计特征,用户行为数据的数据结构指的是用户行为数据的数据属性,具体可以为:用户行为数据中各个字段的名称、字段类型或者字段之间的相互依赖关系等,本发明实施例不做具体限定。用户行为数据的数据统计特征指的是用户行为数据中各个字段对应字段值的数据统计特征,具体可以为:字段值的均值、方差、协方差、存在依赖关系的字段对应字段值间的相关系数、协方差等,本发明实施例不做具体限定。

相应的,本发明实施例中,判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配包括:判断所述用户行为数据的数据结构是否与训练用户流失预测模型所用的预定数据结构相匹配;和/或;判断所述用户行为数据的数据统计特征是否与训练用户流失预测模型所用的预定数据统计特征相匹配。当上述至少任意一种情况不匹配时,则判定数据环境发生了变化,需要对用户流失预测模型进行调节;否则,判定数据环境未发生变化,仍然可以采用预定用户流失预测模型对用户行为数据进行用户流失预测分析。

需要说明的是,本发明实施例中,所述判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配还包括:判断所述用户行为数据的数据特性,是否与预先训练的用户流失预测模型的数据特性相匹配。

本发明实施例中判断用户行为数据的数据特性是否与训练用户流失预测模型所用的预定数据特性相匹配的过程,是为了判断用户行为数据是否与预定数据特性训练出的预定用户流失预测模型相匹配,所述预定用户流失预测模型可以为一种预定用户流失预测函数,则本发明实施例中具体可以是判断用户行为数据是否与预定用户流失预测函数相匹配。

步骤S120、依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。

当用户行为数据的数据特性与训练用户流失预测模型所用的预定数据特性不匹配的情况下,说明预定数据特性对应的预定用户流失预测模型无法从用户行为数据中预测出用户流失预测结果,所以本发明实施例中,则依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型,用以对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果。

本发明实施例中公开了一种用户流失预测模型生成方法,所述方法包括:读取用户行为日志中的用户行为数据;判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;如果所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配,则依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。由此可知,本发明实施例中在用户行为数据的数据特性与训练用户流失预测模型所用的预定数据特性不匹配的情况下,会依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型,解决了现有技术中用户行为数据可能会与预先训练好的用户流失预测模型不适配,导致的预先训练好的用户流失预测模型无法对用户行为数据进行预测分析,或者存在得到的用户流失预测结果不准确的问题。而且,本发明实施例中,依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型的过程中,无需人工参与,具有自适应性和灵活性,提高了工作效率。

本发明实施例提供了另一种用户流失预测模型生成方法流程图,该方法可应用于服务器,参照图2,所述方法可以包括:

步骤S200、读取用户行为日志中的用户行为数据;

步骤S210、判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;如果否,则执行步骤S220;如果是,则执行步骤S240;

步骤S220、依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型;

需要说明的是,本发明实施例中,依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型可以采用如下两种具体的方式:

方式一:将所述用户行为数据加入到用户流失预测模型训练池中;依据所述用户行为数据的数据特性,对预先训练的用户流失预测模型中的参数进行训练调节,生成满足用户行为数据的数据特性的用户流失预测模型。例如:采用逻辑回归算法作为用户流失预测模型,则需要依据所述用户行为数据的数据特性,对预先训练的逻辑回归算法中的参数进行训练调节,得到调整后的参数,作为逻辑回归算法的各特征权重值。

方式二:将所述用户行为数据加入到用户流失预测模型训练池中;依据所述用户行为数据的数据特性,进行用户流失预测模型训练,生成满足用户行为数据的数据特性的用户流失预测模型。例如:依据所述用户行为数据的数据特性,进行用户流失预测模型训练,生成新的满足用户行为数据的数据特性的算法,用来对用户流失进行预测。

步骤S230、通过所述满足用户行为数据的数据特性的用户流失预测模型,对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果;

本发明实施例中,将用户行为数据输入到用户流失预测模型中,进行用户流失预测分析,获得用户流失预测结果后,用以对用户流失状况进行分析,之后,将该次得到的用户行为数据的数据特性进行保存,用于下次进行数据特性比对。至此一轮用户流失预测工作完成,将用户流失预测模型程序置入休眠状态,等待执行下一轮用户流失预测任务。

步骤S240、依据训练用户流失预测模型所用的预定数据特性,训练得到预定用户流失预测模型;

步骤S250、通过预定用户流失预测模型,对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果。

本发明实施例中在用户行为数据的数据特性与训练用户流失预测模型所用的预定数据特性不匹配的情况下,会依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型,通过所述满足用户行为数据的数据特性的用户流失预测模型,对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果,解决了现有技术中用户行为数据可能会与预先训练好的用户流失预测模型不适配,导致的预先训练好的用户流失预测模型无法对用户行为数据进行预测分析,或者存在得到的用户流失预测结果不准确的问题。

本发明实施例提供了又一种用户流失预测模型生成方法流程图,该方法可应用于服务器,参照图3,所述方法可以包括:

步骤S300、获取应用程序运行过程中产生的用户行为日志;

需要说明的是,本发明实施例中可以采用监听的方式获取应用程序运行过程中产生的用户行为日志,具体的,可以在流失预测平台设置一监听接口,用于监听数据仓库中的用户行为日志的写入。

步骤S310、判断获取到的用户行为日志的数量是否达到预设数量值,如果是,则执行步骤S320;否则继续进行判断;

可选的,当监听接口监听到用户行为日志的数量达到了预设数量值时,则执行步骤S320。由于用户行为日志的数量只有达到了预设数量值时,才能够获取用户行为数据的数据统计特征,本发明实施例中的预设数量值可以由技术人员依据经验进行设定,本发明实施例中不做具体限定。

步骤S320、读取获取到的用户行为日志中的用户行为数据;

步骤S330、判断所述用户行为数据的数据结构是否与训练用户流失预测模型所用的预定数据结构相匹配;如果是,则执行步骤S340;如果否,则执行步骤S350;

具体可以判断用户行为数据的数据结构中各个字段的名称、字段类型或者字段之间的相互依赖关系等是否与训练用户流失预测模型所用的预定数据结构相匹配。

可选的,本发明实施例中可以判断所述用户行为数据的数据结构是否与预先训练的用户流失预测模型的数据结构相匹配。

步骤S340、判断所述用户行为数据的数据统计特征是否与训练用户流失预测模型所用的预定数据统计特征相匹配;如果否,则执行步骤S350;如果是,则执行步骤S380;

具体可以判断用户行为数据的数据统计特征中字段值的均值、方差、协方差、存在依赖关系的字段对应字段值间的相关系数、协方差等是否与训练用户流失预测模型所用的预定数据统计特征相匹配。

可选的,本发明实施例中可以判断所述用户行为数据的数据统计特征是否与预先训练的用户流失预测模型的数据统计特征相匹配。

步骤S350、将所述用户行为数据加入到用户流失预测模型训练池中;

步骤S360、依据所述用户行为数据的数据结构以及数据统计特征,对预先训练的用户流失预测模型中的参数进行训练调节,生成满足用户行为数据的数据结构以及数据统计特征的用户流失预测模型;

步骤S370、通过所述满足用户行为数据的数据结构以及数据统计特征的用户流失预测模型,对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果;

步骤S380、通过预定用户流失预测模型,对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果。

下面,以一个具体的基于游戏大数据预测用户流失应用场景详细说明本发明实施例中公开的上述用户流失预测模型生成方法:

通过分布式计算服务器集群,建立用户流失预测平台,通过用户日志监听接口监听数据仓库中的海量玩家日志;假设数据仓库中的历史数据结构包含活跃时长、游戏内收入、游戏内资源消耗三个字段,流失预测平台采用的预定用户流失预测模型为逻辑回归算法。

当监听到新入库的日志数量达到预设阈值后,触发用户流失预测任务。首先用户流失预测平台对新入库的日志的用户行为数据结构进行分析,并与历史用户行为数据结构进行比对后,发现和历史用户行为数据结构保持相同,仍然是同样的字段。然后统计分析这三个字段各自对应的字段值的均值和方差,发现和历史数据统计特征相比,变化不大,变化幅度没有超过预设幅度值(例如设置20%),此时判定数据环境没有发生变化,则直接将新数据输入到预定用户流失预测模型(逻辑回归算法)中进行用户流失预测并输出用户流失预测结果。之后,将用户流失预测模型程序置入休眠状态,通过用户日志监听接口继续监听新进日志,等待足够数量日志到来时启动下一轮流失预测任务。

当用户日志监听接口监听到下一轮新入库的用户日志数量达到预设阈值后,用户流失预测平台分析新入库的用户日志的数据结构以及数据统计特征,发现这批数据结构中多了一个玩家充值金额的字段,则判断数据结构发生了变化,并且,历史数据结构包含的活跃时长、游戏内收入以及游戏内资源消耗三个字段各自对应的均值和方差和历史数据统计特征相比,超出了预设幅度值;用户流失预测平台将这批数据导入用户流失预测模型训练池中进行训练,从而自动修正用户流失预测模型的参数,之后利用参数修正过的用户流失预测模型再对新入库的用户日志的数据进行用户流失预测分析,并输出用户流失预测结果。

下面对本发明实施例提供的用户流失预测模型生成装置进行介绍,下文描述的用户流失预测模型生成装置可与上文用户流失预测模型生成方法相互对应参照。

图4为本发明实施例提供的用户流失预测模型生成装置的结构框图,参照图4,该用户流失预测模型生成装置可以包括:

用户行为数据读取模块100,用于读取用户行为日志中的用户行为数据;

数据特性判断模块110,用于判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;

用户流失预测模型训练模块120,用于在所述数据特性判断模块判断出所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配的情况下,依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。

所述用户行为数据读取模块包括:

用户行为日志获取模块,用于获取应用程序运行过程中产生的用户行为日志;

用户行为数据读取模块,用于当所述用户行为日志获取模块获取到的用户行为日志的数量达到预设数量值时,读取获取到的用户行为日志中的用户行为数据。

所述数据特性判断模块包括:

数据特性判断子模块,用于判断所述用户行为数据的数据特性,是否与预先训练的用户流失预测模型的数据特性相匹配。

所述数据特性判断模块包括:

数据结构判断模块,用于判断所述用户行为数据的数据结构是否与训练用户流失预测模型所用的预定数据结构相匹配。

所述数据特性判断模块包括:

数据统计特征判断模块,用于判断所述用户行为数据的数据统计特征是否与训练用户流失预测模型所用的预定数据统计特征相匹配。

所述用户流失预测模型训练模块包括:

第一用户行为数据加入模块,用于将所述用户行为数据加入到用户流失预测模型训练池中;

用户流失预测模型参数训练模块,用于依据所述用户行为数据的数据特性,对预先训练的用户流失预测模型中的参数进行训练调节,生成满足用户行为数据的数据特性的用户流失预测模型。

所述用户流失预测模型训练模块包括:

第二用户行为数据加入模块,用于将所述用户行为数据加入到用户流失预测模型训练池中;

用户流失预测模型训练子模块,用于依据所述用户行为数据的数据特性,进行用户流失预测模型训练,生成满足用户行为数据的数据特性的用户流失预测模型。

还包括:

用户流失预测分析模块,用于通过所述满足用户行为数据的数据特性的用户流失预测模型,对所述用户行为日志中的用户行为数据进行用户流失预测分析,获得用户流失预测结果。

可选的,用户流失预测模型生成装置可以为硬件设备,上文描述的模块可以设置于用户流失预测模型生成装置内的功能模块。图5示出了用户流失预测模型生成装置的硬件结构框图,参照图5,用户流失预测模型生成装置可以包括:处理器1,通信接口2,存储器3和通信总线4;其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;

处理器1,用于执行程序;存储器3,用于存放程序;程序可以包括程序代码,所述程序代码包括计算机操作指令;

处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路;存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

其中,程序可具体用于:

读取用户行为日志中的用户行为数据;

判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;

如果所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配,则依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。

综上所述:

本发明实施例中公开了一种用户流失预测模型生成方法,所述方法包括:读取用户行为日志中的用户行为数据;判断所述用户行为数据的数据特性,是否与训练用户流失预测模型所用的预定数据特性相匹配;如果所述用户行为数据的数据特性,与训练用户流失预测模型所用的预定数据特性不匹配,则依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型。由此可知,本发明实施例中在用户行为数据的数据特性与训练用户流失预测模型所用的预定数据特性不匹配的情况下,会依据所述用户行为数据的数据特性,训练得到满足用户行为数据的数据特性的用户流失预测模型,解决了现有技术中用户行为数据可能会与预先训练好的用户流失预测模型不适配,导致的预先训练好的用户流失预测模型无法对用户行为数据进行预测分析,或者存在得到的用户流失预测结果不准确的问题。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1