一种流失用户分析方法、装置、电子设备及存储介质与流程

文档序号:18644067发布日期:2019-09-12 00:03阅读:246来源:国知局
一种流失用户分析方法、装置、电子设备及存储介质与流程
本发明涉及数据分析
技术领域
,特别是涉及一种流失用户分析方法、装置、电子设备及存储介质。
背景技术
:随着视频网站业务的迅速发展,视频网站的用户在不断增长或在某段时间内流失。用户流失会对企业造成不良影响,例如降低企业收入,影响企业业绩;降低企业收益率;提高企业营销和用户召回成本。面对用户收视习惯的改变和激烈的市场竞争,用户流失已成为视频网站发展最严峻的压力之一。与用户新增一样,用户流失无时无刻都可能在发生着,且挖掘未注册的用户需要的代价是留住已注册的用户的六倍,因此如何留住已注册的用户成为亟待解决的技术问题。技术实现要素:本发明实施例的目的在于提供一种流失用户分析方法、装置、电子设备及存储介质,以实现分析用户行为,确定是否为流失用户,以及分析流失用户的流失类型,针对性的制定挽留策略,提升挽留成功率,降低运营成本。具体技术方案如下:第一方面,本发明实施例公开了一种流失用户分析方法,所述方法包括:确定目标用户,并提取所述目标用户的特征数据;将所述目标用户的特征数据输入到预设的决策树算法模型,判断所述目标用户是否为流失用户;当所述目标用户为流失用户时,以所述目标用户的特征数据为基础,通过预设评分策略对所述目标用户进行评价,得到每一所述预设评分策略所对应的评价结果,并根据所得到的所述预设评分策略所对应的评价结果,确定所述目标用户的目标流失类型;确定所述目标流失类型对应的挽留策略,使得通过所述挽留策略挽留所述目标用户。可选地,在所述确定目标用户,并提取所述目标用户的特征数据之后,所述方法还包括:对所述目标用户的特征数据进行数据预处理,得到分析所述目标用户所需的特征数据,作为目标特征数据;按照预设规则,以所述目标用户的目标特征数据为基础,判断所述目标用户为新用户或老用户;所述将所述目标用户的特征数据输入到预设的决策树算法模型,判断所述目标用户是否为流失用户,包括:当所述目标用户为新用户时,将所述目标用户的特征数据输入到预设的新用户决策树算法模型,判断所述目标用户是否为流失用户;当所述目标用户为老用户时,将所述目标用户的特征数据输入到预设的老用户决策树算法模型,判断所述目标用户是否为流失用户。可选地,构建所述预设的决策树算法模型的步骤,包括:选取预设时间段内多个用户的历史特征数据,作为各样本特征数据;按照预设规则,分别将各所述样本特征数据划分为新用户历史特征数据或老用户历史特征数据;对各所述新用户历史特征数据及各所述老用户历史特征数据,进行数据预处理,得到分析各新用户所需的特征数据,作为新用户目标历史特征数据及分析各老用户所需的特征数据,作为老用户目标历史特征数据;通过各所述新用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的新用户决策树算法模型;通过各所述老用户目标历史特征数据,利用决策树算法,训练得到满足所述预设准确率的老用户决策树算法模型。可选地,所述评分策略为,以用户是否近期活跃、使用频率高低及视频播放时长长短为特征数据的分析基础建立的。第二方面,本发明实施例公开了一种流失用户分析装置,所述装置包括:特征数据提取模块,用于确定目标用户,并提取所述目标用户的特征数据;流失用户判断模块,用于将所述目标用户的特征数据输入到预设的决策树算法模型,判断所述目标用户是否为流失用户;目标流失类型确定模块,用于当所述目标用户为流失用户时,以所述目标用户的特征数据为基础,通过预设评分策略对所述目标用户进行评价,得到每一所述预设评分策略所对应的评价结果,并根据所得到的所述预设评分策略所对应的评价结果,确定所述目标用户的目标流失类型;挽留策略确定模块,用于确定所述目标流失类型对应的挽留策略,使得通过所述挽留策略挽留所述目标用户。可选地,所述装置还包括:目标特征数据确定模块,用于对所述目标用户的特征数据进行数据预处理,得到分析所述目标用户所需的特征数据,作为目标特征数据;目标用户划分模块,用于按照预设规则,以所述目标用户的目标特征数据为基础,判断所述目标用户为新用户或老用户;所述流失用户判断模块,包括:第一流失用户判断子模块,用于当所述目标用户为新用户时,将所述目标用户的特征数据输入到预设的新用户决策树算法模型,判断所述目标用户是否为流失用户;第二流失用户判断子模块,用于当所述目标用户为老用户时,将所述目标用户的特征数据输入到预设的老用户决策树算法模型,判断所述目标用户是否为流失用户。可选地,所述装置还包括:样本特征数据确定模块,用于选取预设时间段内多个用户的历史特征数据,作为各样本特征数据;样本特征数据划分模块,用于按照预设规则,分别将各所述样本特征数据划分为新用户历史特征数据或老用户历史特征数据;目标历史特征数据确定模块,用于对各所述新用户历史特征数据及各所述老用户历史特征数据,进行数据预处理,分析各新用户所需的特征数据,作为新用户目标历史特征数据及分析各老用户所需的特征数据,作为老用户目标历史特征数据;新用户决策树算法模型确定模块,用于通过各所述新用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的新用户决策树算法模型;老用户决策树算法模型确定模块,用于通过各所述老用户目标历史特征数据,利用决策树算法,训练得到满足所述预设准确率的老用户决策树算法模型。可选地,所述评分策略为,以用户是否近期活跃、使用频率高低及视频播放时长长短为特征数据的分析基础建立的。第三方面,本发明实施例公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序时,实现上述流失用户分析方法中任一所述的方法步骤。在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,实现上述流失用户分析方法中任一所述的方法步骤。在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,实现上述流失用户分析方法中任一所述的方法步骤。本发明实施例提供的一种流失用户分析方法、装置、电子设备及存储介质,可以分析用户行为,具体为,确定目标用户,并提取目标用户的特征数据;本发明实施例中挖掘了一个较为完整的特征集合用于描述用户的行为。进而将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;采用树类的分类模型,可较为准确的分析特征数据,判断目标用户是否为流失用户。当预判出该目标用户为流失用户时,进一步将通过评分策略确定预判的流失用户所属的用户群体,最后针对该用户群体有针对性的实行挽留策略,提升已注册用户的挽留成功率,也能降低运营成本。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。图1为本发明实施例的一种流失用户分析方法流程图;图2为本发明实施例的一种流失用户分析方法中判断目标用户是否为流失用户的方法流程图;图3为本发明实施例的一种流失用户分析方法中决策树算法模型建立方法流程图;图4为本发明实施例的一种流失用户分析方法中各样本特征数据观察期示意图;图5为本发明实施例的一种流失用户分析方法中新用户与老用户的逻辑关系图;图6为本发明实施例的一种流失用户分析方法中新用户与老用户的流失占比对照图;图7为本发明实施例的一种流失用户分析方法逻辑框架图;图8为本发明实施例的一种流失用户分析装置结构示意图;图9为本发明实施例的一种电子设备结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。本发明实施例中通过采集用户的特征数据,并采用树类的分类模型分析用户的特征数据,判断用户是否为流失用户,以及分析流失用户的流失类型,可帮助后期针对性的制定挽留策略,提升挽留成功率,降低运营成本。具体方案如下:第一方面,本发明实施例公开了一种流失用户分析方法,如图1所示。图1为本发明实施例的一种流失用户分析方法流程图,方法包括:s101,确定目标用户,并提取目标用户的特征数据。本发明实施例中,目标用户为指定时段内的任一用户,视频网站可以对指定时段内各用户均执行本申请实施例的流失用户分析方法,从而确定出指定时段内各用户是否为流失用户及流失类型。具体可指定日期作为观测日,提取该观测日前指定时段内的历史数据中的特征数据。通过该特征数据,判断以该观测日为起点的未来指定时段内该目标用户是否为流失用户。流失用户即为以该观测日为起点的未来指定时段内没有活跃行为的用户。例如,指定时段为30天;指定日期为2019.2.1,则本步骤中可提取2019.1.2-2019.1.31的目标用户的特征数据,通过该指定时段的特征数据判断未来以2019.2.1起点的未来30天该目标用户是否为流失用户。本发明实施例中主要采集用户的基本信息、活跃行为、播放行为作为特征数据。例如,用户性别、年龄、最后两次活跃间隔天数、预测日期与最后活跃日期间隔天数、是否登录、是否会员、会员级别、6个月内订单金额、历史订单金额、正片播放量、播放时长、各频道播放量、无播放行为的会话数量、播放视频总量、启动次数,正片播放量、播放时长、活跃日天数等作为特征数据。s102,将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户。决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。本发明实施例中,通过决策树算法预先构建决策树算法模型,通过决策树算法模型分析目标用户的特征数据,判断该目标用户是否为流失用户。具体构建决策树算法模型的方法以下实施例中详细说明。例如,本发明实施例中利用预先构建的梯度提升决策树模型xgboost(extremegradientboosting),分析目标用户的特征数据,判断该目标用户是否为流失用户。s103,当目标用户确定为流失用户时,以该目标用户的特征数据为基础,通过预设评分策略对目标用户进行评价,得到每一预设评分策略所对应的评价结果,并根据所得到的评价结果,确定该目标用户的目标流失类型。在一种实施例中,当目标用户为流失用户时,以目标用户的特征数据为基础,分别通过每种评分类型的预设评分表为目标用户打分,将分数最高的预设评分表的评分类型确定为目标用户的目标流失类型;其中任一预设评分表为按照指定评分类型确定的评分项目表。识别流失用户后,对其实施挽留是运营工作中的重中之重,鉴于运营成本的考虑,更希望是把有价值的用户留住。如果用户无论产品内容怎样改变也不会再尝试使用,比如捆绑、预装等原因进入,只贡献了新增量,与产品没有更多交集,这类用户挽留比较困难,那在挽留用户上投放更多资源也没作用;另外,如何做到在实施挽留的时候有一个友好的用户体验,需要细分挽留的对象,推送用户感兴趣的、与用户心理定位相符合的内容,这样才能最大化避免用户反感,才能不断激发用户的兴趣,提升挽留的成功率。因此,本发明实施例中在识别流失用户后,需要对流失用户进一步挖掘他们的流失原因。在本发明实施例中通过预先建立的不同类型的预设评分表,为流失用户打分,通过类型分析确定流失原因,便于后期指定对应的挽留策略。本发明实施例中,可按照用户特征数据的属性进行分类,进而得到各预设评分类型,针对每种评分类型,分别构建该预设评分类型的预设评分表。可选地,方法还包括:以用户是否近期活跃、使用频率高低及视频播放时长长短为特征数据的分析基础,预先建立预设评分类型的各预设评分表。具体可为:步骤一,将用户是否近期活跃、使用频率高低及视频播放时长长短,作为对用户的特征数据进行分析的评分参考指标;步骤二,针对每种评分参考指标,设置每种评分参考指标的评分项目;步骤三,针对每个评分项目,设置该评分项目下特征数据的多个表现范围,及每种表现范围对应的分值;步骤四,将每种评分项目的一个表现范围及该表现范围对应的分值形成的预设评分表,确定为一种类型的预设评分表,已使得建立每种评分类型的预设评分表。例如,根据运营多样化的推广需求,将预测流失的用户按照是否近期活跃、使用频率高低和播放时长长短三个方面,作为对用户的特征数据进行分析的评分参考指标,形成4种评分类型的预设评分表,每种评分类型的预设评分表的表现分别是:高价值1类预设评分表的用户表现:非近期活跃、使用频率低、播放时长;高价值2类预设评分表的用户表现:近期活跃、使用频率低、播放时长长;低价值1类预设评分表的用户表现:非近期活跃、使用频率低、播放时长短;低价值2类预设评分表的用户表现:近期活跃、使用频率低、播放时长短;每种评分类型的预设评分表包含的评分项目可为:观测日距离最后活跃日天数;最后两次活跃相隔天数;预测日期前最后活跃日的启动次数;预测日期前最后活跃日的播放时长;预测日期前最后活跃日的播放视频数量;预测日期前最后活跃日的正片率;预测日期前最后活跃日的播放频道数;预测日期前7日内的启动次数;预测日期前7日内的播放时长。例如表1中所示的高价值1类用户专家评分表。表1本发明实施例中,其他评分类型的预设评分表与上述高价值1类用户专家评分表中各评分项目相同,在表现和分值上不同,具体不再赘述。可通过上述4种评分类型的预设评分表分别为目标用户打分,将分数最高的预设评分表的评分类型确定为目标用户的目标流失类型。例如,目标用户a参照高价值1类用户专家评分表得分13,高价值2类预设评分表得分32,低价值1类预设评分表得分26,低价值2类预设评分表得分19,那么该目标用户的目标流失类型即为高价值2类。s104,确定所述目标流失类型对应的挽留策略,使得通过所述挽留策略挽留所述目标用户。本发明实施例中,可预先按照评分类型设置与评分类型对应的挽留策略,在上述确定了目标用户的目标流失类型,可在预先制定的多种类型的挽留策略中确定与目标流失类型对应的挽留策略,通过该挽留策略尽可能的对该目标用户进行挽留。例如,上述高价值1类预设评分表的用户表现为非近期活跃、使用频率低、播放时长,则该类型用户的挽留策略可为:获取单次视频的播放时长,为用户推送大于预设播放时长的相同视频类型的视频;高价值2类预设评分表的用户表现:近期活跃、使用频率低、播放时长长,则该类型用户的挽留策略可为:获取用户最近预设时间段观看过的视频,以及视频的播放时长,按照观看的视频类型统计各类型视频播放总时长,为用户推送播放总时长最大的类型的相同类型的视频。具体挽留策略由实施人员根据每种预设评分表的用户表现制定,本发明实施例不做限定。另外,还可按照分析出的目标流失类型,实时制定挽留策略,通过该挽留尽可能的对该目标用户进行挽留。在本发明实施例提供的一种流失用户分析方法中,具体为,确定目标用户,并提取目标用户的特征数据;本发明实施例中挖掘了一个较为完整的特征集合用于描述用户的行为。进而将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;采用树类的分类模型,可较为准确的分析特征数据,判断目标用户是否为流失用户。当预判出该目标用户为流失用户时,进一步将通过评分策略确定预判的流失用户所属的用户群体,最后针对该用户群体有针对性的实行挽留策略,提升已注册用户的挽留成功率,也能降低运营成本。可选地,在本发明实施例的一种流失用户分析装置在确定目标用户,并提取目标用户的特征数据之后,可有图2所示的判断目标用户是否为流失用户的方法流程图,方法包括:s201,对目标用户的特征数据进行数据预处理,得到目标用户的目标特征数据。其中,数据预处理过程具体可为:对目标用户的特征数据进行缺失值填充、离散化、四则运算、去除异常值的处理过程。s202,按照预设规则,以目标用户的目标特征数据为基础,判断目标用户为新用户或老用户;上述s102中将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户,包括:s203,当目标用户为新用户时,将目标用户的特征数据输入到预先确定的新用户决策树算法模型,判断目标用户是否为流失用户;s204,当目标用户为老用户时,将目标用户的特征数据输入到预先确定的老用户决策树算法模型,判断目标用户是否为流失用户。通过本发明实施例,有效判断了目标用户为新用户或老用户,进而通过与目标用户类型对应的决策树算法模型判断该目标用户的流失类型,使得更加精确的判断了目标用户是否为流失用户。可选地,在本发明的流失用户分析方法的一种实施例中,可有图3所示的决策树算法模型建立方法流程图。决策树算法模型包括新用户决策树算法模型及老用户决策树算法模型,预先确定决策树算法模型的步骤包括:s301,选取预设时间段内多个用户的历史特征数据,作为各样本特征数据。不同类型的用户在流失之前会出现与稳定活跃时期不同的行为特征,并且这些行为特征在不同的时间窗口(寒暑假期间,热剧上线期间以及平常时期)又会有不一样的体现。所以本步骤中可采集不同观测期所有用户的历史特征数据,作为各样本特征数据。例如,采集不同观测日前一个月与观测日前三个月的历史特征数据作为各样本特征数据。例如,本发明实施例中选取2018年6月1日和2018年7月15日作为预测日期,设置预设时间段为30日,则可将预设时间段2018年5月2日-2018年5月31及2018年6月16日-2018年7月14日用户的历史特征数据,作为各样本特征数据。两个时间段内总样本量约8亿,随机选取两个时间段各120万作为决策树算法模型的各样本特征数据,其中随机选取其中4/5作为训练数据集,剩下的1/5作为测试数据集。例如图4所示的本发明实施例的一种流失用户分析方法中各样本特征数据观察期示意图,图4中可将预测日期前预设时间段用户的历史特征数据作为目标用户行为观察期,将预测日期后预设时间段用户的历史特征数据作为目标用户流失观察期。本发明实施例中从用户的基本信息、活跃行为、播放行为、剧集规模和档期几个方面构建决策树算法模型。则本步骤中提取的特征数据可为:用户基本信息相关指标:新增天数、平台、性别、年龄;活跃表现相关指标:最后两次活跃间隔天数、预测日期与最后活跃日期间隔天数;预测日期之前最后活跃日行为相关指标:是否登录、是否会员、会员级别、6个月内订单金额、历史订单金额、各类会员类型总数、正片播放量、播放时长、各频道播放量、正片率、无播放行为的会话数量、播放视频总量、启动次数;预测日期前3天7天内播放相关指标:正片播放量、播放时长、正片率、平均每天正片播放量;预测日期前90天各时间段活跃启动分布相关指标:活跃天数、启动次数;预测日期前90天各时间段活跃启动分布相关指标:流失观察期是否在寒暑假、流失观察期内是否有爆剧等。s302,按照预设规则,分别将各样本特征数据划分为新用户历史特征数据或老用户历史特征数据。老用户及新用户的历史特征数据稳定性不同,其流失趋势也不同。因此,本发明实施例中区分了新用户历史特征数据及老用户历史特征数据,便于后期分别设置新用户决策树算法模型及老用户决策树算法模型,针对性的预测新用户中流失用户及老用户中流失用户。图5为本发明实施例的一种流失用户分析方法中新用户与老用户的逻辑关系图。本发明实施例的预设规则为新增用户数据的时间与预测日期及预设时间段的对应关系。具体为,本步骤中检测样本数据中哪些新增用户数据是预测日期前预设时间段内的数据,将这些数据确定为新用户历史特征数据,将新用户历史特征数据对应的用户确定为新用户。将预测日期前预设时间段以前的新增用户数据,确定为老用户历史特征数据,将老用户历史特征数据的对应用户确定为老用户。例如,将预测日期前30日内新增用户数据确定为新用户历史特征数据,将新用户历史特征数据的对应用户确定为新用户;将预测日期前30日以上新增用户数据确定为老用户历史特征数据,将新用户历史特征数据的对应用户确定为老用户。图6为本发明实施例的一种流失用户分析方法中新用户与老用户的流失占比对照图,从图6中可知新用户的流失占比约为老用户的2倍,说明新用户更易流失。本发明实施例针对新老用户两个群体分别建模,结合业务场景和各群体比例需求,分别圈定新老用户群中预测会流失的用户。s303,对各新用户历史特征数据及各老用户历史特征数据,进行数据预处理,得到各新用户目标历史特征数据及各老用户目标历史特征数据。其中,数据预处理过程具体可为:对目标用户的特征数据进行缺失值填充、离散化、四则运算、去除异常值的处理过程。s304,通过各新用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的新用户决策树算法模型。本发明实施例中,采用gbdt(gradientboostingdecisiontree,梯度增强决策树算法)进行二分类,具体实现上,使用了python/r中的xgboost方法,将上一步预处理后的各新用户目标历史特征数据作为模型的输入,流失用户标记为1,未流失用户标记为0,作为目标类标签。目标类标签作为模型的类标签向量,将原始数据分组,一部分做为训练集,剩下的部分做为测试集,用训练集对分类器进行训练,再利用测试集来测试训练得到的模型。多次选择不同的部分作为训练集来综合评价分类器的性能指标,训练得到满足预设准确率的新用户决策树算法模型,例如,训练得到新用户xgboost模型。该预设准确率可有实施人员自行设置,例如根据历史经验设置,或根据具体要求设置。本发明实施例中可设置为85%。s305,通过各老用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的老用户决策树算法模型。按照上述确定新用户决策树算法模型的方式,通过各老用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的老用户决策树算法模型,例如,训练得到老用户xgboost模型,具体不再赘述。通过上述各样本特征数据的训练数据集及测试数据集,可验证本发明实施例得到的新用户决策树算法模型及老用户决策树算法模型的质量。例如表2所示的新用户决策树算法模型与老用户决策树算法模型预测效果分析表。表2用户群准确率precision召回率recall新用户76%68%老用户66%42%通过本发明实施例,可实现针对性的得到预测流失用户的新用户决策树算法模型及老用户决策树算法模型,进而通过该新用户决策树算法模型可较为准确的预测出新用户是否为流失用户,及通过该老用户决策树算法模型可较为准确的预测出老用户是否为流失用户,进而便于后期对新用户的流失用户及老用户的流失用户针对性的设置挽留策略,提高挽留成功率。为了更好地说明本发明实施例的一种流失用户分析方法,可有图7所示的本发明实施例的一种流失用户分析方法逻辑框架图。首先确定样本用户;提取各样本用户的特征数据,对各样本用户的特征数据进行数据预处理,得到各新用户目标历史特征数据及各老用户目标历史特征数据;通过各新用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的新用户决策树算法模型;通过各老用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的老用户决策树算法模型。当有要预测的目标用户时,提取该目标用户的特征数据;以目标用户的目标特征数据为基础,判断目标用户为新用户或老用户;当目标用户为新用户时,将目标用户的特征数据输入到预先确定的新用户决策树算法模型,判断该目标用户是否为流失用户;当该目标用户为老用户时,将该目标用户的特征数据输入到预先确定的老用户决策树算法模型,判断该目标用户是否为流失用户。当该目标用户为流失用户时,以该目标用户的特征数据为基础,分别通过高价值1类用户专家评分表、高价值2类用户专家评分表、低价值1类用户专家评分表及低价值2类用户专家评分表为该目标用户打分,将分数最高的评分表的评分类型确定为该目标用户的目标流失类型。例如,目标用户为a,通过高价值1类用户专家评分表得到目标用户a的分数为13;通过高价值2类用户专家评分表得到目标用户a的分数为32;通过低价值1类用户专家评分表得到目标用户a的分数为26;通过低价值2类用户专家评分表得到目标用户a的分数为19,则该目标用户a为高价值2类流失用户。第二方面,本发明实施例公开了一种流失用户分析装置,如图8所示。图8为本发明实施例的一种流失用户分析装置结构示意图,装置包括:特征数据提取模块801,用于确定目标用户,并提取目标用户的特征数据;流失用户判断模块802,用于将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;目标流失类型确定模块803,用于当目标用户为流失用户时,以目标用户的特征数据为基础,通过预设评分策略对目标用户进行评价,得到每一预设评分策略所对应的评价结果,并根据所得到的预设评分策略所对应的评价结果,确定目标用户的目标流失类型;挽留策略确定模块804,用于确定目标流失类型对应的挽留策略,使得通过挽留策略挽留目标用户。在本发明实施例提供的一种流失用户分析装置中,具体为,确定目标用户,并提取目标用户的特征数据;本发明实施例中挖掘了一个较为完整的特征集合用于描述用户的行为。进而将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;采用树类的分类模型,可较为准确的分析特征数据,判断目标用户是否为流失用户。当预判出该目标用户为流失用户时,进一步将通过评分策略确定预判的流失用户所属的用户群体,最后针对该用户群体有针对性的实行挽留策略,提升已注册用户的挽留成功率,也能降低运营成本。可选地,在本发明的流失用户分析装置的一种实施例中,装置还包括:目标特征数据确定模块,用于对目标用户的特征数据进行数据预处理,得到目标用户的目标特征数据;目标用户划分模块,用于按照预设规则,以目标用户的目标特征数据为基础,判断目标用户为新用户或老用户;流失用户判断模块802,包括:第一流失用户判断子模块,用于当目标用户为新用户时,将目标用户的特征数据输入到预先确定的新用户决策树算法模型,判断目标用户是否为流失用户;第二流失用户判断子模块,用于当目标用户为老用户时,将目标用户的特征数据输入到预先确定的老用户决策树算法模型,判断目标用户是否为流失用户。可选地,在本发明的流失用户分析装置的一种实施例中,决策树算法模型包括新用户决策树算法模型及老用户决策树算法模型,装置还包括:样本特征数据确定模块,用于选取预设时间段内多个用户的历史特征数据,作为各样本特征数据;样本特征数据划分模块,用于按照预设规则,分别将各样本特征数据划分为新用户历史特征数据或老用户历史特征数据;目标历史特征数据确定模块,用于对各新用户历史特征数据及各老用户历史特征数据,进行数据预处理,得到各新用户目标历史特征数据及各老用户目标历史特征数据;新用户决策树算法模型确定模块,用于通过各新用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的新用户决策树算法模型;老用户决策树算法模型确定模块,用于通过各老用户目标历史特征数据,利用决策树算法,训练得到满足预设准确率的老用户决策树算法模型。可选地,在本发明的流失用户分析装置的一种实施例中,装置还包括:预设评分表建立模块,用于以用户是否近期活跃、使用频率高低及视频播放时长长短为特征数据的分析基础,预先建立每种评分评分类型的各预设评分表。第三方面,本发明实施例公开了一种电子设备,如图9所示。图9为本发明实施例的一种电子设备结构示意图,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器904、通信接口902、存储器903通过通信总线904完成相互间的通信;存储器903,用于存放计算机程序;处理器901,用于执行存储器903上所存放的程序时,实现以下方法步骤:确定目标用户,并提取目标用户的特征数据;将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;当目标用户为流失用户时,以目标用户的特征数据为基础,通过预设评分策略对目标用户进行评价,得到每一预设评分策略所对应的评价结果,并根据所得到的预设评分策略所对应的评价结果,确定目标用户的目标流失类型;确定目标流失类型对应的目标策略,使得通过目标策略挽留所述目标用户。上述电子设备提到的通信总线904可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线904可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口902用于上述电子设备与其他设备之间的通信。存储器903可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器903还可以是至少一个位于远离前述处理器901的存储装置。上述的处理器901可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。在本发明实施例提供的一种电子设备中,具体为,确定目标用户,并提取目标用户的特征数据;本发明实施例中挖掘了一个较为完整的特征集合用于描述用户的行为。进而将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;采用树类的分类模型,可较为准确的分析特征数据,判断目标用户是否为流失用户。当预判出该目标用户为流失用户时,进一步将通过评分策略确定预判的流失用户所属的用户群体,最后针对该用户群体有针对性的实行挽留策略,提升已注册用户的挽留成功率,也能降低运营成本。在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,实现上述流失用户分析方法中任一所述的方法步骤。在本发明实施例提供的一种计算机可读存储介质中,具体为,确定目标用户,并提取目标用户的特征数据;本发明实施例中挖掘了一个较为完整的特征集合用于描述用户的行为。进而将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;采用树类的分类模型,可较为准确的分析特征数据,判断目标用户是否为流失用户。当预判出该目标用户为流失用户时,进一步将通过评分策略确定预判的流失用户所属的用户群体,最后针对该用户群体有针对性的实行挽留策略,提升已注册用户的挽留成功率,也能降低运营成本。在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,实现上述流失用户分析方法中任一所述的方法步骤。在本发明实施例提供的一种包含指令的计算机程序产品中,具体为,确定目标用户,并提取目标用户的特征数据;本发明实施例中挖掘了一个较为完整的特征集合用于描述用户的行为。进而将目标用户的特征数据输入到预先构建的决策树算法模型,判断目标用户是否为流失用户;采用树类的分类模型,可较为准确的分析特征数据,判断目标用户是否为流失用户。当预判出该目标用户为流失用户时,进一步将通过评分策略确定预判的流失用户所属的用户群体,最后针对该用户群体有针对性的实行挽留策略,提升已注册用户的挽留成功率,也能降低运营成本。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1