账户分类模型训练方法及装置和账户分类方法及装置与流程

文档序号:22679939发布日期:2020-10-28 12:39阅读:122来源:国知局
账户分类模型训练方法及装置和账户分类方法及装置与流程

本发明涉及数据分析领域,尤其涉及一种账户分类模型训练方法及装置和账户分类方法及装置。



背景技术:

为对账户进行跟进提供信息支持,现有的账户管理系统,提供了账户流失预测,但是发明人经过研究发现:现有的流失预测仅仅局限于得到一个是否会流失的预测结果,结果较为单一,而缺乏分类不同账户的未来流失状态。



技术实现要素:

本发明实施例提供一种账户分类模型训练方法及装置和账户分类方法及装置,以至少解决现有技术中的以上技术问题。

第一方面,本发明实施例提供了一种账户分类模型训练方法,包括:

获取多个样本账户的账户数据;

计算所述账户数据,得到所述多个样本账户的指标数据;

根据所述多个样本账户的指标数据及流失状态类别训练所述账户分类模型。

在一种实施方式中,所述样本账户的流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施方式中,在所述多个样本账户中,每种流失状态类别的样本账户的数量在预设数值范围内。

在一种实施方式中,所述样本账户的流失状态类别的确定方式包括:

根据流失状态类别的定义和所述账户数据,确定所述样本账户的流失状态类别。

在一种实施方式中,确定所述流失状态类别的定义的方式包括:

根据所述账户数据进行统计分析,确定每一所述流失状态类别的边界阈值;

根据所述边界阈值,确定每一所述流失状态类别的定义。

第二方面,本发明实施例还提出一种账户分类方法,包括:

获取多个待测账户的账户数据;

计算所述账户数据,得到所述多个待测账户的指标数据;

采用账户分类模型对所述指标数据进行预测,得到所述待测账户的流失状态类别。

在一种实施方式中,所述账户分类模型的训练方式为:

根据多个样本账户的指标数据及流失状态类别训练所述账户分类模型;其中,所述样本账户的指标数据根据所述样本账户的账户数据计算得到。

在一种实施方式中,所述流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施方式中,还包括:

当接收到处理与管理指令时,根据所述处理与管理指令从所述多个待测账户中确定目标处理账户,并对所述目标处理账户的处理记录进行相应的管理操作;

其中,所述处理与管理指令包括新增处理记录、处理记录列表、删除处理记录和编辑处理记录中的任意一种或多种,所述处理记录包括基于所述流失状态类别对所述待测账户进行跟踪处理后得到的信息。

在一种实施方式中,还包括:

当接收到分类列表查询指令时,获取所述分类列表查询指令中的目标查询分类;

确定流失状态类别与所述目标查询分类一致的所述待测账户为目标查询账户;

根据所述目标查询账户的账户数据,生成查询列表;

和/或,

当接收到条件筛选指令时,获取所述条件筛选指令里的筛选条件;

根据所述筛选条件,将满足所述筛选条件的所述待测账户确定为目标筛选账户;

根据所述目标筛选账户的账户数据,生成筛选列表;

和/或,

当接收到账户详情请求指令时,根据所述账户详情请求指令从所述待测账户中选定目标请求账户;

根据所述目标请求账户的账户数据,生成所述账户详情请求指令所需的详情数据;

和/或,

当接收到数据下载指令时,根据所述数据下载指令执行相应下载操作,其中,所述数据下载指令包括创建导出任务、查询导出状态、取消导出任务和下载导出文件中的至少一项。

第三方面,本发明实施例还提出一种账户分类模型训练装置,包括:

样本账户数据获取模块,用于获取多个样本账户的账户数据;

样本计算模块,用于计算所述账户数据,得到所述多个样本账户的指标数据;

训练模块,用于根据所述多个样本账户的指标数据及流失状态类别训练所述账户分类模型。

在一种实施方式中,所述样本账户的流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施方式中,在所述多个样本账户中,每种流失状态类别的样本账户的数量在预设数值范围内。

在一种实施方式中,还包括:

样本账户分类模块,用于根据流失状态类别的定义和所述账户数据,确定所述样本账户的流失状态类别。

在一种实施方式中,还包括:

定义模块,用于根据所述账户数据进行统计分析,确定每一所述流失状态类别的边界阈值;

根据所述边界阈值,确定每一所述流失状态类别的定义。

第四方面,本发明实施例还提出一种账户分类装置,包括:

待测账户数据获取模块,用于获取多个待测账户的账户数据;

待测计算模块,用于计算所述账户数据,得到所述多个待测账户的指标数据;

分类模块,用于采用账户分类模型对所述指标数据进行预测,得到所述待测账户的流失状态类别。

在一种实施方式中,所述账户分类模型的训练方式为:

根据多个样本账户的指标数据及流失状态类别训练所述账户分类模型;其中,所述样本账户的指标数据根据所述样本账户的账户数据计算得到。

在一种实施方式中,所述流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施方式中,还包括:

处理与管理模块,用于当接收到处理与管理指令时,根据所述处理与管理指令从所述多个待测账户中确定目标处理账户,并对所述目标处理账户的处理记录进行相应的管理操作;

其中,所述处理与管理指令包括新增处理记录、处理记录列表、删除处理记录和编辑处理记录中的任意一种或多种,所述处理记录包括用户基于所述流失状态类别对所述待测账户进行跟踪处理后得到的信息。

在一种实施方式中,还包括:

目标查询模块,用于当接收到分类列表查询指令时,获取所述分类列表查询指令中的目标查询分类;

确定流失状态类别与所述目标查询分类一致的所述待测账户为目标查询账户;

根据所述目标查询账户的账户数据,生成查询列表;

和/或,

条件筛选模块,用于当接收到条件筛选指令时,获取所述条件筛选指令里的筛选条件;

根据所述筛选条件,将满足所述筛选条件的所述待测账户确定为目标筛选账户;

根据所述目标筛选账户的账户数据,生成筛选列表;

和/或,

账户详情模块,用于当接收到账户详情请求指令时,根据所述账户详情请求指令从所述待测账户中选定目标请求账户;

根据所述目标请求账户的账户数据,生成所述账户详情请求指令所需的详情数据;

和/或,

数据下载模块,用于当接收到数据下载指令时,根据所述数据下载指令执行相应下载操作,其中,所述数据下载指令包括创建导出任务、查询导出状态、取消导出任务和下载导出文件中的至少一项。

第五方面,本发明实施例提供了一种账户分类模型训练设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述语音控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。

第六方面,本发明实施例提供了一种账户分类设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述语音控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。

第七方面,本发明实施例提供了一种计算机可读存储介质,用于存储所述设备所用的计算机软件指令,其包括用于执行上述账户分类模型训练方法或账户分类方法所涉及的程序。

上述技术方案中的一个技术方案具有如下优点或有益效果:本发明所训练的账户分类模型,可以预测账户的流失状态类别,从而可以明确账户属于哪种状态,有利于针对不同类别的账户采取不同跟进策略,提高流失预防和挽留效果。

上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。

图1为本发明实施例的一种账户分类模型训练方法的流程图;

图2为本发明实施例的一种账户分类模型训练方法中确定分类的结构示意图;

图3为本发明实施例的一种账户分类方法中消费/续充周期分析的示例图;

图4为本发明实施例的一种账户分类方法的流程图;

图5为本发明实施例的一种账户分类方法的一种具体流程图;

图6为图5所示的流程图的进一步详细流程图;

图7为本发明实施例的一种账户分类方法可适用的一种系统架构图;

图8为本发明实施例的一种账户分类方法中新增处理记录的页面示例图;

图9为本发明实施例的一种账户分类方法中管理操作页面示例图;

图10为本发明实施例的一种账户分类方法中查询列表的页面示例图;

图11为本发明实施例的一种账户分类方法中账户详情的页面示例图;

图12为本发明实施例的一种账户分类方法中数据下载管理的页面示例图;

图13为本发明实施例的一种账户分类模型训练装置的结构示意图;

图14为本发明实施例的一种账户分类装置的结构示意图;

图15为本发明实施例的一种账户分类模型训练设备或账户分类设备的结构示意图。

具体实施方式

在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。

本发明实施例主要提供了账户分类模型训练方法及装置和账户分类方法及装置,下面分别通过以下实施例进行技术方案的展开描述。

在整个描述中可以使用以下词语,通常给以下词语下述含义:

账户:客户/商户所建立的账户,通常一个客户/商户对应一个账户,但不排除一个客户可以建立多个账户;例如,本发明实施例适用于本地广告推广业务的管理系统,此时账户投放本地广告的客户/商户建立的账户。账户也可称为账号。

本发明实施例提供了一种账户分类模型训练方法。

参见图1,为本发明实施例的一种账户分类模型训练方法的流程图,包括:

s11、获取多个样本账户的账户数据;

s12、计算账户数据,得到多个样本账户的指标数据;

s13、根据多个样本账户的指标数据及流失状态类别训练账户分类模型。

在一种实施方式中,步骤s13中所训练的账户分类模型为账户多分类模型。所述样本账户的流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

示例地,确定样本账户的流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户,则所述多个样本账户,包括:流失状态类别为正常账户的多个样本账户、流失状态类别为需预警账户的多个样本账户、流失状态类别为失效复活账户的多个样本账户、流失状态类别为二次开发账户的多个样本账户、流失状态类别为重点优化账户的多个样本账户及流失状态类别为优化预警账户的多个样本账户。

对账户未来的多种可能状态分类进行预测,直接给出未来预定时期里账户趋向于哪种类型确定其流失状态类别,从而体现不同账户的不同优先级处理等级,通过处理高优先级分类商户以提高流失预防和挽留效果;也可以针对不同分类采取不同处理方法,贴合实际业务的智能分类结果给销售更友好的使用体验,无需人工做很多无用分析,即可采用各分类通用或个性化的技巧进行干预处理,提高服务质量。

在一种实施方式中,在所述多个样本账户中,每种流失状态类别的样本账户的数量在预设数值范围内。

在一种实施方式中,所述样本账户的流失状态类别的确定方式包括:

根据流失状态类别的定义和所述账户数据,确定所述样本账户的流失状态类别。

在一种实施方式中,确定所述流失状态类别的定义的方式包括:

s101、根据所述账户数据进行统计分析,确定每一所述流失状态类别的边界阈值;

s102、根据所述边界阈值,确定每一所述流失状态类别的定义。

在一种实施方式中,在步骤s101前可以通过下述步骤确定流失状态类别的种类可以为:

参见图2所示,结合实际业务,建立坐标系,基于续费、消费两个指标数值分别作为横轴、纵轴来表现,确定了账户状态分布的四个象限:

第一象限为账户在预设时间内即有消费又有续费,在业务场景中属于正常账户;

第二象限为账户在预设时间内有消费、无续费,而其中又分为两种情况:一种是账户当前余额很充足,足够消费很长一段时间,这种情况在业务场景中也属于正常账户;另一种是账户余额不足,但仍在消费,且一段时间内仍未续费,这种在业务中属于需要预警的账户;

第三象限为账户在预设时间内即无消费也无续费;而其中也存在两种情况:一种是账户在预设时间内无消费无续费,但余额足以继续消费,这种情况在业务中一般为因某种原因暂停推广消费和续费,而过一段时间或销售给予某种操作干预可以使账户返回到其他象限;第二种为账户余额较少,且预设时间内未消费和续费,这种情况业务上属于流失账户,较难通过手段等方式返回到其他象限;

第四象限为账户在预设时间内有续费但无消费,这种情况在业务场景中属于账户对推广产品是认可的,但由于某种原因未继续消费,此类账户需要销售提供关注,帮账户解决遇到的相关问题,提升用户体验,促进账户消费。

通过基于续费、消费两个指标数值分别作为横轴、纵轴来建立坐标系,来分布账户,从而设计人员清楚直观来确定账户流失状态的种类。

在一种实施例中,步骤s101的过程具体可以为:结合账户数据进行统计,并计算分析真实账户的消费、充值和间隔等生命周期情况,分析出大量账户真实的生命周期表象;基于生命周期的分析结果确定各流失状态分类的边界阈值。示例,图3是统计分析消费金额、充值金额与时间的关系的示例图,体现大量账号是在充值后消费完,再过一端时间再进行充值消费的现象,消费完和再充值消费之间间隔着一段时间。

示例,经过步骤s101的统计分析,经统计分析最终确定了如下分类的定义:

a)正常用户:25天内有续值有消费;或,25天内无续费有消费,且可消费天数>7;

b)需预警用户:25天内无续费有消费,且可消费天数<=7;

c)失效复活用户:25天内无续费无消费,且余额>=100元;

d)二次开发客户:25天内无续费无消费,且余额<100元;

e)重点优化客户:25天内有续费无消费,且余额>=1000元;

f)优化预警客户:25天内有续费无消费,且余额<1000元。

在一种实施例中,针对业务场景特性及与营销相关指标分析,从账户数据里,包括账户行为数据、账户业务数据、账户交易数据、账户基础数据等方面确定指标,再基于这些指标结合时间因素,进行辅助加工指标,最终确定样本指标作为训练数据。示例性地,下述给出样本指标所包含的指标数据:

当前余额、平均消费、平均订单交易流水、预计可消费天数、平均点击数、平均展示次数、平均商机数、近60天消费、现金斜率、最后一次充值距离今天的日期数、最后一次余额大于0前60天平均商机数、最后一次余额大于0前60天平均订单量、最后一次余额大于0前60天平均订单流水、最后一次余额大于0前60天平均推广预算金额、最后一次余额大于0前60天平均日账户质量、最后一次余额大于0前60天充值金额、最后一次余额大于0前60天总充值天数、最后一次余额大于0前60天总消费天数、首次消费日期、首冲时间、首次预存费、一二级行业。

在一种实施例中,指标数据包括了基于时间因子的指标数据,步骤s12中除了常规的基础指标数据、平均、求和等指标计算外,还可以包括对多天消费数据按序做多项式曲线拟合,并求出斜率作为指标数据,更直观的体现账户的消费趋势;也可以加入其他指标的趋势数据。

在一种实施例中,所述账户分类模型的训练周期为每天,即每天账户数据更新后,根据当天更新后的账户数据执行步骤s11~步骤s12,得到多个样本账户的指标数据及流失状态类别,然后执行步骤s13得到当天最新的账户分类模型。

参见图4,本发明实施例还提出一种账户分类方法,包括:

s41、获取多个待测账户的账户数据;

s42、计算所述账户数据,得到所述多个待测账户的指标数据;

s43、采用账户分类模型对所述指标数据进行预测,得到所述待测账户的流失状态类别。

根据上述分类方法,预测客户的账号流失状态类别,可以明确账户属于哪种状态,区分销售需要干预时采取的不同方案;多个待测账户的不同状态,直观体现其优先级,哪些客户需高优支持,来保证用有限的人力得到最好的预防流失效果,同时给客户带来有质有量同时及时的帮助。

在一种实施方式中,所述账户分类模型的训练方式为:

根据多个样本账户的指标数据及流失状态类别训练所述账户分类模型;其中,所述样本账户的指标数据根据所述样本账户的账户数据计算得到。

在一种实施例中,可以参照图7所示,本实施例的步骤定时调度,比如每天系统定时执行本实施例所提供的账户分类方法。且按照图7的流程,由当天训练数据训练当前的账户分类模型,以根据当前的账户分类模型预测待测账户的流失状态类别。保证模型能学习到新数据的特性,从而使预测更贴近与当前数据指标特点,预测效果更好。

在一种实施方式中,账户分类模型为账户多分类模型。所述流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施例中,针对业务场景特性及与营销相关指标分析,从账户数据里,包括账户行为数据、账户业务数据、账户交易数据、账户基础数据等方面确定指标,再基于这些指标结合时间因素,进行辅助加工指标,最终确定样本指标作为预测数据。示例性地,下述给出样本指标所包含的指标数据:

当前余额、平均消费、平均订单交易流水、预计可消费天数、平均点击数、平均展示次数、平均商机数、近60天消费、现金斜率、最后一次充值距离今天的日期数、最后一次余额大于0前60天平均商机数、最后一次余额大于0前60天平均订单量、最后一次余额大于0前60天平均订单流水、最后一次余额大于0前60天平均推广预算金额、最后一次余额大于0前60天平均日账户质量、最后一次余额大于0前60天充值金额、最后一次余额大于0前60天总充值天数、最后一次余额大于0前60天总消费天数、首次消费日期、首充时间、首次预存费和一二级行业。

在一种实施例中,指标数据包括了基于时间因子的指标数据,步骤s42中除了常规的基础指标数据、平均、求和等指标计算外,还可以包括对多天消费数据按序做多项式曲线拟合,并求出斜率作为指标数据,更直观的体现账户的消费趋势;也可以加入其他指标的趋势数据。

参见图7所示,在一种实施方式中,还包括:

当接收到处理与管理指令时,根据所述处理与管理指令从所述多个待测账户中确定目标处理账户,并对所述目标处理账户的处理记录进行相应的管理操作;

其中,所述处理与管理指令包括新增处理记录、处理记录列表、删除处理记录和编辑处理记录中的任意一种或多种,所述处理记录包括基于所述流失状态类别对所述待测账户进行跟踪处理后得到的信息。

详细示例可以参照图8和图9,图8为新建处理记录的操作页面示例图,图9为处理记录管理操作页面示例图。另外,所述处理记录列表指的是获取记录列表页。

通过上述方案,在处理记录里可以对预测的账户进行反馈处理,即能让研发人员了解预测的效果,不断优化预测模型,又能给针对该账户的跟进处理记录信息有序保存,使得后续跟进有迹可循,提高对客户认知,提高预防效果;也能减少对客户打扰,直接针对问题操作,提升用户体验。

例如,本实施例可以适用于销售人员对账户的跟进时,预测流失状态类别给销售参考,销售根据预测对账户进行处理,并记录处理记录,处理记录作为对预测结果的反馈,有利于研发人员根据反馈改进,使整体有机的循环;销售针对预测分类结果进行反馈处理、持续跟进,每天更新的账户的流失状态类别也便于销售总结跟进措施的效果,经过跟进并成功恢复正常的账户,其反馈处理记录,销售可以总结并复用于其他账户,甚至提取经验分享给其他销售。

在一种实施方式中,还包括:

当接收到分类列表查询指令时,获取所述分类列表查询指令中的目标查询分类;

确定流失状态类别与所述目标查询分类一致的所述待测账户为目标查询账户;

根据所述目标查询账户的账户数据,生成查询列表。

进一步地,目标查询分类可以为全部流失状态类别,也可以为至少一种流失状态类别。参见图10的示例,将全部类别的待测账户的流失状态类别拼接如账号名称、销售姓名、供应商、处理状态、余额、首次充值日期和首次消费日期等,生成查询列表进行展示。所有待测账户的不同状态,直观体现其优先级,哪些客户需高优支持,来保证用有限的人力得到最好的预防流失效果,同时给客户带来有质有量同时及时的帮助。本实施例也可针对性获取某一类别下的所有账户的查询列表,便于销售获取针对性的数据。

在一种实施方式中,还包括:

当接收到条件筛选指令时,获取所述条件筛选指令里的筛选条件;

根据所述筛选条件,将满足所述筛选条件的所述待测账户确定为目标筛选账户;

根据所述目标筛选账户的账户数据,生成筛选列表。

在一种实施方式中,还包括:

当接收到账户详情请求指令时,根据所述账户详情请求指令从所述待测账户中选定目标请求账户;

根据所述目标请求账户的账户数据,生成所述账户详情请求指令所需的详情数据。

参考图11示例为目标请求账户的详情数据的展示示例图。详情数据可以包括客户信息、账户信息和点展消趋势。客户信息为建立该账户对应的客户的信息。客户信息对应图中的商家信息,包括了供应商名称、行业、所述销售、标签;账户信息包括账面余额、商机成本、首充日期、首次预存费、最近续费金额、当前有效计划数、业务点数、兴趣点(poi,pointofinterest)打点数、最近消费日期、最近消费金额和最近续费时间等;点展消趋势包括展现次数、点击次数和消费金额。

上述实施方式提供了账户详细的数据页面以及从开通账户后到现在的展、点、销的趋势图,给销售直观、详尽的账户信息用以分析账户状态和需要操作,来帮助客户解决问题。全面的账户数据的展现也可以为对客户沟通提供数据支撑,辅助对客户的沟通,并提高服务质量。

在一种实施方式中,还包括:

当接收到数据下载指令时,根据所述数据下载指令执行相应下载操作,其中,所述数据下载指令包括创建导出任务、查询导出状态、取消导出任务和下载导出文件中的至少一项。可以参见图12,为数据任务下载管理页面示例。

基于上述步骤,实现了预测结果数据(即待测账户的流失状态类别)的在线应用。其中,除了提供按各分类、各检索条件等方便查询展示,还提供了账户详细的数据页面以及从开通账户后到现在的展、点、销的趋势图,给销售直观、详尽的账户信息用以分析账户状态和需要操作,来帮助客户解决问题。同时,管理层也能通过反馈处理信息进行管理监控销售工作;销售也能通过客户账号的历史跟进信息和产生效果进一步指定新计划,有益于计划总结有能减少对客户的过度干扰,使工作简单、直接、高效。

在一种实施例中,所述账户分类模型的训练周期为每天,即每天账户数据更新后,根据当天更新后的账户数据训练得到当天最新的账户分类模型。

在一种实施例中,本实施例的账户分类的周期为每天,即每天均对待测账户执行如上述步骤s41~步骤s43的账户分类。

在一种实施例中,本实施例的待测账户为全部账户。

在一种实施例中,参见图7,还包括:

步骤s41计算所得到的部分指标数据和步骤s43得到的流失状态类别数据均会存入数据库中,具体为存于palo数据库和mysql数据库;同时在线系统服务层的用户的操作反馈等也会存入mysql数据库;这样,数据库层通过存储的数据使离线任务与在线系统服务衔接起来,使得上述分类列表查询、条件筛选、账户详情请求、处理与管理、数据下载的功能得以实现。

其中,plao数据库为百度基础架构部数据团队所开发的一套面向大规模数据分析的并行数据库系统;mysql数据库是一种开放源代码的关系型数据库管理系统,使用最常用的数据库管理语言--结构化查询语言进行数据库管理。

在一种实施例中,可以通过搭建如图7所示的架构来执行本实施例的步骤流程,整体架构主要分为四层,包括系统服务层、数据库层、模型训练和分类预测层和数据工程层。其中,除系统服务层、数据库层外,其他层均为离线工程层,基于公司定时调度平台串联起来各离线工作,可以每天用最新的账户数据,从数据加工到模型训练、预测、入库调度执行一遍完整流程,以保证模型能实时反馈实时指标特性,保证预测效果。

图5为本实施例一种可实现的具体流程图,图6为图5进一步的详细图,图7的系统架构可执行图5和图6所示的流程,结合图5、图6和图7,详述本实施例一种可实现方式:

(a)数据工程层:主要负责对账户数据进行分析计算,最终沉淀出训练和预测所需指标数据和分类标签。主要分为三部分:s501基础数据计算、s502训练数据沉淀和s503预测数据沉淀;基础数据分析计算由hadoop集群处理,hive集群存储加任务调度来完成;训练、预测数据加工沉淀部分由python工程完成。其中,hadoop是一种分布式系统基础架构,能够对大量数据进行分布式处理。hive是基于hadoop的一个数据仓库工具。python是一种计算机程序设计语言,是一种动态的、面向对象的脚本语言;可以用于项目的开发。

s501指标数据计算,包括了从多数据源拉取原始数据,进行加工得到账户数据,结合时间因子计算沉淀得到时间维度数据;对于用于模型训练的账户,确定流失状态类别,根据流失状态类别对账户进行分类,然后在每一流失状态类别的账户里取样预设数量的样本账户,得到训练数据,训练数据包括了样本账户的指标数据和流失状态类别;对于待测账户,计算沉淀(即以账户维度汇总拼接分散的单独存储的各指标数据),得到预测数据,预测数据包括了待测账户的指标数据。

s502模型训练数据沉淀,包括了对同批次训练数据备份,然后训练数据拉取,计算斜率(即计算关于趋势的指标数据),数据指标拼接,将自定义n天的指标数据合并,得到当天训练数据。

s503预测数据沉淀,包括同批次预测数据备份,然后预测数据拉取,计算斜率(即计算关于趋势的指标数据),数据指标拼接,将自定义n天的指标数据合并,得到当天预测数据。

(b)模型训练、分类预测层:主要用于s504账户分类模型训练和s505预测分类,还包括对加工沉淀好的模型训练、预测指标数据按时间批次存储和备份;还包括模型评估和数据库操作管理。本层在python工程中,且包括下述通用工具:配置管理工具、文件工具、数据校验工具、字符转换工具和日志工具。其中,

s504账户分类模型训练的过程包括了训练配置加载初始化、加载训练数据。分割指标标签数据、分割训练及交叉验证集、训练账户分类模型、模型评估、同批次历史模型备份、新训练模型存储。

s505预测分类的过程包括了预测配置加载初始化、加载指定批次预测数据、加载指定批次账户分类模型、预测流失状态类别、分类结果与展示数据拼接、同批次预测分类结果数据备份、预测分类结果数据保存。

(c)数据库层:数据工程层加工的部分账户数据入数据库和s506预测结果入数据库,这两部分所存入的数据库可以为palo数据库和mysql数据库,预测结果即所预测的待测用户的流失状态类别;同时系统服务层的用户操作反馈等也会存入mysql数据库;数据库层通过存储的数据使离线任务与在线的系统服务层衔接起来。其中,

s506预测结果存入数据库的过程包括:导入依赖文件配置检查、导入环境初始化、导入文件切片、清理当前批次数据库(db,database)数据、遍历切片数据导入db、当导入成功时删除历史批次数据、当导入不成功时,进行邮件或短信报警。

其中,所述依赖文件为数据入库需要的必备参数的配置文件,比如数据库、表配置、要入库文件路径批次等。

(d)系统服务层:销售及管理人员使用的在线系统,即为s507业务系统使用,为预测结果数据在线的应用,除了提供按各分类、各检索条件等方便查询展示,还提供了账户详细的数据页面以及从开通账户后到现在的展、点、销的趋势图,给销售直观、详尽的客户信息用以分析账户状态和需要操作,来帮助客户解决问题;同时,可以对预测的账户进行反馈处理,即能让研发人员了解预测的效果,不断优化预测模型,又能给针对该账户的跟进处理记录信息有序保存,使得后续跟进有迹可循,提高对客户认知,提高预防效果;也能减少对客户打扰,直接针对问题操作,提升用户体验;系统服务层所提供的功能对应在上述实施例中的方法步骤有详细描述,因此此处不再赘述。

本发明实施例还提出一种账户分类模型训练装置,参见图13,图13为账户分类模型装置的结构示意图,包括:

样本账户数据获取模块121,用于获取多个样本账户的账户数据;

样本计算模块122,用于计算所述账户数据,得到所述多个样本账户的指标数据;

训练模块123,用于根据所述多个样本账户的指标数据及流失状态类别训练所述账户分类模型。

在一种实施方式中,所述样本账户的流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施方式中,在所述多个样本账户中,每种流失状态类别的样本账户的数量在预设数值范围内。

在一种实施方式中,还包括:

样本账户分类模块,用于根据流失状态类别的定义和所述账户数据,确定所述样本账户的流失状态类别。

在一种实施方式中,还包括:

定义模块,用于根据所述账户数据进行统计分析,从而确定每一所述流失状态类别的边界阈值;

根据所述边界阈值,确定每一所述流失状态类别的定义。

本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。

本发明实施例还提出一种账户分类装置,参见图14,为本实施例账户分类装置的结构示意图,包括:

待测账户数据获取模块131,用于获取多个待测账户的账户数据;

待测计算模块132,用于计算所述账户数据,得到所述多个待测账户的指标数据;

分类模块133,用于采用账户分类模型对所述指标数据进行预测,得到所述待测账户的流失状态类别。

在一种实施方式中,所述账户分类模型的训练方式为:

根据多个样本账户的指标数据及流失状态类别训练所述账户分类模型;其中,所述样本账户的指标数据根据所述样本账户的账户数据计算得到。

在一种实施方式中,所述流失状态类别包括正常账户、需预警账户、失效复活账户、二次开发账户、重点优化账户和优化预警账户中的至少三种。

在一种实施方式中,还包括:

处理与管理模块,用于当接收到处理与管理指令时,根据所述处理与管理指令从所述多个待测账户中确定目标处理账户,并对所述目标处理账户的处理记录进行相应的管理操作;

其中,所述处理与管理指令包括新增处理记录、处理记录列表、删除处理记录和编辑处理记录中的任意一种或多种,所述处理记录包括用户基于所述流失状态类别对所述待测账户进行跟踪处理后得到的信息。

在一种实施方式中,还包括:

目标查询模块,用于当接收到分类列表查询指令时,获取所述分类列表查询指令中的目标查询分类;

确定流失状态类别与所述目标查询分类一致的所述待测账户为目标查询账户;

根据所述目标查询账户的账户数据,生成查询列表;

和/或,

条件筛选模块,用于当接收到条件筛选指令时,获取所述条件筛选指令里的筛选条件;

根据所述筛选条件,将满足所述筛选条件的所述待测账户确定为目标筛选账户;

根据所述目标筛选账户的账户数据,生成筛选列表;

和/或,

账户详情模块,用于当接收到账户详情请求指令时,根据所述账户详情请求指令从所述待测账户中选定目标请求账户;

根据所述目标请求账户的账户数据,生成所述账户详情请求指令所需的详情数据;

和/或,

数据下载模块,用于当接收到数据下载指令时,根据所述数据下载指令执行相应下载操作,其中,所述数据下载指令包括创建导出任务、查询导出状态、取消导出任务和下载导出文件中的至少一项。

本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。

本发明实施例还提供一种账户分类模型训练设备和一种账户分类设备,账户分类模型训练设备和账户分类设备均可参照图15的结构示意图,下述以账户分类模型训练设备为例进行说明,账户分类设备的具体结构参照即可,不再赘述,所述账户分类模型训练设备包括:

存储器11和处理器12,存储器11存储有可在处理器12上运行的计算机程序。所述处理器12执行所述计算机程序时实现上述实施例中账户分类模型训练方法或账户分类方法。所述存储器11和处理器12的数量可以为一个或多个。

所述账户分类模型训练设备还可以包括:

通信接口13,用于与外界设备进行通信,进行数据交换传输。

存储器11可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

如果存储器11、处理器12和通信接口13独立实现,则存储器11、处理器12和通信接口13可以通过总线相互连接并完成相互之间的通信。所述总线可以是工业标准体系结构(isa,industrystandardarchitecture)总线,外部设备互连(pci,peripheralcomponentinterconnect)总线或扩展工业标准体系结构(eisa,extendedindustrystandardarchitecture)等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图15中仅用一条粗线表示,并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储器11、处理器12和通信接口13集成在一块芯片上,则存储器11、处理器12和通信接口13可以通过内部接口完成相互间的通信。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。

综上所述,本发明实施例提出的账户分类模型训练方法和装置,以及账户分类方法和装置,通过对账户未来的多种可能状态分类进行预测,从而可以对账户进行分类;从而可以针对不同分类账户进行优先级分配跟进,提高流失预防和挽留效果,也针对不同分类采取不同处理方法。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1