本发明涉及通信业务,尤其涉及一种业务指标筛选方法及移动通信业务回退潜客识别方法。
背景技术:
1、随着移动通信业务的发展和普及,各运营商为减少客户价值流失和收入损失,对移动通信用户的业务办理行为进行研究十分必要。
2、在对移动通信用户的业务办理行为进行研究时,需要引入移动通信用户的业务指标。由于移动通信用户的业务指标数量很多,因此需要从中选取合适的业务指标。目前通常是由业务人员人为选取业务指标,这将依赖于业务人员的经验和业务水平,存在较大的主观因素的影响,缺乏合理性,进而可能导致业务指标的应用出现偏差。
3、为此,现急需提供一种业务指标筛选方法。
技术实现思路
1、本发明提供一种业务指标筛选方法及移动通信业务回退潜客识别方法,用以解决现有技术中存在的缺陷。
2、本发明提供一种业务指标筛选方法,包括:
3、获取样本用户对应于目标业务的各业务指标的样本指标数据;
4、基于所述各业务指标的样本指标数据,确定各业务指标的信息价值以及各业务指标之间的相关性;
5、基于所述各业务指标的信息价值以及所述各业务指标之间的相关性,对所述各业务指标进行筛选。
6、根据本发明提供的一种业务指标筛选方法,所述样本指标数据包括所述目标业务对应的正样本指标数据以及负样本指标数据;相应地,基于所述各业务指标的样本指标数据,确定各业务指标的信息价值,包括:
7、对所述各业务指标中每个业务指标的样本指标数据均进行分组,得到每个业务指标对应的多组样本数据;
8、将每个业务指标分别作为目标业务指标,基于所述目标业务指标对应的每组样本数据中正样本指标数据的第一数量以及负样本指标数据的第二数量,确定所述目标业务指标对应的每组样本数据的证据权重编码;
9、基于所述目标业务指标对应的每组样本数据的证据权重编码,确定所述目标业务指标的信息价值。
10、根据本发明提供的一种业务指标筛选方法,基于所述各业务指标的样本指标数据,确定各业务指标之间的相关性,包括:
11、确定所述各业务指标的变量类型,所述变量类型包括连续变量以及离散变量;
12、基于所述各业务指标的变量类型以及样本指标数据,确定所述各业务指标之间的相关性。
13、根据本发明提供的一种业务指标筛选方法,所述基于所述各业务指标的变量类型以及样本指标数据,确定所述各业务指标之间的相关性,包括:
14、对于所述各业务指标中属于连续变量的各第一类业务指标,基于所述各第一类业务指标的样本指标数据,计算所述各第一类业务指标之间的皮尔逊相关系数;所述皮尔逊相关系数用于度量所述各第一类业务指标之间的相关性;
15、对于所述各业务指标中属于离散变量的各第二类业务指标,基于所述各第二类业务指标的样本指标数据,计算所述各第二类业务指标之间的斯皮尔曼相关系数;所述斯皮尔曼相关系数用于度量所述各第二类业务指标之间的相关性。
16、根据本发明提供的一种业务指标筛选方法,所述基于所述各业务指标的信息价值以及所述各业务指标之间的相关性,对所述各业务指标进行筛选,包括:
17、遍历所述各业务指标中的任意两个业务指标,若所述任意两个业务指标之间的相关性高于预设阈值,且所述任意两个业务指标的信息价值不同,则剔除所述任意两个业务指标中信息价值低的业务指标;
18、若所述任意两个业务指标之间的相关性高于所述预设阈值,且所述任意两个业务指标的信息价值相同,则随机剔除所述任意两个业务指标中的一个。
19、本发明还提供一种移动通信业务回退潜客识别方法,包括:
20、获取待识别用户对应于移动通信业务的目标指标的指标数据;所述目标指标基于上述的业务指标筛选方法,对所述移动通信业务的各业务指标进行筛选得到;
21、将所述目标指标的指标数据输入至回退潜客识别模型,得到所述回退潜客识别模型输出的所述待识别用户是否为回退潜客的识别结果;
22、其中,所述回退潜客识别模型基于样本用户对应于所述目标指标的样本指标数据,采用模型融合算法训练得到,所述样本用户携带有表征是否为回退潜客的用户标签。
23、根据本发明提供的一种移动通信业务回退潜客识别方法,所述回退潜客识别模型基于如下方法训练得到:
24、基于所述样本用户对应于所述目标指标的样本指标数据,分别采用随机森林算法、xgboost算法以及lightgbm算法,对不同的初级模型进行训练,得到训练好的多个初级模型;
25、将所述样本用户对应于所述目标指标的样本指标数据分别输入至所述训练好的多个初级模型,得到所述训练好的多个初级模型输出的初始识别结果;
26、基于所述初始识别结果以及所述用户标签,采用逻辑回归算法,对次级模型进行训练,得到所述回退潜客识别模型。
27、根据本发明提供的一种移动通信业务回退潜客识别方法,所述移动通信业务的各业务指标包括用户对应于所述移动通信业务的消费信息、流量使用信息、通话信息、用户位置信息、用户投诉信息、合约捆绑信息以及终端使用信息中的至少一个维度。
28、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种业务指标筛选方法,或移动通信业务回退潜客识别方法。
29、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种业务指标筛选方法,或移动通信业务回退潜客识别方法。
30、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种业务指标筛选方法,或移动通信业务回退潜客识别方法。
31、本发明提供的业务指标筛选方法及移动通信业务回退潜客识别方法,首先获取样本用户对应于目标业务的各业务指标的样本指标数据;然后基于各业务指标的样本指标数据,确定各业务指标的信息价值以及各业务指标之间的相关性;最后通过各业务指标的信息价值以及各业务指标之间的相关性,对各业务指标进行筛选。该方法不需要引入人工操作,相比于业务人员人工选取业务指标的方法,不仅可以实现对业务指标的准确筛选,使得保留下来的业务指标更加合理,也降低了业务指标的应用出现偏差的可能性。同时,还可以节约人力成本。
1.一种业务指标筛选方法,其特征在于,包括:
2.根据权利要求1所述的业务指标筛选方法,其特征在于,所述样本指标数据包括所述目标业务对应的正样本指标数据以及负样本指标数据;相应地,基于所述各业务指标的样本指标数据,确定各业务指标的信息价值,包括:
3.根据权利要求1所述的业务指标筛选方法,其特征在于,基于所述各业务指标的样本指标数据,确定各业务指标之间的相关性,包括:
4.根据权利要求3所述的业务指标筛选方法,其特征在于,所述基于所述各业务指标的变量类型以及样本指标数据,确定所述各业务指标之间的相关性,包括:
5.根据权利要求1-4中任一项所述的业务指标筛选方法,其特征在于,所述基于所述各业务指标的信息价值以及所述各业务指标之间的相关性,对所述各业务指标进行筛选,包括:
6.一种移动通信业务回退潜客识别方法,其特征在于,包括:
7.根据权利要求6所述的移动通信业务回退潜客识别方法,其特征在于,所述回退潜客识别模型基于如下方法训练得到:
8.根据权利要求6或7所述的移动通信业务回退潜客识别方法,其特征在于,所述移动通信业务的各业务指标包括用户对应于所述移动通信业务的消费信息、流量使用信息、通话信息、用户位置信息、用户投诉信息、合约捆绑信息以及终端使用信息中的至少一个维度。
9.一种业务指标筛选装置,其特征在于,包括:
10.一种移动通信业务回退潜客识别装置,其特征在于,包括:
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5中任一项所述的业务指标筛选方法,或如权利要求6至8中任一项所述的移动通信业务回退潜客识别方法。
12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的业务指标筛选方法,或如权利要求6至8中任一项所述的移动通信业务回退潜客识别方法。