用户流失预警方法及装置与流程

文档序号:37475359发布日期:2024-03-28 18:57阅读:12来源:国知局
用户流失预警方法及装置与流程

本发明涉及数据处理,尤其涉及一种用户流失预警方法及装置。


背景技术:

1、目前各运营商之间竞争激烈,因此如何高效精准地进行用户流失预测,以保障既有用户不流失是各运营商关心的重要问题。

2、现有的用户流失预警方法主要采用的是有监督的机器学习算法。但是,由于有监督学习模型极度依赖历史数据的标签,而在客户流失预警中不同原因导致的客户流失需要采取不同的挽留策略,因此需要耗费大量人力对数据集中不同的流失模式进行准确标注,同时,现有算法收敛速度非常慢,由此导致用户流失预警效率低下。

3、因此,现在亟需一种用户流失预警方法及装置来解决上述问题。


技术实现思路

1、本发明提供一种用户流失预警方法及装置,用以解决现有技术中采用有监督的机器学习算法进行用户流失预警,需要耗费大量人力对数据集中不同的流失模式进行准确标注,导致用户流失预警效率低下的缺陷,实现高效地进行用户流失预警。

2、本发明提供一种用户流失预警方法,包括:

3、获取目标用户的用户信息、交易信息以及资产信息;

4、对所述用户信息、所述交易信息以及所述资产信息进行特征提取,得到所述目标用户的用户特征;

5、根据所述用户特征确定输入信息,并将所述输入信息输入至流失预警模型,得到所述目标用户的流失预测类别;

6、根据所述流失预测类别生成用户流失预警信息,并根据所述用户流失预警信息进行预警;

7、其中,所述流失预警模型是基于多个样本用户的用户特征以及改进的k均值聚类算法,进行无监督训练得到的;所述改进的k均值聚类算法的目标聚类中心数量是根据预设聚类中心数量进行迭代优化得到的,所述改进的k均值聚类算法的各初始聚类中心是根据在多个所述样本用户中随机确定的任一样本用户进行迭代优化得到的。

8、根据本发明提供的一种用户流失预警方法,所述流失预警模型是基于如下步骤训练得到的:

9、根据多个所述样本用户的用户特征,对所述预设聚类中心数量进行迭代优化,直到优化后的聚类中心数量对应的聚类性能值最优;

10、将聚类性能值最优的优化后的聚类中心数量作为所述目标聚类中心数量;

11、在多个所述样本用户中随机确定任一样本用户,根据所述任一样本用户迭代优化得到各所述初始聚类中心;

12、根据多个所述样本用户的用户特征,对各所述初始聚类中心进行迭代优化,直到优化后的聚类中心对应的目标聚类损失函数收敛;

13、根据收敛的目标聚类损失函数对应的优化后的聚类中心,获取所述流失预警模型。

14、根据本发明提供的一种用户流失预警方法,所述根据所述任一样本用户迭代优化得到各所述初始聚类中心,包括:

15、根据所述任一样本用户,确定第一个初始聚类中心;

16、对于除所述第一个初始聚类中心之外的每一其他初始聚类中心执行如下操作:

17、在多个所述样本用户中,获取当前次迭代优化所需的第二样本用户;所述第二样本用户为除第一样本用户之外的样本用户;所述第一样本用户为上一次迭代优化获取的初始聚类中心对应的样本用户以及在所述上一次迭代优化之前获取的所有初始聚类中心对应的样本用户;

18、计算各所述第二样本用户与各所述第一样本用户之间的相似度距离;

19、根据所述相似度距离,统计各所述第二样本用户与所有所述第一样本用户之间的相似度距离之和;

20、根据最大相似度距离之和对应的第二样本用户,获取所述当前次迭代优化对应的初始聚类中心;

21、在多个所述样本用户中,迭代获取下一次迭代优化所需的第二样本用户,直到累计获取的初始聚类中心的数量达到所述目标聚类中心数量。

22、根据本发明提供的一种用户流失预警方法,所述根据多个所述样本用户的用户特征,对所述预设聚类中心数量进行迭代优化,直到优化后的聚类中心数量对应的聚类性能值最优,包括:

23、根据所述预设聚类中心数量,确定第一聚类中心数量以及第二聚类中心数量;所述第一聚类中心数量大于所述第二聚类中心数量;

24、基于所述第一聚类中心数量,以及多个所述样本用户的用户特征,对多个所述样本用户进行聚类操作,得到所述第一聚类中心数量对应的聚类性能值;

25、基于所述第二聚类中心数量,以及多个所述样本用户的用户特征,对多个所述样本用户进行聚类操作,得到所述第二聚类中心数量对应的聚类性能值;

26、对所述第一聚类中心数量对应的聚类性能值以及所述第二聚类中心数量对应的聚类性能值进行比较操作;

27、若所述第一聚类中心数量对应的聚类性能值小于所述第二聚类中心数量对应的聚类性能值,则根据所述第二聚类中心数量,对所述第一聚类中心数量以及第二聚类中心数量进行更新,得到更新后的第一聚类中心数量和更新后的第二聚类中心数量,并对更新后的第一聚类中心数量和更新后的第二聚类中心数量,迭代执行所述聚类操作以及所述比较操作,直到更新后的第一聚类中心数量对应的聚类性能值大于更新后的第二聚类中心数量对应的聚类性能值;

28、根据聚类性能值大于更新后的第二聚类中心数量的更新后的第一聚类中心数量,确定聚类性能值最优的优化后的聚类中心数量。

29、根据本发明提供的一种用户流失预警方法,所述对所述用户信息、所述交易信息以及所述资产信息进行特征提取,得到所述目标用户的用户特征,包括:

30、对所述用户信息进行特征提取,得到所述目标用户的用户基本特征;

31、对所述交易信息进行特征提取,得到所述目标用户的存款特征、贷款特征以及交易频次特征;

32、对所述资产信息进行特征提取,得到所述目标用户的资产分布特征;

33、根据所述用户基本特征、所述存款特征、所述贷款特征、所述交易频次特征,以及所述资产分布特征,得到所述用户特征。

34、根据本发明提供的一种用户流失预警方法,所述根据所述用户特征确定输入信息,包括:

35、对所述目标用户的用户特征进行预处理;

36、根据预处理后的用户特征,确定所述输入信息;

37、其中,所述预处理包括数据清洗和特征处理;

38、所述数据清洗包括固定变量值删除处理和/或缺失值填充处理;

39、所述缺失值填充处理包括基于统计变量的填充处理或者基于插值算法的填充处理;

40、所述特征处理包括归一化处理或者独立热编码处理。

41、根据本发明提供的一种用户流失预警方法,所述根据所述流失预测类别生成用户流失预警信息,包括:

42、根据所述流失预测类别,确定所述目标用户对应的服务优化策略;

43、根据所述服务优化策略以及所述流失预测类别,生成所述用户流失预警信息。

44、本发明还提供一种用户流失预警装置,包括:

45、数据获取单元,用于获取目标用户的用户信息、交易信息以及资产信息;

46、数据处理单元,用于对所述用户信息、所述交易信息以及所述资产信息进行特征提取,得到所述目标用户的用户特征;

47、监测单元,用于根据所述用户特征确定输入信息,并将所述输入信息输入至流失预警模型,得到所述目标用户的流失预测类别;

48、预警单元,用于根据所述流失预测类别生成用户流失预警信息,并根据所述用户流失预警信息进行预警;

49、其中,所述流失预警模型是基于多个样本用户的用户特征以及改进的k均值聚类算法,进行无监督训练得到的;所述改进的k均值聚类算法的目标聚类中心数量是根据预设聚类中心数量进行迭代优化得到的,所述改进的k均值聚类算法的各初始聚类中心是根据在多个所述样本用户中随机确定的任一样本用户进行迭代优化得到的。

50、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用户流失预警方法。

51、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用户流失预警方法。

52、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述用户流失预警方法。

53、本发明提供的用户流失预警方法及装置,通过对预设聚类中心数量进行迭代优化,以自适应得到的目标聚类中心数量,以及根据在多个样本用户中随机确定的任一样本用户进行迭代优化,以自适应得到的各初始聚类中心,并基于样本用户的用户特征,对改进的k均值聚类算法的各初始聚类中心进行无监督迭代优化,得到流失预警模型,并基于流失预警模型对基于用户信息、交易信息以及资产信息确定的用户特征进行聚类,得到目标用户的流失预测类别,由此实现最大限度地减少人工参与,提高用户流失预警的效率的同时,提高用户流失预警的精准性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1