用户稳定性分析方法及系统与流程

文档序号:32325663发布日期:2022-11-25 20:32阅读:198来源:国知局
用户稳定性分析方法及系统与流程

1.本发明涉及数据挖掘技术领域,尤其涉及一种用户稳定性分析方法及系统。


背景技术:

2.用户稳定性是多个行业关注的指标,例如,金融行业中,用户稳定性越高,用户的还款能力越强。
3.现有用户稳定性分析方法主要包括:
4.基于聚类的用户识别及营销方法:基于聚类的用户识别及营销方法希望通过k-means等无监督机器学习算法实现客群分类,针对聚类结果进行用户行为特征分析,定制用户运营营销策略。
5.基于机器学习模型的离网概率分析:基于机器学习模型的离网概率分析期望,使用机器学习模型及收集到的用户在网、离网数据,根据用户行为预判用户的离网可能性。
6.k-means算法即为无监督的聚类算法,对于给定的样本集,按照样本之间的距离大小,将样本集划分为k个簇,让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。其主要缺点体现在,对于得到的聚类中心,根据得到的k个聚类的距离情况,合并距离最近的类,因此聚类中心数减小,相应的聚类数目也减小了,同时如果个体的数据不平衡,则聚类效果不佳。
7.基于机器学习模型的离网概率分析即为使用数据挖掘算法进行用户离网预测,针对离网倾向的用户实施客户挽留,展开维系与关怀,根据相似的个体特征,以及机器学习模型的推理能力,判断用户的力王特征。其主要缺点体现在,针对不寻常的数据组或者个体特征不稳定,得到的聚类结果可能因偏差较大。
8.考虑到用户通讯数据固有的不稳定性及季节性,单纯依靠个体特征进行稳定性(包含离网概率)会出现较大的偏差。因此,如何解决因个体数据不平衡或个体特征不稳定而导致的聚类效果不佳,以及因聚类效果不佳而导致对用户分析偏差较大,是亟需解决的问题。


技术实现要素:

9.本发明提供的用户稳定性分析方法及系统,用于解决现有技术中存在的上述问题,能够解决因个体特征差异导致的聚类效果不佳以及因聚类效果不佳带来的用户稳定性分析不准确问题。
10.本发明提供的一种用户稳定性分析方法,包括:
11.对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
12.根据所述相似度最高的最优配对,确定满足预设条件的用户群体,并将所述用户群体添加到目标用户群体中,以对目标用户群体进行更新;
13.将满足所述预设条件的用户群体剔除以对所述不同时序的全量用户进行更新,直
至所述更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
14.将更新后的目标用户群体划分为观察组客群和实验组客群,并对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
15.其中,所述预设条件包括所述最优配对中在所述预设观察期的所有时序内均出现的用户。
16.根据本发明提供的一种用户稳定性分析方法,所述对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对,包括:
17.基于自组织映射som聚类算法对更新后的不同时序的全量用户分别进行聚类,获取更新后的不同时序的全量用户的聚类类别;
18.根据预设类别向量生成规则和所述聚类类别,获取不同时序的聚类类别的类别向量;
19.根据所述不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,并根据所述不同时序的聚类类别的相似度,确定所述相邻不同时序的聚类类别的相似度最高的最优配对。
20.根据本发明提供的一种用户稳定性分析方法,所述根据预设类别向量生成规则和所述聚类类别,获取不同时序的聚类类别的类别向量,包括:
21.将所述聚类类别中属于第一类别的第一用户以第一预设数字进行标注;
22.将所述聚类类别中不属于所述第一类别的其他用户以第二预设数字进行标注;
23.根据标注结果,获取所述不同时序的聚类类别的类别向量。
24.根据本发明提供的一种用户稳定性分析方法,所述根据所述不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,包括:
25.根据所述不同时序的聚类类别的类别向量和用户总数,获取所述不同时序的聚类类别的相似度;或
26.根据所述不同时序的聚类类别的类别向量、所述用户总数和预设权重,获取所述不同时序的聚类类别的相似度。
27.根据本发明提供的一种用户稳定性分析方法,所述将更新后的目标用户群体划分为观察组客群和实验组客群,包括:
28.根据目标稳定性分析需求,对所述目标用户群体中各用户进行分类标注;
29.将属于第一预设分类的用户作为所述实验组客群;
30.将属于第二预设分类的用户作为所述观察组客群。
31.根据本发明提供的一种用户稳定性分析方法,所述对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析,包括:
32.将所述训练集样本和训练标签输入至预设二分类模型进行训练,以获取目标预测模型;
33.将所述测试集样本输入至所述目标预测模型,以预测所述目标用户群体的稳定性;
34.其中,所述训练集样本包括第一预设比例的所述观察组客群和所述实验组客群;
35.所述测试集样本包括第二预设比例的所述观察组客群和所述实验组客群;
36.所述训练标签为根据所述目标稳定性分析需求,对所述训练集样本中各用户进行
分类标注后确定的。
37.根据本发明提供的一种用户稳定性分析方法,所述对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析,还包括:
38.基于差分整合移动平均自回归arima算法对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析。
39.本发明还提供一种用户稳定性分析系统,包括:数据获取模块、第一更新模块、第二更新模块和用户分析模块;
40.所述数据获取模块,用于对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
41.所述第一更新模块,用于根据所述相似度最高的最优配对,确定满足预设条件的用户群体,并将所述用户群体添加到目标用户群体中,以对目标用户群体进行更新;
42.所述第二更新模块,用于将满足所述预设条件的用户群体剔除以对所述不同时序的全量用户进行更新,直至所述更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
43.所述用户分析模块,用于将更新后的目标用户群体划分为观察组客群和实验组客群,并对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
44.其中,所述预设条件包括所述最优配对中在所述预设观察期的所有时序内均出现的用户。
45.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用户稳定性分析方法的步骤。
46.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用户稳定性分析方法的步骤。
47.本发明提供的用户稳定性分析方法及系统,对不同时序内的用户进行聚类,并将相似度最高的数据圈定客群,因个体特征差异导致的聚类效果不佳以及因聚类效果不佳带来的用户稳定性分析不准确问题。
附图说明
48.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
49.图1是本发明提供的用户稳定性分析方法的流程示意图;
50.图2是本发明提供的聚类分组示意图;
51.图3是本发明提供的用户稳定性分析系统的结构示意图;
52.图4是本发明提供的电子设备的实体结构示意图。
具体实施方式
53.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.图1是本发明提供的用户稳定性分析方法的流程示意图,如图1所示,方法包括:
55.s1、对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
56.s2、根据相似度最高的最优配对,确定满足预设条件的用户群体,并将用户群体添加到目标用户群体中,以对目标用户群体进行更新;
57.s3、将满足预设条件的用户群体剔除以对不同时序的全量用户进行更新,直至更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
58.s4、将更新后的目标用户群体划分为观察组客群和实验组客群,并对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
59.其中,预设条件包括最优配对中在预设观察期的所有时序内均出现的用户。
60.需要说明的是,上述方法的执行主体可以是计算机设备。
61.可选地,本发明提供的用户稳定性分析方法包括对不同账期内的用户进行聚类、筛选相似性最高的类别进行二次圈定、在二次圈定的所有用户中标记用户为观察组和实验组、并进行组间特征差异性分析,以实现对目标用户群体的稳定性分析,具体实现如下:
62.可选地,本发明提供的用户稳定性分析方法可针对不同业务场景下的稳定性指标进行分析,例如用于消费降档、离网、消费升级、新业务推广等场景下的用户稳定性分析。具体地,可以通过对不同时序的全量用户进行分析,如针对移动用户,例如消费降档和消费未降档的全量用户、离网和在网的全量用户、消费升级和消费未升级的全量用户、办理新业务和未办理新业务的全量用户进行分析,以实现对移动用户的消费降档、离网、消费升级、新业务推广等场景下的用户稳定性分析。
63.对不同账期的用户数据进聚类计算,跟据特定需求,筛选出特定用户群组所在的聚类,并在不同账期的聚类中寻找聚类相似度最高的包含特定用户群组的类别,具体地,如图2所示:
64.表现期:将更新后的不同时序(账期1~账期n)的全量用户进行聚类分析,根据不同时序的聚类类别的相似度,从中圈定出相似度最接近的客群(相似度最高的最优配对)。其中,不同时序的用户数据是通过对不同账期的用户数据进行时序划分后得到的,例如按照“月份”或“季度”对不同账期的用户数据进行划分得到对应不同时序的用户数据。
65.观察期:将相邻不同时序的聚类类别的相似度最高的最优配对中在预设观察期对应的所有时序均出现的用户构成用户群体,并将该用户群体添加到目标用户群体中,以对目标用户群体进行更新。然后,将该用户群体从不同时序的全量用户中剔除,以对不同时序的全量用户进行更新。
66.重复上述过程,对目标用户群体以及不同时序的全量用户进行更新,直至更新后的不同时序的全量用户的数量小于预设阈值,停止对不同时序的全量用户的更新,并根据最后一次更新结果得到更新后的目标用户群体。
67.将更新后的目标用户群体分为实验组客群和观察组客群,对两组用户分别进行行为特征差异分析,例如可以对分析结果综合评判,并设置运营观察指标,以实现对目标用户群体的稳定性分析。
68.本发明提供的用户稳定性分析方法,对不同时序内的用户进行聚类,并将相似度最高的数据圈定客群,因个体特征差异导致的聚类效果不佳以及因聚类效果不佳带来的用户稳定性分析不准确问题。
69.进一步地,在一个实施例中,步骤s1可以具体包括:
70.s11、基于自组织映射som聚类算法对更新后的不同时序的全量用户分别进行聚类,获取更新后的不同时序的全量用户的聚类类别;
71.s12、根据预设类别向量生成规则和聚类类别,获取不同时序的聚类类别的类别向量;
72.s13、根据不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,并根据不同时序的聚类类别的相似度,确定相邻不同时序的聚类类别的相似度最高的最优配对。
73.可选地,利用自组织映射(self-origanizing maps,som)算法对更新后的不同时序的全量用户分别进行聚类,得到更新后的不同时序的全量用户的聚类类别,其中,som算法对初始质心的选择要求低,且不需要提前考虑对每个时序的全量用户所分簇数。
74.对不同时序的全量用户分别聚类完成之后,根据每个时序的全量用户的聚类类别内的用户群体以及预设类别向量生成规则,生成该类别的类别向量。
75.根据得到的不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,并根据不同时序的聚类类别的相似度,确定相邻不同时序的聚类类别的相似度最高的最优配对。
76.例如,时序1~时序n的全量用户的聚类类别对应的类别向量为x
1i
~x
ni
,其中,x
1i
代表时序1对应的类别向量,x
ni
代表时序n对应的类别向量,代表每个时序的第i个用户。然后通过计算得到不同时序的聚类类别的相似度,并由此得到相邻不同时序的聚类类别的相似度最高的最优配对的用户。
77.本发明提供的用户稳定性分析方法,采用som等聚类算法对不同时序的数据进聚类计算,跟据特定需求,筛选出特定用户群组所在的聚类,并在不同时序的聚类中寻找聚类相似度最高的包含特定用户群组的类别,解决了因个体数据差异及不平衡带来的聚类效果不佳及后续的偏差较大的问题。
78.进一步地,在一个实施例中,步骤s12可以具体包括:
79.s121、将聚类类别中属于第一类别的第一用户以第一预设数字进行标注;
80.s122、将聚类类别中不属于第一类别的其他用户以第二预设数字进行标注;
81.s123、根据标注结果,获取不同时序的聚类类别的类别向量。
82.可选地,聚类完成之后,根据聚类类别内的用户群体,生成该类别的类别向量,将聚类类别中属于第一类别的第一用户以第一预设数字如数字“1”进行标注,将聚类类别中不属于第一类别的其他用户以第二预设数字如数字“0”进行标注。
83.例如,对时序1的聚类类别中的用户进行标注,如果时序1中第i个用户属于第一类别,则第i个用户对应的标注值为“1”,否则,若时序1中第i个用户不属于第一类别,则第i个
用户对应的标注值为“0”,基于此,完成对时序1中各个用户的标注。
84.例如,任意选取10个用户作为分析对象,假设只有第1,2,7个用户落在第一类别中,则该类别的类别向量为:
85.本发明提供的用户稳定性分析方法,通过获取不同时序的用户的类别向量,为后续获取不同时序聚类类别的相似度奠定了基础。
86.进一步地,在一个实施例中,步骤s13中根据不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,可以具体包括:
87.s131、根据不同时序的聚类类别的类别向量和用户总数,获取不同时序的聚类类别的相似度;或
88.s132、根据不同时序的聚类类别的类别向量、用户总数和预设权重,获取不同时序的聚类类别的相似度。
89.可选地,根据对不同时序的全量用户聚类得到的结果,可交叉分析不同时序的聚类类别的相似度s:
[0090][0091]
其中,n是选定用户总数,分别代表不同时序内全量用户的类别向量,当两个类别向量完全相同时,相似度趋近无穷大,两个类别完全不同时(无任何共有用户),相似度为0。
[0092]
针对不同的目标稳定性分析需求,可以根据预设权重、不同时序的聚类类别的类别向量和选定用户总数,基于如下公式获取不同时序的聚类类别的相似度ws:
[0093][0094]
其中,wk代表ni属于k类别时,样本的权重分配。
[0095]
本发明提供的用户稳定性分析方法,计算聚类后不同时序的全量用户的相似度,将用户数据根据不同特征进行圈定的算法,精准地将相似度较高的数据聚集,划定更加具有共性的用户群体。
[0096]
进一步地,在一个实施例中,步骤s4中将更新后的目标用户群体划分为观察组客群和实验组客群,可以具体包括:
[0097]
s41、根据目标稳定性分析需求,对目标用户群体中各用户进行分类标注;
[0098]
s42、将属于第一预设分类的用户作为实验组客群;
[0099]
s43、将属于第二预设分类的用户作为观察组客群。
[0100]
可选地,根据目标稳定性分析需求,对目标用户群体中各用户进行分类标注,例如以对用户离网稳定性进行分析,将获取的目标用户群组中各用户进行分类标注,具体地,将属于第一预设分类(例如,离网)的用户标注为“1”并将其作为实验组客群,将属于第二预设分类(例如,在网)的用户标注为“0”并将其作为观察组客群。
[0101]
需要说明的是,第一预设分类和第二预设分类可根据目标稳定性分析需求的不同自由设置,例如当对用户消费降档进行稳定性分析时,第一预设分类对应设置为消费降档,
第二预设分类设置为消费未降档;又如,当对用户消费升级进行稳定性分析时,第一预设分类对应设置为消费升级,第二预设分类设置为消费未升级;再比如,当对用户新业务推广进行稳定性分析时,第一预设分类对应设置为办理新业务,第二预设分类设置为未办理新业务。
[0102]
本发明提供的用户稳定性分析方法,将相似度圈定客群分类为实验组客群和观察组客群,对两组用户分别进行行为特征差异分析,综合进行评判,设置运营观察指标,减少了用户稳定性分析偏差。
[0103]
进一步地,在一个实施例中,步骤s4中对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析,可以包括:
[0104]
s44、将训练集样本和训练标签输入至预设二分类模型进行训练,以获取目标预测模型;
[0105]
s45、将测试集样本输入至目标预测模型,以预测目标用户群体的稳定性;
[0106]
其中,训练集样本包括第一预设比例的观察组客群和实验组客群;
[0107]
测试集样本包括第二预设比例的观察组客群和实验组客群;
[0108]
训练标签为根据目标稳定性分析需求,对训练集样本中各用户进行分类标注后确定的。
[0109]
可选地,将上述得到的实验组客群和观察组客群按照预设比例进行划分,以得到第一预设比例的实验组客群和观察组客群和第二预设比例的实验组客群和观察组客群,并将第一预设比例的实验组客群和观察组客群作为训练集样本,以及将第二预设比例的实验组客群和观察组客群作为测试集样本。其中,第一预设比例和第二预设比例可以分别设置为0.8,0.2,也可以根据实际需求进行设置,本发明对此不作具体限定。
[0110]
根据目标稳定性分析需求,对训练集样本中各用户进行分类标注得到训练标签,例如在对用户离网稳定性分析时,将训练集样本中属于离网的用户以数字“1”标注,将在网用户以数字“0”标注,得到训练标签。
[0111]
将训练集样本和训练标签输入至预设二分类模型(例如,支持向量机svm模型)进行训练,并在svm模型的损失值小于预设值时,停止训练,得到训练好的svm模型,并将其作为目标预测模型。
[0112]
将测试集样本输入至目标预测模型,以预测目标用户群体的稳定性(例如,离网稳定性)。
[0113]
本发明提供的用户稳定性分析方法,基于得到的目标预测模型可以实现对不同业务场景(例如消费降档、离网、消费升级、新业务推广)的用户稳定性分析。
[0114]
进一步地,在一个实施例中,步骤s4中对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析,还可以具体包括:
[0115]
s46、基于差分整合移动平均自回归(autoregressive integrated moving average,arima)算法对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析。
[0116]
可选地,根据arima算法对观察组客群及实验组客群的用户的时序特征进行差异性分析,以对目标用户群体的稳定性进行分析。
[0117]
本发明提供的用户稳定性分析方法,根据arima算法对用户的稳定性进行分析,能
够减少偏差,提高对用户稳定性分析的准确度和可信度。
[0118]
下面对本发明提供的用户稳定性分析系统进行描述,下文描述的用户稳定性分析系统与上文描述的用户稳定性分析方法可相互对应参照。
[0119]
图3是本发明提供的用户稳定性分析系统的结构示意图,如图3所示,包括:数据获取模块310、第一更新模块311、第二更新模块312和用户分析模块313;
[0120]
数据获取模块310,用于对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
[0121]
第一更新模块311,用于根据相似度最高的最优配对,确定满足预设条件的用户群体,并将用户群体添加到目标用户群体中,以对目标用户群体进行更新;
[0122]
第二更新模块312,用于将满足预设条件的用户群体剔除以对不同时序的全量用户进行更新,直至更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
[0123]
用户分析模块313,用于将更新后的目标用户群体划分为观察组客群和实验组客群,并对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
[0124]
其中,预设条件包括最优配对中在预设观察期的所有时序内均出现的用户。
[0125]
本发明提供的用户稳定性分析系统,对不同时序内的用户进行聚类,并将相似度最高的数据圈定客群,因个体特征差异导致的聚类效果不佳以及因聚类效果不佳带来的用户稳定性分析不准确问题。
[0126]
进一步地,在一个实施例中,数据获取模块310,还可以具体包括:第一数据获取子模块、第二数据获取子模块和第三数据获取子模块,
[0127]
第一数据获取子模块,用于基于自组织映射som聚类算法对更新后的不同时序的全量用户分别进行聚类,获取更新后的不同时序的全量用户的聚类类别;
[0128]
第二数据获取子模块,用于根据预设类别向量生成规则和聚类类别,获取不同时序的聚类类别的类别向量;
[0129]
第三数据获取子模块,用于根据不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,并根据不同时序的聚类类别的相似度,确定相邻不同时序的聚类类别的相似度最高的最优配对。
[0130]
本发明提供的用户稳定性分析系统,采用som等聚类算法对不同时序的数据进聚类计算,跟据特定需求,筛选出特定用户群组所在的聚类,并在不同时序的聚类中寻找聚类相似度最高的包含特定用户群组的类别,解决了因个体数据差异及不平衡带来的聚类效果不佳及后续的偏差较大的问题。
[0131]
进一步地,在一个实施例中,第二数据获取子模块还可以用于:
[0132]
将聚类类别中属于第一类别的第一用户以第一预设数字进行标注;
[0133]
将聚类类别中不属于所述第一类别的其他用户以第二预设数字进行标注;以及
[0134]
根据标注结果,获取不同时序的聚类类别的类别向量。
[0135]
本发明提供的用户稳定性分析系统,通过获取不同时序的用户的类别向量,为后续获取不同时序聚类类别的相似度奠定了基础。
[0136]
进一步地,在一个实施例中,第三数据获取子模块,还可以用于根据不同时序的聚类类别的类别向量和用户总数,获取不同时序的聚类类别的相似度;或
[0137]
根据不同时序的聚类类别的类别向量、所述用户总数和预设权重,获取所述不同时序的聚类类别的相似度。
[0138]
本发明提供的用户稳定性分析系统,计算聚类后不同时序的全量用户的相似度,将用户数据根据不同特征进行圈定的算法,精准地将相似度较高的数据聚集,划定更加具有共性的用户群体。
[0139]
进一步地,在一个实施例中,用户分析模块313可以具体包括:分类子模块、实验组客群获取子模块和观察组客群获取子模块;
[0140]
分类子模块,用于根据目标稳定性分析需求,对目标用户群体中各用户进行分类标注;
[0141]
实验组客群获取子模块,用于将属于第一预设分类的用户作为实验组客群;
[0142]
观察组客群获取子模块,用于将属于第二预设分类的用户作为观察组客群。
[0143]
本发明提供的用户稳定性分析系统,将相似度圈定客群分类为实验组客群和观察组客群,对两组用户分别进行行为特征差异分析,综合进行评判,设置运营观察指标,减少了用户稳定性分析偏差。
[0144]
进一步地,在一个实施例中,用户分析模块313,还可以用于将训练集样本和训练标签输入至预设二分类模型进行训练,以获取目标预测模型;以及
[0145]
将测试集样本输入至目标预测模型,以预测目标用户群体的稳定性;
[0146]
其中,训练集样本包括第一预设比例的观察组客群和实验组客群;
[0147]
测试集样本包括第二预设比例的观察组客群和实验组客群;
[0148]
训练标签为根据目标稳定性分析需求,对训练集样本中各用户进行分类标注后确定的。
[0149]
本发明提供的用户稳定性分析系统,基于得到的目标预测模型可以实现对不同业务场景(例如消费降档、离网、消费升级、新业务推广)的用户稳定性分析。
[0150]
进一步地,在一个实施例中,用户分析模块313,还可以用于基于差分整合移动平均自回归arima算法对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析。本发明提供的用户稳定性分析系统,根据arima算法对用户的稳定性进行分析,能够减少偏差,提高对用户稳定性分析的准确度和可信度。
[0151]
图4是本发明提供的一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communication interface)411、存储器(memory)412和总线(bus)413,其中,处理器410,通信接口411,存储器412通过总线413完成相互间的通信。处理器410可以调用存储器412中的逻辑指令,以执行如下方法:
[0152]
对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
[0153]
根据相似度最高的最优配对,确定满足预设条件的用户群体,并将用户群体添加到目标用户群体中,以对目标用户群体进行更新;
[0154]
将满足预设条件的用户群体剔除以对不同时序的全量用户进行更新,直至更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
[0155]
将更新后的目标用户群体划分为观察组客群和实验组客群,并对观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
[0156]
其中,预设条件包括最优配对中在预设观察期的所有时序内均出现的用户。
[0157]
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机电源屏(可以是个人计算机,服务器,或者网络电源屏等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0158]
进一步地,本发明公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的用户稳定性分析方法,例如包括:
[0159]
对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
[0160]
根据相似度最高的最优配对,确定满足预设条件的用户群体,并将用户群体添加到目标用户群体中,以对目标用户群体进行更新;
[0161]
将满足预设条件的用户群体剔除以对不同时序的全量用户进行更新,直至更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
[0162]
将更新后的目标用户群体划分为观察组客群和实验组客群,并对观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
[0163]
其中,预设条件包括最优配对中在预设观察期的所有时序内均出现的用户。
[0164]
另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的用户稳定性分析方法,例如包括:
[0165]
对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
[0166]
根据相似度最高的最优配对,确定满足预设条件的用户群体,并将用户群体添加到目标用户群体中,以对目标用户群体进行更新;
[0167]
将满足预设条件的用户群体剔除以对不同时序的全量用户进行更新,直至更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
[0168]
将更新后的目标用户群体划分为观察组客群和实验组客群,并对观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
[0169]
其中,预设条件包括最优配对中在预设观察期的所有时序内均出现的用户。
[0170]
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0171]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机电源屏(可以是个人计算机,服务器,或者网络电源屏等)执行各个实施例或者实施例的某些部分所述的方法。
[0172]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1