预测模型训练和账户价值预测方法、装置、设备及介质与流程

文档序号:27094928发布日期:2021-10-27 16:39阅读:70来源:国知局
预测模型训练和账户价值预测方法、装置、设备及介质与流程

1.本技术涉及账户价值预测技术领域,尤其涉及一种组合预测模型训练方法、账户价值预测方法、装置、设备及介质。


背景技术:

2.在实际营销过程中,银行等机构希望能够基于客户(账户)的账户信息,预测账户的价值信息,以期在预测到账户的价值信息为有高价值存款潜质的账户(为方便描述,称为高价值账户)时,可以对其进行营销等。其中,在预测账户的价值信息时,可以将账户的特征向量输入预先训练完成的预测模型,基于该预测模型的输出结果,预测账户的价值信息。
3.相关技术在训练该预测模型时,通常可以将设定时间段内多个账户作为预测模型的训练集中的训练数据,来训练该预测模型。其中,通常将训练集中的账户分为2个等级,即已经进行高价值存款的账户和尚未进行高价值存款的账户,并将已经进行高价值存款的账户标注为高价值账户;而将尚未进行高价值存款的账户均标注为低价值账户。
4.然而,由于当前尚未进行高价值存款的账户中通常也可能包含具有高价值存款潜质的高价值账户,因此,基于相关技术训练集中的训练数据(每个账户的特征向量及对应的标注信息)训练完成的预测模型,在预测账户的价值信息时,存在准确性低的技术问题。


技术实现要素:

5.本技术提供了一种组合预测模型训练方法、账户价值预测方法、装置、设备及介质,用以提高预测账户的价值信息的准确性。
6.第一方面,本技术提供了一种组合预测模型训练方法,所述方法包括:
7.根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户,将所述第一账户标注为高价值账户,将所述第二账户标注为低价值账户,其中所述第一账户及所述第二账户均包含至少一个等级的账户,且所述第一账户的资产价值高于所述第二账户的资产价值;
8.针对每个子预测模型,基于该子预测模型的训练集中的每个账户的特征向量及对应的标注信息,对该子预测模型进行训练。
9.在一种可能的实施方式中,所述基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户包括:
10.将最高资产价值区间对应的第一等级的账户,确定为第一账户;将除所述第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集;
11.确定至少一个第二训练集,针对每个第二训练集,将包括所述第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两
个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。
12.在一种可能的实施方式中,所述特征向量包括消费特征信息、房车特征信息、理财特征信息中的至少一种。
13.第二方面,本技术还提供了一种基于上述任一项所述组合预测模型训练方法的账户价值预测方法,所述方法包括:
14.将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述待预测账户属于每个等级的第一概率值;
15.根据每个所述第一概率值及预先确定的每个等级对应的权重值,确定所述待预测账户的价值评分值;
16.根据所述价值评分值,确定所述待预测账户的价值信息。
17.在一种可能的实施方式中,预先确定每个等级对应的权重值的过程包括:
18.将最高资产价值区间对应的第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述第一等级的每个账户属于每个等级的第二概率值;
19.基于设定的每个候选权重向量、每个所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量;其中,所述候选权重向量中包含每个等级对应的候选权重值,且所述每个等级对应的候选权重值的和值为设定数值;
20.将所述目标权重向量中包括的每个等级对应的目标权重值,作为所述预先确定的每个等级对应的权重值。
21.在一种可能的实施方式中,所述基于设定的每个候选权重向量、所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量包括:
22.针对设定的每个候选权重向量,根据该候选权重向量及所述第一等级的每个账户的所述第二概率值,确定该候选权重向量对应的第一等级的每个账户的价值评分总值;
23.根据每个价值评分总值,从每个所述候选权重向量中选取目标权重向量。
24.第三方面,本技术还提供了一种组合预测模型训练装置,所述装置包括:
25.组合模块,用于根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户,将所述第一账户标注为高价值账户,将所述第二账户标注为低价值账户,其中所述第一账户及所述第二账户均包含至少一个等级的账户,且所述第一账户的资产价值高于所述第二账户的资产价值;
26.训练模块,用于针对每个子预测模型,基于该子预测模型的训练集中的每个账户的特征向量及对应的标注信息,对该子预测模型进行训练。
27.在一种可能的实施方式中,所述组合模块,具体用于将最高资产价值区间对应的第一等级的账户,确定为第一账户;将除所述第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集;确定至少一个第二训练集,针对每个第二训练集,将包括所述第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账
户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。
28.第四方面,本技术还提供了一种基于上述任一项所述组合预测模型训练装置的账户价值预测装置,所述装置包括:
29.第一确定模块,用于将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述待预测账户属于每个等级的第一概率值;
30.第二确定模块,用于根据每个所述第一概率值及预先确定的每个等级对应的权重值,确定所述待预测账户的价值评分值;
31.第三确定模块,用于根据所述价值评分值,确定所述待预测账户的价值信息。
32.在一种可能的实施方式中,所述第二确定模块,具体用于将最高资产价值区间对应的第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述第一等级的每个账户属于每个等级的第二概率值;
33.基于设定的每个候选权重向量、每个所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量;其中,所述候选权重向量中包含每个等级对应的候选权重值,且所述每个等级对应的候选权重值的和值为设定数值;
34.将所述目标权重向量中包括的每个等级对应的目标权重值,作为所述预先确定的每个等级对应的权重值。
35.在一种可能的实施方式中,所述第二确定模块,具体用于针对设定的每个候选权重向量,根据该候选权重向量及所述第一等级的每个账户的所述第二概率值,确定该候选权重向量对应的第一等级的每个账户的价值评分总值;
36.根据每个价值评分总值,从每个所述候选权重向量中选取目标权重向量。
37.第五方面,本技术还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述一种组合预测模型训练方法的步骤,或,实现如上述任一所述账户价值预测方法的步骤。
38.第六方面,本技术还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述一种组合预测模型训练方法的步骤,或,实现如上述任一所述账户价值预测方法的步骤。
39.相关技术中通常只将训练集中的账户分为2个等级,即已经进行高价值存款的账户(如本技术中最高资产价值区间对应的第一等级的账户)和尚未进行高价值存款的账户(如除本技术中第一等级之外的其他等级的账户),将已经进行高价值存款的账户标注为高价值账户;而将尚未进行高价值存款的账户均标注为低价值账户。由于尚未进行高价值存款的账户中通常也可能包含具有高价值存款潜质的高价值账户,本技术将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从至少3个等级中选取每个子预测模型的训练集,其中,每个训练集中包含第一账户及第二账户,第一账户及第二账户均包含至少一个等级的账户,且第一账户的资产价值高于第二账户的资产价值,可以将第一账户标注为高价值账户,将第二账户标注为低价值账户。因此,相比相关技术,基于本技术的训练集中的每个账户的特征向量及对应的标注信息训练完成的组合预测模型,在预测账户的价值信息
时,可以提高预测账户的价值信息的准确性。
附图说明
40.为了更清楚地说明本技术实施例或相关技术中的实施方式,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
41.图1示出了一些实施例提供的一种组合预测模型训练过程示意图;
42.图2a示出了一些实施例提供的第一种等级组合方式示意图;
43.图2b示出了一些实施例提供的第二种等级组合方式示意图;
44.图2c示出了一些实施例提供的第三种等级组合方式示意图;
45.图3示出了一些实施例提供的账户价值预测过程示意图;
46.图4示出了一些实施例提供的预测第一等级的账户的召回率曲线示意图;
47.图5示出了一些实施例提供的一种确定每个等级对应的权重值过程示意图;
48.图6示出了一些实施例提供的一种组合预测模型训练装置示意图;
49.图7示出了一些实施例提供的一种账户价值预测装置示意图;
50.图8示出了一些实施例提供的一种电子设备结构示意图;
51.图9示出了一些实施例提供的另一种电子设备结构示意图。
具体实施方式
52.为了提高预测账户的价值信息的准确性,本技术提供了一种组合预测模型训练方法、账户价值预测方法、装置、设备及介质。
53.为使本技术的目的和实施方式更加清楚,下面将结合本技术示例性实施例中的附图,对本技术示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本技术一部分实施例,而不是全部的实施例。
54.需要说明的是,本技术中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本技术的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
55.本技术中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
56.术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
57.术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
58.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术
方案的范围。
59.为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。
60.实施例1:
61.图1示出了一些实施例提供的一种组合预测模型训练过程示意图,该过程包括以下步骤:
62.s101:根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户,将所述第一账户标注为高价值账户,将所述第二账户标注为低价值账户,其中所述第一账户及所述第二账户均包含至少一个等级的账户,且所述第一账户的资产价值高于所述第二账户的资产价值。
63.本技术实施例提供的组合预测模型训练方法应用于电子设备,该电子设备可以是服务器,也可以是pc、移动终端等设备。
64.在一种可能的实施方式中,为了提高预测账户的价值信息的准确性,电子设备可以基于组合预测模型来预测账户的价值信息,其中组合预测模型中可以包括至少两个子预测模型。在训练该组合预测模型时,可以先获取设定时间段内,每个账户的资产价值信息,示例性的,账户的资产价值信息可以为账户在设定时间段内的存款信息或持有的存单的信息等,本技术对设定时间段及账户的资产价值信息不做具体限定,可以根据需求灵活设置。
65.在一种可能的实施方式中,为了提高预测账户的价值信息的准确性,用户可以预设至少3个资产价值区间,以使电子设备可以根据每个账户的资产价值信息及用户预设的每个资产价值区间,将账户划分为至少3个等级。其中,本技术对资产价值区间的数值不做具体限定,可以根据需求灵活设置,示例性的,最高资产价值区间可以为设定时间段内已经进行高价值存款的账户的资产价值的区间,除最高资产价值区间之外的其他资产价值区间可以为设定时间段内尚未进行高价值存款的账户的资产价值的区间等。可以理解的,预设的资产价值区间的数量与账户的等级的数量是一致的,资产价值区间的数量(账户的等级的数量)可以是3、4、5等,本技术对此不做具体限定,在一种可能的实施方式中,资产价值区间的数量(账户的等级的数量)可以为4,以可以最大程度的保证预测账户的价值信息的准确性的同时,还可以兼顾预测效率。
66.将账户划分为至少3个等级之后,可以基于设定的至少两种等级组合方式,从划分的至少3个等级中选取每个子预测模型的训练集。可以理解的,等级组合方式的总数量与子预测模型的数量是一致的,选取的每个子预测模型的训练集中既包含第一账户,又包含第二账户,第一账户及第二账户中均包含至少一个等级的账户。在一种可能的实施方式中,确定了第一账户所属的等级之后,可以将除第一账户所属的等级之外的其他等级的账户均确定为第二账户。其中,第一账户的资产价值高于第二账户的资产价值,即第一账户所属的等级的资产价值区间高于第二账户所属的等级的资产价值区间。
67.为了可以确定训练集中的每个账户的价值信息,针对训练集中包含每个账户,可
并输出,电子设备可以根据该概率值p1、概率阈值及该账户的标注信息,判断该子预测模型的识别结果是否准确,若不准确,则可以对该待训练的子预测模型的参数α1、β1(β
1i
)进行调整。
74.同样的,如果组合预测模型中包括的子预测模型(第二子预测模型a)输出的概率值用p
12
表示,则log
it
(p
12
)=α2+β2x。其中,α2、β2均为第二子预测模型a的参数,x为账户的特征向量。在一种可能的实施方式中,账户的特征向量x中可以包括至少一种特征信息,例如可以包括消费特征信息、房车特征信息、理财特征信息中的至少一种。将特征向量中包含的特征信息用x
i
表示,其中1≤i≤n,n为特征向量中包含的特征信息的总数量,则β2x=β
21
x1+β
22
x2+β
23
x3+

β
2i
x
i
+

β
2n
x
n
,其中β
2i
为针对第x
i
个特征信息,第二子预测模型a对应的子参数。
75.第二子预测模型a可以根据账户的特征向量,确定该账户为高价值账户的概率值p
12
并输出,电子设备可以根据该概率值p
12
、概率阈值及该账户的标注信息,判断该子预测模型的识别结果是否准确,若不准确,则可以对该待训练的子预测模型的参数α2、β2(β
2i
)进行调整。
76.同样的,如果组合预测模型中包括的子预测模型(第二子预测模型b)输出的概率值用p
123
表示,则log
it
(p
123
)=α3+β3x。其中,α3、β3均为第二子预测模型b的参数,x为账户的特征向量。在一种可能的实施方式中,账户的特征向量x中可以包括至少一种特征信息,例如可以包括消费特征信息、房车特征信息、理财特征信息中的至少一种。将特征向量中包含的特征信息用x
i
表示,其中1≤i≤n,n为特征向量中包含的特征信息的总数量,则β3x=β
31
x1+β
32
x2+β
33
x3+

β
3i
x
i
+

β
3n
x
n
,其中β
3i
为针对第x
i
个特征信息,第二子预测模型b对应的子参数。
77.第二子预测模型b可以根据账户的特征向量,确定该账户为高价值账户的概率值p
123
并输出,电子设备可以根据该概率值p
123
、概率阈值及该账户的标注信息,判断该子预测模型的识别结果是否准确,若不准确,则可以对该待训练的子预测模型的参数α3、β3(β
3i
)进行调整。
78.在一种可能的实施方式中,可以对训练集中的每个账户都进行上述操作,当满足预设的收敛条件时,确定该子预测模型训练完成。
79.其中,满足预设的收敛条件可以为训练集中的账户通过该待训练的子预测模型,被正确识别的账户的个数大于设定数量,或对待训练的子预测模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以根据需求灵活设置,在此不做具体限定。
80.在一种可能的实施方式中,在对待训练的子预测模型进行训练时,可以把训练集中的账户分为训练账户和测试账户,先基于训练账户对待训练的子预测模型进行训练,再基于测试账户对上述已训练的子预测模型的可靠程度进行验证。
81.相关技术中通常只将训练集中的账户分为2个等级,即已经进行高价值存款的账户(如本技术中最高资产价值区间对应的第一等级的账户)和尚未进行高价值存款的账户(如除本技术中第一等级之外的其他等级的账户),将已经进行高价值存款的账户标注为高价值账户;而将尚未进行高价值存款的账户均标注为低价值账户。由于尚未进行高价值存款的账户中通常也可能包含具有高价值存款潜质的高价值账户,本技术将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从至少3个等级中选取每个子预测模型的训
练集,其中,每个训练集中包含第一账户及第二账户,第一账户及第二账户均包含至少一个等级的账户,且第一账户的资产价值高于第二账户的资产价值,可以将第一账户标注为高价值账户,将第二账户标注为低价值账户。因此,相比相关技术,基于本技术的训练集中的每个账户的特征向量及对应的标注信息训练完成的组合预测模型,在预测账户的价值信息时,可以提高预测账户的价值信息的准确性。
82.实施例2:
83.相关技术在训练该预测模型时,通常将训练集中的账户分为2个等级,即已经进行高价值存款的账户和尚未进行高价值存款的账户。由于已经进行高价值存款的账户的数量通常远远低于尚未进行高价值存款的账户的数量,为方便描述,将标注为高价值账户的账户称为正样本,将标注为低价值账户的账户称为负样本,即正样本的数量较少(少数类),而负样本的数量较多(多数类),正负样本比例存在较大差距,正负样本极端不平衡。而如果训练集中正负样本极端不平衡时,基于该训练集训练完成的预测模型,在预测账户的价值信息时,通常存在准确性较低的问题。
84.针对训练集中正负样本极端不平衡的情况,相关技术大多采用欠采样法(如模型融合法)或过采样法(如增量训练法)对训练集中正负样本的比例进行调整,使正负样本数量基本平衡。然而,相关技术在平衡正负样本时,通常是基于随机采样进行的,存在准确性低、稳定性差的技术问题。
85.在上述实施例的基础上,在本技术实施例中,为了平衡训练集中正负样本数量,提高预测账户价值信息的准确性和稳定性,所述基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户包括:
86.将最高资产价值区间对应的第一等级的账户,确定为第一账户;将除所述第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集;
87.确定至少一个第二训练集,针对每个第二训练集,将包括所述第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。
88.具体的,可以基于以下至少两种等级组合方式,从至少3个等级中选取每个子预测模型的训练集:
89.首先,在确定组合预测模型中其中一个子预测模型的训练集时,可以先确定资产价值区间中的最高资产价值区间,为方便描述,将最高资产价值区间对应的等级,称为第一等级。将第一等级的账户,确定为第一账户。然后,将除第一等级之外的其他等级的账户,确定为第二账户,并将由该第一账户和该第二账户组成的训练集(称为第一训练集),确定为组合预测模型中其中一个子预测模型(称为第一子预测模型)的训练集。
90.另外,鉴于每个子预测模型均对应一个训练集,即子预测模型的总数量与训练集的总数量是一致的。为方便描述,将组合预测模型中除上述第一子预测模型之外的其他子预测模型,称为第二子预测模型。第二子预测模型的数量为至少一个,每个第二子预测模型均对应一个训练集,将每个第二子预测模型对应的训练集,均称为第二训练集,则需要确定
至少一个第二训练集。
91.在确定该至少一个第二训练集时,针对每个第二训练集,可以先将包括第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。为方便理解,下面通过一个具体实施例对本技术提供的等级组合方式及选取每个子预测模型的训练集的过程进行举例说明。
92.示例性的,以账户的资产价值为存款金额(存款信息)为例,存款金额用a表示,预设的每个资产价值区间分别为a≥20万、20万>a≥10万、10万>a≥3万、a<3万。(其中,a≥20万为设定时间段内已经进行高价值存款的账户的资产价值的区间,其他资产价值区间(20万>a≥10万、10万>a≥3万、a<3万)均为设定时间段内尚未进行高价值存款的账户的资产价值的区间。)根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为4个等级,其中最高资产价值区间(a≥20万)对应的等级为第一等级,资产价值区间(20万>a≥10万)对应的等级为第二等级,资产价值区间(10万>a≥3万)对应的等级为第三等级,最低资产价值区间(a<3万)对应的等级为第四等级。
93.经统计获知,参阅表1,除前一设定时间段内账户即为第一等级的账户之外,该前一设定时间段的下一相邻设定时间段内第一等级的账户中,有81.94%的账户来自第二等级,有11.86%的账户来自第三等级,有6.20%的账户来自第四等级。
94.表1
[0095][0096]
由表1可以看出,前一设定时间段账户所属的等级级别越高,该账户在下一相邻设定时间段内成为高价值存款账户(第一等级的账户)的可能性越大,也就是说,前一设定时间段存款金额较多的账户更容易发展为高价值存款账户,各等级级别之间存在层层递进的关联关系。基于此,本技术可以基于有序多分类算法确定等级组合方式。图2a示出了一些实
施例提供的第一种等级组合方式示意图,图2b示出了一些实施例提供的第二种等级组合方式示意图,图2c示出了一些实施例提供的第三种等级组合方式示意图,如图2a、图2b、图2c所示,等级组合方式可以包括以下三种:
[0097]
参阅图2a,第一种等级组合方式可以为:将第一等级的账户,确定为第一账户;将第二等级、第三等级及第四等级的账户均确定为第二账户。
[0098]
参阅图2b,第二种等级组合方式可以为:将第一等级和第二等级的账户,均确定为第一账户;将第三等级和第四等级的账户均确定为第二账户。
[0099]
参阅图2c,第三种等级组合方式可以为:将第一等级、第二等级及第三等级的账户,均确定为第一账户;将第四等级的账户确定为第二账户。
[0100]
相应的,组合预测模型中共包括三个子预测模型,分别称为第一子预测模型、第二子预测模型a和第二子预测模型b。其中,可以将由上述第一种等级组合方式确定的第一账户和第二账户组成的第一训练集,确定为第一子预测模型的训练集。同时,将由上述第二种等级组合方式确定的第一账户和第二账户组成的第二训练集,确定为其中一个第二子预测模型(第二子预测模型a)的训练集。将由上述第三种等级组合方式确定的第一账户和第二账户组成的第二训练集,确定为另一个第二子预测模型(第二子预测模型b)的训练集。
[0101]
确定了每个子预测模型的训练集后,与上述实施例相同,可以将每个第一账户均标注为高价值账户,将每个第二账户均标注为低价值账户。
[0102]
由于本技术可以将账户划分为至少3个等级,并考虑到每个等级之间的层层递进的关联关系,除了可以将最高资产价值区间对应的第一等级的账户,确定为第一账户,将除第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集之外,还可以确定至少一个第二训练集,针对每个第二训练集,将包括第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户,并将该第二训练集确定为任一第二子预测模型的训练集。相比相关技术中通常基于随机采样平衡正负样本数量而言,本技术可以基于每个等级之间的关联关系平衡正负样本数量,从而可以在一定程度上平衡训练集中正负样本数量的同时,还可以提高确定的训练集的质量,进一步提高预测账户价值信息的准确性和稳定性。
[0103]
实施例3:
[0104]
为了准确的确定待预测账户的价值信息,在上述各实施例的基础上,本技术实施例提供了一种账户价值预测方法,图3示出了一些实施例提供的账户价值预测过程示意图,如图3所示,该过程包括以下步骤:
[0105]
s301:将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述待预测账户属于每个等级的第一概率值。
[0106]
本技术实施例提供的组合预测模型训练方法应用于电子设备,该电子设备可以是服务器,也可以是pc、移动终端等设备。
[0107]
在一种可能的实施方式中,可以基于预先训练完成的每个子预测模型来预测(确定)账户的价值信息。具体的,在确定待预测账户的价值信息时,可以将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,示例性的,仍以上述实施例为例,组合预测
模型中共包括三个子预测模型,分别称为第一子预测模型、第二子预测模型a和第二子预测模型b,则可以分别将待预测模型的特征向量分别输入预先训练完成的第一子预测模型、第二子预测模型a和第二子预测模型b。每个子预测模型可以输出该待预测账户为正样本的概率值。
[0108]
示例性的,第一子预测模型输出的概率值用p1表示,则p1可以表示待预测账户属于高价值账户(第一等级的账户)的概率值,其中,α1和β1为第一子预测模型的参数值,x为待预测账户的特征向量。
[0109]
第二子预测模型a输出的概率值用p
12
表示,则p
12
可以表示待预测账户属于高价值账户(第一等级的账户和第二等级账户)的概率值(累计概率值),
[0110]
第二子预测模型b输出的概率值用p
123
表示,则p
123
可以表示待预测账户属于高价值账户(第一等级的账户、第二等级及第三等级账户)的概率值(累计概率值),
[0111]
为方便理解,仍以上述实施例举例说明,累计概率值满足以下公式:
[0112]
p(y≤j|x)=p(y=1|x)+p(y=2|x)+p(y=3|x)+...+p(y=j|x)...+p(y=k|x),
[0113]
其中,1≤j≤k,k为账户的等级的数量,y为账户的价值信息,p(y=j|x)为待预测账户属于第j等级账户的概率值(第一概率值),例如,p(y=1|x)为待预测账户属于第一等级的账户的概率值(第一概率值),p(y=2|x)为待预测账户属于第二等级账户的概率值(第一概率值),p(y=3|x)为待预测账户属于第三等级账户的概率值(第一概率值)。p(y≤j|x)为待预测账户属于第一等级、第二等级、...第j等级账户的累计概率值,例如,当j为1时,p(y≤j|x)即为上述实施例中的p1;当j为2时,p(y≤j|x)即为上述实施例中的p
12
;当j为3,p(y≤j|x)即为上述实施例中的p
123

[0114]
为了确定待预测账户属于每个等级的第一概率值,可以基于每个子预测模型输出的概率值及累计概率算法,确定待预测账户属于每个等级的第一概率值。示例性的,待预测账户属于第一等级的账户的第一概率值p(y=1|x)=p1;
[0115]
待预测账户属于第二等级账户的第一概率值p(y=2|x)=p
12

p1;
[0116]
待预测账户属于第三等级账户的第一概率值p(y=3|x)=p
123

p
12

[0117]
待预测账户属于第四等级账户的第一概率值p(y=4|x)=1

p
123

[0118]
s302:根据每个所述第一概率值及预先确定的每个等级对应的权重值,确定所述待预测账户的价值评分值。
[0119]
在一种可能的实施方式中,为了准确确定待预测账户的价值信息,可以先确定待预测账户的价值评分值,根据该价值评分值,确定待预测账户的价值信息。其中,为了准确确定待预测账户的价值评分值,可以预先确定每个等级对应的权重值,然后根据待预测账户属于每个等级的第一概率值及该预先确定的每个等级对应的权重值,确定待预测账户的价值评分值。
[0120]
示例性的,仍以上述实施例为例,第一等级对应的权重值用θ1表示,第二等级对应的权重值用θ2表示,第三等级对应的权重值用θ3表示,第四等级对应的权重值用θ4表示,待
预测账户的价值评分值用v表示,则:
[0121]
v=θ1p(y=1|x)+θ2p(y=2|x)+θ3p(y=3|x)+θ4p(y=4|x)。
[0122]
s303:根据所述价值评分值,确定所述待预测账户的价值信息。
[0123]
在一种可能的实施方式中,用户可以预先设定价值评分区间值与价值信息的对应关系并将该对应关系保存在电子设备中,电子设备在根据价值评分值,确定待预测账户的价值信息时,可以先确定待预测账户所属的目标价值评分区间值,然后根据保存的价值评分区间值与价值信息的对应关系,将目标价值评分区间值对应的目标价值信息,确定为待预测账户的价值信息。其中,待预测账户的价值信息可以包括高价值账户、低价值账户;也可以包括第一等级的账户、第二等级的账户、第三等级的账户、第四等级的账户等等,待预测账户的价值信息可以根据需求灵活设置,本技术对此不做具体限定。
[0124]
图4示出了一些实施例提供的预测第一等级的账户的召回率曲线示意图,如图4所示,横坐标为选取的进行账户价值信息预测的账户的数量与账户总数量的比值,如账户总数量为10000个,选取的进行账户价值信息预测的账户的数量为1000个,则横坐标即为10%。纵坐标为选取的进行账户价值信息预测的账户中实际为第一等级的账户的数量与选取的进行账户价值信息预测的账户的数量的比值。参阅图4,相比相关技术中采用欠采样法(如模型融合法)或过采样法(如增量训练法)训练预测模型,基于预测模型的输出结果(为方便描述,称为相关技术预测模型),确定账户是否为第一等级的账户的召回率、以及相比相关技术不基于预测模型,采用随机抽样统计方法(为方便描述,称为相关技术无模型)确定第一等级的账户的召回率而言,本技术实施例基于组合预测模型的账户价值预测方法(为方便描述,称为本技术组合预测模型)可以提高确定的账户的价值信息的准确性,确定第一等级的账户的召回率较高。
[0125]
另外,在一种可能的实施方式中,根据价值评分值,确定待预测账户是否为第一等级的账户之后,还可以再统计预测的第一等级的账户中,实际购买银行等推荐的存款产品的账户所占的比例(存款潜客识别率)、每个账户的平均(户均)存款增长金额、户均存款余额增速、实际购买大额定期存款的账户所占的比例(大额定期存款占比)等参数值。其中,可以采用现有技术确定存款潜客识别率、户均存款增长金额、户均存款余额增速、大额定期存款占比等参数值,在此不再赘述。为方便描述,本技术基于组合预测模型确定账户的价值信息的方式称为实验组,将基于相关技术确定账户的价值信息的方式称为对照组。在同等实验条件下,如实验组和对照组均预测了1000个账户为第一等级的账户,本技术实验组的上述四个参数值均高于对照组,例如本技术实验组的存款潜客识别率比对照组高15.9%,实验组的户均存款增长金额比对照组高0.85万,实验组的户均存款余额增速比对照组高16.89%,实验组的大额定期存款占比相比对照组高8.92%。由于账户的价值信息与存款潜客识别率、户均存款增长金额、户均存款余额增速、大额定期存款占比这几个参数值之间通常是正相关的关系,由此也可以侧面反映出,本技术基于组合预测模型确定账户的价值信息的方式可以提高预测账户价值信息的准确性。
[0126]
本技术可以将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于每个子预测模型输出的概率值及累计概率算法,确定待预测账户属于每个等级的第一概率值;并根据每个第一概率值及预先确定的每个等级对应的权重值,确定待预测账户的价值评分值;根据该价值评分值,确定待预测账户的价值信息。由于本技术可以基于每个子
预测模型输出的概率值、预先确定的每个等级对应的权重值,综合确定待预测账户的价值评分值,从而可以在根据该价值评分值,确定待预测账户的价值信息时,可以提高确定的价值信息的准确性。
[0127]
实施例4:
[0128]
图5示出了一些实施例提供的一种确定每个等级对应的权重值过程示意图,如图5所示,为了准确确定每个等级对应的权重值,在上述各实施例的基础上,在本技术实施例中,预先确定每个等级对应的权重值的过程包括以下步骤:
[0129]
s501:将最高资产价值区间对应的第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述第一等级的每个账户属于每个等级的第二概率值。
[0130]
在一种可能的实施方式中,鉴于前一设定时间段内账户为第一等级的账户时,在该前一设定时间段的下一相邻设定时间段时,该账户通常仍为第一等级的账户,即该账户在下一相邻设定时间段的价值信息(预测的价值信息)可以认为是已知的。为了准确确定每个等级对应的权重值,提高确定待预测账户的价值信息的准确性,可以基于第一等级的账户确定每个等级对应的权重值。
[0131]
具体的,在基于第一等级的账户确定每个等级对应的权重值时,可以将第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于每个子预测模型输出的概率值及累计概率算法,确定第一等级的每个账户属于每个等级的第二概率值。其中,为方便描述,将待预测账户属于每个等级的概率值称为第一概率值,将第一等级的账户属于每个等级的概率值称为第二概率值,其中确定第二概率值的过程与上述实施例中确定第一概率值的过程相同,在此不再赘述。
[0132]
s502:基于设定的每个候选权重向量、每个所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量;其中,所述候选权重向量中包含每个等级对应的候选权重值,且所述每个等级对应的候选权重值的和值为设定数值。
[0133]
在一种可能的实施方式中,可以预先设定多个候选权重向量,其中,每个候选权重向量中包含每个等级对应的候选权重值,且包含的每个等级对应的候选权重值的和值为设定数值。其中,设定数值可以根据需求灵活设定,例如可以为1或100等。示例性的,仍以上述实施例为例,候选权重向量中,第一等级对应的候选权重值用θ1’
表示,第二等级对应的候选权重值用θ2’
表示,第三等级对应的候选权重值用θ3’
表示,第四等级对应的候选权重值用θ4’
表示,设定数值为1,则θ1’
+θ2’
+θ3’
+θ4’
=1。
[0134]
在一种可能的实施方式中,可以基于设定的每个候选权重向量、每个第二概率值及线性加权融合法,从每个候选权重向量中选取目标权重向量。在上述各实施例的基础上,在本技术实施例中,所述基于设定的每个候选权重向量、所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量包括:
[0135]
针对设定的每个候选权重向量,根据该候选权重向量及所述第一等级的每个账户的所述第二概率值,确定该候选权重向量对应的第一等级的每个账户的价值评分总值;
[0136]
根据每个价值评分总值,从每个所述候选权重向量中选取目标权重向量。
[0137]
在从候选权重向量中,选取目标权重向量时,可以先针对设定的每个候选权重向量,根据该候选权重向量及第一等级的任一账户的第二概率值,确定该候选权重向量对应
第一等级的任一账户的价值评分值。示例性的,第一等级的任一账户的价值评分值用v’表示,该任一账户属于第一等级的账户的第二概率值用p’(y=1|x)表示,该任一账户属于第二等级账户的第二概率值用p’(y=2|x)表示,该任一账户属于第三等级账户的第二概率值用p’(y=3|x)表示,该任一账户属于第四等级账户的第二概率值用p’(y=4|x)表示,则:
[0138]
v’=θ1’
p’(y=1|x)+θ2’
p’(y=2|x)+θ3’
p’(y=3|x)+θ4'p'(y=4|x)。
[0139]
确定了第一等级的每个账户的价值评分值后,可以根据第一等级的每个账户的价值评分值的和值,确定候选权重向量对应的第一等级的每个账户的价值评分总值。确定了每个候选权重向量对应的价值评分总值后,可以根据每个价值评分总值,从每个候选权重向量中选取目标权重向量。在一种可能的实施方式中,价值评分总值越高,可以认为确定账户为第一等级的账户的可能性越大,为了提高确定待预测账户的价值信息的准确性,可以将每个价值评分总值中的最高值对应的候选权重向量,确定为目标权重向量。
[0140]
s503:将所述目标权重向量中包括的每个等级对应的目标权重值,作为所述预先确定的每个等级对应的权重值。
[0141]
确定了目标权重向量后,可以将目标权重向量中包括的每个等级对应的目标权重值,作为预先确定的每个等级对应的权重值。示例性的,如果目标权重向量中,第一等级对应的目标权重值为θ1,第二等级对应的目标权重值为θ2,第三等级对应的目标权重值为θ3,第四等级对应的目标权重值为θ4。则预先确定的第一等级对应的权重值即为θ1,第二等级对应的权重值即为θ2,第三等级对应的权重值即为θ3,第四等级对应的权重值即为θ4。
[0142]
实施例5:
[0143]
基于相同的技术构思,本技术还提供了一种组合预测模型训练装置,图6示出了一些实施例提供的一种组合预测模型训练装置示意图,该装置包括:
[0144]
组合模块61,用于根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户,将所述第一账户标注为高价值账户,将所述第二账户标注为低价值账户,其中所述第一账户及所述第二账户均包含至少一个等级的账户,且所述第一账户的资产价值高于所述第二账户的资产价值;
[0145]
训练模块62,用于针对每个子预测模型,基于该子预测模型的训练集中的每个账户的特征向量及对应的标注信息,对该子预测模型进行训练。
[0146]
在一种可能的实施方式中,所述组合模块61,具体用于将最高资产价值区间对应的第一等级的账户,确定为第一账户;将除所述第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集;确定至少一个第二训练集,针对每个第二训练集,将包括所述第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。
[0147]
实施例6:
[0148]
基于相同的技术构思,本技术还提供了一种账户价值预测装置,图7示出了一些实施例提供的一种账户价值预测装置示意图,该装置包括:
[0149]
第一确定模块71,用于将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述待预测账户属于每个等级的第一概率值;
[0150]
第二确定模块72,用于根据每个所述第一概率值及预先确定的每个等级对应的权重值,确定所述待预测账户的价值评分值;
[0151]
第三确定模块73,用于根据所述价值评分值,确定所述待预测账户的价值信息。
[0152]
在一种可能的实施方式中,所述第二确定模块72,具体用于将最高资产价值区间对应的第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述第一等级的每个账户属于每个等级的第二概率值;
[0153]
基于设定的每个候选权重向量、每个所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量;其中,所述候选权重向量中包含每个等级对应的候选权重值,且所述每个等级对应的候选权重值的和值为设定数值;
[0154]
将所述目标权重向量中包括的每个等级对应的目标权重值,作为所述预先确定的每个等级对应的权重值。
[0155]
在一种可能的实施方式中,所述第二确定模块72,具体用于针对设定的每个候选权重向量,根据该候选权重向量及所述第一等级的每个账户的所述第二概率值,确定该候选权重向量对应的第一等级的每个账户的价值评分总值;
[0156]
根据每个价值评分总值,从每个所述候选权重向量中选取目标权重向量。
[0157]
实施例7:
[0158]
基于相同的技术构思,本技术还提供了一种电子设备,图8示出了一些实施例提供的一种电子设备结构示意图,如图8所示,包括:处理器81、通信接口82、存储器83和通信总线84,其中,处理器81,通信接口82,存储器83通过通信总线84完成相互间的通信;
[0159]
所述存储器83中存储有计算机程序,当所述程序被所述处理器81执行时,使得所述处理器81执行如下步骤:
[0160]
根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户,将所述第一账户标注为高价值账户,将所述第二账户标注为低价值账户,其中所述第一账户及所述第二账户均包含至少一个等级的账户,且所述第一账户的资产价值高于所述第二账户的资产价值;
[0161]
针对每个子预测模型,基于该子预测模型的训练集中的每个账户的特征向量及对应的标注信息,对该子预测模型进行训练。
[0162]
在一种可能的实施方式中,处理器81,具体用于将最高资产价值区间对应的第一等级的账户,确定为第一账户;将除所述第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集;
[0163]
确定至少一个第二训练集,针对每个第二训练集,将包括所述第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。
[0164]
在一种可能的实施方式中,所述特征向量包括消费特征信息、房车特征信息、理财特征信息中的至少一种。
[0165]
由于上述电子设备解决问题的原理与组合预测模型训练方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
[0166]
上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0167]
通信接口82用于上述电子设备与其他设备之间的通信。
[0168]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non

volatile memory,nvm),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0169]
上述处理器可以是通用处理器,包括中央处理器、网络处理器(network processor,np)等;还可以是数字指令处理器(digital signal processing,dsp)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0170]
实施例8:
[0171]
基于相同的技术构思,本技术还提供了一种电子设备,图9示出了一些实施例提供的另一种电子设备结构示意图,如图9所示,包括:处理器91、通信接口92、存储器93和通信总线94,其中,处理器91,通信接口92,存储器93通过通信94完成相互间的通信;
[0172]
所述存储器93中存储有计算机程序,当所述程序被所述处理器91执行时,使得所述处理器91执行如下步骤:
[0173]
将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述待预测账户属于每个等级的第一概率值;
[0174]
根据每个所述第一概率值及预先确定的每个等级对应的权重值,确定所述待预测账户的价值评分值;
[0175]
根据所述价值评分值,确定所述待预测账户的价值信息。
[0176]
在一种可能的实施方式中,处理器91,具体用于将最高资产价值区间对应的第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述第一等级的每个账户属于每个等级的第二概率值;
[0177]
基于设定的每个候选权重向量、每个所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量;其中,所述候选权重向量中包含每个等级对应的候选权重值,且所述每个等级对应的候选权重值的和值为设定数值;
[0178]
将所述目标权重向量中包括的每个等级对应的目标权重值,作为所述预先确定的每个等级对应的权重值。
[0179]
在一种可能的实施方式中,处理器91,具体用于针对设定的每个候选权重向量,根据该候选权重向量及所述第一等级的每个账户的所述第二概率值,确定该候选权重向量对
应的第一等级的每个账户的价值评分总值;
[0180]
根据每个价值评分总值,从每个所述候选权重向量中选取目标权重向量。
[0181]
由于上述电子设备解决问题的原理与基于组合预测模型训练方法的账户价值预测方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
[0182]
上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0183]
通信接口92用于上述电子设备与其他设备之间的通信。
[0184]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non

volatile memory,nvm),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0185]
上述处理器可以是通用处理器,包括中央处理器、网络处理器(network processor,np)等;还可以是数字指令处理器(digital signal processing,dsp)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0186]
实施例9:
[0187]
基于相同的技术构思,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现如下步骤:
[0188]
根据每个账户的资产价值信息及预设的每个资产价值区间,将账户划分为至少3个等级;基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户,将所述第一账户标注为高价值账户,将所述第二账户标注为低价值账户,其中所述第一账户及所述第二账户均包含至少一个等级的账户,且所述第一账户的资产价值高于所述第二账户的资产价值;
[0189]
针对每个子预测模型,基于该子预测模型的训练集中的每个账户的特征向量及对应的标注信息,对该子预测模型进行训练。
[0190]
在一种可能的实施方式中,所述基于设定的至少两种等级组合方式,从所述至少3个等级中选取每个子预测模型的训练集,其中每个训练集中包含第一账户及第二账户包括:
[0191]
将最高资产价值区间对应的第一等级的账户,确定为第一账户;将除所述第一等级之外的其他等级的账户,确定为第二账户,将该第一账户和该第二账户组成的第一训练集确定为第一子预测模型的训练集;
[0192]
确定至少一个第二训练集,针对每个第二训练集,将包括所述第一等级在内的资产价值区间连续的至少两个等级的账户,确定为该第二训练集的第一账户;将除该至少两个等级的账户之外的其他等级的账户,确定为该第二训练集的第二账户;并将该第二训练集确定为任一第二子预测模型的训练集。
[0193]
在一种可能的实施方式中,所述特征向量包括消费特征信息、房车特征信息、理财特征信息中的至少一种。
[0194]
由于上述计算机可读存储介质解决问题的原理与组合预测模型训练方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
[0195]
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(mo)等、光学存储器如cd、dvd、bd、hvd等、以及半导体存储器如rom、eprom、eeprom、非易失性存储器(nand flash)、固态硬盘(ssd)等。
[0196]
实施例10:
[0197]
基于相同的技术构思,本技术实施例提供了另一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现如下步骤:
[0198]
将待预测账户的特征向量分别输入预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述待预测账户属于每个等级的第一概率值;
[0199]
根据每个所述第一概率值及预先确定的每个等级对应的权重值,确定所述待预测账户的价值评分值;
[0200]
根据所述价值评分值,确定所述待预测账户的价值信息。
[0201]
在一种可能的实施方式中,预先确定每个等级对应的权重值的过程包括:
[0202]
将最高资产价值区间对应的第一等级的每个账户的特征向量分别输入到预先训练完成的每个子预测模型,基于所述每个子预测模型输出的概率值及累计概率算法,确定所述第一等级的每个账户属于每个等级的第二概率值;
[0203]
基于设定的每个候选权重向量、每个所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量;其中,所述候选权重向量中包含每个等级对应的候选权重值,且所述每个等级对应的候选权重值的和值为设定数值;
[0204]
将所述目标权重向量中包括的每个等级对应的目标权重值,作为所述预先确定的每个等级对应的权重值。
[0205]
在一种可能的实施方式中,所述基于设定的每个候选权重向量、所述第二概率值及线性加权融合法,从每个所述候选权重向量中选取目标权重向量包括:
[0206]
针对设定的每个候选权重向量,根据该候选权重向量及所述第一等级的每个账户的所述第二概率值,确定该候选权重向量对应的第一等级的每个账户的价值评分总值;
[0207]
根据每个价值评分总值,从每个所述候选权重向量中选取目标权重向量。
[0208]
由于上述计算机可读存储介质解决问题的原理与基于组合预测模型训练方法的账户价值预测方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
[0209]
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(mo)等、光学存储器如cd、dvd、bd、hvd等、以及半导体存储器如rom、eprom、eeprom、非易失性存储器(nand flash)、固态硬盘(ssd)等。
[0210]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
[0211]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0212]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0213]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0214]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1