银寿客户转化的预测方法、装置和电子设备与流程

文档序号:33118379发布日期:2023-02-01 03:13阅读:46来源:国知局
银寿客户转化的预测方法、装置和电子设备与流程

1.本发明涉及数据处理的技术领域,尤其是涉及一种银寿客户转化的预测方法、装置和电子设备。


背景技术:

2.随着大数据时代的到来和金融科技的发展,银行或者保险公司也发展了自己的科技部门,产出了大量的业务数据和数据挖掘模型,但是,尽管如此,依然存在如下问题:金融行业存在天然的信息壁垒。由于金融监管和行业竞争的问题,金融公司相对互联网企业,相互合作的并不多,往往只专注于自己的领域,信息闭塞,然而随着市场经济和金融业的发展,亟需打通这种信息壁垒,寻求更多的银寿合作等不同专业公司的合作。
3.目前,在金融行业,传统的银寿客户转化模型系统往往采用专家经验规则实现,专家经验规则具有可解释性强、可控性高、充分贴合业务历史数据的特点,但是,专家经验规则比较主观,所以预测的银寿客户转化的概率准确性差;除了专家经验规则,传统金融企业预测客户转化一般使用的是logistic(逻辑回归)模型,logistic具有良好的模型可解释性,但其本质上还是一种线性模型,预测的银寿客户转化的概率准确性差;还有一种xgboost(分布式梯度提升树)模型用于客户的转化预测,在数据量小,且特征标签少的场景下,预测的准确率比较高,但xgboost建模过程需要把所有建模数据载入内存用于预排序,不仅需要保存特征值,也需要保存特征的排序索引,这势必导致其内存耗用过大,而将其应用于大数据、多特征标签的客户转化预测场景时,预测的准确率差,即不能很好的满足业务准确率的要求。
4.综上,现有的银寿客户转化的预测方法存在准确性差的技术问题。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种银寿客户转化的预测方法、装置和电子设备,以缓解现有的银寿客户转化的预测方法准确性差的技术问题。
6.第一方面,本发明实施例提供了一种银寿客户转化的预测方法,包括:获取历史时间范围内的客户业务数据,并根据所述客户业务数据确定各客户的各种特征的初始值,其中,所述各种特征为亲密度评估树状图中的指标层的特征,所述亲密度评估树状图自上而下包括:标签层、准则层、子准则层和所述指标层;基于所述亲密度评估树状图和所述各客户的各种特征的初始值进行亲密度评估,得到各客户与当前银行的亲密度和各客户的亲密度相关因子,其中,所述亲密度相关因子为所述亲密度评估树状图中所述标签层、所述准则层、所述子准则层和所述指标层中所包含的各特征的得分;根据所述客户业务数据确定各客户的基本属性和各客户的客户代理人的相关属性;将所述各客户与当前银行的亲密度、所述各客户的亲密度相关因子、所述各客户
的基本属性和所述各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型,得到各客户的转化概率,其中,所述银寿客户转化预测模型为lightgbm模型。
7.第二方面,本发明实施例还提供了一种银寿客户转化的预测装置,包括:获取和确定单元,用于获取历史时间范围内的客户业务数据,并根据所述客户业务数据确定各客户的各种特征的初始值,其中,所述各种特征为亲密度评估树状图中的指标层的特征,所述亲密度评估树状图自上而下包括:标签层、准则层、子准则层和所述指标层;亲密度评估单元,用于基于所述亲密度评估树状图和所述各客户的各种特征的初始值进行亲密度评估,得到各客户与当前银行的亲密度和各客户的亲密度相关因子,其中,所述亲密度相关因子为所述亲密度评估树状图中所述标签层、所述准则层、所述子准则层和所述指标层中所包含的各特征的得分;确定单元,用于根据所述客户业务数据确定各客户的基本属性和各客户的客户代理人的相关属性;银寿客户转化预测单元,用于将所述各客户与当前银行的亲密度、所述各客户的亲密度相关因子、所述各客户的基本属性和所述各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型,得到各客户的转化概率,其中,所述银寿客户转化预测模型为lightgbm模型。
8.第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。
9.第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述第一方面任一项所述的方法。
10.在本发明实施例中,提供了一种银寿客户转化的预测方法,包括:获取历史时间范围内的客户业务数据,并根据客户业务数据确定各客户的各种特征的初始值,其中,各种特征为亲密度评估树状图中的指标层的特征,亲密度评估树状图自上而下包括:标签层、准则层、子准则层和指标层;基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估,得到各客户与当前银行的亲密度和各客户的亲密度相关因子,其中,亲密度相关因子为亲密度评估树状图中标签层、准则层、子准则层和指标层中所包含的各特征的得分;根据客户业务数据确定各客户的基本属性和各客户的客户代理人的相关属性;将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型,得到各客户的转化概率,其中,银寿客户转化预测模型为lightgbm模型。通过上述描述可知,本发明的银寿客户转化的预测方法,基于客户业务数据得到了非线性的各客户与当前银行的亲密度和各客户的亲密度相关因子的参量,进而,再将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测,由于各客户与当前银行的亲密度、各客户的亲密度相关因子属于非线性的、层次化的特征,能够更好的刻画客户的画像,这样将这些非线性的、层次化的特征输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测时,预测得到的结果的准确性好,
另外,该银寿客户转化预测模型为lightgbm模型,具备可解释性和高效预测的特点,适用于大数据、多特征的业务场景,因此,进一步确保了预测的结果的准确性,缓解了现有的银寿客户转化的预测方法准确性差的技术问题。
附图说明
11.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
12.图1为本发明实施例提供的一种银寿客户转化的预测方法的流程图;图2为本发明实施例提供的亲密度评估树状图的示意图;图3为本发明实施例提供的客户在服务渗透,互动活跃,优质体验及负面影响几个维度的热力图;图4为本发明实施例提供的亲密度与合同数、持有产品类型数、vip覆盖等的关系示意图;图5为本发明实施例提供的亲密度与aum等的关系示意图;图6为本发明实施例提供的一种银寿客户转化的预测装置的示意图;图7为本发明实施例提供的一种电子设备的示意图。
具体实施方式
13.下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
14.传统的银寿客户转化的预测方法准确性差。
15.基于此,本发明的银寿客户转化的预测方法,基于客户业务数据得到了非线性的各客户与当前银行的亲密度和各客户的亲密度相关因子的参量,进而,再将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测,由于各客户与当前银行的亲密度、各客户的亲密度相关因子属于非线性的、层次化的特征,能够更好的刻画客户的画像,这样将这些非线性的、层次化的特征输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测时,预测得到的结果的准确性好,另外,该银寿客户转化预测模型为lightgbm模型,具备可解释性和高效预测的特点,适用于大数据、多特征的业务场景,因此,进一步确保了预测的结果的准确性。
16.为便于对本实施例进行理解,首先对本发明实施例所公开的一种银寿客户转化的预测方法进行详细介绍。
17.实施例一:根据本发明实施例,提供了一种银寿客户转化的预测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,
并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
18.图1是根据本发明实施例的一种银寿客户转化的预测方法的流程图,如图1所示,该方法包括如下步骤:步骤s102,获取历史时间范围内的客户业务数据,并根据客户业务数据确定各客户的各种特征的初始值,其中,各种特征为亲密度评估树状图中的指标层的特征,亲密度评估树状图自上而下包括:标签层、准则层、子准则层和指标层;在本发明实施例中,上述历史时间范围内具体可以为过去的一个月时间内,上述客户业务数据是从个金会处获取得到的,个金会为当前银行的一个部门,它有整个当前银行集团不同的大小的专业子公司的全部业务数据,过去的一个月时间内的客户业务数据一般会有2亿多客户的客户业务数据,数据量非常庞大。
19.在得到客户业务数据后,能够根据客户业务数据确定各客户的各种特征的初始值,各种特征为亲密度评估树状图中的指标层的特征,图2中示出了亲密度评估树状图,其中,标号为1的层为标签层,标号为2的层为准则层,标号为3的层为子准则层,标号为4的层为指标层,可见,在该亲密度评估树状图中,各层都包含有多个特征。
20.具体的,在得到客户业务数据后,能够加工得到各客户的各种特征的初始值,例如,根据客户业务数据中app活跃度的数据,加工得到各客户的app活跃度的初始值,如,a客户对r app的使用次数为18,对s app的使用次数为12,对t app的使用次数为30,那么a客户的app活跃度的初始值可以为18+12+30=60,同理,可以得到b客户的app活跃度的初始值,c客户的app活跃度的初始值等等,这里只是进行了一个简单的举例说明,还可以为其它的方式确定各种特征的初始值,在此不进行具体限制。
21.步骤s104,基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估,得到各客户与当前银行的亲密度和各客户的亲密度相关因子,其中,亲密度相关因子为亲密度评估树状图中标签层、准则层、子准则层和指标层中所包含的各特征的得分;发明人考虑到现有的客户特征往往集中于基本属性、交易数据、财务数据这种线性维度的特征,线性特征有时候并不能很好刻画客户的画像,所以发明人构造了本发明中的非线性的、层次化的特征来更好地刻画客户的画像属性,也就是本发明的亲密度评估实现了数据分析技术上的突破,充分挖掘了数据内的业务价值,结合大数据的优势,达到了数据赋能业务的效果。
22.通过图2中的亲密度评估树状图可知,标签层、准则层、子准则层和指标层中所包含的特征非常多,也就是数据的维度很多,通过该多维的数据特征(即各客户与当前银行的亲密度和各客户的亲密度相关因子)对客户的画像进行刻画,能够更精细、准确、科学的刻画客户的特征,使得后续基于这些特征得到的各客户的转化概率更为准确。
23.下文中再对该过程进行详细描述,在此不再赘述。
24.步骤s106,根据客户业务数据确定各客户的基本属性和各客户的客户代理人的相关属性;具体的,上述各客户的基本属性是指传统现有的客户特征,如,基本信息、交易数据、财务数据等,上述各客户的客户代理人的相关属性是指各客户的客户代理人(如,客户经理)的重要客户数信息、各客户的客户代理人是否为明星代理人等。
25.步骤s108,将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型,得到各客户的转化概率,其中,银寿客户转化预测模型为lightgbm模型。
26.可见,与传统的方案相比,本发明的方案中,客户特征更加丰富科学,在原有的客户特征的基础上,又增加了各客户与当前银行的亲密度、各客户的亲密度相关因子,另外,本发明的方案中,还替换了预测的模型,本发明的银寿客户转化预测模型为lightgbm模型,lightgbm(轻型梯度提升器)模型具备可解释性和高效预测的特点,lightgbm是一款快速高效、低内存占用、高准确率、支持并行和大规模数据处理的数据科学工具。可见,该模型适用于本发明的大数据多特征的预测场景,在该场景下的预测结果的准确性好,且耗时短。
27.在本发明实施例中,提供了一种银寿客户转化的预测方法,包括:获取历史时间范围内的客户业务数据,并根据客户业务数据确定各客户的各种特征的初始值,其中,各种特征为亲密度评估树状图中的指标层的特征,亲密度评估树状图自上而下包括:标签层、准则层、子准则层和指标层;基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估,得到各客户与当前银行的亲密度和各客户的亲密度相关因子,其中,亲密度相关因子为亲密度评估树状图中标签层、准则层、子准则层和指标层中所包含的各特征的得分;根据客户业务数据确定各客户的基本属性和各客户的客户代理人的相关属性;将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型,得到各客户的转化概率,其中,银寿客户转化预测模型为lightgbm模型。通过上述描述可知,本发明的银寿客户转化的预测方法,基于客户业务数据得到了非线性的各客户与当前银行的亲密度和各客户的亲密度相关因子的参量,进而,再将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测,由于各客户与当前银行的亲密度、各客户的亲密度相关因子属于非线性的、层次化的特征,能够更好的刻画客户的画像,这样将这些非线性的、层次化的特征输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测时,预测得到的结果的准确性好,另外,该银寿客户转化预测模型为lightgbm模型,具备可解释性和高效预测的特点,适用于大数据、多特征的业务场景,因此,进一步确保了预测的结果的准确性,缓解了现有的银寿客户转化的预测方法准确性差的技术问题。
28.上述内容对本发明的银寿客户转化的预测方法进行了简要介绍,下面对其中涉及到的具体内容进行详细描述。
29.在本发明的一个可选实施例中,上述步骤s104,基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估,具体包括如下步骤:(1)获取指标层的各种特征对应的第一特征值区间和各第一特征值区间所对应的权重;为了便于对该过程的理解,下面以一个举例进行说明:例如,指标层中的app活跃度的特征和95511活跃度的特征,该app活跃度的特征对应的第一特征值区间分别是[0,30]、(30,60]、(60,+∞),这些第一特征值区间对应的权重分别是0.3、0.5、0.2;该95511活跃度的特征对应的第一特征值区间分别是[0,50]、(50,+∞),这些第一特征值区间对应的权重分别是0.6、0.4。
[0030]
(2)确定子准则层的第一目标特征的下游的同一客户的各种特征的初始值所属的目标第一特征值区间,并确定目标第一特征值区间对应的权重,其中,第一目标特征为子准则层的特征中的任一特征;例如,第一目标特征为渠道交互强度,其下游的各种特征包括:app活跃度的特征和95511活跃度的特征。如果一个客户a的app活跃度的初始值为40,95511活跃度的初始值为60,那么确定渠道交互强度的下游的客户a的app活跃度的初始值40所属的目标第一特征值区间为(30,60],对应的权重为0.5(参见上述(1)中的举例),客户a的95511活跃度的初始值60所属的目标第一特征值区间为(50,+∞),对应的权重为0.4。
[0031]
(3)将子准则层的第一目标特征的下游的同一客户的各种特征的初始值与初始值所属的目标第一特征值区间对应的权重进行加权计算,得到各客户的第一目标特征的得分;如上述(2)中的举例,将渠道交互强度的下游的客户a的app活跃度的初始值40与40所属的目标第一特征值区间(30,60]对应的权重0.5、客户a的95511活跃度的初始值60与60所属的目标第一特征值区间(50,+∞)对应的权重0.4进行加权计算,得到40*0.5+60*0.4=44,即为客户a的渠道交互强度的得分。
[0032]
同理,可以得到各客户的各种第一目标特征(即子准则层中的每一特征)的得分。
[0033]
(4)获取子准则层的各种第一目标特征对应的第二特征值区间和各第二特征值区间所对应的权重;(5)确定准则层的第二目标特征的下游的同一客户的各种第一目标特征的得分所属的目标第二特征值区间,并确定目标第二特征值区间对应的权重,其中,第二目标特征为准则层的特征中的任一特征;(6)将准则层的第二目标特征的下游的同一客户的各种第一目标特征的得分与得分所属的目标第二特征值区间对应的权重进行加权计算,得到各客户的第二目标特征的得分;上述(4)-(6)的过程与上述(1)-(3)的过程相似,在此不再展开叙述。
[0034]
(7)获取准则层的各种第二目标特征对应的第三特征值区间和各第三特征值区间所对应的权重;(8)确定标签层的亲密度的特征的下游的同一客户的各种第二目标特征的得分所属的目标第三特征值区间,并确定目标第三特征值区间对应的权重;(9)将标签层的亲密度的特征的下游的同一客户的各种第二目标特征的得分与得分所属的目标第三特征值区间对应的权重进行加权计算,得到各客户的亲密度的特征的得分;上述(7)-(9)的过程与上述(1)-(3)的过程也相似,在此也不再展开叙述。
[0035]
(10)获取标签层的亲密度的特征对应的第四特征值区间和各第四特征值区间所对应的权重;(11)确定各客户的亲密度的特征的得分所属的目标第四特征值区间,并确定目标第四特征值区间对应的权重;(12)将各客户的亲密度的特征的得分与得分所属的目标第四特征值区间对应的权重进行加权计算,根据加权计算的结果得到各客户与当前银行的亲密度,其中,指标层的
各种特征对应的第一特征值区间、各第一特征值区间所对应的权重、子准则层的各种第一目标特征对应的第二特征值区间、各第二特征值区间所对应的权重、准则层的各种第二目标特征对应的第三特征值区间、各第三特征值区间所对应的权重、标签层的亲密度的特征对应的第四特征值区间和各第四特征值区间所对应的权重为根据训练数据进行训练得到的。
[0036]
上述(10)-(12)的过程与上述(1)-(3)的过程也相似,在此也不再展开叙述。
[0037]
与上述(1)-(3)不同的是,在进行加权计算得到加权计算的结果后,按照加权计算的结果的大小将各客户与当前银行的亲密度表示为1-5级中的值,例如,加权计算的结果属于1级的亲密度区间,那该客户与当前银行的亲密度即为1级,级数越高,表示与当前银行越亲密。
[0038]
在本发明的一个可选实施例中,该方法还包括如下步骤:(1)获取训练数据,其中,训练数据为目标历史时间范围内的历史客户业务数据,目标历史时间范围与历史时间范围间隔预设时长;具体的,上述目标历史时间范围的时长也是一个月,目标历史时间范围与历史时间范围间隔的预设时长可以为3个月,该预设时长若为3个月,那么预测得到的各客户的转化概率为在未来两个月内各客户的转化概率。
[0039]
例如,历史时间范围内的客户业务数据为6月份的客户业务数据,那么训练数据即为3月份的客户业务数据(因为3月份的客户业务数据,看未来2个月的转化,那就是4月份的客户业务数据和5月份的客户业务数据,对于当前的6月份来说,4月份的客户业务数据和5月份的客户业务数据都可以拿到,也就是可以知道3月份的客户业务数据中各客户在4月、5月是否转化的真值标签),也就是用3月份的客户业务数据作为训练样本去训练,训练完成后,对6月份的客户业务数据进行预测,看6月的客户在未来2个月的转化情况。
[0040]
(2)根据历史客户业务数据确定各历史客户的各种特征的初始值,其中,各种特征为亲密度评估树状图中的指标层的特征;确定过程与上述步骤s102中的举例相同,在此不再赘述。例如,e历史客户的app活跃度的初始值为25,f历史客户的app活跃度的初始值为5,g历史客户的app活跃度的初始值为70等,当然实际为大量的历史客户。
[0041]
(3)对各历史客户按照同一特征的初始值进行排序,并对排序后的各历史客户进行聚类;例如,按照app活跃度的初始值对各历史客户进行排序,为g历史客户、e历史客户、f历史客户,并对排序后的各历史客户进行聚类。
[0042]
(4)根据聚类得到的簇确定当前特征对应的第一特征值区间,并确定各第一特征值区间所对应的权重;具体的,如果聚类后得到3个簇,其中,第一个簇中所有历史客户的app活跃度在[0,30],第二个簇中所有历史客户的app活跃度在(30,60],第三个簇中所有历史客户的app活跃度在(60,+∞),那么可以确定app活跃度对应的第一特征值区间分别是[0,30]、(30,60]、(60,+∞),进而根据一些业务规则再确定上述[0,30]、(30,60]、(60,+∞)所对应的权重。
[0043]
(5)确定子准则层的第一目标特征的下游的同一历史客户的各种特征的初始值所
属的目标第一特征值区间,并确定目标第一特征值区间对应的权重,其中,第一目标特征为子准则层的特征中的任一特征;具体过程可以参考上述基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估中的(2)的相关描述,在此不再赘述。
[0044]
(6)将子准则层的第一目标特征的下游的同一历史客户的各种特征的初始值与初始值所属的目标第一特征值区间对应的权重进行加权计算,得到各历史客户的第一目标特征的得分;具体过程可以参考上述基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估中的(3)的相关描述,在此不再赘述。
[0045]
(7)对各历史客户按照同一第一目标特征的得分进行排序,并对排序后的各历史客户进行聚类;(8)根据聚类得到的簇确定当前第一目标特征对应的第二特征值区间,并确定各第二特征值区间所对应的权重;(9)确定准则层的第二目标特征的下游的同一历史客户的各种第一目标特征的得分所属的目标第二特征值区间,并确定目标第二特征值区间对应的权重,其中,第二目标特征为准则层的特征中的任一特征;(10)将准则层的第二目标特征的下游的同一历史客户的各种第一目标特征的得分与得分所属的目标第二特征值区间对应的权重进行加权计算,得到各历史客户的第二目标特征的得分;(11)对各历史客户按照同一第二目标特征的得分进行排序,并对排序后的各历史客户进行聚类;(12)根据聚类得到的簇确定当前第二目标特征对应的第三特征值区间,并确定各第三特征值区间所对应的权重;(13)确定标签层的亲密度的特征的下游的同一历史客户的各种第二目标特征的得分所属的目标第三特征值区间,并确定目标第三特征值区间对应的权重;(14)将标签层的亲密度的特征的下游的同一历史客户的各种第二目标特征的得分与得分所属的目标第三特征值区间对应的权重进行加权计算,得到各历史客户的亲密度的特征的得分;(15)对各历史客户按照亲密度的特征的得分进行排序,并对排序后的各历史客户进行聚类;(16)根据聚类得到的簇确定亲密度的特征对应的第四特征值区间,并确定各第四特征值区间所对应的权重。
[0046]
上述(7)-(16)的内容可以参考对应的相关介绍,在此不再赘述。
[0047]
在本发明的一个可选实施例中,该方法还包括:(1)确定各历史客户的亲密度的特征的得分所属的目标第四特征值区间,并确定目标第四特征值区间对应的权重;(2)将各历史客户的亲密度的特征的得分与得分所属的目标第四特征值区间对应的权重进行加权计算,根据加权计算的结果得到各历史客户与当前银行的亲密度;(3)将各历史客户的各种特征的初始值、各历史客户的第一目标特征的得分、各历
史客户的第二目标特征的得分和各历史客户的亲密度的特征的得分作为各历史客户的亲密度相关因子;(4)根据历史客户业务数据确定各历史客户的基本属性和各历史客户的客户代理人的相关属性;(5)通过各历史客户与当前银行的亲密度、各历史客户的亲密度相关因子、各历史客户的基本属性、各历史客户的客户代理人的相关属性和各历史客户是否转化的标签对初始银寿客户转化预测模型进行训练,得到银寿客户转化预测模型。
[0048]
在本发明的一个可选实施例中,亲密度评估树状图为预先对亲密度和客户业务数据进行分析构建得到的。
[0049]
具体的,应用层次分析法自上而下地构建亲密度评估树状图,结合业务经验设置层级(包括正负两个方向)、各特征区间对应的权重。进一步地,对客户在各项指标(30+指标)表现进行聚类标准化处理,进而根据权重向上汇总计算客户的亲密度评分。
[0050]
本发明利用个金会的海量业务数据打造了指标层的特征的初始值,基于亲密度评估树状图突破了信息壁垒,实现了从多个维度描述客户与当前银行的“亲密度”的关系。
[0051]
在本发明的一个可选实施例中,各客户的转化概率包括:寿险非银行一类户客户转化为当前银行一类户客户的概率。
[0052]
具体的,各客户的转化概率包括:寿险非银行一类户客户在未来两个月转化为当前银行一类户客户的概率。
[0053]
图3中示出了客户在服务渗透,互动活跃,优质体验及负面影响几个维度的热力图,从中可以看出,服务渗透,互动活跃,优质体验及负面影响在亲密度方面的相关关系没有冲突,图4中示出了亲密度与合同数、持有产品类型数、vip覆盖等的关系,可见,亲密度越高,合同数越多,亲密度越高,持有产品类型数也越多等,图5中示出了亲密度与aum等的关系。通过这3张图,可以看出,本发明提出的亲密度的标签在评价客户与当前银行的亲密性上是准确的,科学的。
[0054]
另外,发明人还将本发明的方案与传统方案的准确率进行了对比,发现,在传统的专家规则下预测银寿客户转化率,历史预测准确率在1.5%-2.5%之间,而利用xgboost/lr的机器学习模型则能够达到5%的准确率。而利用本发明提出的亲密度因子+lightgbm模型架构,得到的准确率在12%,是专家规则的5倍,是xgboost/lr模型的2倍,同时召回率也比它们要大,尽管召回率并不是主要考量指标;另外,本发明使用的内存消耗和训练时间更少,部署到大数据的分布环境更容易基于亲密度标签++lightgbm的预测模型在该银行、寿险双边合作的项目中得到成功的应用,预测得到的寿险客户己经下发给寿险相关代理人作为获客、触客、触发商机使用,每月客户下发量在5万,年累计客户下发接近60万,带来银行新客7万,银行aum增长20
亿。
[0055]
实施例二:本发明实施例还提供了一种银寿客户转化的预测装置,该银寿客户转化的预测装置主要用于执行本发明实施例一中所提供的银寿客户转化的预测方法,以下对本发明实施例提供的银寿客户转化的预测装置做具体介绍。
[0056]
图6是根据本发明实施例的一种银寿客户转化的预测装置的示意图,如图6所示,该装置主要包括:获取和确定单元10、亲密度评估单元20、确定单元30和银寿客户转化预测单元40,其中:获取和确定单元,用于获取历史时间范围内的客户业务数据,并根据客户业务数据确定各客户的各种特征的初始值,其中,各种特征为亲密度评估树状图中的指标层的特征,亲密度评估树状图自上而下包括:标签层、准则层、子准则层和指标层;亲密度评估单元,用于基于亲密度评估树状图和各客户的各种特征的初始值进行亲密度评估,得到各客户与当前银行的亲密度和各客户的亲密度相关因子,其中,亲密度相关因子为亲密度评估树状图中标签层、准则层、子准则层和指标层中所包含的各特征的得分;确定单元,用于根据客户业务数据确定各客户的基本属性和各客户的客户代理人的相关属性;银寿客户转化预测单元,用于将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型,得到各客户的转化概率,其中,银寿客户转化预测模型为lightgbm模型。
[0057]
本发明的银寿客户转化的预测装置,基于客户业务数据得到了非线性的各客户与当前银行的亲密度和各客户的亲密度相关因子的参量,进而,再将各客户与当前银行的亲密度、各客户的亲密度相关因子、各客户的基本属性和各客户的客户代理人的相关属性输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测,由于各客户与当前银行的亲密度、各客户的亲密度相关因子属于非线性的、层次化的特征,能够更好的刻画客户的画像,这样将这些非线性的、层次化的特征输入至训练好的银寿客户转化预测模型进行银寿客户转化的预测时,预测得到的结果的准确性好,另外,该银寿客户转化预测模型为lightgbm模型,具备可解释性和高效预测的特点,适用于大数据、多特征的业务场景,因此,进一步确保了预测的结果的准确性,缓解了现有的银寿客户转化的预测方法准确性差的技术问题。
[0058]
可选地,亲密度评估单元还用于:获取指标层的各种特征对应的第一特征值区间和各第一特征值区间所对应的权重;确定子准则层的第一目标特征的下游的同一客户的各种特征的初始值所属的目标第一特征值区间,并确定目标第一特征值区间对应的权重,其中,第一目标特征为子准则层的特征中的任一特征;将子准则层的第一目标特征的下游的同一客户的各种特征的初始值与初始值所属的目标第一特征值区间对应的权重进行加权计算,得到各客户的第一目标特征的得分;获取子准则层的各种第一目标特征对应的第二特征值区间和各第二特征值区间所对应的权重;确定准则层的第二目标特征的下游的同一客户的各种第一目标特征的得分所属的目标第二特征值区间,并确定目标第二特征值区间对应的权重,其中,第二目标特征为准则层的特征中的任一特征;将准则层的第二目标特征
的下游的同一客户的各种第一目标特征的得分与得分所属的目标第二特征值区间对应的权重进行加权计算,得到各客户的第二目标特征的得分;获取准则层的各种第二目标特征对应的第三特征值区间和各第三特征值区间所对应的权重;确定标签层的亲密度的特征的下游的同一客户的各种第二目标特征的得分所属的目标第三特征值区间,并确定目标第三特征值区间对应的权重;将标签层的亲密度的特征的下游的同一客户的各种第二目标特征的得分与得分所属的目标第三特征值区间对应的权重进行加权计算,得到各客户的亲密度的特征的得分;获取标签层的亲密度的特征对应的第四特征值区间和各第四特征值区间所对应的权重;确定各客户的亲密度的特征的得分所属的目标第四特征值区间,并确定目标第四特征值区间对应的权重;将各客户的亲密度的特征的得分与得分所属的目标第四特征值区间对应的权重进行加权计算,根据加权计算的结果得到各客户与当前银行的亲密度,其中,指标层的各种特征对应的第一特征值区间、各第一特征值区间所对应的权重、子准则层的各种第一目标特征对应的第二特征值区间、各第二特征值区间所对应的权重、准则层的各种第二目标特征对应的第三特征值区间、各第三特征值区间所对应的权重、标签层的亲密度的特征对应的第四特征值区间和各第四特征值区间所对应的权重为根据训练数据进行训练得到的。
[0059]
可选地,该装置还用于:获取训练数据,其中,训练数据为目标历史时间范围内的历史客户业务数据,目标历史时间范围与历史时间范围间隔预设时长;根据历史客户业务数据确定各历史客户的各种特征的初始值,其中,各种特征为亲密度评估树状图中的指标层的特征;对各历史客户按照同一特征的初始值进行排序,并对排序后的各历史客户进行聚类;根据聚类得到的簇确定当前特征对应的第一特征值区间,并确定各第一特征值区间所对应的权重;确定子准则层的第一目标特征的下游的同一历史客户的各种特征的初始值所属的目标第一特征值区间,并确定目标第一特征值区间对应的权重,其中,第一目标特征为子准则层的特征中的任一特征;将子准则层的第一目标特征的下游的同一历史客户的各种特征的初始值与初始值所属的目标第一特征值区间对应的权重进行加权计算,得到各历史客户的第一目标特征的得分;对各历史客户按照同一第一目标特征的得分进行排序,并对排序后的各历史客户进行聚类;根据聚类得到的簇确定当前第一目标特征对应的第二特征值区间,并确定各第二特征值区间所对应的权重;确定准则层的第二目标特征的下游的同一历史客户的各种第一目标特征的得分所属的目标第二特征值区间,并确定目标第二特征值区间对应的权重,其中,第二目标特征为准则层的特征中的任一特征;将准则层的第二目标特征的下游的同一历史客户的各种第一目标特征的得分与得分所属的目标第二特征值区间对应的权重进行加权计算,得到各历史客户的第二目标特征的得分;对各历史客户按照同一第二目标特征的得分进行排序,并对排序后的各历史客户进行聚类;根据聚类得到的簇确定当前第二目标特征对应的第三特征值区间,并确定各第三特征值区间所对应的权重;确定标签层的亲密度的特征的下游的同一历史客户的各种第二目标特征的得分所属的目标第三特征值区间,并确定目标第三特征值区间对应的权重;将标签层的亲密度的特征的下游的同一历史客户的各种第二目标特征的得分与得分所属的目标第三特征值区间对应的权重进行加权计算,得到各历史客户的亲密度的特征的得分;对各历史客户按照亲密度的特征的得分进行排序,并对排序后的各历史客户进行聚类;根据聚类得到的簇确定亲密度的特征对应的第四特征值区间,并确定各第四特征值区间所对应的权重。
[0060]
可选地,该装置还用于:确定各历史客户的亲密度的特征的得分所属的目标第四特征值区间,并确定目标第四特征值区间对应的权重;将各历史客户的亲密度的特征的得分与得分所属的目标第四特征值区间对应的权重进行加权计算,根据加权计算的结果得到各历史客户与当前银行的亲密度;将各历史客户的各种特征的初始值、各历史客户的第一目标特征的得分、各历史客户的第二目标特征的得分和各历史客户的亲密度的特征的得分作为各历史客户的亲密度相关因子;根据历史客户业务数据确定各历史客户的基本属性和各历史客户的客户代理人的相关属性;通过各历史客户与当前银行的亲密度、各历史客户的亲密度相关因子、各历史客户的基本属性、各历史客户的客户代理人的相关属性和各历史客户是否转化的标签对初始银寿客户转化预测模型进行训练,得到银寿客户转化预测模型。
[0061]
可选地,亲密度评估树状图为预先对亲密度和客户业务数据进行分析构建得到的。
[0062]
可选地,各客户的转化概率包括:寿险非银行一类户客户转化为当前银行一类户客户的概率。
[0063]
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
[0064]
如图7所示,本技术实施例提供的一种电子设备600,包括:处理器601、存储器602和总线,所述存储器602存储有所述处理器601可执行的机器可读指令,当电子设备运行时,所述处理器601与所述存储器602之间通过总线通信,所述处理器601执行所述机器可读指令,以执行如上述银寿客户转化的预测方法的步骤。
[0065]
具体地,上述存储器602和处理器601能够为通用的存储器和处理器,这里不做具体限定,当处理器601运行存储器602存储的计算机程序时,能够执行上述银寿客户转化的预测方法。
[0066]
处理器601可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processing,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现成可编程门阵列(field-programmable gate array,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器602,处理器601读取存储器602中的信息,结合其硬件完成上述方法的步骤。
[0067]
对应于上述银寿客户转化的预测方法,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述银寿客户转化的预测
方法的步骤。
[0068]
本技术实施例所提供的银寿客户转化的预测装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本技术实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
[0069]
在本技术所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0070]
再例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0071]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0072]
另外,在本技术提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0073]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述车辆标记方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0074]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0075]
最后应说明的是:以上所述实施例,仅为本技术的具体实施方式,用以说明本技术的技术方案,而非对其限制,本技术的保护范围并不局限于此,尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本技术实施例技术方案的范围。都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1