一种电力识别模型的构建方法及系统与流程

文档序号:11217252阅读:460来源:国知局
一种电力识别模型的构建方法及系统与流程

本发明属于电力数据的分析处理技术领域,尤其涉及一种电力识别模型的构建方法及系统。



背景技术:

随着生活方式和行为习惯的变化,人们对供电服务的要求越来越倾向于便捷专业、智能互动、量身定制等方面,这对供电服务的客户需求感知能力、及时响应能力以及服务提供能力提出了更高的要求。为了提升供电服务的以上各方面能力,进而降低用电客户的投诉几率、提高用电客户的满意度,识别出电力行业中潜在的具有投诉倾向的客户、对客户诉求提前预知变得十分必要。

目前,电力行业对于潜在投诉倾向客户的识别多为基于业务经验进行的群体识别,该识别方式通过主观判断来认知客户,对业务数据的应用率低,过于依赖分析者的主观情绪感受,易受分析者的个人分析倾向左右,不够客观;且该识别方式直观性差、精准度低、用时长,无法应对不断发展延伸的电力业务如95598业务带来的人工话务强度增大、精准服务能力低下、对客户认知有待提升等情况。



技术实现要素:

有鉴于此,本发明的目的在于提供一种电力识别模型的构建方法及系统,旨在克服现有的潜在投诉倾向客户识别方式存在的上述问题,使得基于构建的模型能够更为直观、准确、快速地识别出电力行业中的潜在投诉倾向客户。

为此,本发明公开如下技术方案:

一种电力识别模型的构建方法,包括:

获得构建电力识别模型所需基于的历史业务数据,所述历史业务数据包括多个电力客户所对应的各个电力业务指标的指标数据;

基于所述历史业务数据确定各个预定的电力客户类型所对应的客户特征;其中,所述电力客户类型至少包括潜在投诉倾向客户类型;

确定构建所述电力识别模型所需的各个模型因子,所述模型因子基于各个电力业务指标确定;

结合各个模型因子所对应的电力业务指标的历史业务数据,分析各个模型因子对于识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,得到包括各个模型因子及模型因子权重的电力识别模型,以使得后续基于所述电力识别模型来识别电力客户的类型;其中,所述识别结果包括识别出具有相应客户特征的相应电力客户类型。

上述方法,优选的,模型因子对识别结果的影响包括模型因子对识别结果的重要性及所提供的信息量大小;则所述结合各个模型因子所对应的电力业务指标的历史业务数据,分析各个模型因子对于识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,包括:

获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选;其中,模型因子的熵权值越大,表示模型因子对于识别结果所提供的信息量越大;

利用主成分分析法,获得筛选后所剩余的各模型因子的因子载荷,并基于所述各模型因子的因子载荷,再次进行模型因子筛选,其中,模型因子的因子载荷的绝对值越大,模型因子对识别结果的重要性越高;

利用主成分分析法,提取二次筛选后所剩余的各模型因子所对应的主成分因子,实现模型维度降低,并基于主成分因子载荷权重还原,得到各主成分因子所对应的原始的模型因子的指标权重;

结合各模型因子的指标权重及熵权值,确定各模型因子的综合权重。

上述方法,优选的,所述获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选,包括:

对各模型因子对应的指标进行归一化处理;

对归一化处理的指标结果进行极端值平移及再归一化处理;

基于极端值平移及再归一化处理的指标结果,计算各模型因子的熵权值;

利用配合熵权法的相关分析对模型因子的信息量及冗余与否进行判断,并基于判断结果进行模型因子筛选。

上述方法,优选的,在所述获得构建所述电力识别模型所需基于的历史业务数据之后,还包括:

对所述历史业务数据进行冗余信息剔除。

上述方法,优选的,还包括:

利用所述电力识别模型识别电力客户的类型;

其中,所述利用所述电力识别模型识别电力客户的类型,包括:

基于所述电力识别模型中各模型因子的综合权重,对电力客户对应于各模型因子的指标实际值进行加权合成,得到电力客户的评分;

基于电力客户的评分,识别电力客户的类型;所述电力客户的类型包括高投诉倾向类型、中投诉倾向类型、低投诉倾向类型及无投诉倾向类型。

一种电力识别模型的构建系统,包括:

获取单元,用于获得构建电力识别模型所需基于的历史业务数据,所述历史业务数据包括多个电力客户所对应的各个电力业务指标的指标数据;

第一确定单元,用于基于所述历史业务数据确定各个预定的电力客户类型所对应的客户特征;其中,所述电力客户类型至少包括潜在投诉倾向客户类型;

第二确定单元,用于确定构成所述电力识别模型的各个模型因子,所述模型因子基于各个电力业务指标确定;

模型构建单元,用于结合各个模型因子所对应的电力业务指标的历史业务数据,分析各个模型因子对于识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,得到包括各个模型因子及模型因子权重的电力识别模型,以使得能够基于所述电力识别模型来识别电力客户的类型;其中,所述识别结果包括识别出具有相应客户特征的相应电力客户类型。

上述系统,优选的,所述模型因子对识别结果的影响包括模型因子对识别结果的重要性及所提供的信息量大小;则所述模型构建单元,进一步用于:

获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选;其中,模型因子的熵权值越大,表示模型因子对于识别结果所提供的信息量越大;利用主成分分析法,获得筛选后所剩余的各模型因子的因子载荷,并基于所述各模型因子的因子载荷,再次进行模型因子筛选,其中,模型因子的因子载荷的绝对值越大,模型因子对识别结果的重要性越高;利用主成分分析法,提取二次筛选后所剩余的各模型因子所对应的主成分因子,实现模型维度降低,并基于主成分因子载荷权重还原,得到各主成分因子所对应的原始的模型因子的指标权重;结合各模型因子的指标权重及熵权值,确定各模型因子的综合权重。

上述系统,优选的,所述模型构建单元,获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选,进一步包括:

对各模型因子对应的指标进行归一化处理;对归一化处理的指标结果进行极端值平移及再归一化处理;基于极端值平移及再归一化处理的指标结果,计算各模型因子的熵权值;利用配合熵权法的相关分析对模型因子的信息量及冗余与否进行判断,并基于判断结果进行模型因子筛选。

上述系统,优选的,还包括:

冗余信息剔除单元,用于对所述历史业务数据进行冗余信息剔除。

上述系统,优选的,还包括:

识别单元,用于利用所述电力识别模型识别电力客户的类型;

其中,所述识别单元利用所述电力识别模型识别电力客户的类型,进一步包括:基于所述电力识别模型中各模型因子的综合权重,对电力客户对应于各模型因子的指标实际值进行加权合成,得到电力客户的评分;基于电力客户的评分,识别电力客户的类型;所述电力客户的类型包括高投诉倾向类型、中投诉倾向类型、低投诉倾向类型及无投诉倾向类型。

由以上方案可知,本申请提供的电力识别模型的构建方法及系统,在基于电力历史业务数据确定出各个预定的电力客户类型(至少包括潜在投诉倾向客户类型)所对应的客户特征,以及确定出构建电力识别模型所需的各个模型因子的基础上,通过分析各模型因子对客户类型识别结果的影响作用,并基于影响作用分析结果,获得各模型因子的综合权重,最终得到包括各个模型因子及模型因子权重的电力识别模型,后续可利用该模型识别电力客户的类型,进而识别出电力行业中的潜在投诉倾向客户。可见,应用本申请方案,可实现利用构建的电力识别模型来更为直观、准确、快速地识别电力行业中的潜在投诉倾向客户,从而可有效解决通过主观判断来认知客户的方式存在的各种问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1是本发明实施例一提供的电力识别模型的构建方法流程图;

图2是本发明实施例二提供的获得各个模型因子的综合权重的流程图;

图3是本发明实施例二提供的模型因子相关矩阵示意图;

图4是本发明实施例三提供的电力识别模型的构建方法流程图;

图5是本发明实施例四提供的电力识别模型的构建方法流程图;

图6-图8是本发明实施例五提供的电力识别模型的构建系统的结构示意图。

具体实施方式

为了引用和清楚起见,下文中使用的技术名词、简写或缩写总结解释如下:

熵权法(entropy):信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用理当越大,权重就应该越高。

主成分分析法(principalcomponentanalysis,pca):主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。这种方法在引进多方面变量的同时将复杂因素归结为几个主成分,使问题简单化,同时得到的结果更加科学有效的数据信息。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。基于主成分分析的指标筛选原理:1)因子载荷的原理,通过对剩余多个指标进行主成分分析,得到每个指标的因子载荷。因子载荷的绝对值小于等于1,而绝对值越是趋向于1,指标对评价结果越重要;2)基于主成分分析的指标筛选原理,因子载荷反映指标对评价结果的影响程度,因子载荷绝对值越大表示指标对评价结果越重要,越应该保留;反之,越应该删除。通过对相关性分析筛选后的指标进行主成分分析,得到每个指标的因子载荷,从而删除因子载荷小的指标,保证筛选出重要的指标。

因子载荷:因子载荷a(ij)的统计意义就是第i个变量与第j个公共因子的相关系数即表示x(i)依赖f(j)的份量(比重)。统计学术语称作权,心理学家将它叫做载荷,即表示第i个变量在第j个公共因子上的负荷,它反映了第i个变量在第j个公共因子上的相对重要性。

相关分析(correlationanalysis):相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。基于相关性分析的指标筛选原理:两个指标之间的相关系数,反映了两个指标之间的相关性。相关系数越大,两个指标反映的信息相关性就越高。而为了使评价指标体系简洁有效,就需要避免指标反映信息重复。通过计算同一准则层中各个评价指标之间的相关系数,删除相关系数较大的指标,避免了评价指标所反映的信息重复。通过相关性分析,简化了指标体系,保证了指标体系的简洁有效。

信息冗余:在信息论中,信息冗余是传输消息所用数据位的数目与消息中所包含的实际信息的数据位的数目的差值。数据压缩是一种用来消除不需要的冗余的方法,校验和是在经过有限信道容量的噪声信道中通信,为了进行错误校正而增加冗余的方法。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

本发明实施例一提供一种电力识别模型的构建方法,以使得基于构建的模型能够更为直观、准确、快速地识别出电力行业中的潜在投诉倾向客户,参考图1示出的电力识别模型的构建方法流程图,该方法可以包括以下步骤:

步骤101、获得构建电力识别模型所需基于的历史业务数据,所述历史业务数据包括多个电力客户所对应的各个电力业务指标的指标数据。

所述历史业务数据包括电力行业中多个电力客户所对应的各个电力业务指标的指标数据,其中,具体可以包括多个电力客户所对应的历史业务办理及客户呼叫等方面的指标数据。

具体地,本实施例利用电力行业中某企业自2012年至2016年积累的1亿余条95598通话明细记录、9690余万条工单受理数据、2亿余条工单处理流转数据,以及催办督办数据、投诉处理数据、通讯记录数据、ivr(interactivevoiceresponse,互动式语音应答)动作数据等,作为构建电力识别模型所需的基础数据,从而为电力识别模型的构建提供了数据支持。

步骤102、基于所述历史业务数据确定各个预定的电力客户类型所对应的客户特征;其中,所述电力客户类型至少包括潜在投诉倾向客户类型。

本申请的目的旨在实现基于构建的模型能够更为直观、准确、快速地识别出电力行业中的潜在投诉倾向客户,基于此,所述电力客户类型应至少包括潜在投诉倾向客户类型,更具体地,所述客户类型可以包括高投诉倾向、中投诉倾向、低投诉倾向及无投诉倾向等类型。相对应的,所述电力客户类型所对应的客户特征应至少包括潜在投诉倾向客户类型的客户特征,如包括高投诉倾向、中投诉倾向、低投诉倾向及无投诉倾向等类型客户的客户特征等。

本实施例具体结合客户投诉、催办、督办的工单特点、客户呼叫行为特点、工单关键字等信息,分析容易多次拨打、重复拨打,更甚者升级为投诉或者催办业务的客户特征,在此基础上得到各个程度的投诉倾向客户的客户特征。

步骤103、确定构建所述电力识别模型所需的各个模型因子,所述模型因子基于各个电力业务指标确定。

本实施例将海量的电力行业历史业务数据(历史业务办理及客户呼叫等方面的指标数据)进行多维度综合关联,结合业务经验构建丰富的模型因子,其中,可通过工单编号关联工单受理、工单处理数据、催办督办数据,并获取用户来电号码、业务类型、业务受理内容等信息;通过工单id(identity,身份标识号码)主键关联通讯记录数据、ivr动作数据;通过通话主键(callid)关联通话明细表及通信明细表,通过来电号码关联客户拨打时间、拨打ivr入口、服务申请起始及终止时间等信息,最终形成多维度立体分析体系,为模型构建提供了丰富的指标及因子维度。

具体地,本实施例根据行业分析,构建了包含143项模型因子的多因子分析体系,后经过配合熵权法的相关分析法,对模型因子进行修剪,最终得到了包含92项模型因子的因子体系。该因子体系中包含的构建电力识别模型所需基于的92项模型因子具体参考以下的表1所示:

表1

步骤104、结合各个模型因子所对应的电力业务指标的历史业务数据,分析各个模型因子对于识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,得到包括各个模型因子及模型因子权重的电力识别模型,以使得后续基于所述电力识别模型来识别电力客户的类型;其中,所述识别结果包括识别出具有相应客户特征的相应电力客户类型。

其中,模型因子对识别结果的影响包括模型因子对识别结果的重要性及所提供的信息量大小。

本实施例结合各个模型因子所对应的电力业务指标的历史业务数据,应用熵权法配合相关分析,以及使用主成分分析,获得各个模型因子对于客户类型识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,最终得到包含各模型因子及各模型因子权重的电力识别模型,从而为后续进行电力客户类型识别,进而识别出电力行业中的潜在投诉倾向客户提供了模型支持。该部分内容将在接下来的实施例中进行详细阐述。

由以上方案可知,本申请提供的电力识别模型的构建方法,在基于电力历史业务数据确定出各个预定的电力客户类型(至少包括潜在投诉倾向客户类型)所对应的客户特征,以及确定出构建电力识别模型所需的各个模型因子的基础上,通过分析各模型因子对客户类型识别结果的影响作用,并基于影响作用分析结果,获得各模型因子的综合权重,最终得到包括各个模型因子及模型因子权重的电力识别模型,后续可利用该模型识别电力客户的类型,进而识别出电力行业中的潜在投诉倾向客户。可见,应用本申请方案,可实现利用构建的电力识别模型来更为直观、准确、快速地识别电力行业中的潜在投诉倾向客户,从而可有效解决通过主观判断来认知客户的方式存在的各种问题。

实施例二

本实施例中,参考图2,所述步骤104中结合各个模型因子所对应的电力业务指标的历史业务数据,分析各个模型因子对于识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,可以通过以下的处理过程实现:

步骤201、获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选;其中,模型因子的熵权值越大,表示模型因子对于识别结果所提供的信息量越大。

其中,本步骤201首先对各模型因子对应的指标进行归一化处理,并具体将各模型因子对应的指标归一化处理为正向指标或负向指标。

所述正向指标表示指标值越大对于评价越好,归一化计算公式如下:

相对应地,负向指标表示指标值越小对于评价越好,归一化计算公式如下:

以上式(1)、式(2)中,aij为因子矩阵中i行j列因子值,min(aij)为因子最小值,max(aij)为因子最大值,rij为因子矩阵中i行j列因子归一化后的因子值。

之后,对归一化处理的指标结果进行极端值平移及再归一化处理。

其中,具体采用以下式(3)的平移公式实现极端值平移:

rij'=c+rij*d(3)

该式中,c、d为平移的参数,且其中,为因子均值,rij'为极端值平移后的因子值。

采用以下的式(4)进行数据再归一化:

其中,rij”表示再归一化后的因子值。

在上述数据再归一化处理的基础上,本步骤继续进行模型因子的熵值计算以及熵值计算基础上的熵权值计算。

具体而言,采用以下式(5)计算模型因子的熵值:

hi=-k∑rij”inrij”(5)

其中,k为常数,k=1/ln(m),m为样本量,保证hi取值在0-1之间。

并进一步依据计算出的熵值hi,采用以下式(6)的权重计算公式,计算模型因子的熵权值:

在以上处理的基础上,本步骤利用配合熵权法的相关分析进行模型因子筛选。

其中,通过对因子体系中的模型因子进行相关分析,获得143*143的因子相关分析矩阵(因子矩阵),基于变量与变量间的相关显著程度、相关系数大小,参照大小,对变量的信息量及冗余与否进行判断,从而对多维度因子体系进行修剪,在保留主要信息量的前提下(量化为涵盖97.5%的信息量标准)修剪尽可能多的因子,因子相关矩阵具体可参考图3所示。

步骤202、利用主成分分析法,获得筛选后所剩余的各模型因子的因子载荷,并基于所述各模型因子的因子载荷,再次进行模型因子筛选,其中,模型因子的因子载荷的绝对值越大,模型因子对识别结果的重要性越高。

本步骤通过对剩余的各个模型因子进行主成分分析,得到每个模型因子的因子载荷。因子载荷的绝对值小于等于1,而绝对值越是趋向于1,即因子载荷的绝对值越大,模型因子对识别结果越重要。

由于因子载荷反映模型因子对识别结果的影响程度,因子载荷绝对值越大表示模型因子对识别结果越重要,越应该保留;反之,越应该删除。基于此,本步骤通过对相关性分析筛选后剩余的模型因子进行主成分分析,得到每个模型的因子载荷,进而删除因子载荷小的模型因子,实现模型因子的二次筛选,保证通过筛选得到重要的因子。

步骤203、利用主成分分析法,提取二次筛选后所剩余的各模型因子所对应的主成分因子,实现模型维度降低,并基于主成分因子载荷权重还原,得到各主成分因子所对应的原始模型因子的指标权重。

在以上步骤的基础上,本步骤使用主成分分析法,先基于协方差矩阵构建线性无关特征向量,提取模型因子的主成分因子,实现模型维度降低,模型精度提升,通过主成分分析降维使得模型最终实现构建4个主成分提取全部因子97.5%以上信息。

之后,本步骤继续通过主成分因子载荷权重还原,得到各主成分因子所对应的原始模型因子的指标权重。其中,具体基于获得的主成分的权重,使用r工具,通过特征向量和特征值进行矩阵运算,还原各主成分因子所对应的原始模型因子的指标权重。

步骤204、结合各模型因子的指标权重及熵权值,确定各模型因子的综合权重。

最终,结合各模型因子的熵权值及指标权重,合成模型因子的综合权重,从而得到包含有多个模型因子及各模型因子所对应的综合权重的电力识别模型。该电力识别模型的构建基于丰富的指标及因子维度体系,且通过考虑各模型因子对于电力客户类型识别结果的重要性及信息量大小,来确定各模型因子的综合权重,从而利用该模型能够有效识别电力行业中电力客户的类型,能够识别出电力行业中的潜在投诉倾向客户,且模型的识别精度较高。

实施例三

本实施例三中,参考图4示出的电力识别模型的构建方法流程图,所述电力识别模型的构建方法还可以包括以下步骤:

步骤105、利用所述电力识别模型识别电力客户的类型。

其中,在存在识别出电力行业中的潜在投诉倾向客户的需求时,可利用本申请构建的电力识别模型对电力行业客户的客户类型进行识别,进而基于客户类型识别出电力行业中的潜在投诉倾向客户。

具体而言,在利用上述电力识别模型识别电力客户的类型时,可使用该模型中各模型因子的综合权重,对电力客户对应于各模型因子的指标实际值进行加权合成(加权求和),并将加权合成所得的加权和值作为对电力客户的评分,在此基础上,可依据电力客户对应的评分分值,识别电力客户的类型。示例性地,在对电力客户进行评分的基础上,可对各电力客户按评分分值降序排列,并可根据业务规则确定得分大于零的目标客户中,得分排序在前14%的客户为高投诉倾向客户,得分排序在前14%-42%的客户为中投诉倾向客户,得分42%-70%标记低投诉倾向客户,其他客户为无投诉倾向客户,从而实现了对电力行业中的潜在投诉倾向客户进行识别。

在识别客户类型的同时,还可为各类型客户标记相应标签,例如分别对高投诉倾向客户、中投诉倾向客户、低投诉倾向客户及无投诉倾向客户,相应地标记高倾向、中倾向、低倾向及无倾向的四种不同程度潜在投诉倾向标签等,以帮助客服人员快速、精准地识别具有潜在投诉倾向的客户,并将相关名单提交给省(市)公司,帮助省(市)公司对不同投诉倾向客户制定不同的服务策略,从而实现优化潜在投诉倾向客户供电服务,进而提升客户服务满意度,降低客户投诉率的目的。

实施例四

本实施例三中,参考图5示出的电力识别模型的构建方法流程图,所述方法还可以包括以下步骤:

步骤101’、对所述历史业务数据进行冗余信息剔除。

在获得构建所述电力识别模型所需基于的历史业务数据后,可对所获得的历史业务数据进行冗余信息剔除处理,以精减掉其中的冗余信息。

具体地,可首先根据关键字、数据缺失情况、数据异常情况等对数据进行初步冗余剔除,之后再通过相关分析,对指标与投诉现象产生的相关显著性、相关系数情况进行进一步探索,完成冗余信息的二次剔除。

其中,关键字筛选主要基于源自于日常业务办理及工单信息中归纳总结的具有强电力行业背景的关键词词库,通过基于关键字的冗余处理可有效实现非目标信息的剔除。

本实施例通过对获得的历史业务数据进冗余信息剔除处理,可有效精减历史业务数据的数据量并提升构建模型所基于的业务数据的可用性。

实施例五

本实施例五提供一种电力识别模型的构建系统,参考图6示出的电力识别模型的构建系统的结构示意图,该系统可以包括:

获取单元601,用于获得构建所述电力识别模型所需的历史业务数据,所述历史业务数据包括多个电力客户所对应的各个电力业务指标的指标数据;第一确定单元602,用于基于所述历史业务数据确定各个预定的电力客户类型所对应的客户特征;其中,所述电力客户类型至少包括潜在投诉倾向客户类型;第二确定单元603,用于确定构成所述电力识别模型的各个模型因子,所述模型因子基于各个电力业务指标确定;模型构建单元604,用于结合各个模型因子所对应的电力业务指标的历史业务数据,分析各个模型因子对于识别结果的影响作用,并基于各个模型因子对于识别结果的影响作用,获得各个模型因子的综合权重,得到包括各个模型因子及模型因子权重的电力识别模型,以使得能够基于所述电力识别模型来识别电力客户的类型;其中,所述识别结果包括识别出具有相应客户特征的相应电力客户类型。

在本发明实施例的一实施方式中,所述所述模型构建单元,进一步用于:

获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选;其中,模型因子的熵权值越大,表示模型因子对于识别结果所提供的信息量越大;利用主成分分析法,获得筛选后所剩余的各模型因子的因子载荷,并基于所述各模型因子的因子载荷,再次进行模型因子筛选,其中,模型因子的因子载荷的绝对值越大,模型因子对识别结果的重要性越高;利用主成分分析法,提取二次筛选后所剩余的各模型因子所对应的主成分因子,实现模型维度降低,并基于主成分因子载荷权重还原,得到各主成分因子所对应的原始模型因子的指标权重;结合各模型因子的指标权重及熵权值,确定各模型因子的综合权重。

在本发明实施例的一实施方式中,所述模型构建单元,获得各模型因子的熵权值,并利用配合熵权法的相关分析进行模型因子筛选,进一步包括:

对各模型因子对应的指标进行归一化处理;对归一化处理的指标结果进行极端值平移及再归一化处理;基于极端值平移及再归一化处理的指标结果,计算各模型因子的熵权值;利用配合熵权法的相关分析对模型因子的信息量及冗余与否进行判断,并基于判断结果进行模型因子筛选。

在本发明实施例的一实施方式中,如图7所示,所述系统还包括:

冗余信息剔除单元601’,用于对所述历史业务数据进行冗余信息剔除。

在本发明实施例的一实施方式中,如图8所示,所述系统还包括:

识别单元605,用于利用所述电力识别模型识别电力客户的类型;

其中,所述识别单元利用所述电力识别模型识别电力客户的类型,进一步包括:基于所述电力识别模型中各模型因子的综合权重,对电力客户对应于各模型因子的指标实际值进行加权合成,得到电力客户的评分;基于电力客户的评分,识别电力客户的类型;所述电力客户的类型包括高投诉倾向类型、中投诉倾向类型及低投诉倾向类型。

此处,需要说明的是,本实施例涉及的电力识别模型的构建系统的描述,与上文方法的描述是类似的,且同方法的有益效果描述,对于本发明的电力识别模型的构建系统在本实施例中未披露的技术细节,请参照本发明方法实施例的说明,本实施对此不再作赘述。

综上所述,本发明方案具有以下优势:

本发明将相关分析、熵权法、主成分分析相结合,逐步实现冗余指标的剔除和高信息量指标的提取,集合了三种算法的优势,更实现了建模因子权重的还原,构建的评分具有业务判别依据,便于追溯潜在投诉倾向客户特征,模型分析精度更高,分析更加准确。根据评分为客户标记无倾向、高倾向、中倾向、低倾向四种不同程度潜在投诉倾向标签,可帮助客服人员快速、精准识别具有有潜在投诉倾向的客户,并将相关名单提交给省(市)公司,帮助省(市)公司对不同投诉倾向客户制定不同服务策略,从而可实现优化潜在投诉倾向客户供电服务,进而提升客户服务满意度,降低客户投诉率。

还需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1