一种电力客户价值评估模型的构建方法与流程

文档序号:12825755阅读:130来源:国知局
一种电力客户价值评估模型的构建方法与流程
本发明涉及电力系统
技术领域
,特别是指一种电力客户价值评估模型的构建方法。
背景技术
:近年来,电力客户价值评价是供电企业实施差异化服务、实现利益最大化的基础。随着基于大数据挖掘的技术与行业经验逐步地被供电企业吸收利用,供电企业纷纷对现有的营销系统进行深度应用,以系统庞大的客户行为数据为基础,通过数据挖掘方法等方式对客户进行价值评估,所述数据挖掘方法包括神经网络、支持向量机、层次聚类、主成分分析法等。数据挖掘的方法在给客户价值分类时准确度较高,但是不能精准的区分客户等级划分的差异性。技术实现要素:本发明要解决的技术问题是提供一种电力客户价值评估模型的构建方法,以解决现有技术所存在的不能精准的区分客户等级划分的差异性的问题。为解决上述技术问题,本发明实施例提供一种电力客户价值评估模型的构建方法,包括:确定评价客户当前价值和客户潜在价值的指标体系;根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。进一步地,所述评价客户当前价值和潜在价值的指标体系包括:评价客户当前价值的指标体系和评价客户潜在价值的指标体系;其中,所述评价客户当前价值的指标体系包括:电压等级、当前未拆除变压器容量、高耗能标识、电源数量、最近一年年度电费、当前负荷等级、本年有电费去年无电费中的一种或多种指标;所述评价客户潜在价值的指标体系包括:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费中的一种或多种指标。进一步地,所述电费趋势表示为:进一步地,在构建用户当前价值决策树预测模型之前,所述方法还包括:对得到的用于构建用户当前价值决策树预测模型的样本集进行预处理,其中,所述预处理包括:填补缺漏的数据值、平滑噪声数据、识别或更替异常值。进一步地,所述用于构建用户当前价值决策树预测模型的样本集包括:训练集;所述根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型包括:s11,根据训练集中的数据,计算评价客户当前价值的指标体系中每个指标的gini系数,选择gini系数最小的指标作为决策树的根节点;s12,若分裂指标是离散型数据,则按照连续型指标的分割阈值,将训练集分成两个子集;s13,对决策树的根节点的分裂指标对应的两个子集,采用与s11相同的方法递归地建立根节点的子节点,如此循环下去,直至全部子节点中的样本属于同类或没有可以选作分裂指标的指标为止;s14,对决策树进行减枝操作。进一步地,所述s12还包括:若分裂指标是连续型数据,则按照分割后得到的最小gini系数,将训练集分成两个子集。进一步地,所述对决策树进行减枝操作包括:对于某个连续型指标ac,假设在决策树的某个节点上的训练集s的样本数量为total,对当前节点上的所有样本,由小到大对连续型指标ac的具体数值进行排序,得到指标值序列{a1c,a2c,...atotalc};在指标值序列中生成total-1个分割点,第i(0<i<total)个分割点的取值设置为:vi=(aic+a(i+1)c)/2,利用vi,将当前节点上的训练集划分为s1={s|s∈s,ac(s)≤vi}和s2={s|s∈s,ac(s)≤vi}两个子集,ac(s)为样本s在指标ac上的取值;计算total-1个分割点的gini系数,选择gini系数最小点作为分割点来分割训练集s。进一步地,在根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型之后,所述方法还包括:根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果,基于用户的当前价值等级分类结果,给客户分级别评定客户价值分值;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,基于用户的潜在价值等级分类结果,给客户分级别评定客户价值分值。进一步地,所述给客户分级别评定客户价值分值包括:s21,利用向量规范化法,生成规范化决策矩阵y=(yij)m×n,其中,xij为第i个方案在第j个指标下的指标值,m={1,2,...m}为方案的下标集,n={1,2,...n}为指标的下标集;s22,生成加权规范化决策矩阵z=(zij)m×n,其中,zij=ωjyij,i∈m,j∈n,ωj表示第j个指标的权重;s23,确定正理想解a+和负理想解a-:a+=(z1+,z2+...,zn+);a-=(z1-,z2-...,zn-)其中,zj+=maxzij,j∈t1;zj+=minzij,j∈t2;zj-=maxzij,j∈t1;zj-=minzij,j∈t2;其中,t1表示效益型指标,t2表示成本型指标;s24,评估各方案分别与正负理想解的euclid距离d+和d-:s25,计算各方案与正理想解的相对贴近度:s26,按照ci+的值降序排列。进一步地,在s21之前,所述方法还包括:对评价客户当前价值和客户潜在价值的指标体系中的指标数据进行归一化处理,使所有指标数据统一在一个量级。本发明的上述技术方案的有益效果如下:上述方案中,通过确定评价客户当前价值和客户潜在价值的指标体系;根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。这样,根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,从而提高客户等级划分的差异性。附图说明图1为本发明实施例提供的电力客户价值评估模型的构建方法的流程示意图;图2为本发明实施例提供的用户当前价值决策树预测模型示意图;图3为本发明实施例提供的用户潜在价值决策树预测模型示意图;图4为本发明实施例提供的混合决策树预测模型和topsis算法的客户评分结果示意图;图5为本发明实施例提供的电力客户价值评估模型的构建方法的详细流程示意图。具体实施方式为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本发明针对现有的不能精准的区分客户等级划分的差异性的问题,提供一种电力客户价值评估模型的构建方法。实施例一参看图1所示,本发明实施例提供的电力客户价值评估模型的构建方法,包括:s101,确定评价客户当前价值和客户潜在价值的指标体系;s102,根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;s103,根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;s104,根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。本发明实施例所述的电力客户价值评估模型的构建方法,通过确定评价客户当前价值和客户潜在价值的指标体系;根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。这样,根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,从而提高客户等级划分的差异性。本实施例中,将从客户当前价值和客户潜在价值2方面构建评价客户当前价值和客户潜在价值的指标体系,所述评价客户当前价值和潜在价值的指标体系包括:评价客户当前价值的指标体系和评价客户潜在价值的指标体系。本实施例中,评价客户当前价值时,考虑到客户电压等级和当前未拆除变压器容量都对用电量有线性同比增加的影响,而客户电费对当前价值有直接影响,电量一般与电费成正比,所以只分析电费指标;所述评价客户当前价值的指标体系包括:电压等级、当前未拆除变压器容量、高耗能标识、电源数量、最近一年年度电费、当前负荷等级、本年有电费去年无电费中的一种或多种指标。本实施例中,在评价客户潜在价值时,根据价值划分理论,将可能为供电公司带来潜在可能收入或是可能损失的指标:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费作为客户潜在价值评价的指标;也就说,所述评价客户潜在价值的指标体系包括:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费中的一种或多种指标。本实施例中,所述电费趋势表示为:本实施例中,所述根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据包括:根据不同的指标体系(评价客户当前价值的指标体系和评价客户潜在价值的指标体系)从营销系统中抽取不同的客户数据。本实施例中,为了方法的可实现性,人工标注以数据量多和标注结果简化为特点,以求能快速巨量的获取专家标注结果,用以学习内部规律。因此本实施例在标注时不同于普通人工标注打出高低分的方式,而是基于专家标注的客户价值的优、良、中、差等级代替打高低分的方式,生成用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集。本实施例中,接着对用于构建用户当前价值决策树预测模型的样本集的数据和用于构建用户潜在价值决策树预测模型的样本集中的数据进行预处理,以及解决不一致问题,其中,所述预处理包括:填补缺漏的数据值、平滑噪声数据、识别或更替异常值;具体的,将字段空缺、数据错误的指标从指标库中删除;缺漏的数据值、噪声数据、异常值用数据中位数值代替;遇到有些指标时间周期不适用情况,以平均数补足。本实施例中,根据不同的指标体系(评价客户当前价值的指标体系和评价客户潜在价值的指标体系)从营销系统中抽取最近一年的数据(2015年6月到2016年6月),去年的数据(2014年6月到2015年6月),如表1和表2所示。表1客户当前价值各项指标的数据描述表2客户潜在价值各项指标的数据描述本实施例中,从抽取的数据中发现与分析目标无关数据、空数据或na值(因为有的用户没有用电记录却没有注销账户),并将空值整条删除且na值替换成0。本实施例中,将预处理后的两套数据按照价值等级分为4类,分别是优、良、中、差,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集,每套样本集都包括:测试集和训练集。以用于构建用户当前价值决策树预测模型的样本集为例,根据不同的价值等级分类以行向量为单位分层随机抽取3/4的数据作为训练集,剩下1/4数据去除价值等级指标作为测试集。以这种方法,实验得到:当前价值和潜在价值都有1575条数据的训练集和525条数据的测试集,并且两种价值模型的训练集与测试集各不相同。本实施例中,构建用户当前价值决策树预测模型和构建用户潜在价值决策树预测模型的方法类似,因此,以构建用户当前价值决策树预测模型为例进行说明,为了构建用户当前价值决策树预测模型,需计算评价客户当前价值的指标体系中所有指标的基尼(gini)系数,根据指标的连续性和gini系数选取合适的分割阈值,将训练集分成两个子集,对分割后的两个子集继续用上一步的方法取分割阈值划分指标,直到所有的样本都有一个分类结果,所述构建用户当前价值决策树预测模型的具体步骤可以包括:步骤1、根据用于构建用户当前价值决策树预测模型的训练集(在步骤1、2、3、4中,简称训练集)中的数据,对评价客户当前价值的指标体系中的每一个指标,利用分类回归树(classificationandregressiontree,cart)算法计算该指标上不同分割方法的gini系数,选择gini系数最小的指标作为分裂的根节点。然后比较所有候选指标上最小划分的gini系数,拥有最小划分的gini系数的指标成为根节点。gini系数的生成方法:(1)训练集的gini系数为:gini(t)=1-∑pj2,其中,pj是分类j会出现在t中的概率,t是指在这种节点分配下的指标集。(2)若t被划分为t1、t2,那么本次分类的gini系数为:其中s是t样本的数量,|s1|,|s2|分别是t1,t2中样本的个数;步骤2、若分裂指标是离散型数据,如三方协议的签署情况,则按照连续型指标的分割阈值,将训练集分成两个子集;若分裂指标是连续型数据,则按照分割后得到的最小gini系数,将训练集分成两个子集。步骤3、对决策树的根节点的分裂指标对应的两个子集,采用与步骤1相同的方法递归地建立根节点的子节点,如此循环下去,直至全部子节点中的样本属于同类或没有可以选作分裂指标的指标为止;步骤4、对决策树进行减枝操作。对于某个连续型指标ac,假设在某个节点上的样本集s的样本数量为total,cart算法将对该连续型指标作如下处理:(1)对当前节点上的所有样本,由小到大对连续型指标ac的具体数值排序,得到指标值序列{a1c,a2c,...atotalc};(2)在指标值序列中生成total-1个分割点,第i(0<i<total)个分割点的取值设置为:vi=(aic+a(i+1)c)/2,vi可以将节点上的样本集划分为s1={s|s∈s,ac(s)≤vi}和s2={s|s∈s,ac(s)≤vi}两个子集,ac(s)为样本s在指标ac上的取值;(3)计算total-1个分割点的gini系数,依旧选择gini系数最小点作为分割点来来分割训练集s。在前述电力客户价值评估模型的构建方法的具体实施方式中,进一步地,所述对决策树进行减枝操作包括:对于某个连续型指标ac,假设在决策树的某个节点上的训练集s的样本数量为total,对当前节点上的所有样本,由小到大对连续型指标ac的具体数值进行排序,得到指标值序列{a1c,a2c,...atotalc};在指标值序列中生成total-1个分割点,第i(0<i<total)个分割点的取值设置为:vi=(aic+a(i+1)c)/2,利用vi,将当前节点上的训练集划分为s1={s|s∈s,ac(s)≤vi}和s2={s|s∈s,ac(s)≤vi}两个子集,ac(s)为样本s在指标ac上的取值;计算total-1个分割点的gini系数,选择gini系数最小点作为分割点来分割训练集s。本实施例中,构建得到的用户当前价值决策树预测模型和用户潜在价值决策树预测模型分别如图2和图3所示。将相应的测试集数据输入训练好的预测模型中,得到测试集每个客户向量的价值等级分类结果。测试集数据输入用户当前价值决策树预测模型和用户潜在价值决策树预测模型后生成的结果与真实结果对比,得到预测价值等级与实际专家标注价值等级的混淆矩阵,如表3所示,表3的左部分是用户当前价值决策树预测模型性能评价混淆矩阵表,表3的右部分是用户潜在价值决策树预测模型性能评价混淆矩阵表,可以看到各按照当前价值和潜在价值的不同等级抽取的共525个客户的用户当前价值预测正确率为96.00%,潜在价值预测准确率为94.10%,混淆矩阵的结果显示,构建的用户当前价值决策树预测模型和用户潜在价值决策树预测模型,能较为准确的模仿专家思路预测价值等级。表3混淆矩阵表将电力客户数据输入训练好的预测模型中,能够得到这些客户价值等级的预测结果,如表4所示。表4客户价值等级预测结果优优良中差当前价值8680324610031397潜在价值5711306135981956实施例二参看图5所示,本发明实施例提供的电力客户价值评估模型的构建方法,包括:s101,确定评价客户当前价值和客户潜在价值的指标体系;s102,根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;s103,根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;s104,根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型;s105,根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果,基于用户的当前价值等级分类结果,给客户分级别评定客户价值分值;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,基于用户的潜在价值等级分类结果,给客户分级别评定客户价值分值。本实施例中,为了保留用户当前价值决策树预测模型和用户潜在价值决策树预测模型的等级预测结果,将客户按照优、良、中、差四个等级分开评分,这样既保证了等级的有效性,同时完成客户价值的进一步评分。本实施例中,可以采用逼近理想解排序法(topsis)方法给客户分级别评定客户价值分值,topsis借助离正负理想解的距离来对评价的对象进行评价。正理想解是虚拟的最优解,其各个指标均为对象中的最优值;负理想解是虚拟的最差解,其各个指标值都达到对象中的最差值。如果评判对象离最优解最近同时又最远离最差解,则为最好;否则为最差。本实施例中,用户的指标数据有的量级很大不利于折算最终得分,因此在采用topsis方法给客户分级别评定客户价值分值之前,需对指标数据进行归一化,将所有指标数据统一在一个量级。数值型指标可以直接套用归一化公式预处理;离散性指标,例如,三方协议签署,由于只有两个值0、1不需要预处理;字符型指标,例如,当前负荷等级,需转换成对应的数值1、2、3之后进行归一化处理;并利用公式:yi=(xi-xmin)/(xmax-xmin)对专家标注客户等级的标签做归一化处理,免去量级的影响,其中,xi、yi分别表示处理前后的指标项,xmin表示该项指标的最小值,xmax表示该项指标的最大值。本实施例中,topsis打分使用的权重由业务专家给出:例如,电压等级的权重为2;当前未拆除变压器容量的权重为3;电源数量的权重为2;年度电量的权重为8;最近一年年度电费的权重为8;当前负荷等级的权重为2;电费趋势的权重为4;电量趋势的权重为4;最近一年年违约使用电费的权重为-3;去年年度电费的权重为5;三方协议签署的权重为4。topsis可以根据指标的权重,相关性给客户打分,实现客户价值的进一步评估。将没有专家标记的剩余客户数据预处理后,分别输入用户当前价值决策树预测模型和用户潜在价值决策树预测模型,得到客户价值等级的优、良、中、差分类,以客户当前价值为例,对不同等级的客户:设多指标决策问题的方案集为a={a1,a2,...am},指标集为f={f1,f2,...fn},决策矩阵x=(xij)m×n,其中xij为第i个方案在第j个指标下的指标值,i∈m,j∈n,m={1,2,...m}为方案的下标集,n={1,2,...n}为指标的下标集,规定xij≥0,指标的权向量为ω=(ω1,ω2,...ωn),权向量ω中的元素是专家给出的权重经过归一化后得到的,权向量ω满足本实施例中,m等于2,n等于13,分别对应当前价值、潜在价值和13项三级指标。本实施例中,采用topsis方法给客户分级别评定客户价值分值的具体步骤可以包括:步骤一:用向量规范化法,生成规范化决策矩阵y=(yij)m×n,其中,xij为第i个方案在第j个指标下的指标值,m={1,2,...m}为方案的下标集,n={1,2,...n}为指标的下标集;步骤二:生成加权规范化决策矩阵z=(zij)m×n,其中,zij=ωjyij,i∈m,j∈n,ωj表示第j个指标的权重;权重ωj由专家给出;步骤三:确定正理想解a+和负理想解a-:a+=(z1+,z2+...,zn+);a-=(z1-,z2-...,zn-)其中,zj+=maxzij,j∈t1;zj+=minzij,j∈t2;zj-=maxzij,j∈t1;zj-=minzij,j∈t2;其中,t1代表效益型指标,就是指标值越大越好,t2代表成本型指标,就是指标值越小越好;步骤四:评估各方案分别与正负理想解的欧式距离(euclid)d+和d-:步骤五:计算各方案与正理想解的相对贴近度:步骤六:按照ci+的降序排列,ci+越大其对应的方案越优,排序越靠前,由此得出方案的优劣次序。本实施例中,对剩余14327名客户价值的最终评分如图4所示。本发明提出的基于决策树算法和topsis的电力客户价值模型的构建方法,用专家人工打分数据作为学习样本,依据cart构建决策树分类模型,混合topsis方法给客户评定分值,侧重于客户价值的分值细分,进一步提高了客户等级划分的差异性。本实施例为电力行业的电力客户价值评估模型提出了一种新的思路和方法,考虑客户当前价值和客户潜在价值的指标体系,设计决策树和topsis的结合方式得到客户价值评分,决策树算法能从主观评分中提取一般方法,保留了专家赋权重的优越性,topsis既能对各方案进行整体评判,又能反映各方案内部各因素对评价结果的影响,对用户当前价值决策树预测模型和用户潜在价值决策树预测模型预测分类后的客户数据进一步细化评分,克服了数据挖掘在客户价值评价方面不能精准的给客户价值评分并区分客户等级的差异性的问题,是一种合理有效的评价方法。以上所述是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1