一种基于改进特征词权重算法的供电营销服务方法与流程

文档序号:22327167发布日期:2020-09-25 17:57阅读:113来源:国知局
一种基于改进特征词权重算法的供电营销服务方法与流程

本发明涉及供电营销服务领域,特别涉及一种基于改进特征词权重算法的供电营销服务方法。



背景技术:

tf-idf(特征词权重):tf-idf(termfrequency–inversedocumentfrequency)是一种用于信息检索与数据挖掘的常用加权技术。其中tf是词频(termfrequency),idf是逆文本频率指数(inversedocumentfrequency)。tf-idf是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。tf-idf加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了tf-idf以外,因特网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜寻结果中出现的顺序。

多标签分类(ml-knn):邻近算法,或者说k最近邻(knn,k-nearestneighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻近值来代表。

knn算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。knn方法在类别决策时,只与极少量的相邻样本有关。由于knn方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,knn方法较其他方法更为适合。

动态博弈:动态博弈(dynamicgame)是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。这种博弈无论如何都无法看做同时决策,所以叫做动态博弈,也称“多阶段博弈”。

针对传统的供电营销服务方式单一,服务成本高和电力客户体验差的问题,我国的供电企业均采用被动方式进行电力营销服务,服务资源平均分配,既造成了电力客户个性化需求的服务针对性不强,也导致电力营销服务成本开支庞大和电力客户体验效果不佳。传统的被动营销服务已不能满足电力客户日益增长的服务需求,这种被动服务模式既不利于拓展增量配电网市场,也不能有效巩固存量的电力客户。

近几年也有解决上述问题的各种方案被提出和试行,比如:方案(1)一种针对供电企业顾客满意度的营销服务策略,策略基于顾客满意度理论,运用德尔菲法等方法构建了电力客户满意度评价体系,并根据评价的结果,有针对性的提出营销服务策略;方案(2)一种新形势下电力市场营销模式与新型电价体系,针对不断变化的电力市场环境,采用菜单电价和套餐服务引导供电企业的营销服务资源配置优化;方案(3)基于电力市场改革的供电营销服务策略,通过对售电产品策略、价格策略、分销策略、促销策略进行分析,提升用电用户对供电企业的营销服务的满意度;还有其他方案都针对这些问题进行了不同角度的分析并提出了解决方案,而且取得了一定的成果,但这些研究均局限于对客户的量测数据与投诉数据进行分析,所述研究仅考虑电力客户的满意度,缺少对不同类型客户的行为、需求和价值分析,未充分计及供电营销服务策略的改变对供电企业运营方面造成的影响。若要实现对不同类型的电力客户提供差异化服务,则要对电力客户的需求和供电企业运营能力做综合考虑。



技术实现要素:

本发明的目的在于:提供了一种基于改进特征词权重算法的供电营销服务方法,采用特征词权重算法的分类方法,并结合多标签分类算法和动态博弈,能针对不同的电力客户制定不同的供电营销服务,解决了现有的被动服务模式无法满足电力客户日益增长的服务需求的问题。

本发明采用的技术方案如下:

一种基于改进特征词权重算法的供电营销服务方法,包括以下步骤:

电力客户信息数据分类:基于供电企业的电力客户数据和社会机构公布的外部电力客户数据,从电力客户的“行为-需求-价值”维度进行数据分类;

构建电力客户特征标签指标集:使用多标签分类算法构建电力客户特征指标集;

分析电网运营业务影响:从供电企业的成本进行分析,进行动态博弈分析,得到最优的供电营销服务方式;

对tf-idf客户经济贡献画像建模:针对电力客户的经济贡献画像,通过tf-idf算法,对电力客户的经济贡献进行画像建模;

制定供电营销服务套餐:根据电力客户的画像将电力客户分成一定的等级,并且根据不同的等级进行不同内容的服务。

为了更好地实现本方案,进一步地,所述电力客户信息数据分类在电力客户的行为方面包括电力客户在用电过程中的行为和影响电力客户用电行为因素;

所述电力客户信息数据分类在电力客户的需求方面包括电力客户对供电服务的感受、评价和与供电企业的互动;

所述电力客户信息数据分类在电力客户的价值方面包括电力客户对供电企业的电费和或增值服务的价值贡献和电力客户资金支付能力。

为了更好地实现本方案,进一步地,所述构建电力客户特征标签指标集的方法为:获取新增电力客户特征数据的k个近邻索引集合;利用贝叶斯条件概率计算新增电力客户特征数据的标签概率,概率大的近邻索引集合即为新增电力客户特征数据的最终标签,形成完整的电力客户特征标签指标集。

为了更好地实现本方案,进一步地,所述分析电网运营业务影响的方法为:

将供电营销服务内容和供电企业的业务影响共同作为博弈方参与因子,建立动态博弈模型:

步骤1:建立供电营销服务的类型序列s为s={s1,s2,......,sn},其中n为供电营销服务内容;

步骤2:电网运营业务的影响序列为eg={eg1,eg2,......,egm},

ej={ej1,ej2,......,ejm},

ey={ey1,ey2,......,eym},

ec={ec1,ec2,......,ecm},

ex={ex1,ex2,......,exm}

其中m为供电企业的业务影响种类,eg为供电企业规划影响,ej为建设影响,ey为运维影响,ec为财务影响,ex为传统供电营销业务影响;

则电网运营业务影响的动态博弈目标函数为:

其中δγi为可调整的供电营销服务资源,ca为总体供电营销服务成本;

步骤3:总体供电营销服务成本ca满足两个约束条件:

ca≤call,其中call为供电企业的投资计划总和;

ca≤clong,其中clong为供电企业长期投资回报;

最后求得满足步骤3两个约束条件的动态博弈目标函数中的最小总体供电营销服务成本minca。

为了更好地实现本方案,进一步地,对tf-idf客户经济贡献画像建模的方法具体为:

电力客户特征指标出现的频度tf为

其中lw为电力客户的特征数据z在用户画像中出现的次数,lw为用户画像中的特征数据z的总词语数量;

电力客户特征指标的逆向文件频率idf为

其中qs是每一项电力客户特征数据文本总数量,qs是总的电力客户特征数据文本的数量;

对电力客户特征指标的逆向文件频率idf增加一个固定偏移量n,则电力客户的tf-idf特征提取函数ftfidf为:

所述特征数据在电力客户特征标签指标集画像中的权重fw为

其中tfu为其中一个电力客户特征数据文本在该类指标集中的频率;

电力客户的总体画像特征pall为

其中θ为该电力客户的特征指标数量。

为了更好地实现本方案,进一步地,所述制定供电营销服务套餐的方法具体为:设定五级电力客户,其中一级电力客户的项目有电费清单、欠费提醒、用电安全培训;

二级电力客户的项目在一级电力客户的项目上增加了故障通知服务;

三级电力客户的项目在二级电力客户的项目上增加了有限缴费服务;

四级电力客户的项目在三级电力客户的项目上增加了专业设备巡视、故障设备更换和设备年检报告;

五级电力客户的项目在四级电力客户的项目上增加了用电分析报告和能效监测分析。

为了更好地实现本方案,进一步地,在收到电力客户的数据后,判断该电力客户的数据是否为已经新建的电力客户特征标签指标集,若是,则进行电力客户信息特征分类,将该数据分类到已经建立的电力客户特征标签指标集中;若不是,则新增电力客户特征标签指标集,然后再进行电力客户信息特征分类,将该电力客户数据分类到电力客户特征标签指标集中。

在对不同类型客户的行为、需求和价值进行分析,需要考虑供电营销服务策略的改变对供电企业运营方面造成的影响。要想实现对不同类型的电力客户提供差异化服务,则要对电力客户的需求和供电企业运营能力做综合考虑。结合这个思路,在本方案中,我们综合考虑了电力客户的需求和供电企业的运营能力,首先,我们基于电力客户的“行为-需求-价值”维度,对获取的数据进行数据分类,对于行为类数据可以设置该用户的负荷曲线、功率因数、欠费和或违约记录等等,对于需求类数据可以设置客户投诉、客户建议等,对于价值类数据可以设置电价信息、电费数据或该电力客户的信用评估、司法信息等等。

然后再构建电力客户特征标签指标集,在这步使用了ml-knn算法,即多标签分类算法,对于新增的电力客户特征数据,使用其最近邻的k个索引的电力客户特征标签指标集的集合,来形成该新增的电力客户特征数据的最终标签,这样就形成了完整的新建的电力客户特征标签指标集。然后使用动态博弈的方法分析电网运营业务影响,得到最优的供电营销服务方式,具体地方法如上述,由供电营销服务的类型序列s和电网运营业务的各个影响序列e为基础,结合可调整的营销服务资源δγi,得到关于总体供电营销服务成本ca的最小值minca的动态博弈目标函数,其中电网运营业务的不同影响序列e为各种不同的影响;总体供电营销服务成本ca需要同时不大于供电企业的投资计划总和call和长期投资回报clong。然后对tf-idf客户经济贡献画像进行建模,其目标是实现供电企业的收益最大化,调整的原则是向经济贡献大的电力客户倾斜更多的服务资源,这里我们会在电力客户特征指标的逆向文件频率idf增加一个固定偏移量n,这是因为在公式3中,若某个电力客户特征数据文本的数量为0,则会出现逆向文件频率idf除0的情况,因此,我们需要添加一个偏移量n,这个偏移量n一般为一个较小的数值,对整体的结果影响不大。最后制定供电营销服务套餐,一般可以设定一定数量等级的用户,根据实际服务项目的分级,对应将电力客户也按电力客户的总体画像特征pall的值划分该数量的不同等级,对不同等级的电力客户,给予不同的服务项目。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1.本发明所述的一种基于改进特征词权重算法的供电营销服务方法,采用特征词权重算法的分类方法,并结合多标签分类算法和动态博弈,针对不同的电力客户制定不同的供电营销服务,实现了对不同类型的电力客户提供差异化服务;

2.本发明所述的一种基于改进特征词权重算法的供电营销服务方法,采用特征词权重算法的分类方法,并结合多标签分类算法和动态博弈,针对不同的电力客户制定不同的供电营销服务,对电力客户进行的行为-需求-价值三方全面的分析,兼顾了供电营销服务策略的变化对供电企业运营造成的影响,使得本方案更具有普适性;

3.本发明所述的一种基于改进特征词权重算法的供电营销服务方法,采用特征词权重算法的分类方法,并结合多标签分类算法和动态博弈,针对不同的电力客户制定不同的供电营销服务,综合考虑了电力客户的需求和供电企业的运营能力,使得方案更具有普适性。

附图说明

为了更清楚地说明本技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:

图1是本发明的供电营销服务方法架构图;

图2是本发明的流程框图。

具体实施方式

为了更清楚地说明本发明实施例的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,应当理解,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,因此不应被看作是对保护范围的限定。基于本发明中的实施例,本领域普通技术工作人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“设置”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;也可以是直接相连,也可以是通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

下面结合图1至图2对本发明作详细说明。

实施例1:

一种基于改进特征词权重算法的供电营销服务方法,包括以下步骤:

电力客户信息数据分类:基于供电企业的电力客户数据和社会机构公布的外部电力客户数据,从电力客户的“行为-需求-价值”维度进行数据分类;

构建电力客户特征标签指标集:使用多标签分类算法构建电力客户特征指标集;

分析电网运营业务影响:从供电企业的成本进行分析,进行动态博弈分析,得到最优的供电营销服务方式;

对tf-idf客户经济贡献画像建模:针对电力客户的经济贡献画像,通过tf-idf算法,对电力客户的经济贡献进行画像建模;

制定供电营销服务套餐:根据电力客户的画像将电力客户分成一定的等级,并且根据不同的等级进行不同内容的服务。

实施例2

本实施例在实施例1的基础上,所述电力客户信息数据分类在电力客户的行为方面包括电力客户在用电过程中的行为和影响电力客户用电行为因素,数据主要来源于供电企业的内部系统;

所述电力客户信息数据分类在电力客户的需求方面包括电力客户对供电服务的感受、评价和与供电企业的互动,数据主要来源于供电企业的内部系统;

所述电力客户信息数据分类在电力客户的价值方面包括电力客户对供电企业的电费和或增值服务的价值贡献和电力客户资金支付能力,数据主要来源于供电企业的内部系统和社会机构公布的客户外部数据。在本实施例中,设置如下表1的这些电力客户信息数据。

表1

所述构建电力客户特征标签指标集的方法为:获取新增电力客户特征数据的k个近邻索引集合;利用贝叶斯条件概率计算新增电力客户特征数据的标签概率,概率大的近邻索引集合即为新增电力客户特征数据的最终标签,形成完整的电力客户特征标签指标集。

具体地说,我们设电力客户的样本数量为n,电力客户行为为b、电力客户需求的指标集为n、电力客户价值v的指标集分别为:

b={b1,b2,.......,bn},

n={n1,n2,.....,nn},

v={v1,v2,.........,vn}

设bi是第i实例对应的电力客户行为特征向量,设ni是第i实例对应的电力客户需求特征向量,设vi是第i实例对应的电力客户价值特征向量,电力客户的样本集合为:

设k为电力客户特征标签与簇心之间的欧式距离,d为电力客户特征标签的维度,β为电力客户特征标签簇的数量,则电力客户的行为、需求和价值簇心的向量分别为:

则新增电力客户特征标签lk的特征映射函数为δk:

设模型的边界为ψ,新增电力客户特征标签lk的独有的特征集为:

由该式可知,通过计算新增电力客户特征标签的近邻索引集合,可获得新增电力客户特征标签的最终电力客户特征类型标签,并对电力客户特征标签指标集进行完善。

这里我们将原有的电力客户特征标签集中的电力客户特征标签,挑选出和新的电力客户特征标签临近的k个近邻的电力客户特征标签形成一个小的电力客户特征标签集,该电力客户特征标签集,作为最新的电力客户特征标签的特征,从而将新的电力客户特征标签融入到原有的电力客户特征标签集中。

供电企业对电力客户提供更优质的营销服务后,可能出现财务结算方式转变、负荷迅猛增长、配电网潮流多向等维度的变化,这些变化将对供电企业的规划、建设、运维、财务等业务产生较大的影响,甚至大幅增大供电企业的运营投入,本方案通过对供电营销服务的投入、产出做动态博弈分析,求解最优的供电营销服务方式,以期在满足供电营销服务水平提升的同时,减少供电企业的综合成本投入。该分析电网运营业务影响的方法为:

将供电营销服务内容和供电企业的业务影响共同作为博弈方参与因子,建立动态博弈模型:

步骤1:建立供电营销服务的类型序列s为s={s1,s2,......,sn},其中n为供电营销服务内容;

步骤2:电网运营业务的影响序列为eg={eg1,eg2,......,egm},

ej={ej1,ej2,......,ejm},

ey={ey1,ey2,......,eym},

ec={ec1,ec2,......,ecm},

ex={ex1,ex2,......,exm}

其中m为供电企业的业务影响种类,eg为供电企业规划影响,ej为建设影响,ey为运维影响,ec为财务影响,ex为传统供电营销业务影响;

则电网运营业务影响的动态博弈目标函数为:

其中δγi为可调整的供电营销服务资源,ca为总体供电营销服务成本;

步骤3:总体供电营销服务成本ca满足两个约束条件:

ca≤call,其中call为供电企业的投资计划总和;

ca≤clong,其中clong为供电企业长期投资回报;

最后求得满足步骤3两个约束条件的动态博弈目标函数中的最小总体供电营销服务成本minca。

对tf-idf客户经济贡献画像建模的方法具体为:

电力客户特征指标出现的频度tf为

其中lw为电力客户的特征数据z在用户画像中出现的次数,lw为用户画像中的特征数据z的总词语数量;

电力客户特征指标的逆向文件频率idf为

其中qs是每一项电力客户特征数据文本总数量,qs是总的电力客户特征数据文本的数量;

对电力客户特征指标的逆向文件频率idf增加一个固定偏移量0.0001,则电力客户的tf-idf特征提取函数ftfidf为:

所述特征数据在电力客户特征标签指标集画像中的权重fw为

其中tfu为其中一个电力客户特征数据文本在该类指标集中的频率;

电力客户的总体画像特征pall为

其中θ为该电力客户的特征指标数量。

所述制定供电营销服务套餐的方法具体为:设定五级电力客户,其中一级电力客户的项目有电费清单、欠费提醒、用电安全培训;

二级电力客户的项目在一级电力客户的项目上增加了故障通知服务;

三级电力客户的项目在二级电力客户的项目上增加了有限缴费服务;

四级电力客户的项目在三级电力客户的项目上增加了专业设备巡视、故障设备更换和设备年检报告;

五级电力客户的项目在四级电力客户的项目上增加了用电分析报告和能效监测分析。如表2所示,除此之外,电力客户即可通过购买会员等级的方式,提升服务内容,从而满足不同电力客户群体的服务期望。

表2

在收到电力客户的数据后,判断该电力客户的数据是否为已经新建的电力客户特征标签指标集,若是,则进行电力客户信息特征分类,将该数据分类到已经建立的电力客户特征标签指标集中;若不是,则新增电力客户特征标签指标集,然后再进行电力客户信息特征分类,将该电力客户数据分类到电力客户特征标签指标集中。

工作原理:在对不同类型客户的行为、需求和价值进行分析,需要考虑供电营销服务策略的改变对供电企业运营方面造成的影响。要想实现对不同类型的电力客户提供差异化服务,则要对电力客户的需求和供电企业运营能力做综合考虑。结合这个思路,在本方案中,我们综合考虑了电力客户的需求和供电企业的运营能力,首先,我们基于电力客户的“行为-需求-价值”维度,对获取的数据进行数据分类,对于行为类数据可以设置该用户的负荷曲线、功率因数、欠费和或违约记录等等,对于需求类数据可以设置客户投诉、客户建议等,对于价值类数据可以设置电价信息、电费数据或该电力客户的信用评估、司法信息等等。

然后再构建电力客户特征标签指标集,在这步使用了ml-knn算法,即多标签分类算法,对于新增的电力客户特征数据,使用其最近邻的k个索引的电力客户特征标签指标集的集合,来形成该新增的电力客户特征数据的最终标签,这样就形成了完整的新建的电力客户特征标签指标集。然后使用动态博弈的方法分析电网运营业务影响,得到最优的供电营销服务方式,具体地方法如上述,由供电营销服务的类型序列s和电网运营业务的各个影响序列e为基础,结合可调整的营销服务资源δγi,得到关于总体供电营销服务成本ca的最小值minca的动态博弈目标函数,其中电网运营业务的不同影响序列e为各种不同的影响;总体供电营销服务成本ca需要同时不大于供电企业的投资计划总和call和长期投资回报clong。然后对tf-idf客户经济贡献画像进行建模,其目标是实现供电企业的收益最大化,调整的原则是向经济贡献大的电力客户倾斜更多的服务资源,这里我们会在电力客户特征指标的逆向文件频率idf增加一个固定偏移量n,这是因为在公式3中,若某个电力客户特征数据文本的数量为0,则会出现逆向文件频率idf除0的情况,因此,我们需要添加一个偏移量n,这个偏移量n一般为一个较小的数值,对整体的结果影响不大。最后制定供电营销服务套餐,一般可以设定一定数量等级的用户,根据实际服务项目的分级,对应将电力客户也按电力客户的总体画像特征pall的值划分该数量的不同等级,对不同等级的电力客户,给予不同的服务项目。

本实施例的其他部分与上述实施例1相同,故不再赘述。

以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1