一种基于聚类对分布式光伏客户进行分类的方法及系统与流程

文档序号:17187678发布日期:2019-03-22 21:32阅读:253来源:国知局
一种基于聚类对分布式光伏客户进行分类的方法及系统与流程

本发明涉及数据分析技术领域,尤其涉及一种基于聚类对分布式光伏客户进行分类的方法。



背景技术:

随着社会的发展,能源是人类生存发展的重要物质基础,随着全球气候变暖日益严重及化石能源,日渐枯竭的情形下,可再生能源在众多能源中成为最具有竞争力和发展前景的能源。

近年来,我国光伏发电应用市场逐步扩大,其光伏发电机容量每年以成倍的速度增长,在光伏发电市场持续升温的背景下,目前光伏产品制造业产能也逐渐扩大。光伏发电领域的市场竞争也越来越激烈,因此,针对现有的光伏客户中,根据光伏客户的数据信息,对光伏发电客户进行细分,然后进行精准的营销是非常重要的。

现有技术中电力公司具有积累海量的光伏客户的历史故障信息,然而目前对这些故障信息的处理,只是基于表面分析,例如单独从区域或者所属行业来进行划分,然而这些初步的数据处理,无法具体的运用这些数据信息,反而随着数据累积形成“数据灾难”和“资源浪费”。

因此需要设计一种直观的,具有针对性的对光伏客户统计分类的数据处理和分析方法,来解决上述问题。



技术实现要素:

为了解决上述问题,本发明提供了一种利用聚类的方法,对光伏客户数据库中的数据信息进行分析分类优选优质客户的基于聚类对分布式光伏客户进行分类的方法及系统。

为了达到上述目的,采用以下技术方案:

一种基于聚类对分布式光伏客户进行分类的方法,其特征在于,包括步骤:

s1:根据多个预设特征指标公式,获取每个光伏客户对应的多个特征指标;

s2:将每个光伏客户对应的多个特征指标输入预设数据挖掘软件,通过预设数据挖掘软件将光伏客户进行聚类分类。

进一步地,步骤s1包括:

s11:根据预设日负荷指标公式,获取光伏客户的光伏用电日负荷指标;

s12:根据预设电量指标公式,获取光伏客户的光伏电量使用指标;

s13:根据预设日负载率指标公式,获取光伏客户的光伏日负载率指标。

进一步地,步骤s1中的预设日负荷指标公式为:

每日第一电压平均值为:客户每日第一预设时间段内每间隔预设时间时使用的电压值的平均值;

每日第二电压平均值为:客户每日第二预设时间段内每间隔预设时间时使用的电压值的平均值;

所述第一预设时间段和第二预设时间段组合为一日;

每日电压标准差为:客户每日每间隔预设时间段时使用的电压值的标准差。

进一步地,步骤s1中的预设电量指标公式为:

进一步地,步骤s1中的预设日负载率指标公式为:

进一步地,预设数据挖掘软件为spssmodeler数据挖掘软件。

一种基于聚类对分布式光伏客户进行分类的系统,包括:

获取特征指标模块,用于根据多个预设特征指标公式,获取每个光伏客户对应的多个特征指标;

聚类分类模块,用于将每个光伏客户对应的多个特征指标输入预设数据挖掘软件,通过预设数据挖掘软件将光伏客户进行聚类分类。

进一步地,获取指标模块包括:

获取用电日负荷指标单元,用于根据预设日负荷指标公式,获取光伏客户的光伏用电日负荷指标;

获取电量使用指标单元,用于根据预设电量指标公式,获取光伏客户的光伏电量使用指标;

获取日负载率指标单元,用于根据预设日负载率指标公式,获取光伏客户的光伏日负载率指标。

进一步地,聚类分类模块包括:

聚类分类单元,用于通过预设数据挖掘软件,结合光伏客户的多个特征指标字,将光伏客户按照预设分类方式进行分类;

分类导出单元,用于将分类后的光伏客户按照预设饼形图或者柱形图进行保存并导出。

本发明的有益效果为:

(1)通过对光伏客户的特征提取,对光伏客户进行聚类分类为预设类别,建立新的客户群组,可以根据每类客户群组,选择对应的营销方式。

(2)能够通过本聚类分析对分布式光伏客户的分类,准确的确定光伏客户的所属类别,从而可以进一步地,对每一类客户进行精准分析。

附图说明

图1为本基于基于聚类对分布式光伏客户进行分类的方法流程图一;

图2为本基于基于聚类对分布式光伏客户进行分类的方法流程图二;

图3为本基于基于聚类对分布式光伏客户进行分类的聚类分析分类模型图;

图4为本基于基于聚类对分布式光伏客户进行分类的聚类分类光伏客户饼形图;

图5为本基于基于聚类对分布式光伏客户进行分类的聚类分类变量重要性排序图;

图6为本基于基于聚类对分布式光伏客户进行分类的聚类分类指标值列表;

图7为本基于基于聚类对分布式光伏客户进行分类的系统结构图一;

图8为本基于基于聚类对分布式光伏客户进行分类的系统结构图二。

具体实施方式

以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。

实施例一

本实施例提供了一种基于大数据对分布式光伏客户分类的方法,如图1至图2所示,本方法包括:

s1:根据多个预设特征指标公式,获取每个光伏客户对应的多个特征指标;

s2:将每个光伏客户对应的多个特征指标输入预设数据挖掘软件,通过预设数据挖掘软件将光伏客户进行聚类分类。

其中光伏客户的数据信息有很多,供电单位、发电户号、户名、用电地址、并网点呀等级、发电容量、发电方式、发电量消纳方式、机组信息、发思安设备名称、发电设备类型、发电设备型号、日发电量、月发电量、年发电量等等,因此对光伏客户进行分类,可以分为很多类别,并且分类后也不能针对的确定光伏客户的所属类别。因此,本实施例中提供的基于大数据对分布式光伏客户分类的方法是首先获取光伏客户数据信息中的预设指标,然后根据预设数据挖掘软件和获取的光伏客户多个指标进行聚类分类。

进一步地,步骤s1包括:

s11:根据预设日负荷指标公式,获取光伏客户的光伏用电日负荷指标;

s12:根据预设电量指标公式,获取光伏客户的光伏电量使用指标;

s13:根据预设日负载率指标公式,获取光伏客户的光伏日负载率指标。

由于光伏客户数据信息中的数据类型有很多,其中因此要对光伏客户中的数据信息进行特征指标进行获取,本实施例中提供的光伏客户数据信息中的特征指标数据信息包括:日负荷指标、电量使用指标以及日负载率指标。

进一步地,步骤s1中的预设日负荷指标公式为:

每日第一电压平均值为:客户每日第一预设时间段内每间隔预设时间时使用的电压值的平均值;

每日第二电压平均值为:客户每日第二预设时间段内每间隔预设时间时使用的电压值的平均值;

所述第一预设时间段和第二预设时间段组合为一日;

其中获取日负荷指标,目的是为了获取预设间隔时间的电压使用数据,其中是在导出保存的光伏客户数据信息中对每个光伏客户的用电电压信息,分析得知,光伏客户在光伏发电使用过程中,一、用电白天高于夜间,光伏发电可直接利用,无需储能或上网;二、用电稳定性高,其中稳定性越高的话,其波动越小越好。因此将提取企业每隔15分钟的电压使用数据,然后利用一天内每间隔15分钟获取到的电压使用的电压平均值来表示该客户电压的使用情况,用标准差差来表示波动情况,综合这两方面,进一步优选地,通过:

日负荷指标公式=(八点到十六点的平均值-其余时间的平均值)/每日每隔15分钟采集的电压的标准差;

由此公式得到了客户的日负荷指标。其中日负荷指标表示光伏客户白天光伏发电的使用量,若日负荷指标大于1,则说明八点到十六点的电量使用大于其他时间,光照时间使用量大。

每日电压标准差为:客户每日每间隔预设时间段时使用的电压值的标准差。

进一步地,步骤s1中的预设电量指标公式为:

获取电量使用指标

获取电量使用指标的目的是获取光伏客户的用电量是否稳定,其中本实施例中提供的方法为:从用采集的光伏客户数据信息中导出客户2017年1月至2018年4月间每个月的用电量,可以通过电量使用的标准差来判断该光伏客户电量使用是否稳定,但由于每个光伏客户的发电、用电规模不一致,还需经过方差的标准化,而从得到电量指标=月平均值/标准差,该指标是衡量用户用电稳定性指标。

进一步地,步骤s1中的预设日负载率指标公式为:

获取日负载率指标

获取日负载率指标目的是判断其发电效益,因此从采集的光伏客户数据信息中导出光伏客户2017年1月至2018年4月间每个月的用电量,及对应的运行容量,从供电公司成本角度考虑,当公司用电量与运量容量比例越大,则对供电公司来说,光伏发电的效益最好,因此本实施例中提供的:日负载率=平均每月用电量/(运行容量*10*30)。

本实施例中提供的光伏客户特征指标的提取,能够实现对光伏客户数据信息的定性分析,有针对性的对光伏客户进行数据分析。进一步地,为光伏客户数据信息的聚类分类进行特征指标准备。

将获取的光伏客户多个指标值结合预设数据挖掘软件,建立光伏客户分类模型;根据建立的光伏客户分类模型,将光伏客户分类为预设类别。

本实施例中利用spssmodeler数据挖掘软件,建立光伏客户分类模型,如图3所示,本实施例中,将光伏客户分为了4类,其分类结果,如图4所示,聚类1占50.5%,聚类2占13.4%,聚类3占9.2%,聚类4占26.9%;

进一步地,确定光伏客户分类后每一类光伏客户的多个指标值;结合预设效益指标计算方法,确定聚类分类后优质类光伏客户。

其中每类光伏客户中的特征指标都有显示,如图6所示:

其中聚类1中负载率为0.29、日负荷指标为1.18、电量指标为2.98;

其中聚类2中负载率为0.92、日负荷指标为1.09、电量指标为3.86;

其中聚类3中负载率为0.83、日负荷指标为-0.23、电量指标为3.47;

其中聚类4中负载率为0.27、日负荷指标为-0.28、电量指标为2.75;

其中负载率、电量指标与日负荷是电力公司使用光伏发电后所带来的效益指标,所以越大越好;因此通过判断,其中聚类2可以作为主要营销对象,因为其负载率为0.92,将近达到1,说明安装的变压器基本完全使用;日负荷指标为1.09,说明用户电量使用情况是早上8点至下午16点的电量使用远远大于其余时间,光照时间使用电量大,适合安装光伏发电;电量指标为3.86,说明电量使用稳定性高,波动小。这类用户也将是给公司带来最好效益的企业,因此选择出优质光伏客户类,就是聚类2中包含的光伏客户,因此可以选择聚类2中的光伏客户作为主要营销对象,进一步地,可以看出,聚类4为最不适合安装光伏的客户。

本实施例提供的基于聚类的分布式光伏客户分类的方法,能够通过挖掘光伏客户间不同个体行业以及用电特性规律,对光伏客户进行聚类分类,得到每类光伏客户对应的分类,其中包括优质光伏客户类以及不适合安装光伏客户类或者普通适合安装光伏客户类,从而达到精准营销的目的。

实施例二

本实施例提供了一种基于聚类的分布式光伏客户分类的系统,如图7至图8所示,本系统包括:

获取特征指标模块,用于根据多个预设特征指标公式,获取每个光伏客户对应的多个特征指标;

聚类分类模块,用于将每个光伏客户对应的多个特征指标输入预设数据挖掘软件,通过预设数据挖掘软件将光伏客户进行聚类分类。

进一步地,获取指标模块包括:

获取用电日负荷指标单元,用于根据预设日负荷指标公式,获取光伏客户的光伏用电日负荷指标;

获取电量使用指标单元,用于根据预设电量指标公式,获取光伏客户的光伏电量使用指标;

获取日负载率指标单元,用于根据预设日负载率指标公式,获取光伏客户的光伏日负载率指标。

进一步地,聚类分类模块包括:

聚类分类单元,用于根据数据挖掘软件,结合光伏客户的指标,将光伏客户按照预设分类方式进行分类;

分类导出单元,用于将分类好的光伏客户按照预设饼形图或者柱形图进行保存并导出。

采用本实施例提供的基于聚类对分布式光伏客户进行分类的系统,能够通过不同的预设光伏客户特征提取公式对光伏客户的特征进行提取,然后对光伏客户进行聚类分类为预设类别,建立新的客户群组,可以根据每类客户群组,选择对应的营销方式。并且可以筛选优质客户,进行针对性的推广分布式光伏的安装和售后,提高了光伏产品的营销成功率。

进一步地,能够针对不同的企业群组,执行针对性的服务策略,提高了光伏产品的售后服务准确率,也提高了光伏客户的使用体验。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1