一种基于随机森林算法的电动汽车用户聚类方法及装置与流程

文档序号：17466025发布日期：2019-04-20 05:31阅读：421来源：国知局

本发明属于电力系统技术领域，涉及电动汽车用户聚类方法，尤其是一种基于随机森林算法的电动汽车用户聚类方法及装置。

背景技术：

近年来，电动汽车和充电技术不断发展，我国电动汽车用户数量也随之增加，电动汽车负荷在总负荷中占据了不可忽视的比例。电动汽车负载有着较强的灵活性和可调度性，如果对电动汽车进行有效的需求侧管理，则有助于实现电力负载的削峰填谷，缓解用电高峰时段电网的送电压力。而电动汽车需求侧管理需要基于对电动汽车用户的充电行为的研究。通过对电动汽车用户进行聚类分析，可以细化电动汽车充电行为的特征，有助于对电动汽车精细化且有针对的管理。

目前，对充电汽车行为的模拟主要基于概率分布函数，常见的有对数正态分布。对电动汽车的分类主要基于充电汽车的车型种类，而其运行规则也是参考日常生活中的常见情形。研究表明，这种方式的模拟和分类的可靠性相对较低，且不足以准确反映电动汽车的实际充电特征。

技术实现要素：

本发明的目的在于克服现有技术的不足，提出一种设计合理、可靠性强且能够准确反映电动汽车的实际充电特征的基于随机森林算法的电动汽车用户聚类方法及装置。

本发明解决其现实问题是采取以下技术方案实现的：

一种基于随机森林算法的电动汽车用户聚类方法，包括以下步骤：

步骤1、获取电动汽车充电行为大数据；

步骤2、删除充电行为大数据中的不良数据；

步骤3、对剩下的充电行为大数据进行数据预处理；

步骤4、分别基于工作日、双休日和节假日的数据，设定需要研究的充电特征目标并选取恰当的变量参数；

步骤5、根据步骤4的设定，将步骤3预处理后得到的变量数据输入到随机森林算法，并使用经典多维尺度下的坐标表征各个充电行为之间的联系；

步骤6、基于步骤5中得到的充电行为二维坐标，在直角坐标系下绘出所有充电行为的经典多维尺度图；

步骤7、根据步骤6中得到的经典多维尺度图的形状特征，对图像进行划分，将密集的点归为同一类，得到电动汽车用户充电行为的聚类结果；

步骤8、根据步骤7得到的聚类结果，分析充电行为的特征，对充电行为进行比例、数量方面的评估；

而且，所述步骤1的电动汽车充电行为大数据的参数类型包括较长测量时段内的电动汽车充电起始时间、充电结束时间、充电持续时间、充电电量和充电地点；

而且，所述步骤2的不良数据包括有明显错误的起始和结束时间数据、充电持续时间为零的相关数据；

而且，所述步骤3的具体步骤包括：

(1)将所有的充电行为数据按月份划分且编号；

(2)将充电行为数据按工作日、双休日和节假日划分且编号；

(3)对充电地点进行编号；

(4)将所有参数转化成可供随机森林算法识别的数字型数据；

而且，所述步骤4的具体步骤包括：

(1)基于充电起始时间、结束时间和持续时间，研究所有电动汽车用户中存在的充电类型及其比例，以及各类型的充电特征；

(2)基于充电起始时间、持续时间和充电电量，研究所有电动汽车用户中存在的充电类型及其比例，以及各类型的充电特征；

(3)基于充电起始时间、充电电量和充电地点，研究所有电动汽车用户中存在的充电类型及其比例，以及各类型的充电特征。

而且，所述步骤5的具体步骤包括：

(1)使用rstudio软件中的rfdist函数实现随机森林算法；

(2)使用rstudio软件中的cmdscale函数生成各个充电行为在经典多维尺度的二维坐标。

一种基于随机森林算法的电动汽车用户聚类装置，包括获取模块、预处理模块、运算模块、聚类模块和评估模块；其中：

所述获取模块，用于获得充电行为信息，包括充电地点配置信息、充电起始时间、充电结束时间、充电电量和充电时间等可用于聚类分析的数据信息；

所述预处理模块，用于剔除不良数据，根据设定的聚类分析目标，对有效数据进行分类和提取；

所述运算模块，用于输入数据后，通过随机森林算法对所有电动汽车用户进行聚类，并通过经典多维尺度下的二维坐标表示每个充电行为；

所述聚类模块，用于对得到的经典多维尺度下的图像进行划分，得到最终的电动汽车用户聚类结果；

所述评估模块，用于对得到的聚类结果进行分析，输出各类别的充电特征。

本发明的优点和有益效果：

本发明提供了一种基于随机森林算法的电动汽车用户聚类方法，能够获取并处理电动汽车充电数据；采用的随机森林算法满足大数据处理的要求，通过无监督的机械学习得到的聚类结果，同时可以评估影响聚类结果的变量因子的重要性。相比于使用概率密度函数进行模拟，本发明为充电行为的判定提供了一种客观且可靠的依据，这也有助于提高电动汽车需求侧管理的准确性和针对性。

附图说明

图1为本发明的一种基于随机森林算法的电动汽车用户聚类方法的处理流程图；

图2为本发明中的数据预处理的框架图；

图3为本发明的一种基于随机森林算法的电动汽车用户聚类装置的结构示意图。

具体实施方式

以下结合附图对本发明实施例作进一步详述：

现阶段发展趋势表明，未来我国的电动汽车用户数量会继续增加，而且充电设施也会不断更新，越来越多的充电数据将被记录，从而形成关于电动汽车充电行为的大数据。基于这种实测的大数据来对电动汽车用户充电行为进行聚类分析，可以极大提高对充电行为描述的准确性。

随机森林算法是指利用多棵决策树对样本进行训练并预测的一种机械学习方法，该算法可以输入包含多个变量的大数据，通过快速学习后输出高准确度的分类、聚类或者回归结果。同时，随机森林算法不会产生过拟合问题，也可以评估输入变量的重要性。基于其以上特点和优点，随机森林非常适合于电动汽车用户的聚类分析，可快速学习变量因子和用户类型之间的关系并给出变量因子的重要性评价。

一种基于随机森林算法的电动汽车用户聚类方法，如图1所示，包括以下步骤：

步骤1、获取电动汽车充电行为大数据；

其中，所述电动汽车充电行为大数据主要来自于一定区域内的充电站和充电桩，所述电动汽车充电行为大数据的参数类型包括较长测量时段内的电动汽车充电起始时间、充电结束时间、充电持续时间、充电电量和充电地点；

步骤2、删除充电行为大数据中的不良数据；

其中，所述不良数据主要包括有明显错误的起始和结束时间数据、充电持续时间为零的相关数据；

步骤3、对剩下的充电行为大数据进行数据预处理；

所述步骤3的具体步骤，如图2所示，包括：

步骤s31、将所有的充电行为数据按月份划分且编号；

步骤s32、将充电行为数据按工作日、双休日和节假日划分且编号；

步骤s33、对充电地点进行编号；

步骤s34、将所有参数转化成可供随机森林算法识别的数字型数据；

步骤4、分别基于工作日、双休日和节假日的数据，设定需要研究的充电特征目标并选取恰当的变量参数；

所述步骤4的具体步骤包括：

步骤s41，基于充电起始时间、结束时间和持续时间，研究所有电动汽车用户中存在的充电类型及其比例，以及各类型的充电特征；

步骤s42，基于充电起始时间、持续时间和充电电量，研究所有电动汽车用户中存在的充电类型及其比例，以及各类型的充电特征；

步骤s43，基于充电起始时间、充电电量和充电地点，研究所有电动汽车用户中存在的充电类型及其比例，以及各类型的充电特征；

步骤5、根据步骤4的设定，将步骤3预处理后得到的变量数据输入到随机森林算法，并使用经典多维尺度下的坐标表征各个充电行为之间的联系；

所述步骤5的具体步骤包括：

步骤s51，使用rstudio软件中的rfdist函数实现随机森林算法；

在本实施例中，步骤s51中对rfdist函数的参数设定包括：

将工作模式设定为addcl1，或者根据实际聚类结果的改用addcl2模式；

输入特征数目为接近于使用变量数量的二分之一次方的整数；

根据所用计算机性能，设定生成的森林的数量和每个森林中决策树的数量，一般设定森林的数量为5至30，决策树的数量为300至3000；

步骤s52，使用rstudio软件中的cmdscale函数生成各个充电行为在经典多维尺度的二维坐标；

步骤6、基于步骤5中得到的充电行为二维坐标，在直角坐标系下绘出所有充电行为的经典多维尺度图；

步骤7、根据步骤6中得到的经典多维尺度图的形状特征，对图像进行划分，将密集的点归为同一类，得到电动汽车用户充电行为的聚类结果；

步骤8、根据步骤7得到的聚类结果，分析充电行为的特征，对充电行为进行比例、数量方面的评估；

与上述技术相对应，本发明还提供了一种基于随机森林算法的电动汽车用户聚类装置，如图3所示，其中包括：获取模块、预处理模块、运算模块、聚类模块和评估模块。其中：

所述获取模块，用于获得充电行为信息，包括充电地点配置信息、充电起始时间、充电结束时间、充电电量和充电时间等可用于聚类分析的数据信息。

所述预处理模块，用于剔除不良数据，根据设定的聚类分析目标，对有效数据进行分类和提取。

所述运算模块，用于输入数据后，通过随机森林算法对所有电动汽车用户进行聚类，并通过经典多维尺度下的二维坐标表示每个充电行为。

所述聚类模块，用于对得到的经典多维尺度下的图像进行划分，得到最终的电动汽车用户聚类结果。

所述评估模块，用于对得到的聚类结果进行分析，输出各类别的充电特征。

在本实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施列仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-0nlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要强调的是，本发明所述实施例是说明性的，而不是限定性的，因此本发明包括并不限于具体实施方式中所述实施例，凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式，同样属于本发明保护的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘亚丽;王旭东;赵新;任国歧;李国栋;洪奕;刘瑜俊;李树鹏;吕金炳;陈培育;胡晓辉;王峥;赵玉新;徐青山;赵迎春
技术所有人：国网天津市电力公司电力科学研究院;国网天津市电力公司;国家电网有限公司;东南大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。