大规模电池储能电站海量电池数据异常检测方法及系统的制作方法

文档序号:9616339阅读:435来源:国知局
大规模电池储能电站海量电池数据异常检测方法及系统的制作方法【
技术领域
】[0001]本发明属于智能电网、能源互联网以及储能
技术领域
,具体涉及一种大规模电池储能电站海量电池数据异常检测方法及系统。【
背景技术
】[0002]近些年,我国风能和大阳能发电快速发展,电池储能电站的规模不断扩大,电池储能电站采集上来的储能电池数据也日益剧增。随着电池储能电站朝着大容量化趋势发展,特别是数十兆瓦级锂电池储能电站中电池单体预计将达数十万只,百兆瓦级电池储能电站的数据量将达到百万级,需分析与处理电池及储能电站相关的数据量异常庞大。[0003]目前的常规电池数据存储方式、架构、管理与分析方法等,难以满足如此大规模海量电池数据在线管理与高效分析的应用需求。无论在数据容量、写库速度以及查询检索上都遇到了瓶颈,导致海量电池数据的存取周期长、数据检索及分析效率低。故将海量数据库以及相关分析方法,应用于电池储能电站领域具有愈发凸显的重要意义。对于海量电池数据进行进一步的深入挖掘与分析,从电池数据中获取有用的价值,找出大量数据背后隐藏的规律和特性,也会迫切需要研究解决的关键技术难题。[0004]目前,从大规模电池储能电站中采集的海量电池异常数据虽然较少,但如何检测与处理非常关键,将会直接影响到大规模电池储能电站运行状态的分析与评估,安全预警等。这些少数的异常数据中隐藏着重要的信息,有助于我们更好地运行与维护储能电站。尤其在百兆瓦级电池储能电站的实时控制、安全预警以及运行维护中,上述问题将更加凸显。目前针对上述问题的解决方案非常少,基于处于空白状态,相关问题亟待解决。【
发明内容】[0005]为了克服上述现有技术的不足,本发明提供一种大规模电池储能电站海量电池数据异常检测方法及系统。本发明采用基于距离的滑动窗口异常检测算法,降低时间和空间的复杂度,提供检测的实时性。[0006]为了实现上述发明目的,本发明采取如下技术方案:[0007]-种大规模电池储能电站海量电池数据异常检测方法,所述方法包括如下步骤:[0008](1)获取海量储能数据并根据数据类别进行分类;[0009](2)将分类后的数据进行基于距离的滑动窗口异常检测;[0010](3)将检测到的异常数据信息按照特定的格式输出到指定地方。[0011]优选的,所述步骤(1)中,所述海量储能数据存储在非关系型Hbase数据库中,利用hadoop的map方式从所述Hbase数据库中分布式获取海量储能数据。[0012]优选的,所述步骤(2)中,包括如下步骤:[0013]步骤2-1、根据储能数据类别定义前提条件包括距离R、阈值k,窗口长度L;[0014]步骤2-2、将储能数据按照时间序列化,将长度为L的选择窗口W放入该时间序列中;[0015]步骤2-3、对窗口内的每个数据点〇计算与其他数据点的欧式距离,统计距离在R范围之内的点的个数n,若η大于k,则认为数据点〇局部异常,反之认为〇局部正常;[0016]步骤2-4、把窗口向前推移1个时间点,重复步骤2-3;[0017]步骤2-5、当数据点〇,从进入窗口到离开窗口均为局部正常的话,则认为该数据为正常数据,反之则为异常数据。[0018]优选的,所述步骤2-3中,所述欧氏距离计算如下:若X和Y为η维数据:[0019]X=(χ1;χ2,......,Xi,......xn)[0020]Y=(yi,y2,......,Yi,......yn)[0021]X与Y之间的欧式距离为:[0022][0023]若X和Y为1维数据,则X和Y之间的欧式距离为:[0024]ED(X,Υ)=|Χ-Υ|。[0025]优选的,所述步骤(3)中,所述特定的格式为:{tutn,[t^Du,…,tn:Dtn]},其中ktn为监测点异常的起始和终止时间,[t1:Dtl,…,tn:Dtn]为异常数据,所述指定地方指用户选定输出方式的地方,包括关系型数据库和非关系型Hbase数据库。[0026]优选的,一种大规模电池储能电站海量电池数据异常检测系统,所述系统包括依次相连的海量数据存储模块、海量数据异常检测模块和海量数据异常输出模块,所述海量数据存储模块采用非关系型Hbase数据库,存储海量数据;所述异常检测到模块采用hadoop并行计算模型,获取海量储能数据并根据数据类别进行分类;所述海量数据异常输出模块,用于将检测到的异常数据信息按照特定的格式输出到指定地方。[0027]优选的,所述海量数据异常检测模块包括依次连接的收集模块、分类模块和异常检测模块,所述收集模块利用hadoop的map方式从Hbase中分布式获取所述海量储能数据;所述分类模块,用于将所述海量储能数据根据监测项的类别,分发给对应的所述异常检测模块;所述异常检测模块,用于将从所述分类模块获得的数据进行基于距离的滑动窗口异常检测。[0028]优选的,所述海量数据异常输出模块包括选择器,用于配置输出环境,所述输出环境包括关系型数据库和非关系型Hbase数据库2种。[0029]与现有技术相比,本发明的有益效果在于:[0030]本发明专利采用基于hadoop分布式计算的海量电池数据异常检测方法及模型,具有高效、可扩展等特点,大大提高了计算能力和处理速度。由于本发明采用基于距离的滑动窗口异常检测算法,降低时间和空间的复杂度,提供检测的实时性。同时,采用欧式距离,可以对数据点为多维的,进行异常检测。[0031]本发明适用于集中式或分散式接入的大规模电池储能电站海量电池数据的异常检测、分析与评估,可以为大规模电池储能系统的状态评估、协调控制与安全预警等提供参考依据。【附图说明】[0032]图1为本发明提供的一种大规模电池储能电站海量电池数据异常检测系统交互图[0033]图2为本发明提供的一种大规模电池储能电站海量电池数据异常检测方法流程图[0034]图3为本发明提供的基于距离的滑动窗口异常检测图[0035]图4为本发明提供的存储海量储能电池数据的Hbase表结构图【具体实施方式】[0036]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。该实施例仅用于解释本发明,并不构成对本发明保护范围的限定。[0037]此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。[0038]如图1所示,本发明实施例提供了一种海量储能电池数据异常检测系统,其包括海量数据存储模块,海量数据异常检测模块和海量数据异常输出模块。其系统构建步骤如下:[0039]步骤1构建海量数据存储模块,通过非关系型数据库Hbase建立数据表table存储海量风光储电池数据,表结构如图4所示。其中Rowkey的组成为数据标示符、距离1970年1月1日的天数和当天开始的秒数,中间以"I"分隔开来。表中t0表示版本号,Column:"data"为列族,value为列名,后面跟的数字为监测值。[0040]步骤2基于hadoop分布式计算框架MapReduce,构建海量数据异常检测模块,利用hadoop的map方式从Hbase分布式地获取海量数据,hadoop将Hbase表中的数据拆分成很多小数据集,每个数据集被分配到一个Map任务中进行处理。Map任务输出的中间结果会提交给分类器Pa当前第1页1 2 
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1