一种风电设备的视频分布式存储与检索方法与流程

文档序号:17662652发布日期:2019-05-15 22:29阅读:360来源:国知局

本发明属于新能源发电技术领域,具体涉及一种风电设备的视频分布式存储与检索方法。



背景技术:

风电综合数据具有复杂性、体量巨大及多源异构等特点,现有的关系数据库已经无法满足风电生产运营数据的存储需求,表现在以下几个方面:

1)风电生产数据体量为tb或pb级,关系数据库已无法处理;

2)数据访问时输入输出耗时,数据响应速度受到关系数据库的制约,导致大数据快速访问能力较低;

3)针对视频图像、图片、文档等非结构化数据缺乏处理能力;

4)对海量数据分析处理的可扩展性差。



技术实现要素:

为解决上述问题,本发明提出一种风电设备的视频分布式存储与检索方法,解决风电视频数据量大、存储困难、利用率低等技术问题。

本发明采用如下技术方案,一种风电设备的视频分布式存储与检索方法,具体步骤如下:

1)将监控视频设备产生的视频数据写入本地缓冲区;

2)将本地缓冲区中的视频数据上传到hadoop的分布式系统文件(hadoopdistributefilesystem,hdfs)中,删除缓冲区中上传成功的视频数据;将视频名称和视频路径写入hadoop数据库(hadoopdatabase,hbase)视频表;

3)设定视频数据的目标图像,并存储到hbase图像表中;

4)对视频数据的目标图像进行分布式特征信息提取,将特征信息写入hbase图像表中;

5)调用mapreduce分布式计算框架,实现对视频图像的并行检索。

优选地,所述步骤2)具体为,调用hdfs中数据流写入函数将本地缓冲区中的视频数据上传到hdfs中,调用文件删除函数删除缓冲区中上传成功的视频数据。

优选地,所述步骤4)中对视频数据中预设的目标图像进行分布式特征信息提取,包括对目标图像进行颜色特征、纹理特征和形状特征提取。

优选地,所述步骤4)中对预设的目标图像进行颜色特征信息提取具体为,利用rgb颜色直方图算法提取图像中红色、绿色和蓝色的统计分布信息。

优选地,所述步骤4)中对预设的目标图像进行纹理特征信息提取具体为,利用tamura特征算法提取图像的纹理特征,所述纹理特征包括粗糙度、对比度和方向度。

优选地,所述步骤4)中对预设的目标图像进行形状特征信息提取具体为,利用边缘直方图算法对图像进行边缘算子计算和边缘方向量化,通过直方图统计,实现对图像的形状和边缘信息提取。

优选地,所述步骤5)的具体步骤如下:

51)基于待检测图像的时间和地点获取hbase图像表中目标图像子集;hbase图像表为预设存储在hbase中以风机为主键的数据表,包括风机名称、视频名称、目标图像名称、目标图像特征信息、存储时间和监控地点;

52)对待检索图像进行分布式特征信息提取;

53)将待检索图像的特征信息与步骤51)中得到的目标图像子集的特征信息进行特征匹配,得到相似度;

54)对相似度进行排序,得到相似度最高的n个目标图像,所述n为预设值;

55)基于目标图像名称得到对应的视频名称;

56)根据视频名称对hbase视频表进行扫描,得到对应的视频路径;

57)读取对应视频。

发明所达到的有益效果:本发明公开了一种风电设备的视频分布式存储与检索方法,解决风电视频数据量大、存储困难、利用率低等技术问题。本发明首先利用hadoop分布式文件系统实现海量视频数据的分布式存储,然后利用mapreduce分布式处理框架,分别采用rgb颜色直方图算法、tamura特征算法边缘直方图算法,对视频图像颜色、纹理和形状三个方面进行特征提取,并将特征结果写入hbase分布式数据库,最后利用mapreduce分布式计算框架,实现对图像的并行检索。本发明通过大数据技术和图像特征识别实现了风电设备海量视频分布式存储,弥补了关系数据库的不足,同时提高了数据访问能力,实现了图像的快速处理,摒弃视频数据中的冗余信息,进行并行检索,不再需要人工检索,为大数据时代下新能源信息化建设提供技术支撑。

附图说明

图1是本发明实施例的一种风电设备的视频分布式存储与检索方法流程图。

图2是本发明实施例的一种分布式图像特征信息提取方法流程图。

具体实施方式

下面根据附图并结合实施例对本发明的技术方案作进一步阐述。

本发明提出一种风电设备的视频分布式存储与检索方法,如图1所示,具体步骤如下:

1)将监控视频设备产生的视频数据写入本地缓冲区;所述本地缓冲区为指定的本地文件夹,即将监控视频设备产生的视频数据以流的形式写入动态调整的本地文件夹中;

2)将本地缓冲区中的视频数据上传到hdfs中,删除缓冲区中上传成功的视频数据;将视频名称和视频路径写入hbase视频表;

所述步骤2)具体为,调用hdfs中数据流写入函数将本地缓冲区中的视频数据上传到hdfs中,调用文件删除函数删除本地缓冲区中上传成功的视频数据。这一过程不断循环进行,直到本地缓冲区的所有文件上传到hdfs中,并且把本地缓冲区文件全部清空为止。当完成视频数据写入hdfs文件系统后,即实现视频数据的分布式数据存储,将视频名称和视频路径写入hbase视频表,用于视频图像检索。

3)设定视频数据的目标图像,并存储到hbase图像表中;可选取视频数据中风机关键部位、风电场关键监控点的图像作为目标图像,并存储到hbase图像表。

4)对视频数据的目标图像进行分布式特征信息提取,将特征信息写入hbase图像表中;

首先从hdfs中读取目标图像,然后调用mapreduce分布式框架对视频数据中的目标图像进行特征信息提取,包括对目标图像进行颜色特征、纹理特征和形状特征提取。

对目标图像进行颜色特征信息提取具体为,利用rgb颜色直方图算法提取图像中红色、绿色和蓝色的统计分布信息。

对目标图像进行纹理特征信息提取具体为,利用tamura特征算法提取图像的纹理特征,所述纹理特征包括粗糙度、对比度和方向度。

对目标图像进行形状特征信息提取具体为,利用边缘直方图算法对图像进行边缘算子计算和边缘方向量化,通过直方图统计,实现对图像的形状和边缘信息提取。

最后将目标图像特征信息写入hbase,并判断是否存在下一目标图像,如果存在重复本步骤过程,如图2所示。

5)调用mapreduce分布式计算框架,实现对视频图像的并行检索。

所述步骤4)的具体步骤如下:

51)基于待检测图像的时间和地点获取hbase图像表中目标图像子集;所述待检测图像的时间和地点均可自行设定;hbase图像表为预设存储在hbase中以风机为主键的数据表,包括风机名称、视频名称、目标图像名称、目标图像特征信息、存储时间和监控地点;

根据指定的地点和时间范围信息确定搜索范围,在hbase图像表中根据存储时间和监控地点的复合行键作为前缀扫描器参数,获取目标图像子集;

52)对待检索图像进行分布式特征信息提取;需要提取的特征可自行设定。

53)将待检索图像的特征信息与步骤51)中得到的目标图像子集的特征信息进行特征匹配,得到相似度;

54)对相似度进行排序,得到相似度最高的n个目标图像,所述n为预设值;

55)基于目标图像名称得到对应的视频名称;根据目标图像名称对hbase图像表进行扫描,得到目标图像对应的视频名称;

56)根据视频名称对hbase视频表进行扫描,得到对应的视频hdfs路径;

57)读取hdfs中对应视频。将得到的目标图像以及对应读取的视频一起返回给用户。

以上所述仅为本发明的优选实施方式,用以说明本发明的技术方案,而非对其限制;应当指出:对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1