一种利用分段和压缩的海底监测视频大数据存储方法与流程

文档序号：20769452发布日期：2020-05-15 19:28阅读：295来源：国知局

本发明涉及海底监测视频存储技术领域，尤其是涉及一种利用分段和压缩的海底监测视频大数据存储方法。

背景技术：

随着国内外海底监测网的初步建立，依托监测网的诸多海洋观测手段开始实施，其中海底视频监测是重要的手段之一，它可以将海底最直观的影像数据实时全天候地传输至岸上，为海洋科考人员提供宝贵信息。然而，海洋地域广泛，监控产生的视频数据海量巨大，如果不能很好的存储下来，将丢失宝贵海底影像信息。目前，还没有人提出专门针对海洋监测领域视频的存储方案。通常视频数据通过文件或磁带存放，但只能存有限和少量的数据。现有的视频存储方案大多是针对场所监控、新闻录像等领域，从编码、数据格式压缩和视频检索等方面入手，忽略了视频本身的内容特征，导致视频的无差别存储，在视频空白冗余压缩，有价值视频按需存储等方便做的不好。

现有的视频存储方案没有考虑海底监测视频的内容稀疏性，对视频进行无差别存储，例如将视频按一定时长或大小进行划分，将划分后的视频按文件或数据块进行存储。但海底环境空旷，拍摄到的视频中会有大段只有背景的空白部分，仅有少数视频是有内容的，采用这种存储方式会存储大量无价值的视频，浪费存储资源。其次，在对视频按内容进行分段后，一条视频流在实际存储时会被分割为不同类型、大小不一、数量巨大的视频碎片。如果仍选用文件的方式去一一存储这些视频碎片，会给视频数据的组织和管理造成巨大的困难，同时也会造成文件冗余和数据、元数据一致性维护较难等问题。

在“基于hbase的海底监测视频大数据存储方法”这篇论文中公开了一种使用hbase数据库进行海底监测视频大数据存储的方法，该方法中使用背景减法计算视频中的运动量变化，该方法需要对每一个关键帧进行灰度转换并与背景帧做平方差，需要较大的计算量，难以应对海底监测中海量、高密集视频流的实时处理需求。

技术实现要素：

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种实现视频快速分段、减少视频数据量、简化视频存储结构的利用分段和压缩的海底监测视频大数据存储方法。

本发明的目的可以通过以下技术方案来实现：

一种利用分段和压缩的海底监测视频大数据存储方法，包括以下步骤：

步骤1：视频数据中心获取海底监测视频数据；

步骤2：视频数据中心对海底监测视频数据进行基于宏块类型的视频分段，获得关键视频和空白视频；

步骤3：对关键视频进行特征提取；

步骤4：对空白视频进行冗余压缩；

步骤5：将视频段和特征属性组织为大数据表，存入数据库。

优选地，所述步骤2具体为：

步骤2-1：以gop为单位提取视频中的b帧和p帧；

步骤2-2：分别计算b帧和p帧中内部编码宏块的数量并求和，记为n；

步骤2-3：设置n的阈值t，判断n是否大于t，若是，则标记该gop为静止状态，否则，标记该gop为运动状态；

步骤2-4：将处于运动状态的gop按关键视频合并规则合并为若干段关键视频；

步骤2-5：将处于静止状态的gop和未合并为关键视频的处于运动状态的gop按空白视频合并规则合并为若干段空白视频。

更加优选地，所述的关键视频的合并规则具体为：每一段关键视频中的gop在时间上相邻，且关键视频gop的个数大于预先设置的阈值；所述的空白视频的合并规则为：每一段空白视频中的gop在时间上相邻。

优选地，所述的步骤3中的特征提取具体为：提取视频的图像特征，并将其与该段视频进行关联保存，然后采用语义特征自完善方法提取视频的语义特征。

更加优选地，所述的语义特征自完善方法具体为：视频数据中心根据收到的需要进行检索的语义关键字，构造并行计算程序查询数据库中满足要求的视频段，最后检索出满足要求的视频段并对该视频段打上语义标签，用于完善该段视频的语义特征。

优选地，所述的步骤4具体为：保存该段视频的有用信息，将其压缩为若干帧图像。

优选地，所述的数据库为cassandra数据库，该数据库具有视频检索功能。

更加优选地，所述的数据库包括用于存放视频段的视频列族和用于存放视频段信息和特征的属性列族。

与现有技术相比，本发明具有以下优点：

一、实现视频快速分段：本发明中的存储方法通过基于宏块类型的视频分段方法对视频进行分段，相较于传统的使用背景减法计算视频中的运动量变化来进行分段的方法，基于宏块类型的视频分段方法直接根据视频编码中的运动补偿宏块的个数统计帧的运动量，无需经过大量的计算，大大提高了视频分段的速度。

二、减少视频数据量：本发明为目前正处于探索领域的海底视频监测项目提出了一种专门的稀疏视频存储方案，设计了基于宏块类型的视频快速分段方法，着重保留分段后的关键部分，对空白部分进行了压缩，大大减少了视频数据量。

三、简化视频存储结构：本发明设计了基于cassandra的视频存放策略，该方法打破了传统数据库加文件的视频存储模式限制，将视频稀疏的特性融入到存储设计思想中去，简化了视频的存储结构。

四、提供更好的负载均衡：本发明中的cassandra数据库采用的是一致性哈希算法，视频数据会分散在多台服务器上，相较于传统的hbase数据库，使用cassandra数据库更有利于负载均衡，放置数据倾斜。

五、实现快速检索：本发明中的存储方法在对视频进行特征提取时，采用语义特征自完善方法提取语义特征，该方法可以数据库使用的过程中不断地完善视频段的语义特征，用以实现视频段的快速检索。

附图说明

图1为本发明的流程示意图；

图2为本发明实施例中大数据表的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

本发明涉及一种利用分段和压缩的海底监测视频大数据存储方法，具体步骤如图1所示，包括：

步骤1：视频数据中心接受海岸基站转发来的海底监测视频数据；

步骤2：视频数据中心中的视频处理器对海底监测视频数据进行基于宏块类型的视频分段，获得关键视频和空白视频；

步骤3：对关键视频进行特征提取，具体为：提取视频的图像特征，并将其与该段视频进行关联保存，然后采用语义特征自完善方法提取视频的语义特征。

所述的语义特征自完善方法具体为：

1、视频数据中心根据收到的需要进行检索的语义关键字；

2、构造并行计算程序查询数据库中满足要求的视频段；

3、最后检索出满足要求的视频段并对该视频段打上语义标签；

4、用于完善该段视频的语义特征。

步骤4：对空白视频进行冗余压缩，具体为：为了实现视频的完整播放，并不直接丢弃空白视频段，而是选择大力度地加以压缩，将其中包含背景、起止时间等有用信息保留下来。所以在视频压缩时将一段空白视频压缩为若干帧图像，在视频回放时通过重复回放该帧的形式恢复完整视频。上述若干帧图像采用等间隔的方法获得，本实施例选取三帧图像进行保存，分别为空白视频的头、中和尾部三帧图像，采用三帧重复播放的形式替代原有视频。

以检索“带鱼”为例，首先查询数据库的属性列族中是否有“带鱼”的语义特征，若有，则直接返回相应的视频记录，否则，搜索带鱼相关的底层特征，例如颜色为银白色，形状为条状、带状等，根据底层特征，来对要检索的视频进行过滤，缩小视频的查询范围，然后使用能够对鱼类进行模式识别的深度学习模型并行的对每一条关键视频进行语义特征提取，对符合“带鱼”语义的视频进行打标签处理，并且将“带鱼”这一语义特征写入大数据表的属性列族，同时将视频数据返回给用户。

步骤5：将视频段和特征属性组织为大数据表，存入数据库。

由于海底监测视频在经过分段和压缩后不再是完整的视频文件，而被分割为不同类型、大小不一、数量巨大的视频碎片，加上每段视频相应的元数据和特征属性信息，就形成了典型的半结构化数据。因此实施例选用cassandra大数据库来组织和存储这些视频数据，使用方法是在cassandra中创建一张大数据表，在表中开辟视频图像列族和视频属性列族，使得二者的查询可以基于列独立进行。为支持海量视频数据的检索，将数据表的行键设计为组合时间、地点、摄像源id和视频类型的组合键，支持视频的顺序完整回放和仅回放关键视频数据段两种回放功能。

所述的步骤2具体为：

步骤2-1：以gop为单位提取视频中的b帧和p帧；

步骤2-2：分别计算b帧和p帧中内部编码宏块的数量并求和，记为n；

步骤2-3：设置n的阈值t，判断n是否大于t，若是，则标记该gop为静止状态，否则，标记该gop为运动状态；

所述的阈值t的取值方法具体为：人工选取若干段运动的海底监测视频，计算b帧和p帧中内部编码宏块的数量并求和，记为n1,,n2,...,nk，统计n的正太分布n(μ,σ²)，然后将阈值t设置为μ-2σ，由此获得的阈值在理论上可以保证误差降到2.2％。

步骤2-4：将处于运动状态的gop按规则合并为若干段关键视频；

步骤2-5：将处于静止状态的gop和未合并为关键视频的处于运动状态的gop按规则合并为若干段空白视频。

上述步骤中关键视频中gop的合并规则具体为：每一段关键视频中的gop在时间上相邻，且gop的个数大于预先设置的阈值，本实施例为了避免噪声，将gop个数的阈值设为5；空白视频中gop的合并规则为：每一段空白视频中的gop在时间上相邻。

本实施例中的合并方法可以通过下面的举例体现：例如，对于一段视频，其可以按时间先后划分为标号1～10，其中标号为3～8的gop处于运动状态，标号为1、2、9和10的gop处于静止状态，其中标号3～8的6个处于运动状态的gop满足关键视频合并规则，将其合并为关键视频；标号为1和2以及9和10的gop满足空白视频合并规则，将其合并为空白视频。若处于运动状态的gop不满足合并要求，则不进行合并。

本实施例中的大数据表如图2所示，每一段视频v会被存储到cassandra的一行记录中，行键采用组合键，行键的前面部分可以是视频的拍摄时间、地点等，尾部可以加一个标志位来区分关键视频和稀疏空白视频，这样在查询时可以利用标志位快速过滤稀疏视频段。数据列采用两列族的形式，视频列族存放视频影像的数据，对于关键视频存放的是原始视频段v，对于稀疏空白视频存放的是压缩后的图片帧p，这种混合存储方式可以有效减少原始视频中的空白冗余。对于属性列族，le、lo代表改段视频的时长、地点等信息，而其他属性则根据每一行存储的视频类型灵活添加，如对关键视频添加形状sh、语义se、颜色co等特征，对稀疏空白视频添加相应压缩参数n，这体现了cassandra列的灵活性和允许表稀疏存储的特点。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾国荪;王川;丁春玲
技术所有人：同济大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。