一种应用于视频对象检索的对象标志位高效编码方法

文档序号：7800452阅读：150来源：国知局

一种应用于视频对象检索的对象标志位高效编码方法
【专利摘要】本发明公开了一种应用于视频对象快速浏览的对象标志位高效编码的方法，该方法基于对象区域信息、语义信息生成对象标志位来存储监控视频。首先根据视频对象分割结果，公开了一种基于区域生长的帧内对象区域标记位与基于运动估计的帧间对象区域标志位编码方案。提出一种基于对象细节描述的新的码流格式，将提取视频对象的语义信息一并写入码流进行存储。本发明将高复杂度的视频分析转移到监控前端，通过前端分析描述、标记视频对象，进一步基于H.264帧内、帧间的编码特性对标志位进行编码，通过减少对象标志位编码代价从而降低了监控视频的存储代价，为监控后端基于标志位高效率地获得感兴趣对象信息成为可能。
【专利说明】一种应用于视频对象检索的对象标志位高效编码方法
【【技术领域】】
[0001]本发明涉及对象形状、语义编码与视频存储领域，特别涉及一种基于对象细节描述的对象标志位高效编码方法。
【【背景技术】】
[0002]近些年数字视频监控得到了学术界和工业界的广泛关注，并对监控视频存储及其应用展开了深入研究。监控视频的显著特征是场景相对固定，许多研究工作基于这样的特点展开，其中主要包括监控视频高效存储于快速浏览技术。
[0003]视频快速浏览技术主要包括视频摘要与视频检索技术。视频摘要又称视频浓缩，是对视频内容的一个简单概括，以自动或半自动的方式，先通过运动目标分析，提取运动目标，然后对各个目标的运动轨迹进行分析，将不同的目标拼接到一个共同的背景场景中，并将它们以某种方式进行组合。一方面，这样的拼接组合方式一定程度上会出现对象重叠，不能深度透析每个感兴趣的对象；另一方面，视频摘要需要进行非常复杂的视频分析过程，监控后端的处理能力有限一般不能满足海量视频处理的需要。而传统的视频、图像检索技术是从大量的视频数据中找到所需的视频片段或图片，根据所给样例或是特征描述，系统自动的找到所匹配的视频片段点，通常适用于在新闻中检索感兴趣的事件、电影中检索喜欢的情节、体育节目中检索喜爱的体育运动等。
[0004]在监控视频应用当中，当监控人员只关心某一特征对象时，如何能整个监控视频的此类特征对象短时间内呈现出来，针对后端处理能力有限的问题，能不能将高复杂度的视频分析过程放在前端，存储包含视频分析内容的监控视频，后端监控人员直接按需获取感兴趣对象的视频？从用户角度讲，通过什么样的技术手段来大大减少了浏览用户不感兴趣视频对象的时间从而实现视频的快速浏览；从系统实现角度讲，通过什么样的技术手段减轻后端处理器的任务将复杂度转移到前端？本发明旨在为上述技`术难题提供一种解决方案。
【
【发明内容】
】
[0005]首先根据视频对象分割结果，公开了一种基于区域生长的帧内对象区域标记位与基于运动估计的帧间对象区域标志位编码方案。提出一种基于对象细节描述的新的码流格式，将提取视频对象的语义信息一并写入码流进行存储。本发明将高复杂度的视频分析转移到监控前端，通过前端分析描述、标记视频对象，进一步基于H.264帧内、帧间的编码特性对标志位进行编码，通过减少对象标志位编码代价从而降低了监控视频的存储代价，为监控后端基于标志位高效率地获得感兴趣对象信息成为可能。
[0006]通过对象标志位准确地描述对象区域信息等相关语义信息并进行高效存储，解码端根据用户感兴趣的对象信息解码出检索视频，大大了删减视频的冗余内容，从而基于用户感兴趣信息对海量监控视频进行快速浏览。对象标志位主要描述对象区域信息与对象语义信息，而语义信息不仅包括颜色、纹理、形状、等低层语义信息，而且包括对象类别、行为特征等等高层语义信息。本发明旨在说明一种应用于视频检索的基于对象标志位的编码框架，故以对象颜色标志位作为对象语义信息为例做分析说明。
[0007]为了实现本发明的目的，根据本发明的一个方面，本发明通过改变帧内对象区域块划分扫描方式，进一步基于运动估计、运动补偿引入对象区域标志位帧间编码技术。
[0008]I)基于区域生长的区域标志位帧内编码:
[0009]根据权利要求2，对象外接矩形框将运动对象进行标记，并采用压缩域块划分信息将矩形框内的宏块进行划分，这些子块可以表示为Ri = Isb1, sb2, -Sb1J，子块的中心坐标表示为集合Ce = {sbc1; sbc2,…sbcN}。以矩形框中心(对象中心)为坐标原点设定水平、垂直坐标轴。采用归一化各个子块中心到矩形框中心距离:
【权利要求】
1.一种基于对象标志位高效编码技术的视频对象快速浏览框架，其特征在于，所述方法包括: 基于H.264视频编码框架对原始视频编码的同时进行视频分析；基于视频分析结果相关的对象区域信息、语义信息设定对象标志位；基于区域生长的帧内对象区域标记位编码算法，能无损编码帧内标志位；基于运动估计、1/4像素精度运动补偿的帧间对象区域标志位编码方案，提高帧间标志位编码性能；基于对象标志位存储或传输一种应用于视频检索的监控视频。
2.根据权利要求1所述的基于区域生长的帧内对象区域标记位编码算法，根据视频分析的对象外接矩形框进行运动对象标记，采用压缩域块划分信息将矩形框内的宏块进行划分: 子块表示为Ri = {sb1； sb2,...sbN},子块的中心坐标表示为集合Ce = {sbc1； sbc2,...sbcN}。以矩形框中心(对象中心)为坐标原点设定水平、垂直坐标轴。采用归一化各个子块中心到矩形框中心距离:
3.根据权利要求1所述的基于运动估计、1/4像素精度运动补偿的帧间对象区域标志位编码算法，先对每个子块的像素点进行标记: 待标记当前块smb中所有像素点基于1/4像素精度进行帧间预编码，将参考帧中运动对象的外接矩形框中的子块分为三类:前景区域(F)、背景区域(B)、边界区域(C)，接下来根据运动矢量MV(mvx，mvy)进行预测，预测策略如下:
4.根据权利要求3所述对每个子块的像素点标记后，判定每个子块的标志位:
5.根据权利要求1所述，基于对象标志位存储或传输一种应用于视频检索的监控视频: 首先提取运动对象的RGB颜色模型，经过一种线性变换得到HSV颜色空间模型，对转换后的HSV模型进行颜色量化，将h，s，V三个分量按人眼颜色感知进行非等间隔的量化，通过对HSV颜色模型的大量分析及比较，本文将色调h划分成7份，饱和度s分成3份，亮度V分成3份，根据色彩的不同范围进行量化，量化后的色调、饱和度和亮度值分别为H，S，V:
【文档编号】H04N19/186GK103873864SQ201410126655
【公开日】2014年6月18日申请日期:2014年3月31日优先权日:2014年3月31日
【发明者】梁久祯, 王小龙申请人:江南大学

完整全部详细技术资料下载

上一篇：浏览器中下载文件的发送方法和浏览器装置制造方法
上一篇：一种基于本地文件的评论和互动系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。