基于关注度的目标物三维重建方法

文档序号：6337723阅读：408来源：国知局

专利名称：基于关注度的目标物三维重建方法
基于关注度的目标物三维重建方法技术领域
本发明属于计算机视觉，图像处理和多媒体分析技术领域，涉及基于关注度的目标物三维重建方法。
背景技术：
随着数字图像的发展，高质量的视频变得更加丰富。由于基于视频的三维重建通过使用丰富的视频数据，可以提高集合精度和视觉质量，因此成为一个很流行的研究课题，在计算机视觉，图像处理和多媒体分析。
一般来说，基于视频/图像的三维重建系统可以分为两类基于非标定的系统和基于自标定的系统。基于非标定的系统需要图像和摄像机参数来进行三维重建，例如基于块的多视立体方法(PMVS)，它通过增强局部光学一致性和全局视觉约束来恢复物体或者场景的三维结构。基于自标定的系统首先通过摄像机自标定算法估计摄像机参数然后再恢复三维点云。但是，当前的方法只提供整体场景的三维重建，而我们往往只关注那些吸引我们注意力的区域。这样的方法浪费了太多的计算量在重建那些非感兴趣区域，而且三维模型不能突出那些感兴趣区域。
人们往往关注与那些视觉显著的区域，而视觉关注度分析可以获得视觉显著区域。视觉关注度分析已经被学习和广泛的应用于计算机视觉，人工智能和多媒体处理。大部分先前的工作集中于静态图像的分析，主要使用静态信息。当前，视频关注度分析吸引了更多的关注。主要方法有结合静态和位置显著度图来获得关键帧中的感兴趣区域。除了静态和位置关注度，动态关注度同样引起了人们的注意，并且广泛的应用于基于时空信息的关注区域检测。有很多方法可以用来获得运动向量，例如光流法。但是，在运动摄像机条件下的运动向量的估计仍然是一个挑战性的问题，而且仅仅从观看者的角度分析动态关注度是不够的。发明内容
为了解决现有技术三维重建的精确度不能令人满意的问题，本发明的目的是提出了一个时空关注度区域检测的方法来增强基于视频的三维重建，为此提供一种基于关注度的目标物三维重建方法。
为达到上述目的，本发明提供的基于关注度的目标物三维重建方法的技术方案包括通过分析视频帧中的感兴趣区域来提高三维重建的效果并加快三维重建的速度，包括步骤如下
步骤Sl 将用于三维重建的视频分割为视频帧，并从静态、位置和动态三个方面来分析视频帧中的视觉关注度分布，并获得其对应的静态、位置和动态显著度图；融合静态、位置和动态三方面分析的显著度图以得到每个视频帧的基于视频的显著度图，显著度图所描述的显著区域为三维重建中的感兴趣区域；
步骤S2 利用概要性全局特征来聚类所有的视频帧，并根据每个视频帧产生的显4著度图选出一个候选的关键帧集合，最终通过几何约束和视觉约束分析，提取用于三维重建的视频关键帧；
步骤S3 使用视频关键帧和其相对应的显著度图，仅对视频帧中的显著区域进行三维重建，以得到在感兴趣区域上的精确的三维模型并加快重建速度。
其中，所述分析视频的视觉关注度包括静态关注度分析、位置关注度分析、动态关注度分析和关注度融合；
对于每个视频帧，使用基于对比和基于信息论相结合的方法进行静态关注度分析，得到静态显著度对于每个视频帧，从水平、垂直和放射三个方面描述摄像机的运动使用完整模板匹配进行位置关注度分析，得到位置显著度对于相邻视频帧，从视频观众和视频拍摄者两个方面进行动态关注度分析，得到相邻两帧中前帧的动态显著度对于得到的每个视频帧的静态显著度图、位置显著度图和动态显著度图，使用动态融合的方式进行关注度融合，根据静态显著度图和动态显著度图的均值之间的关系来计算融合时各自的权重，并最终得到每个视频帧的融合后的视觉显著度图。
其中，所述提取用于三维重建的视频关键帧的步骤包括如下
步骤S21 先用概要性全局特征描述符聚类所有的帧到k个聚类类别；
步骤S22 对于每一个聚类类别，通过计算这个类别中所有显著度图的均值来获得这个类别的类显著度步骤S23 计算每个聚类中帧的显著度图和类显著度图之间的距离，并从每个聚类类别中选出与类显著度图距离最小的10%的图像作为候选关键帧集合；
步骤S24 将来自候选关键帧集合中的任意k个帧构成一个帧组合，如果他们来自不同的类别，根据几何约束和视觉约束排序所有的帧组合并最终决定关键帧组合。
其中，所述仅对视频帧中的显著区域进行三维重建的步骤如下
步骤S31 用由运动恢复结构的方法自动的恢复关键帧的摄像机参数；然后，在每个关键帧中用高斯差分和哈里斯检测子来检测角点；对每个关键帧的感兴趣区域由视觉显著度的值来描述；通过帧显著度图，删除检测出来的分布在感兴趣区域之外的特征；最后，分布在感兴趣区域内的特征被提供去恢复三维信息；
步骤S32 使用两幅图像之间的极限约束对分布在感兴趣区域内的图片特征进行特征匹配，从而在显著区域中形成稀疏的块分布，得到初始匹配块，
步骤S33 重复η次对初始匹配块向周围进行扩散膨胀，并且得到稠密的块分布；
步骤S34 根据视觉约束，对稠密的块分布重复η次消除匹配错误的块，实现关注度增强的三维重建。
本发明的有益效果本发明通过对每个视频帧进行视觉关注度分析，在每个视频帧中得到了较为精确的感兴趣区域，并通过对视频帧的基于全局特征的聚类以及基于视觉约束和几何约束的视频关键帧提取，来得到有利于三维重建视频关键帧和视频帧中的感兴趣区域。对视频关键帧中的感兴趣区域中的特征进行三维重建，得到了精确的三维重建结果，并提高了三维重建的速度。
本发明在真实环境中的室内和室外的实验，证明了本发明的方法有更高的精确度和更高的计算效率。

图1本发明基于视觉关注度的目标物三维重建框架图
图2是描述在室内环境下的视觉关注度分析结果。
图3是描述在室外环境下视觉关注度分析的结果。
图4是室内环境下视频关键帧提取结果。
图5是室外环境下视频关键帧提取结果。
图6是室内场景重建的例子。
图7是室外场景重建的例子。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。
考虑到视觉关注度分析在感兴趣区域检测上的广泛应用，本发明提出了一个时空关注度区域检测的方法来增强基于视频的三维重建。本发明的方法适应基于视频的三维重建的特性未知的摄像机运动和视频中某些物体的突然出现(例如飞鸟，行人，路过的车辆等)。通过与传统的三维重建方法比较，本发明的方法可以获得更准确的三维模型和较低的运算消耗。本发明中所使用计算机均在Windows XP操作系统下，硬件设备条件为处理器: 酷睿双核2. 2G，内存2G。本发明的结构图在图1中显示基于视觉关注度的目标物三维重建框架图，包括三部分1)基于视频的视觉关注度分析，幻视频关键帧提取，幻关注区域增强的视频三维重建，其中
1基于视频的视觉关注度分析
基于视频的视觉关注度分析主要包括四部分静态关注度分析、位置关注度分析、动态关注度分析和关注度融合。其中，静态关注度分析主要是针对视频帧中能够引起人们视觉关注的静态的物体的分析；位置关注度分析主要是针对视频帧中，由位置引起的视觉关注的分析，并且视觉关注的位置也随着摄像机的变化而转移；动态关注度分析主要是针对相邻视频帧中，运动的物体能够引起视觉关注的分析，通过对视频帧中每个像素点的运动强度分析，获得能够引起视觉关注的动态显著度图；分别从静态、位置和动态三个方面分析视觉关注之后，本发明融合三方面分析的结果，得到最终的视觉关注分析。
1. 1静态关注度分析
静态物体可以吸引人们的关注，这就是所谓的静态关注度。基于反差的关注度分析引入中心环绕结构的概念来提供人类视觉系统(HVS)以特征反差。基于信息论的方法依靠于这样的前提视觉关注的完全依靠于最大化的信息采样。反差和信息采样是计算显著度的两个因素。本发明融合基于反差的方法和基于信息论的方法来计算静态显著度图，如公式⑴
Mapstatic (X，y) = Con (x, y) X ID (χ, y)(1)
这里在点(X，y)处的静态显著度值为Mapstati。(x，y)，归一化之后的反差特征为 Con (x, y)和信息特征为ID (X，y)。6
1. 2位置关注度分析
本发明从水平(H)、垂直(V)和放射(R)三个方面描述摄像机的运动使用整体模板匹配(Integral Template Matching)技术。应用水平(H)、垂直(V)和放射(R) 3参数的模型，用一下三个公式计算摄像机在水平MapH(i，j)、垂直Mapv(i，j)和放射MapK(i，j)三个方向的运动强度，如公式0-4)
权利要求
1.一种基于关注度的目标物三维重建方法，其特征在于，通过分析视频帧中的感兴趣区域来提高三维重建的效果并加快三维重建的速度，包括步骤如下步骤Sl 将用于三维重建的视频分割为视频帧，并从静态、位置和动态三个方面来分析视频帧中的视觉关注度分布，并获得其对应的静态、位置和动态显著度图；融合静态、位置和动态三方面分析的显著度图以得到每个视频帧的基于视频的显著度图，显著度图所描述的显著区域为三维重建中的感兴趣区域；步骤S2 利用概要性全局特征来聚类所有的视频帧，并根据每个视频帧产生的显著度图选出一个候选的关键帧集合，最终通过几何约束和视觉约束分析，提取用于三维重建的视频关键帧；步骤S3 使用视频关键帧和其相对应的显著度图，仅对视频帧中的显著区域进行三维重建，以得到在感兴趣区域上的精确的三维模型并加快重建速度。
2.根据权利要求1所述的基于关注度的目标物三维重建方法，其特征在于，所述分析视频的视觉关注度包括静态关注度分析、位置关注度分析、动态关注度分析和关注度融合；对于每个视频帧，使用基于对比和基于信息论相结合的方法进行静态关注度分析，得到静态显著度图；对于每个视频帧，从水平、垂直和放射三个方面描述摄像机的运动使用完整模板匹配进行位置关注度分析，得到位置显著度图；对于相邻视频帧，从视频观众和视频拍摄者两个方面进行动态关注度分析，得到相邻两帧中前帧的动态显著度图；对于得到的每个视频帧的静态显著度图、位置显著度图和动态显著度图，使用动态融合的方式进行关注度融合，根据静态显著度图和动态显著度图的均值之间的关系来计算融合时各自的权重，并最终得到每个视频帧的融合后的视觉显著度图。
3.根据权利要求1所述的基于关注度的目标物三维重建方法，其特征在于，所述提取用于三维重建的视频关键帧的步骤包括如下步骤S21 先用概要性全局特征描述符聚类所有的帧到k个聚类类别；步骤S22 对于每一个聚类类别，通过计算这个类别中所有显著度图的均值来获得这个类别的类显著度图；步骤S23 计算每个聚类中帧的显著度图和类显著度图之间的距离，并从每个聚类类别中选出与类显著度图距离最小的10%的图像作为候选关键帧集合；步骤S24 将来自候选关键帧集合中的任意k个帧构成一个帧组合，如果他们来自不同的类别，根据几何约束和视觉约束排序所有的帧组合并最终决定关键帧组合。
4.根据权利要求1所述的基于关注度的目标物三维重建方法，其特征在于，所述仅对视频帧中的显著区域进行三维重建的步骤如下步骤S31 用由运动恢复结构的方法自动的恢复关键帧的摄像机参数；然后，在每个关键帧中用高斯差分和哈里斯检测子来检测角点；对每个关键帧的感兴趣区域由视觉显著度的值来描述；通过帧显著度图，删除检测出来的分布在感兴趣区域之外的特征；最后，分布在感兴趣区域内的特征被提供去恢复三维信息；步骤S32 使用两幅图像之间的极限约束对分布在感兴趣区域内的图片特征进行特征匹配，从而在显著区域中形成稀疏的块分布，得到初始匹配块；步骤S33 重复η次对初始匹配块向周围进行扩散膨胀，并且得到稠密的块分布；步骤S34 根据视觉约束，对稠密的块分布重复η次消除匹配错误的块，实现关注度增强的三维重建。
全文摘要
本发明基于关注度的目标物的三维重建方法，包括步骤S1将用于三维重建的视频分割为视频帧，并从静态、位置和动态分析视频帧中的视觉关注度分布，并获得其对应的静态、位置和动态显著度图；融合静态、位置和动态分析的显著度图以得到每个视频帧的基于视频的显著度图，显著度图所描述的显著区域为三维重建中的感兴趣区域；步骤S2利用概要性全局特征来聚类所有的视频帧，并根据每个视频帧产生的显著度图选出一个候选的关键帧集合，最终通过几何约束和视觉约束分析，提取用于三维重建的视频关键帧；步骤S3使用视频关键帧和其相对应的显著度图，仅对视频帧中的显著区域进行三维重建，以得到在感兴趣区域上的精确的三维模型并加快重建速度。
文档编号G06T17/00GK102034267SQ20101057427
公开日2011年4月27日申请日期2010年11月30日优先权日2010年11月30日
发明者徐常胜, 肖宪申请人:中国科学院自动化研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐常胜;肖宪
技术所有人：中国科学院自动化研究所
我是此专利的发明人

上一篇：电子商务网络中基于行为收益模式的共谋团体识别方法
上一篇：提供者管理方法以及提供者管理系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。