一种立体图像视觉显著提取方法与流程

文档序号:12468659阅读:373来源:国知局
本发明涉及一种图像信号的处理方法,尤其是涉及一种立体图像视觉显著提取方法。
背景技术
:在人类视觉接收与信息处理中,由于大脑资源有限以及外界环境信息重要性区别,因此在处理过程中人脑对外界环境信息并不是一视同仁的,而是表现出选择特征。人们在观看图像或者视频片段时注意力并非均匀分布到图像的每个区域,而是对某些显著区域关注度更高。如何将视频中视觉注意度高的显著区域检测并提取出来是计算机视觉以及基于内容的视频检索领域的一个重要的研究内容。而随着立体视频显示技术和高质量立体视频内容获取技术的快速发展,针对立体图像/视频的显著区域检测及建模也是一个非常重要的研究内容。然而,立体图像并不是平面图像的简单空间拓展,因此人眼感知立体图像产生立体视觉的过程也不是简单的左视点图像和右视点图像叠加的过程,因此,立体视觉特征(例如:三维视觉注意力)并不是平面视觉特性的简单拓展。然而,现有的立体图像显著图提取方法还停留在平面图像显著提取方法的简单拓展上。因此,如何从立体图像中有效地提取出立体视觉特征、如何使得提取出的立体视觉特征符合人眼三维观看行为都是在对立体图像进行视觉显著图提取过程中需要研究解决的问题。技术实现要素:本发明所要解决的技术问题是提供一种立体图像视觉显著提取方法,其符合显著语义特征,且具有较强的提取稳定性和较高的提取准确性。本发明解决上述技术问题所采用的技术方案为:一种立体图像视觉显著提取方法,其特征在于包括以下步骤:①令SRGB表示待提取视觉显著的立体图像,将SRGB的左视点图像记为{LRGB(x,y)},将SRGB的深度图像记为{D(x,y)},其中,1≤x≤W,1≤y≤H,W表示SRGB的宽度,H表示SRGB的高度,LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值;②采用颜色空间变换方法,将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间,得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图,对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)},其中,LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值;③将{D(x,y)}的像素值范围变换到区间[0,255],将变换得到的图像记为{D0,255(x,y)},其中,D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值;④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施log-Gabor低通滤波,对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图,对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},其中,LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值,D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值;⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},获取左视点视觉显著图,记为{Lsaliency(x,y)},将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y),⑥获取SRGB的中心偏好图,记为{Csaliency(x,y)},将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y),其中,e为自然基数,x0和y0对应表示SRGB中的中心像素点的横坐标和纵坐标,δx表示SRGB中的像素点的横坐标的标准差,δy表示SRGB中的像素点的纵坐标的标准差;⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图,记为{S3D,saliency(x,y)},其中,S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值。所述的步骤③中,其中,min()为取最小值函数,max()为取最大值函数。所述的步骤⑦中S3D,saliency(x,y)=Lsaliency(x,y)×Csaliency(x,y)。与现有技术相比,本发明的优点在于:1)本发明方法采用log-Gabor低通滤波器,符合人眼视觉系统对关注物体的检测,使得本发明方法具有较高的提取准确性和较强的稳定性,并能够较好地反映各种因素的显著变化情况,符合显著语义特征。2)本发明方法将深度信息的特征融合到左视点视觉显著图提取之中,提高了立体视觉显著值预测的准确性和稳定性。3)本发明方法同时考虑立体图像的中心偏好图和左视点视觉显著图,并最终融合得到立体图像的视觉显著图,通过这个过程进一步提高了三维视觉显著值的预测准确性和稳定性,从而进一步提高了立体图像的视觉显著图的提取稳定性和提取准确性。附图说明图1为本发明方法的总体实现框图。具体实施方式以下结合附图实施例对本发明作进一步详细描述。本发明提出的一种立体图像视觉显著提取方法,其总体实现框图如图1所示,其包括以下步骤:①令SRGB表示待提取视觉显著的立体图像,将SRGB的左视点图像记为{LRGB(x,y)},将SRGB的右视点图像记为{RRGB(x,y)},将SRGB的深度图像记为{D(x,y)},其中,1≤x≤W,1≤y≤H,W表示SRGB的宽度,H表示SRGB的高度,LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,RRGB(x,y)表示{RRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值。②采用现有的颜色空间变换方法,将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间,得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图,对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)},其中,LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值。③将{D(x,y)}的像素值范围变换到区间[0,255],将变换得到的图像记为{D0,255(x,y)},其中,D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值,,min()为取最小值函数,max()为取最大值函数。④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施现有的log-Gabor低通滤波,对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图,对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},其中,LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值,D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值。⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},获取左视点视觉显著图,记为{Lsaliency(x,y)},将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y),⑥获取SRGB的中心偏好图,记为{Csaliency(x,y)},将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y),其中,e为自然基数,e=2.7182818284…,x0和y0对应表示SRGB中的中心像素点的横坐标和纵坐标,δx表示SRGB中的像素点的横坐标的标准差,δy表示SRGB中的像素点的纵坐标的标准差。在本实施例中,δx=94和δy=94,其中,符号为向上取整符号。⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图,记为{S3D,saliency(x,y)},其中,S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值,S3D,saliency(x,y)=Lsaliency(x,y)×Csaliency(x,y)。为验证本发明方法的可行性和有效性,进行实验。在此,采用法国南特大学提供的三维人眼跟踪数据库(3Deye-trackingdatabase)来分析本发明方法的准确性和稳定性。这里,利用评估视觉显著提取方法的3个常用客观参量作为评价指标,即Pearson相关系数(Pearsonlinearcorrelationcoefficient,PLCC)、Kullback-Leibler散度系数(Kullback-Leiblerdivergence,KLD)、AUC参数(theAreaUnderthereceiveroperatingcharacteristicsCurve,AUC)。利用本发明方法获取法国南特大学提供的三维人眼跟踪数据库中的每幅立体图像的视觉显著图,并与三维人眼跟踪数据库中的每幅立体图像的主观视觉显著图(三维人眼跟踪数据库中存在)进行比较,PLCC和AUC值越高、KLD值越低说明本发明方法提取的视觉显著图与主观视觉显著图的一致性越好。反映本发明方法的显著提取性能的PLCC、KLD和AUC相关指标如表1所列。从表1所列的数据可知,按本发明方法提取得到的视觉显著图与主观视觉显著图的准确性和稳定性是很好的,表明客观提取结果与人眼主观感知的结果较为一致,足以说明本发明方法的可行性和有效性。表1利用本发明方法提取得到的视觉显著图与主观视觉显著图的准确性和稳定性性能指标性能指标值PLCC0.5077KLD0.3449AUC0.7134当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1