一种基于saliency熵和objectbank特征的图像记忆性判定方法

文档序号:6573782阅读:311来源:国知局
专利名称:一种基于saliency熵和object bank特征的图像记忆性判定方法
技术领域
本发明涉及一种基于saliency熵和object bank特征的图像记忆性判定方法,可以应用于各类可见光图像,判定图像的记忆性数值。
背景技术
图像的记忆性是数字图像处理领域 新的研究方向,它有很多的应用。如编辑可以选择容易被人们记住的图像作为杂志的封面,广告设计者可以选择易被记住的图像作为宣传海报等等。因此,当给定一幅图像,如果能用计算机自动判定出它能否被人们记住将会很有意义。因为图像的记忆性研究是一个较新的研究方向,所以在这一问题的研究上,方法并不是很多。目前存在的一些方法首先提取图像的全局特征(如SIFT,GIST, HOG等),通过构建分类器并训练模型,然后判别一幅给定的图像的记忆性。然而由于图像的记忆性是一个很复杂的问题,用图像的全局特征很难表示这一特性,故目前存在的方法的判定效果较差。因此需要对图像的记忆性进行深入的研究,提出新的图像记忆性判定的方法。

发明内容
要解决的技术问题为了解决现有技术的不足之处,本发明提出一种基于saliency熵和object bank特征的图像记忆性判定方法。本发明的思想在于通过研究表明图像中所包含的物体以及图像对人类视觉吸引的分散程度都会对图像的记忆性产生影响,因此对图像中所包含的物体,我们用objectbank特征来表示,对图像对人类视觉吸引的分散程度,我们用图像的视觉saliency熵来表示。由于这两个模型都对图像的记忆性有很好的表示,因此将两种特征结合,可以取得更好的图像记忆性判定效果。技术方案—种基于saliency熵和object bank特征的图像记忆性的判定方法,其特征在于步骤I :提取每一幅输入图像的object bank特征和计算图像的saliency熵;提取每一幅输入图像的object bank特征,具体的步骤如下步骤a JL^Li-Jia Li在2010年发布的object bank程序包,对每一幅输入图像,利用下采样技术得到输入图像的12个尺度图像,并将这12个尺度图像与object bank程序包中的208个物体模板进行卷积计算,使每幅输入图像得到208 X 12幅响应图像;步骤b :利用二插值方法,将输入图像对应于每个模板的12个尺度的响应图像插值,得到相同尺寸的图像;然后对相同尺寸的图像的每一个像素点,计算其在插值后得到的12个相同尺度的尺度图像上的最大值,构成一个最大响应图像;然后求最大响应图像的像素平均值,得到每幅输入图像的一个208维的特征表示,为输入图像的object bank特征;计算图像的saliency熵首先提取输入图像的saliency图像,然后将得到的
saliency图像二值化得到二值图像;计算二值图像的不连通区域的个数以及其相应的面
积,然后计算图像的saliency熵,计算模型为
权利要求
1.一种基于saliency熵和object bank特征的图像记忆性的判定方法,其特征在于 步骤I :提取每一幅输入图像的object bank特征和计算图像的saliency熵; 提取每一幅输入图像的object bank特征,具体的步骤如下 步骤a:利用Li-Jia Li在2010年发布的object bank程序包,对每一幅输入图像,利用下采样技术得到输入图像的12个尺度图像,并将这12个尺度图像与object bank程序包中的208个物体模板进行卷积计算,使每幅输入图像得到208 X 12幅响应图像; 步骤b :利用二插值方法,将输入图像对应于每个模板的12个尺度的响应图像插值,得到相同尺寸的图像;然后对相同尺寸的图像的每一个像素点,计算其在插值后得到的12个相同尺度的尺度图像上的最大值,构成一个最大响应图像;然后求最大响应图像的像素平均值,得到每幅输入图像的一个208维的特征表示,为输入图像的object bank特征; 计算图像的saliency熵首先提取输入图像的saliency图像,然后将得到的saliency图像二值化得到二值图像;计算二值图像的不连通区域的个数以及其相应的面积,然后计算图像的saliency熵,计算模型为 H =^riIn(I)) I J=1 其中,m是二值图像中不连通区域的个数&是每一不连通区域的面积;S是二值图像的面积A是不连通区域面积与整个图像区域的面积的比出表示二值图像的saliency熵; 步骤2模型训练以给定训练图像的记忆性数值作为训练样本,利用步骤I的方法,提取训练样本中图像的object bank特征以及saliency熵的特征,然后构成一个209维的特征向量,利用训练样本中图像的记忆性数值作为标签,训练得到一个支持向量回归机模型; 步骤3 :对于一幅记忆性数值未知的图像,通过步骤I提取其object bank特征以及saliency熵的特征,然后利用步骤2得到的支持向量回归机模型,判定得到该幅图像的记忆性数值。
2.根据权利要求I所述的一种基于saliency熵和objectbank特征的图像记忆性的判定方法,其特征在于所述二值化的阈值3取值为0. 70、. 80。
全文摘要
一种基于saliency熵和object bank特征的图像记忆性判别方法,通过研究表明图像中所包含的物体以及图像对人类视觉吸引的分散程度都会对图像的记忆性产生影响,因此对图像中所包含的物体,我们用object bank特征来表示,对图像对人类视觉吸引的分散程度,采用图像的视觉saliency熵来表示。由于这两个模型都对图像的记忆性有很好的表示,因此将两种特征结合表示一幅图像,通过训练支持回归向量机模型,对一幅未知可记忆性数值的图像预测其记忆性数值。本发明方法属于计算机图像处理领域,这一技术方案可以用于判定图像的记忆性,能应用于广告业,新闻编辑等行业,可以让从业者挑选出合适的图像,具有广泛的商业价值。
文档编号G06T7/00GK102855630SQ20121029867
公开日2013年1月2日 申请日期2012年8月21日 优先权日2012年8月21日
发明者韩军伟, 陈长远, 王东阳, 郭雷, 程塨 申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1