一种用于数字图像内容识别的特征编码方法

文档序号：6633550阅读：704来源：国知局

一种用于数字图像内容识别的特征编码方法
【专利摘要】本发明公开了一种用于数字图像内容识别的特征编码方法，涉及信号与信息处理【技术领域】，包括：将输入的图像特征序列分割成具有固定长度的特征矢量，利用稀疏编码获得每个特征矢量的稀疏描述；从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引，对索引序列进行二值化处理；构造原子权重直方图并进行二值化处理；合并由原子索引和原子权重直方图所生成的二值序列构成图像哈希。本方法能够将图像特征矢量映射为简短的二值哈希序列，计算复杂度低；且所生成的图像哈希能够抵抗图像处理操作所引入的内容失真，可实现高效、准确的图像内容识别。
【专利说明】一种用于数字图像内容识别的特征编码方法

【技术领域】
[0001] 本发明涉及信号与信息处理【技术领域】，尤其涉及一种用于数字图像内容识别的特征编码方法。

【背景技术】
[0002] 近年来，社交网络的快速发展和低成本图像传感器（如手机内置摄像头）的普及极大程度地丰富了数字图像资源，数字图像的数量呈现出激增的态势。海量的图像资源对高效的查询、索引以及版权管理技术提出了迫切需求，其核心问题是对图像感知内容的识另IJ，而内容识别的基础是对图像感知内容的描述。为了实现准确的内容识别，图像描述符需要具备鲁棒性、区分性和简要性的特点。鲁棒性是指当图像经过处理后（如压缩、滤波和加噪声等），其描述符仍然保持稳定。区分性要求内容不同的数字图像的描述符之间应呈现出显著差异。简要性则要求描述符的数据量尽量小，以降低内容识别中的比对复杂度和描述符存储空间。图像哈希（也称图像指纹）是内容识别中常用的描述符，它能够将图像感知内容用简短的二值序列描述，具有易于比对和存储等优点。图像哈希是对图像特征序列进行编码后的结果，因此对特征的编码是图像哈希中的关键技术。Swaminathan等人计算图像的傅立叶梅林变换系数在极坐标系下的圆周积分，采用文献[1]中提出的自适应量化器将积分结果编码为二元哈希序列[2]。与之类似，文献[3]对图像内显著点的响应进行自适应量化以生成哈希。为了达到鲁棒性和区分性之间的平衡，文献[4]中采用抖动格型矢量量化对特征矢量进行编码。文献[5]利用非负矩阵分解生成图像哈希。
[0003] 发明人在实现本发明的过程中，发现现有技术中至少存在以下缺点和不足：
[0004]现有的特征量化技术所生成的哈希序列数据量偏大。现有技术大多以每个特征量化索引的二进制表示作为哈希，哈希数据量大会增加图像识别的复杂度以及哈希存储空间。此外，现有技术的鲁棒性不强。例如：自适应量化器所生成的哈希是对特征进行标量量化的结果。图像处理操作会导致特征的改变，标量量化器存在对特征扰动敏感的特点，由此导致图像哈希在鲁棒性方面的局限。

【发明内容】

[0005]本发明提供了一种用于数字图像内容识别的特征编码方法，本发明将图像特征编码为简短的二值哈希序列，该哈希序列能够实现对图像感知内容的简要化描述，同时具有良好的鲁棒性和区分性，据此可实现高效、准确的图像内容识别，详见下文描述：
[0006] -种用于数字图像内容识别的特征编码方法，所述方法包括以下步骤：
[0007] (1)将输入的图像特征序列分割成具有固定长度的特征矢量，利用稀疏编码获得每个特征矢量的稀疏描述；
[0008] (2)从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引，对索引序列进行二值化处理；
[0009] (3)构造原子权重直方图并进行二值化处理；
[0010] ⑷合并由原子索引和原子权重直方图所生成的二值序列构成图像哈希。
[0011] 所述从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引，对索引序列进行二值化处理的步骤具体为：
[0012] 在每个特征矢量的稀疏描述Xi中，获取具有最大绝对值的元素所在的位置（即原子索引），收集所有特征矢量所对应的最大权重原子索引，组成集合；将集合中的每个元素与中位数作比较，如果元素大于中位数，输出1，否则输出0,由此获得二值序列。
[0013] 所述构造原子权重直方图并进行二值化处理的步骤具体为：
[0014] 1)统计每个原子在所有稀疏描述中的权重，获取原子权重直方图；
[0015] 2)随机生成Q个随机矢量，对每个随机矢量进行归一化，使其2-范数为1 ;
[0016] 3)将原子权重直方图投影至生成的Q个随机矢量上，计算投影矢量L ;对于投影矢量L求取相应的中位数，将每个元素与中位数相比较，如果大于中位数，则输出1，否则输出 0,经比较后得到二值序列。
[0017] 本发明提供的技术方案的有益效果是：本发明通过对特征矢量进行稀疏编码生成图像哈希。首先，稀疏编码能够以最稀疏的方式对特征矢量进行描述，由此可保证哈希序列的简要性，有利于降低图像识别的复杂度以及哈希存储空间；其次，特征矢量的稀疏描述能够抵御图像处理操作（如压缩、滤波和加噪声等）所引入的失真，由此保证了图像哈希的鲁棒性。此外，本发明程序简单，易于实现，所述的特征编码过程计算复杂度低。在CPU主频为3. 4GHz，内存为3. 2GB的计算机上的测试结果表明，本方法计算单幅尺寸为512X512图像的哈希序列所需的时间为仅为〇. 0235秒，分别较文献[4]和文献[5]中所述算法快18 倍和30倍。综上所述，本发明所生成的图像哈希具有易于比对和数据量小的优点，可以实现高效、准确的图像内容识别。

【专利附图】

【附图说明】
[0018] 图1为对图像特征矢量进行编码的流程图；
[0019] 图2为对图像特征矢量进行编码的不意图。

【具体实施方式】
[0020] 为使本发明的目的、技术方案和优点更加清楚，下面对本发明实施方式作进一步地详细描述。
[0021] 为了实现对图像内容的简要且鲁棒的描述，本发明实施例提出了一种用于图像内容识别的特征编码方法，参见图1和图2,详见下文描述：
[0022] 101 :将输入的图像特征序列分割成具有固定长度的特征矢量，利用稀疏编码获得每个特征矢量的稀疏描述；
[0023] 其中该步骤具体为：
[0024] 1)对输入特征序列V = {Vl，…，vN}进行矢量化，将该特征序列分割成一系列维数为M的特征矢量： yi，i = 1，2,…，N/M。M和N的具体取值根据实际应用中的需要进行设定，本发明实施例对此不做限制。
[0025] 2)对于集合中的每一个特征矢量yi(i = 1，2,…，N/M)，根据稀疏编码字典

【权利要求】
1. 一种用于数字图像内容识别的特征编码方法，其特征在于，所述方法包括以下步骤： (1) 将输入的图像特征序列分割成具有固定长度的特征矢量，利用稀疏编码获得每个特征矢量的稀疏描述； (2) 从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引，对索引序列进行二值化处理； (3) 构造原子权重直方图并进行二值化处理； (4) 合并由原子索引和原子权重直方图所生成的二值序列构成图像哈希。
2. 根据权利要求1所述的一种用于数字图像内容识别的特征编码方法，其特征在于，所述从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引，对索引序列进行二值化处理的步骤具体为：在每个特征矢量的稀疏描述Xi中，获取具有最大绝对值的元素所在的位置，即原子索弓丨，收集所有特征矢量所对应的最大权重原子索引，组成集合；将集合中的每个元素与中位数作比较，如果元素大于中位数，输出1，否则输出0,由此获得二值序列。
3. 根据权利要求1所述的一种用于数字图像内容识别的特征编码方法，其特征在于，所述构造原子权重直方图并进行二值化处理的步骤具体为： 1) 统计每个原子在所有稀疏描述中的权重，获取原子权重直方图； 2) 随机生成Q个随机矢量，对每个随机矢量进行归一化，使其2-范数为1 ; 3) 将原子权重直方图投影至生成的Q个随机矢量上，计算投影矢量L ;对于投影矢量 L求取相应的中位数，将每个元素与中位数相比较，如果大于中位数，则输出1，否则输出0，经比较后得到二值序列。
【文档编号】G06K9/00GK104392207SQ201410628154
【公开日】2015年3月4日申请日期:2014年11月10日优先权日:2014年11月10日
【发明者】李岳楠, 王萍, 苏育挺申请人:天津大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李岳楠;王萍;苏育挺;
技术所有人：天津大学;
我是此专利的发明人

上一篇：一种车辆行驶路径预测方法及系统的制作方法
上一篇：基于水位样本的洪水预报方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。