一种基于集成学习的图像特征编码及识别方法

文档序号：6637289阅读：550来源：国知局

一种基于集成学习的图像特征编码及识别方法
【专利摘要】本发明公开了一种基于集成学习的图像特征编码及识别方法，涉及信号与信息处理【技术领域】，包括：构造训练样本，初始化样本采样概率；根据采样概率选取训练样本，利用采样到的样本训练特征编码函数，对训练样本进行分类；根据分类结果自适应更新训练样本的采样概率；循环上述采样及训练过程，直至满足停止训练条件。本方法所训练得到的特征编码函数可将任意图像特征矢量映射为简短的哈希序列，同时可使哈希之间的距离最大程度地吻合于图像间的感知相似度，具有计算复杂度低的特点。测试结果表明由本发明所生成的图像哈希在图像内容识别中可以表现出较高的识别准确率。
【专利说明】-种基于集成学习的图像特征编码及识别方法

【技术领域】
[0001] 本发明涉及信号与信息处理【技术领域】，尤其涉及一种基于集成学习的图像特征编码及识别方法。

【背景技术】
[0002] 内容识别是解决图像查询、索引和版权管理问题的核心技术，图像内容识别的目标是在大型数据库或网络中搜索与待查询图像具有相同感知内容的同源图像。图像内容识别的前提是对图像的感知内容进行描述。为了降低图像内容识别的复杂度，通常需要将图像特征编码成简短的描述符。通过比对描述符即可对图像的感知相似性做出判断。为实现准确的图像内容识别，原始图像和它的同源版本（如原始图像经过有损压缩、滤波和添加噪声等内容保持失真后的版本）应该具有高度相似的描述符，称之为鲁棒性要求。相反，对于内容迥异的图像，它们的描述符之间应呈现出显著差异，称之为区分性要求。图像哈希算法是近年来提出的生成图像描述符的新技术，被广泛用于各类图像内容识别应用中。图像哈希算法可以将图像特征编码成具有良好鲁棒性和区分性的描述符（即哈希）。现有的图像哈希算法大多将图像特征进行量化，取特征的量化索引作为描述符。例如，文献[1]中提出一种自适应量化器，对特征进行随机的非均匀量化，将特征的量化索引作为图像描述符。在Swaminathan等人提出的算法中，作者用上述自适应量化器将基于傅立叶梅林变换的图像特征映射为哈希[2]。文献[3]中的图像哈希算法以图像内显著点的响应为特征，利用自适应量化器将响应量化为哈希。文献[4]提出基于抖动格型矢量量化的特征量化方法，对特征矢量进行随机抖动及格型矢量量化以生成哈希，该方法可在鲁棒性和区分性之间获得较好的平衡。此外，一些图像哈希算法通过将特征和阈值做比较来生成二值哈希[5]，相当于对特征的二元量化。
[0003] 发明人在实现本发明的过程中，发现现有技术中至少存在以下缺点和不足：
[0004] 文献所报道的算法大多沿袭数据压缩中的量化方法将图像特征映射至哈希。然而现有研究表明，特征的量化索引之间的距离难以准确反映出图像感知内容的相似度，由此影响了图像内容识别的性能。为了克服这一不足，本发明借助集成学习算法从训练样本中学习最优的特征编码函数，旨在使哈希之间的距离能够与图像感知内容的相似度达到最大吻合。

【发明内容】

[0005] 本发明提供了一种基于集成学习的图像特征编码及识别方法，本发明提高了图像识别的准确度，详见下文描述：
[0006] -种基于集成学习的图像特征编码及识别方法，所述方法包括以下步骤：
[0007] 构造训练样本，初始化样本采样概率；
[0008] 根据采样概率选取训练样本，利用采样到的样本训练特征编码函数，对训练样本进行分类；
[0009] 根据分类结果自适应更新训练样本的采样概率；
[0010] 循环上述采样及训练过程，直至满足停止训练条件。
[0011] 所述根据采样概率选取训练样本，利用采样到的样本训练特征编码函数，对训练样本进行分类的步骤具体为：
[0012] 1)按照训练样本的采样概率W (Vi), i = 1，2,…，N随机选取P XN个训练样本，其中0 < p < 1为采样比例；
[0013] 2)利用采样到的样本训练第t个特征编码函数Mt( ·):
[0014] 3)根据2)中所得的编码函数Mt(·)构造分类器ht(·)，据此对训练样本进行分

【权利要求】
1. 一种基于集成学习的图像特征编码及识别方法，其特征在于，所述方法包括以下步骤：构造训练样本，初始化样本采样概率；根据采样概率选取训练样本，利用采样到的样本训练特征编码函数，对训练样本进行分类；根据分类结果自适应更新训练样本的采样概率；循环上述采样及训练过程，直至满足停止训练条件。
2. 根据权利要求1所述的一种基于集成学习的图像特征编码及识别方法，其特征在于，所述根据采样概率选取训练样本，利用采样到的样本训练特征编码函数，对训练样本进行分类的步骤具体为： 1) 按照训练样本的采样概率W(Vi),i= 1，2,…，N随机选取pXN个训练样本，其中O <P<1为采样比例； 2) 利用采样到的样本训练第t个特征编码函数Mt (·): 3) 根据2)中所得的编码函数Mt (·)构造分类器ht (·)，据此对训练样本进行分类；
其中ht (Vi)e{-1，+1}为对训练样本Vi进行分类；逐一将每个训练样本的分类结果MVi)和其真实标签yie{-1，+1}做比对，计算ht( ·)的分类错误率Et:
根据Et计算由Mt( ·)所生成的哈希值在哈希距离比对中权重：
其中ln( ·)表示取自然对数为底的对数运算。
【文档编号】G06T9/00GK104463922SQ201410728955
【公开日】2015年3月25日申请日期:2014年12月3日优先权日:2014年12月3日
【发明者】李岳楠, 王萍, 苏育挺申请人:天津大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李岳楠;王萍;苏育挺;
技术所有人：天津大学;
我是此专利的发明人

上一篇：一种流式数据细胞亚群快速自动识别方法
上一篇：基于城市路径交叉搜索模型的停车管理系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。