一种基于集成学习的图像特征编码及识别方法

文档序号:6637289阅读:550来源:国知局
一种基于集成学习的图像特征编码及识别方法
【专利摘要】本发明公开了一种基于集成学习的图像特征编码及识别方法,涉及信号与信息处理【技术领域】,包括:构造训练样本,初始化样本采样概率;根据采样概率选取训练样本,利用采样到的样本训练特征编码函数,对训练样本进行分类;根据分类结果自适应更新训练样本的采样概率;循环上述采样及训练过程,直至满足停止训练条件。本方法所训练得到的特征编码函数可将任意图像特征矢量映射为简短的哈希序列,同时可使哈希之间的距离最大程度地吻合于图像间的感知相似度,具有计算复杂度低的特点。测试结果表明由本发明所生成的图像哈希在图像内容识别中可以表现出较高的识别准确率。
【专利说明】-种基于集成学习的图像特征编码及识别方法

【技术领域】
[0001] 本发明涉及信号与信息处理【技术领域】,尤其涉及一种基于集成学习的图像特征编 码及识别方法。

【背景技术】
[0002] 内容识别是解决图像查询、索引和版权管理问题的核心技术,图像内容识别的目 标是在大型数据库或网络中搜索与待查询图像具有相同感知内容的同源图像。图像内容识 别的前提是对图像的感知内容进行描述。为了降低图像内容识别的复杂度,通常需要将图 像特征编码成简短的描述符。通过比对描述符即可对图像的感知相似性做出判断。为实现 准确的图像内容识别,原始图像和它的同源版本(如原始图像经过有损压缩、滤波和添加 噪声等内容保持失真后的版本)应该具有高度相似的描述符,称之为鲁棒性要求。相反,对 于内容迥异的图像,它们的描述符之间应呈现出显著差异,称之为区分性要求。图像哈希算 法是近年来提出的生成图像描述符的新技术,被广泛用于各类图像内容识别应用中。图像 哈希算法可以将图像特征编码成具有良好鲁棒性和区分性的描述符(即哈希)。现有的图 像哈希算法大多将图像特征进行量化,取特征的量化索引作为描述符。例如,文献[1]中提 出一种自适应量化器,对特征进行随机的非均匀量化,将特征的量化索引作为图像描述符。 在Swaminathan等人提出的算法中,作者用上述自适应量化器将基于傅立叶梅林变换的图 像特征映射为哈希[2]。文献[3]中的图像哈希算法以图像内显著点的响应为特征,利用自 适应量化器将响应量化为哈希。文献[4]提出基于抖动格型矢量量化的特征量化方法,对 特征矢量进行随机抖动及格型矢量量化以生成哈希,该方法可在鲁棒性和区分性之间获得 较好的平衡。此外,一些图像哈希算法通过将特征和阈值做比较来生成二值哈希[5],相当 于对特征的二元量化。
[0003] 发明人在实现本发明的过程中,发现现有技术中至少存在以下缺点和不足:
[0004] 文献所报道的算法大多沿袭数据压缩中的量化方法将图像特征映射至哈希。然而 现有研究表明,特征的量化索引之间的距离难以准确反映出图像感知内容的相似度,由此 影响了图像内容识别的性能。为了克服这一不足,本发明借助集成学习算法从训练样本中 学习最优的特征编码函数,旨在使哈希之间的距离能够与图像感知内容的相似度达到最大 吻合。


【发明内容】

[0005] 本发明提供了一种基于集成学习的图像特征编码及识别方法,本发明提高了图像 识别的准确度,详见下文描述:
[0006] -种基于集成学习的图像特征编码及识别方法,所述方法包括以下步骤:
[0007] 构造训练样本,初始化样本采样概率;
[0008] 根据采样概率选取训练样本,利用采样到的样本训练特征编码函数,对训练样本 进行分类;
[0009] 根据分类结果自适应更新训练样本的采样概率;
[0010] 循环上述采样及训练过程,直至满足停止训练条件。
[0011] 所述根据采样概率选取训练样本,利用采样到的样本训练特征编码函数,对训练 样本进行分类的步骤具体为:
[0012] 1)按照训练样本的采样概率W (Vi), i = 1,2,…,N随机选取P XN个训练样本,其 中0 < p < 1为采样比例;
[0013] 2)利用采样到的样本训练第t个特征编码函数Mt( ·):
[0014] 3)根据2)中所得的编码函数Mt(·)构造分类器ht(·),据此对训练样本进行分

【权利要求】
1. 一种基于集成学习的图像特征编码及识别方法,其特征在于,所述方法包括以下步 骤: 构造训练样本,初始化样本采样概率; 根据采样概率选取训练样本,利用采样到的样本训练特征编码函数,对训练样本进行 分类; 根据分类结果自适应更新训练样本的采样概率; 循环上述采样及训练过程,直至满足停止训练条件。
2. 根据权利要求1所述的一种基于集成学习的图像特征编码及识别方法,其特征在 于,所述根据采样概率选取训练样本,利用采样到的样本训练特征编码函数,对训练样本进 行分类的步骤具体为: 1) 按照训练样本的采样概率W(Vi),i= 1,2,…,N随机选取pXN个训练样本,其中O <P<1为采样比例; 2) 利用采样到的样本训练第t个特征编码函数Mt (·): 3) 根据2)中所得的编码函数Mt (·)构造分类器ht (·),据此对训练样本进行分类;
其中ht (Vi)e{-1,+1}为对训练样本Vi进行分类;逐一将每个训练样本的分类结果MVi)和其真实标签yie{-1,+1}做比对,计算ht( ·)的分类错误率Et:
根据Et计算由Mt( ·)所生成的哈希值在哈希距离比对中权重:
其中ln( ·)表示取自然对数为底的对数运算。
【文档编号】G06T9/00GK104463922SQ201410728955
【公开日】2015年3月25日 申请日期:2014年12月3日 优先权日:2014年12月3日
【发明者】李岳楠, 王萍, 苏育挺 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1