一种多层稀疏编码特征的鸟类图像识别方法_2

文档序号:9866193阅读:来源:国知局
dist(yi,dN)]T/〇),而dist(yi,dj)是yi与dj的欧式距离,?表示矩阵点 乘,σ为权重(本实施例设定其为0.1),λ,β是平衡两种约束的权重系数(本实施例设定λ为 0.01,β为0.003)。由于设及到X和D的两个变量的求解,为此采用迭代优化的方法实施。
[0056] S1.2.2计算输入信号像素矩阵集Υ的编码系数X,因此公式(1)中的第二项可W略 去,得到的新目标函数如式(2)所示,其解析解如式(3)所示;
[0060] S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,通过移 除式(1)中的常量部分,目标函数(1)更新为:
[0061]
[006^ s.t. I |dm| k = l
[0063] 其中而是X的第m行的向量,
是矩阵关于第m个单词的残差,字典总 个数为是X中的(m,i)元素,若而*〇则Smi = l,否则Smi = 0。为了求解式(4),可W发现 其中第Ξ个约束项的0<e邱(2diSt (yi,dm)/〇)< 1,0 < |兩。'I < 1 >两者的乘积使得第Ξ项几乎 为0,所W可W将运一项略去;从另一个角度来看,运一项实际上的意义是引入编码过程中 的局部约束,而在字典跟新中保持运一项仅是使求解出来的dm更靠近训练样本,运种情况 不是必要的。
[0064] S1.2.3不断地迭代实现步骤S1.2.1~S1.2.2;直到每次迭代运行的字典D不再改 变;
[0065] SI.3利用SI. 1得到的字典,采用多层稀疏编码对鸟类训练图像进行稀疏编码稀疏 计算,得到稀疏编码特征输出,如图2所示:
[0066] 在第一层稀疏编码中,将训练图像均匀分成16x16或者32x32两种大小,分别在运 两种图像大小的块中,利用S1.1得到的字典,进行稀疏编码稀疏计算,得到第一层的稀疏编 码系数,利用2*2大小的最大化抽取方式获取第一层稀疏编码的特征输出;
[0067] 将第一层稀疏编码的特征输出作为第二层稀疏编码的输入,在第二层稀疏编码 中,将第一层的稀疏编码的特征输出展成二维矩阵,并将其均匀分成8*8大小后,利用S1.1 得到的字典,进行稀疏编码稀疏计算,得到第二层的稀疏编码系数;利用2*2大小的最大化 抽取方式获取第二层稀疏编码的特征输出;
[0068] 将第一层的特征输出和第二层的特征输出都进行空间分层采样,得到最终的稀疏 编码特征输出;空间分层采样的处理过程就是将图像均分成2*2和4*4的子图区域,然后在 整图、1/2子图区域和1/4子图区域内,统计各个区域的特征输出的直方图,然后将各个区域 的特征输出直方图进行级联,得到最终的稀疏编码特征输出。
[0069] S1.4分类器训练
[0070] 将步骤S1.3所得的稀疏编码特征输出送入线性支持矢量机分类器(支持矢量机分 类器原理可W参考文献化ang,化:ih-化ung; Lin,化ih-Jen, 2011,LIBSVM:A 1 ibrary for support vector machines,ACM Transactions on Intelligent Systems and Technology),得到不同类别鸟类之间的最大分类平面模型;
[0071] S2测试过程
[0072] 对测试图像,采用步骤S1.3的方法得到稀疏编码特征输出,送入S1.4的分类器所 得的鸟类不同类别之间的最大分类平面模型,判断当前测试图像对应的鸟类类别输出。
[0073] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的 限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化, 均应为等效的置换方式,都包含在本发明的保护范围之内。
【主权项】
1. 一种多层稀疏编码特征的鸟类图像识别方法,其特征在于,包括以下步骤: S1训练过程 S1.1收集各种鸟类训练图像,组成鸟类训练数据集; S1.2字典学习 SI.2.1设定字典学习的目标函数为:⑴ 其中Y为图像块的像素矩阵集,是像素矩阵集Y中第i个图像块的像素矩阵;D是需学习 的字典,字典个数为N,字典元素为di和dj;X是字典的权重系数,其元素为xi; 是F范 F 数Wist(yi,山)是71与山的欧式距离,?表示矩阵 点乘,σ为权重,λ,β是平衡两种约束的权重系数; S1.2.2计算输入信号像素矩阵集Υ的编码系数X,得到的新目标函数如式(2)所示,其解 析解如式(3)所示;(2) …r , (3) S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,目标函数 (1)更新为:(4) " ^ y-v.ir-m J \ ~τ y S.t. I I dm I I 2=1 其中4是乂第m行的向量,l = 是像素矩阵集Y关于第m个单词的残差;N是字 典总个数; S1.2.3不断地迭代实现步骤SI. 2.1~S1.2.2;直到每次迭代运行的字典D不再改变; S1.3利用S1.1得到的字典,采用多层稀疏编码对鸟类训练图像进行稀疏编码稀疏计 算,得到稀疏编码特征输出; S1.4分类器训练 将步骤S1.3所得的稀疏编码特征输出送入线性支持矢量机分类器,得到不同类别鸟类 之间的最大分类平面模型; S2测试过程 对测试图像,采用步骤SI. 3的方法得到稀疏编码特征输出,送入SI.4的分类器所得的 鸟类不同类别之间的最大分类平面模型,判断当前测试图像对应的鸟类类别输出。2. 根据权利要求1所述的多层稀疏编码特征的鸟类图像识别方法,其特征在于,所述多 层稀疏编码具体为两层稀疏编码,步骤如下: 在第一层稀疏编码中,将训练图像均匀分成16x16或者32x32两种大小,分别在这两种 大小的图像块中,利用S1.1得到的字典,进行稀疏编码稀疏计算,得到第一层的稀疏编码系 数,获取第一层稀疏编码的特征输出; 将第一层稀疏编码的特征输出作为第二层稀疏编码的输入,在第二层稀疏编码中,将 第一层的稀疏编码的特征输出展成二维矩阵,并将其均匀分成8*8大小后,利用S1.1得到的 字典,进行稀疏编码稀疏计算,得到第二层的稀疏编码系数;获取第二层稀疏编码的特征输 出; 将第一层的特征输出和第二层的特征输出进行级联,得到最终的稀疏编码特征输出。3. 根据权利要求2所述的多层稀疏编码特征的鸟类图像识别方法,其特征在于,所述获 取第一层稀疏编码的特征输出,具体为: 利用2*2大小的最大化抽取方式获取第一层稀疏编码的特征输出。4. 根据权利要求3所述的多层稀疏编码特征的鸟类图像识别方法,其特征在于,所述获 取第二层稀疏编码的特征输出,具体为: 利用2*2大小的最大化抽取方式获取第二层稀疏编码的特征输出。5. 根据权利要求2所述的多层稀疏编码特征的鸟类图像识别方法,其特征在于,所述将 第一层的特征输出和第二层的特征输出进行级联,得到最终的稀疏编码特征输出,具体为: 将第一层的特征输出和第二层的特征输出都进行空间分层采样,得到最终的稀疏编码 特征输出;空间分层采样的处理过程具体为:将图像均分成2*2和4*4的子图区域,然后在整 图、1/2子图区域和1/4子图区域内,统计各个区域的特征输出的直方图,然后将各个区域的 特征输出直方图进行级联,得到最终的稀疏编码特征输出。
【专利摘要】本发明公开了一种多层稀疏编码特征的鸟类图像识别方法,首先在局部图像块的R,G,B三通道上利用级联多层稀疏编码结构提取稀疏编码特征,每层稀疏编码结构都包含特征编码部分和特征最大值抽取两部分;然后在输出特征上,多层稀疏编码特征使用线性核进行融合,并使用SVM作为分类器进行分类判决。在多层稀疏编码结构中,在优化目标函数中加入了一个局部约束项,在特征编码部分迭代地使用所求得目标函数的近似解进行稀疏编码,然后使用这些编码值最小化重构误差,更新字典。本发明的多层稀疏编码特征的鸟类图像识别方法,能极大提高系统对于鸟类图像的识别精度。
【IPC分类】G06K9/62
【公开号】CN105631469
【申请号】CN201510964442
【发明人】郭礼华
【申请人】华南理工大学
【公开日】2016年6月1日
【申请日】2015年12月18日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1