一种多层稀疏编码特征的鸟类图像识别方法

文档序号:9866193阅读:598来源:国知局
一种多层稀疏编码特征的鸟类图像识别方法
【技术领域】
[0001] 本发明设及图像识别领域,特别设及一种多层稀疏编码特征的鸟类图像识别方 法。
【背景技术】
[0002] 目前已有一些鸟类识别的专利,但是对于鸟类图像进行识别的专利并未发现。在 鸟类识别方面,如专利2009102108999提供基于声像一体化野生鸟类识别技术的远程无线 监测系统,其用于远程生态监测,所述系统包括鸣声录制模块、视频录制模块、音视频数据 处理模块、音视频流传输模块和音视频数字文件存储模块。专利2013105810072提供一种基 于鸟鸣声的移动式鸟类识别方法,该专利通过LabVIEW软件对采集的鸟鸣声信号进行预处 理,并通过LabVIEW和MATLAB软件混合编程的A0K时频分析方法处理预处理之后的鸟鸣声信 号,最后通过MA化AB软件处理A0即寸频谱图,实现特征值的提取。将已知鸟种的鸟的特征值 经模型训练生成训练模板并进行数据存储,将待识别鸟种的鸟的特征值经模型训练生成测 试模板,结合DTW算法将测试模板与训练模板进行匹配来实现鸟类的识别。在实际生活中, 用户更常用手机对鸟类拍照等方式来进行记录和识别。为此急需一种基于鸟类图像的识别 方法。

【发明内容】

[0003] 为了克服现有技术的上述缺点与不足,本发明的目的在于一种多层稀疏编码特征 的鸟类图像识别方法,对于鸟类图像的识别精度高。
[0004] 本发明的目的通过W下技术方案实现:
[0005] -种多层稀疏编码特征的鸟类图像识别方法,包括W下步骤:
[0006] S1训练过程
[0007] S1.1收集各种鸟类训练图像,组成鸟类训练数据集;
[000引 S1.2字典学习
[0009] S1.2.1设定字典学习的目标函数为:
[001^ 其中Y为图像块的像素矩阵集,yi是像素矩阵集Y中第i个图像块的像素矩阵;D是 需学习的字典,字典个数为N,字典元素为di和dj; X是字典的权重系数,其元素为xi;
是F范数,ei = e邱([dist(yi,di), . . . ,dist(yi,dN)]T/〇),而dist(yi,dj)是yi与dj的欧式距 离,?表示矩阵点乘,σ为权重,λ, β是平衡两种约束的权重系数;
[OOK] S1.2.2计算输入信号像素矩阵集Υ的编码系数X,得到的新目标函数如式(2)所示, 其解析解如式(3)所示;
[0017] S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,目标函 数(1)更新为:
[001 引
(4)
[0019] s.t. I |dm| k = l
[0020] 其中而是乂第m行的向量
是像素矩阵集Y关于第m个单词的残差;N 是字典总个数;
[0021] S1.2.3不断地迭代实现步骤S1.2.1~S1.2.2;直到每次迭代运行的字典D不再改 变;
[0022] S1.3利用S1.1得到的字典,采用多层稀疏编码对鸟类训练图像进行稀疏编码稀疏 计算,得到稀疏编码特征输出;
[0023] S1.4分类器训练
[0024] 将步骤S1.3所得的稀疏编码特征输出送入线性支持矢量机分类器,得到不同类别 鸟类之间的最大分类平面模型;
[00巧]S2测试过程
[0026] 对测试图像,采用步骤S1.3的方法得到稀疏编码特征输出,送入S1.4的分类器所 得的鸟类不同类别之间的最大分类平面模型,判断当前测试图像对应的鸟类类别输出。
[0027] 所述多层稀疏编码具体为两层稀疏编码,步骤如下:
[00%]在第一层稀疏编码中,将训练图像均匀分成16x16或者32x32两种大小,分别在运 两种大小的图像块中,利用S1.1得到的字典,进行稀疏编码稀疏计算,得到第一层的稀疏编 码系数,获取第一层稀疏编码的特征输出;
[0029] 将第一层稀疏编码的特征输出作为第二层稀疏编码的输入,在第二层稀疏编码 中,将第一层的稀疏编码的特征输出展成二维矩阵,并将其均匀分成8*8大小后,利用S1.1 得到的字典,进行稀疏编码稀疏计算,得到第二层的稀疏编码系数;获取第二层稀疏编码的 特征输出;
[0030] 将第一层的特征输出和第二层的特征输出进行级联,得到最终的稀疏编码特征输 出。
[0031 ]所述获取第一层稀疏编码的特征输出,具体为:
[0032]利用巧2大小的最大化抽取方式获取第一层稀疏编码的特征输出。
[0033] 所述获取第二层稀疏编码的特征输出,具体为:
[0034] 利用巧2大小的最大化抽取方式获取第二层稀疏编码的特征输出。
[0035] 所述将第一层的特征输出和第二层的特征输出进行级联,得到最终的稀疏编码特 征输出,具体为:
[0036] 将第一层的特征输出和第二层的特征输出都进行空间分层采样,得到最终的稀疏 编码特征输出;空间分层采样的处理过程就是将图像均分成巧2和4*4的子图区域,然后再 整图、1/2子图区域和1/4子图区域内,统计各个区域的特征输出的直方图,然后将各个区域 的特征输出直方图进行级联,得到最终的稀疏编码特征输出。
[0037] 与现有技术相比,本发明具有W下优点和有益效果:
[0038] (1)本发明的鸟类图像识别方法,首先在局部图像块的R,G,BS通道上利用级联多 层稀疏编码结构提取稀疏编码特征,每层稀疏编码结构都包含特征编码部分和特征最大值 抽取两部分;然后在输出特征上,多层稀疏编码特征使用线性核进行融合,并使用SVM作为 分类器进行分类判决。本发明采用多层稀疏编码结构,通过空间抽取获得多尺度与空间分 布级别融合,W尽可能地提取出有足够区分度的鉴别特征,最大化精细视觉目标的类间差 异,提高了系统对于鸟类图像的识别精度。
[0039] (2)本发明在多层稀疏编码结构中,在优化目标函数中加入了一个局部约束项,在 特征编码部分迭代地使用所求得目标函数的近似解进行稀疏编码,然后使用运些编码值最 小化重构误差,更新字典,强调在编码过程中的局部平滑性质.
[0040] (3)本发明的鸟类图像识别方法可W单纯依靠图像的信息对其中鸟类类别进行判 断,方法方便易实现。
【附图说明】
[0041] 图1为本发明的实施例的多层稀疏编码特征的鸟类图像识别方法的流程示意图。
[0042] 图2为本发明的实施例的多层稀疏编码过程示意图。
【具体实施方式】
[0043] 下面结合实施例,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
[0044] 实施例
[0045] 如图1所示,本实施例的多层稀疏编码特征的鸟类图像识别方法,包括W下;
[0046] S1训练过程
[0047] S1.1收集各种鸟类训练图像,组成鸟类训练数据集;
[004引本发明选用加州理工大学200类鸟类数据集,此数据集包含200类不同鸟类的图像 数据,每个类别图像数都有300 W上。
[0049] S1.2字典学习
[0050] S1.2.1
[0051] 在进行分类器训练之前,需要建立稀疏编码字典。传统的稀疏编码字典学习过程 中,由于有些图像块会大量的重复出现,因此在随机抽取样本集训练字典时,运些重复性很 高的图像块就会W很高的概率被选中,从而导致最终学习到的字典出现过拟合现象。同时 在学习字典的过程中,一些具有视觉上纹理相差较大的图像块会使用字典中相同原子,因 此字典学习过程并不是十分稳定。为了使字典学习过程具有局部平滑的性质,同时也能快 速编码,本发明在目标函数加上一个局部平滑约束项,并迭代的去优化新的目标函数。
[0052]本实施例设定字典学习的目标函数为:
[0055] 其中Y为图像块的像素矩阵集(本实施例是将训练数据集中图像随机采用了 20000 份16*16大小的图像矩阵,yi是其中第i个图像块的像素矩阵);D是需学习的字典,字典个数 为N,字典元素为di和dj;X是对应字典的权重系数,其元素为xi;
量F范数,ei = exp ([dist(yi,di), . . . ,
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1