一种籽粒分类方法及装置与流程

文档序号:12721373阅读:181来源:国知局
一种籽粒分类方法及装置与流程

本发明涉及识别技术领域,具体涉及一种籽粒分类方法及装置。



背景技术:

籽粒的品种识别及品质鉴定在种质判别和现代化粮库仓储管理等领域有着广阔的应用前景。目前主要采用人工手段从外形、色泽、净度等方面进行综合评价,因而存在主观性强、效率低和可重复性差的缺点,增强了籽粒品种分类的不确定性。

当前,随着计算机技术的迅速发展,机器视觉得以广泛应用于农作物籽粒品质检测和识别分类中,为农业实行高效生产提供保障。与人类的视觉相比,机器视觉代替人工进行品种鉴别不仅能够降低人的主观因素影响,实现自动化;还可以降低检验误差,提高准确度和精度。

现有的技术中,采用稀疏表示分类器对籽粒进行识别分类,在训练样本较大的情况下计算量较大,这样会对籽粒的识别分类造成一定影响,导致存在分类准确度不高,效率低的问题。



技术实现要素:

为解决上述技术问题,本发明提供一种籽粒分类方法及装置,实现了对籽粒进行快速识别和分类;提高了分类的准确度和分类的效率。

为实现上述目的,本发明提供以下技术方案:

一方面,本发明提供了一种籽粒分类方法,包括:

根据预设训练数据建立原始字典,所述原始字典中存储有籽粒特征参数向量与籽粒种类的对应关系;所述预设训练数据包括多个籽粒特征参数向量以及多个籽粒种类;

获取待测试籽粒的特征参数向量;

根据获取的待测试籽粒的特征参数向量查询所述原始字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

进一步的,所述获取待测试籽粒的特征参数向量的步骤之后,还包括:

对所述原始字典进行更新和迭代处理以获取特征字典;所述特征字典中存储有更新和迭代处理后籽粒特征参数向量与更新和迭代后的籽粒种类的对应关系;

根据获取的待测试籽粒的特征参数向量查询所述特征字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

进一步的,所述对所述原始字典进行更新和迭代处理以获取特征字典,具体包括:

采用所述原始字典对所述训练样本籽粒进行稀疏表示得到稀疏表示系数矩阵;

对所述系数矩阵进行迭代处理获取特征字典。

进一步的,所述根据预设训练数据建立原始字典,包括:

采用核函数的方式将所述预设训练数据映射到高维空间中,在所述高维空间中对所述预设训练数据中线性不可分数据变成线性可分数据。

进一步的,所述籽粒特征参数包括:籽粒颜色的色度分量、籽粒颜色的饱和度分量、籽粒颜色的亮度分量、籽粒形状的矩形度、籽粒形状的伸长度和籽粒形状的面积。

进一步的,所述根据获取的待测试籽粒的特征参数向量查询所述原始字典获取与待测试籽粒的特征参数向量对应的籽粒种类,包括:

在原始字典中查询与所述测试籽粒的特征参数向量的误差最小的目标特征参数向量;

根据所述目标特征参数向量确定所述待测试籽粒的特征参数向量对应的籽粒种类。

另一方面,本发明提供了一种籽粒分类装置,包括:

字典模块,用于根据预设训练数据建立原始字典,所述原始字典中存储有籽粒特征参数向量与籽粒种类的对应关系;所述预设训练数据包括多个籽粒特征参数向量以及多个籽粒种类;

采集模块,用于获取待测试籽粒的特征参数向量;

查询模块,用于根据获取的待测试籽粒的特征参数向量查询所述原始字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

进一步的,所述装置还包括:

更新模块,用于对所述原始字典进行更新和迭代处理以获取特征字典;所述特征字典中存储有更新和迭代处理后籽粒特征参数向量与更新和迭代后的籽粒种类的对应关系;

输出模块,用于根据获取的待测试籽粒的特征参数向量查询所述特征字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

进一步的,所述字典模块中包括:

存储单元,用于存储所述籽粒特征参数,包括:籽粒颜色的色度分量、籽粒颜色的饱和度分量、籽粒颜色的亮度分量、籽粒形状的矩形度、籽粒形状的伸长度和籽粒形状的面积。

进一步的,所述查询模块包括:

误差单元,用于在原始字典中查询与所述测试籽粒的特征参数向量的误差最小的目标特征参数向量;

定位单元,同于根据所述目标特征参数向量确定所述待测试籽粒的特征参数向量对应的籽粒种类。

由上述技术方案可知,本发明所述的一种籽粒分类方法及装置,通过在原始字典中查询测试籽粒的特征参数向量对应的籽粒种类,实现了根据原始字典对籽粒进行快速识别和分类;提高了分类的准确度和分类的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种籽粒分类方法的流程示意图;

图2是本发明实施例二提供的一种籽粒分类方法的流程示意图;

图3是本发明实施例二提供的一种籽粒分类方法中步骤S203的流程图;

图4是本发明的一种籽粒分类装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前主要采用人工手段对籽粒的品种进行综合评价,存在主观性强、效率低和可重复性差的缺点,增强了籽粒品种分类的不确定性。随着计算机技术的迅速发展,机器视觉得以广泛应用于农作物籽粒品质检测和识别分类中,为农业实行高效生产提供保障。现有的技术中,采用稀疏表示分类器对籽粒进行识别分类,在训练样本较大的情况下计算量较大,这样会对籽粒的识别分类造成一定影响,导致存在分类准确度不高,效率低的问题。为解决上述技术问题,本发明实施例提供一种籽粒分类方法及装置。

实施例一

本发明实施例提供一种籽粒分类方法,参见图1,该方法包括:

S101:根据预设训练数据建立原始字典,所述原始字典中存储有籽粒特征参数向量与籽粒种类的对应关系;所述预设训练数据包括多个籽粒特征参数向量以及多个籽粒种类;

在本步骤中,利用对训练样本籽粒的图像采用PCA(Principal Component Analysis)进行降维处理和采用SIFT(Scale-invariant feature transform)进行特征提取;得到的数据存在线性不可分情况。因此,为使训练出的字典能够更好地代表整个训练集,把这些线性不可分数据考虑进去:采用核函数将降维处理后的数据映射到高维空间里,即特征空间,在特征空间里,这些数据将变成线性可分,从而简化处理。

提取训练样本籽粒的特征参数,根据特征参数和籽粒的种类生成数据矩阵;采用核函数的方式对训练样本的数据矩阵进行加核处理后获得原始字典。

S102:获取待测试籽粒的特征参数向量;

在本步骤中,利用对待测试样本籽粒的图像采用PCA进行降维处理和采用SIFT进行特征提取;并采用核函数将线性不可分数据变成线性可分数据。根据特征参数生成待测试籽粒的特征参数向量。

S103:根据获取的待测试籽粒的特征参数向量查询所述原始字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

在本步骤中,在原始字典中查询与所述测试籽粒的特征参数向量的误差最小的目标特征参数向量;

根据所述目标特征参数向量确定所述待测试籽粒的特征参数向量对应的籽粒种类。

从上述描述可知,本实施例提供的一种籽粒分类方法,结合稀疏表示进行籽粒的识别分类,避免把所有训练籽粒的图像作为稀疏表示计算对象从而产生巨大计算量;采用PCA进行降维处理和采用SIFT进行特征提取,降低量处理过程中的计算量,提高了分类的速度;采用核函数的方式对训练样本的数据矩阵进行处理,数据矩阵中线性不可分数据变成线性可分数据,提高分类精度。

实施例二

本发明实施例提供一种籽粒分类方法,参见图2,该方法包括:

S201:根据预设训练数据建立原始字典,所述原始字典中存储有籽粒特征参数向量与籽粒种类的对应关系;所述预设训练数据包括多个籽粒特征参数向量以及多个籽粒种类;

在本步骤中,利用对训练样本籽粒的图像采用PCA(Principal Component Analysis)进行降维处理和采用SIFT(Scale-invariant feature transform)进行特征提取;得到的数据存在线性不可分情况。因此,为使训练出的字典能够更好地代表整个训练集,把这些线性不可分数据考虑进去:采用核函数将降维处理后的数据映射到高维空间里,即特征空间,在特征空间里,这些数据将变成线性可分,从而简化处理。

提取训练样本籽粒的特征参数,根据特征参数和籽粒的种类生成数据矩阵;采用核函数的方式对训练样本的数据矩阵进行加核处理后获得原始字典。

S202:获取待测试籽粒的特征参数向量;

在本步骤中,利用对待测试样本籽粒的图像采用PCA进行降维处理和采用SIFT进行特征提取;并采用核函数将线性不可分数据变成线性可分数据。根据特征参数生成待测试籽粒的特征参数向量。

S203:对所述原始字典进行更新和迭代处理以获取特征字典;所述特征字典中存储有更新和迭代处理后籽粒特征参数向量与更新和迭代后的籽粒种类的对应关系;

在本步骤中,在本步骤中,通过提取籽粒的特征参数作为籽粒的典型特征,用来组建原始字典;应用K-SVD方法训练原始字典,得到相应的特征字典。

S204:根据获取的待测试籽粒的特征参数向量查询所述特征字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

在本步骤中,在特征字典中查询与所述测试籽粒的特征参数向量的误差最小的目标特征参数向量;

根据所述目标特征参数向量确定所述待测试籽粒的特征参数向量对应的籽粒种类。

从上述描述可知,本实施例提供的一种籽粒分类方法,在实施例一的基础上对原始字典进行更新获取特征字典,不仅提高了字典的准确性,还提高了分类的精度。

进一步地,所述训练样本籽粒的特征参数包括:籽粒颜色的色度分量、籽粒颜色的饱和度分量、籽粒颜色的亮度分量、籽粒形状的矩形度、籽粒形状的伸长度和籽粒形状的面积;

所述数据矩阵的行为特征参数的个数,列为训练样本籽粒的个数。

籽粒的颜色特征,HIS颜色模型是数字图像处理中常用的颜色模型。通过HIS模型提取籽粒的颜色特征。用籽粒颜色的色度分量、饱和度分量和亮度分量的平均值来表示其颜色特征,满足了籽粒品种识别对籽粒颜色特征的多参数测量要求,公式如下:

上式中,和分别表示第i个品种第j个籽粒的第1、2、3个特征值,p为图像中属于籽粒的像素数,和分别为该籽粒图像I的第k个点的色度、饱和度和亮度分量。

籽粒的形状特征

同一物种不同品种的籽粒,外形差异是它们之间区别的重要特征之一。形态特征参数的选取没有统一规定,只要能够有效区分物体的形态差异,并且能方便快速获取的参数可作为形态特征参数。选取面积、矩形度、伸长度3个参数。籽粒的形态特征表示如下:

矩形度:

伸长度:

面积:

上式中:A为籽粒的面积;a为长轴,b为短轴。

综上所述,设样本有n类品种,每类品种有m个训练样本,描述籽粒的外观特征向量可以表示成:

它的m个列向量构成一个空间,反应第i类品种,则n类品种训练样本组成的字典矩阵为

A=[A1A2...An] (8)

A的行数为训练样本的特征参数个数,列数为训练样本总数。

当选取40粒籽粒作为训练样本,将这些籽粒的特征向量排列起来,组成如下训练样本矩阵即字典:

矩阵A表示4类品种特征组成的字典行数代表提取籽粒的特征个数,列数代表训练样本总数。

在一种可选实施方式中,提供了上述步骤S203的一种具体实施方式。参见图3,上述步骤S203具体包括如下步骤:

S2031:采用所述原始字典对所述训练样本籽粒进行稀疏表示得到稀疏表示系数矩阵;

在本步骤中,利用给定的原始字典D`对训练样本y进行稀疏表示得到稀疏表示系数向量α:

其中,δ为稀疏表示系数中非零元素的个数上限。字典训练过程是个不断更新和迭代过程,逐列进行。对此,可选用OMP等经典迭代方法得到原始字典D`上训练样本y的稀疏表示系数矩阵α。

S2032:对所述系数矩阵进行迭代和更新获取特征字典。

在本步骤中,根据系数矩阵α不断迭代和更新,确定特征字典。下面以更新原始字典D`中任意一列为例,若更新原始字典D`的第k列dk,令系数矩阵α中dk对应的第k行为则

即有k-1项是固定的,剩下的为需处理的第k个。针对第k项求解l2范数,其中Ek即为当前去掉dk后形成的误差矩阵。对于这个误差矩阵,使用SVD(奇异值分解)调整误差得到符合条件的最小值。最终得到的特征字典。

从上述描述可知,在本实施例中采用SVD字典训练方法选取部分“最优基”来代表所有训练图像,为避免把所有训练图像作为稀疏表示计算对象从而产生巨大计算量。

本发明实施例提供的一种籽粒分类方法,在核函数中,最简单的方法就是考虑多个基本核函数的凸组合,形如:

这里km(x,x')是基本核函数,βm是该基本核函数对应的权重系数,F是基本核的总数,k(x,y)为最终的核函数。βm就是这里所需要优化的对象。

本文采用的是广义组合核函数,具体表现形式如下:

在该核函数中,一共使用(n+m)个系数来优化核函数。其中,d1,d2,....,dn用来表示每个特征块内部的权重关系,而dn+1,dn+2,....,dn+m用来表示不同块特征间的关系。

从上式可以看到,该核函数实质上结合了“高斯和”函数和“高斯积”函数。同时,它也考虑了特征的内部组织结构,以块的形式区别特征所包含的图像几何意义。之后需要在每轮优化中计算核函数的梯度,并按照梯度下降法更新参数。

加遮挡的情况下分别将D1加上单位矩阵得到K1;然后解l1最小范数问题;

s.t.λ>0

此时,在训练样本中与测试样本差值最小的即为所属籽粒的品种;

y'=argmin||Φ(y)-KiW||2

实施例三

本发明实施例提供一种籽粒分类装置,参见图4,该装置包括:

字典模块10,用于根据预设训练数据建立原始字典,所述原始字典中存储有籽粒特征参数向量与籽粒种类的对应关系;所述预设训练数据包括多个籽粒特征参数向量以及多个籽粒种类;

采集模块20,用于获取待测试籽粒的特征参数向量;

查询模块30,用于根据获取的待测试籽粒的特征参数向量查询所述原始字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

进一步的,所述装置还包括:

更新模块40,用于对所述原始字典进行更新和迭代处理以获取特征字典;所述特征字典中存储有更新和迭代处理后籽粒特征参数向量与更新和迭代后的籽粒种类的对应关系;

输出模块50,用于根据获取的待测试籽粒的特征参数向量查询所述特征字典,获取与待测试籽粒的特征参数向量对应的籽粒种类。

进一步的,所述字典模块10中包括:

存储单元101,用于存储所述籽粒特征参数,包括:籽粒颜色的色度分量、籽粒颜色的饱和度分量、籽粒颜色的亮度分量、籽粒形状的矩形度、籽粒形状的伸长度和籽粒形状的面积。

进一步的,所述查询模块20包括:

误差单元201,用于在原始字典中查询与所述测试籽粒的特征参数向量的误差最小的目标特征参数向量;

定位单元202,同于根据所述目标特征参数向量确定所述待测试籽粒的特征参数向量对应的籽粒种类。

通过上述描述可知,本发明实施例提供的一种籽粒分类装置,通过对原始字典进行处理获取特征字典,在提高字典准确性的同时降低了采集籽粒的特征参数过程中的计算量;根据特征字典对籽粒进行快速识别和分类;提高了分类的准确度和分类的效率。

以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1