一种基于边界点的抗噪支持向量机的水蜜桃品质分级方法与流程

文档序号:13165345阅读:264来源:国知局
一种基于边界点的抗噪支持向量机的水蜜桃品质分级方法与流程
本发明涉及水蜜桃品质等级鉴别领域,具体涉及一种基于边界点的抗噪支持向量机的水蜜桃品质等分级的方法。
背景技术
:桃原产于中国,除了具有很好的观赏性外,更具有很有的食用性,桃富含蛋白质、脂肪、糖、钙、磷、铁和多种维生素,特别是铁的含量在水果中名列前茅。特别是水蜜桃,其以果肉柔嫩、甜蜜多汁、香气浓郁而享誉海内外。同时,从国际贸易看,东南亚作为世界两个鲜桃市场之一,其良好的桃消费习惯和广阔的市场成为推进我国水蜜桃产业发展的动力。但是,我国水蜜桃生产技术水平较低,离标准化生产和规范化管理还有很大的距离,水蜜桃的品质分级操作基本通过人工方式处理。然而,由于水蜜桃含粗纤维少肉质细软、个头大、水分足且皮薄绵软,采用人工方式进行品质等级的鉴定存在以下的缺陷:1)人工方法常会在水蜜桃上留下手印子,并由于氧化的缘故,手印处会颜色变深,影响水蜜桃的品相和质量;2)人工品质分级方法主观性强,标准化程度低;3)水蜜桃成熟上市的时间较集中且不易存储,人工品质分级方法耗费时间长,不利于水蜜桃从生产环节到物流环节的流通。因此,研究一种简单、快速、且无损的水蜜桃品质分级的自动鉴定方法不仅具有极大的经济价值,而且对于水蜜桃产业的健康持续发展具有重要的意义。可见/近红外光谱分析技术是依据某一物质成分对电磁波的吸收特性而进行的定性、定量分析技术,可见/近红外光谱分析具有速度快、效率高、结果稳定、测试重现性好、无破坏等优点。潘磊庆等在《水蜜桃货架期内糖度的近红外光谱检测》(南京农业大学学报,2013年4月)中使用近红外光谱技术和偏最小二乘法建立水蜜桃货架期糖度无损的检测方法;李晓丽等在《基于主成分分析和多类判别分析的可见-红外光谱水蜜桃品种鉴别新方法》(红外与毫米波学报,2009年12月)中使用可见-近红外光谱仪测定水蜜桃的光谱曲线,再用主成分分析法对不同品种样本进行聚类分析,同时结合多类判别分析技术建立水蜜桃品种鉴别的模型。上述潘磊庆和李晓丽等的水蜜桃鉴别模型均建立在光谱数据无噪声的情况下,不适用于带噪声的水蜜桃光谱数据。然而可见/近红外光谱属于一种绝对测量技术,容易受到噪声的影响,且噪声一般对测量的结果有较大的影响。赵环环等在《噪声对近红外光谱分析的影响及相应的数学处理方法》(光谱学与光谱分析,2013年4月)一文中以玉米籽粒为例,对近红外光谱分析仪进行近红外分析的可行性进行了分析,指出对于信噪比较低的可见/近红外光谱分析仪采集的光谱数据,需要借助一定的软件技术才能用于定量分析。另外,rukshanbatuwita等人在《fsvm-cil:fuzzysupportvectormachinesforclassimbalancelearning》(ieeetransactionsonfuzzysystems,2010年6月)一文中指出真实环境下采集的数据很大程度上或多或少都存在噪声。针对水蜜桃品质分级方法的现状与诸多不足,以及为了能有效适用于日常生产环节的分级检测,本发明提出了一种基于边界点的抗噪支持向量机的水蜜桃品质分级的方法。技术实现要素:本发明的主要目的是为了提供一种无损、易操作、高可靠、高质量的基于边界点的抗噪支持向量机的水蜜桃品质分级的方法,重点缓解因噪声给现有可见/近红外定性分析模型带来的误差的影响,提高水蜜桃品质分级方法的准确性和抗噪性。本发明的技术方案是:为达到上述目的,首先通过可见/近红外光谱获取水蜜桃的光谱数据,并通过对光谱数据经过预处理和pca方法提取特征,获得其特征数据构成训练样本,进而使用基于边界点的抗噪支持向量机对训练样本集进行训练,构建若干个水蜜桃品质等级分类器,最后采用投票机制统计检测结果,实现对水蜜桃品质等级的自动化检测。根据上述构思,本发明采用下述技术方案。(1)采集n个不同品质等级的水蜜桃可见/近红外光谱数据,并对可见/近红外光谱数据进行预处理和pca特征提取,得到不同品质等级的水蜜桃可见/近红外光谱样本集;(2)将不同品质等级的水蜜桃可见/近红外光谱样本集两两组合,建立组水蜜桃可见/近红外光谱训练集;(3)将上述组水蜜桃可见/近红外光谱训练集输入到基于边界点的抗噪支持向量机中进行训练,得到个水蜜桃品质等级分类器;(4)使用水蜜桃品质等级分类器对待分级的水蜜桃样本进行检测;上述步骤(3)所述的水蜜桃品质等级分类器的构建步骤如下:(31)在每组水蜜桃可见/近红外光谱训练集中的两类品质等级的水蜜桃可见/近红外光谱样本集x1和x2上分别使用支持向量域描述(supportvectordatadescription,svdd)算法得到两类样本集在特征空间下的最小球形空间闭区域的球心c1和c2,以及分布在两个最小球形空间闭区域上的样本点集合z1和z2,并设置x1和x2在特征空间的边界点集b1和b2的初始值分别为z1和z2;(32)在x1中计算每个样本xi到球心c1在特征空间中的欧氏距离di:di=||φ(xi)-φ(c1)||2,(1)其中xi满足xi∈x1且表示样本从原始空间到核空间的映射函数;在x2计算每个样本点xi到球心c2在特征空间中的欧氏距离ei,其中xi满足xi∈x2且ei=||φ(xi)-φ(c2)||2;(2)(33)根据di值降序排列x1中的样本xi,其中xi满足xi∈x1且依次将样本xi代入式(3)求解向量μ,随即将xi连同得到的μ值代入式(4)更新边界点集b1,这一过程直至遍历x1中所有满足条件的样本,其中|b1|表示b1中样本的个数,阈值ε为一正常数;根据ei值降序排列x2中的样本点xi,其中xi满足xi∈x2且依次将样本xi代入式(5)求解向量λ,随即将xi连同得到的λ值代入式(6)更新边界点集b2,这一过程直至遍历x2中所有满足条件的样本,其中|b2|表示b2中样本的个数;(34)计算x1中边界点集b1中各边界点的权重αi:计算x2中边界点集b2中各边界点的权重βi:(35)将b1集中权重ai平方值小于阈值δ的样本剔除出b1集:其中阈值δ为一正常数,将b2集中权重βi平方值小于阈值δ的样本剔除出b2集:其中(36)将步骤(35)得到的b1和b2集连同其类别标签代入中位数损失函数支持向量机:其中w为权向量,c为惩罚参数,为松弛向量,yi∈{+1,-1}分别表示两类品质等级水蜜桃可见/近红外光谱样本的类别标签,b为分类超平面的偏移量,τ为一个在[0,1]之间的实数;引入拉格朗日函数,上式可以转换成如下的二次规划形式:其中,α和是拉格朗日系数;求解式(11)和(12)式可得w和b最优解w*,b*并得到基于边界点的抗噪支持向量机的水蜜桃品质等级分类器:f(x)=sign(1-(w*·φ(x)+b*)),(13)其中sign()为符号函数;上述步骤(4)所述的使用水蜜桃品质等级分类器对待分级的水蜜桃样本进行检测,具体步骤如下:(41)获取待检测的水蜜桃可见/近红外光谱数据;(42)对获取的可见/近红外光谱数据进行预处理和使用pca方法进行特征提取;(43)将提取到的特征数据输入到步骤(3)所述的个水蜜桃品质等级分类器中,得到个判别结果;(44)采用投票机制统计个判别结果,以所有结果中占最多的等级作为待检水蜜桃的品质等级。本发明的有益效果:1)利用可见/近红外光谱技术分析水蜜桃的外观品质信息,不使用任何化学试剂,不污染环境,对水蜜桃不造成损伤,不影响检测水蜜桃的销售;2)利用基于边界点的抗噪支持向量机对水蜜桃可见/近红外光谱数据进行品质等级鉴定,鉴定的过程不超过0.1秒,识别速度快,适用于规模化标准化生产领域;3)设计的基于边界点的抗噪支持向量机使用核技术把样本集映射到高维特征空间,通过识别样本集在特征空间的几何轮廓有效剔除掉噪声样本,且在支持向量机中损失函数的选择上,使用了对噪声不敏感的分位数损失函数,以达到提高水蜜桃品质分级方法的准确率和抗噪性。附图说明图1是本发明的一种基于边界点的抗噪支持向量机的水蜜桃品质分级的总流程图;图2是实施例中水蜜桃的可见/近红外光谱图;图3是图1中步骤(3)所述的水蜜桃品质等级分类器的构建流程图。具体实施方式为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体事实例,并参照附图1,对本发明进一步详细说明。本实施例选取产于江苏省常州市的阳湖水蜜桃作为研究对象,以单果重、果形指数、皮色、肉质、含糖量、可容性固形物、可滴定酸、可食率8个品质指标采集不同品质等级的阳湖水蜜桃共计490个,其中特级品80个,一级品150个,二级品160个,三级品100个。(1)采集n个不同品质等级的水蜜桃的可见/近红外光谱数据,将可见/近红外光谱数据采用pca方法进行特征提取,得到不同品质等级的水蜜桃可见/近红外光谱样本集,其具体步骤如下:(11)采集4个不同品质等级共计490个水蜜桃的可见/近红外光谱数据:本实施例使用美国asd(analyticalspectraldevice)公司的handheldfieldspec光谱仪,其光谱测定范围325~1075nm,采样间隔为1.5nm,分辨率为3.5nm,探头视场角为20度,光源采用14.5v卤素灯,光谱扫描稳定后进行光谱数据的采样,每个水蜜桃沿赤道轨迹扫描50次,保存水蜜桃可见/近红外光谱数据和其品质等级信息,并取其平均值作为最终的实验数据,其中,4个不同品质等级典型水蜜桃可见/近红外光谱曲线如图2所示。(12)对上述采集的水蜜桃可见/近红外光谱数据进行预处理:为了消除或降低高频随机噪声、基线漂移、光散射等对光谱数据的干扰,本实施例中截取350-1050nm波段的光谱数据进行分析,分析软件采用asdviewspecpro,unscramblerv9.6和dps(dataprocessionsystemforpracticalstatistic)。首先采用savitzky-golay卷积平滑法,选用平滑点数为3,并进行snv(standardnormalvariate)处理,然后使用一阶savitzky-golay导数法处理,求导间隔为3。最后使用向量归一化对光谱数据进行处理。(13)在满足主成分的累积可信度≥99.95%的条件下,采用pca方法对490个水蜜桃可见/近红外光谱样本进行降维处理,得到的主因子数为8,因此本实施例将水蜜桃可见/近红外光谱数据降维至8维。(2)将不同品质等级的水蜜桃可见/近红外光谱样本集两两组合,建立组水蜜桃可见/近红外光谱训练集,其具体步骤如下:本实施例共有4种水蜜桃品质等级,进行两两组合,组合成6个组合:特等和一等、特等和二等、特等和三等、一等和二等、一等和三等、二等和三等,根据这6个组合构建6组水蜜桃可见/近红外光谱训练集,每组训练集由对应的两个品质等级的水蜜桃可见/近红外光谱样本构成;(3)将上述组水蜜桃可见/近红外光谱训练集输入到基于边界点的抗噪支持向量机中进行训练,得到个水蜜桃品质等级分类器,其具体步骤如下:(31)在每个水蜜桃可见/近红外光谱训练集中的两类品质等级的水蜜桃可见/近红外光谱样本集x1和x2上分别使用支持向量域描述(supportvectordatadescription,svdd)算法得到两类样本集在特征空间下的最小球形空间闭区域的球心c1和c2,以及分布在两个球形空间闭区域上的样本点集合z1和z2,并设置x1和x2在特征空间的边界点集b1和b2的初始值为z1和z2,其中svdd算法的表述为:式(1)中为某品质等级水蜜桃可见/近红外光谱样本集,c为特征空间下的最小球形空间闭区域的球心,r为最小球形空间的球半径,xi为第i个水蜜桃可见/近红外光谱样本,表示样本从原始空间到核空间的映射函数,本实施例中φ()使用的映射函数为高斯核函数,其核参的取值范围为{0.001,0.1,0.1,1,10,100,1000};(32)在x1中计算每个样本xi到球心c1在特征空间中的欧氏距离di:di=||φ(xi)-φ(c1)||2,(2)其中xi满足xi∈x1且在x2计算每个样本点xi到球心c2在特征空间中的欧氏距离ei,其中xi满足xi∈x2且ei=||φ(xi)-φ(c2)||2;(3)(33)根据di值降序排列x1中的样本xi,其中xi满足xi∈x1且依次将样本xi代入式(4)求解向量μ,随即将xi连同得到的μ值代入式(5)更新边界点集b1,这一过程直至遍历x1中所有满足条件的样本,其中|b1|表示b1中样本的个数,阈值ε为一正常数;根据ei值降序排列x2中的样本点xi,其中xi满足xi∈x2且依次将样本xi代入式(6)求解向量λ,随即将xi连同得到的λ值代入式(7)更新边界点集b2,这一过程直至遍历x2中所有满足条件的样本,(34)计算x1中边界点集b1中各边界点的权重αi:计算x2中边界点集b2中各边界点的权重βi:(35)将b1集中权重ai平方值小于阈值δ的样本剔除出b1集:其中阈值δ为一正常数,将b2集中权重βi平方值小于阈值δ的样本剔除出b2集:其中(36)将步骤(35)得到的b1和b2集中的样本连同其类别标签代入中位数损失函数支持向量机:其中w为权向量,惩罚参数c通过在网格{0.001,0.1,0.1,1,10,100,1000}中寻优获得最优值,为松弛向量,yi∈{+1,-1}分别表示两类品质等级水蜜桃可见/近红外光谱样本的类别标签,b为分类超平面的偏移量,τ为一个在[0,1]之间的实数,本实施例中τ=0.05,φ(xi)中映射函数使用高斯核函数,且与式(1)使用相同的核参数;引入拉格朗日函数,上式可以转换成如下的二次规划形式:其中,α和是拉格朗日系数;求解式(12)和(13)式可得w和b最优解w*,b*得到基于边界点的抗噪支持向量机的水蜜桃品质等级分类器:f(x)=sign(1-|w*·φ(x)+b*|),(14)其中sign()为符号函数;(4)如图3所示,利用水蜜桃品质分级分类器对待分级检测的水蜜桃样本进行检测,其具体步骤如下:(41)本实施例中重新采集特级、一级、二级和三级水蜜桃各30个样本,利用可见/近红外光谱仪,得到待分级检测的水蜜桃可见/近红外光谱数据;(42)对获取的可见/近红外光谱数据进行预处理,使用pca方法对其进行特征提取,得到8维特征数据;(43)将得到的8维特征向量分别输入到步骤(3)中得到的6个水蜜桃品质等级分类器中,得到6个检测结果,例如:把一个特级水蜜桃的特征数据输入到特级和一级分类器时,检测结果是:特级;输入到特级和二级分类器时,检测结果是:特级;输入到特级和三级分类器时,检测结果是:特级;输入到一级和二级分类器时,检测结果是:一级;输入到一级和三级分类器时,检测结果是:一级;输入到二级和三级分类器时,检测结果是:二级;(44)采用投票机制统计6个检测结果,6个结果中等级为特级的占得最多,该水蜜桃品质等级判定为特级。本实施例的判定准确率(%)如表2所示,并将本发明方法的结果与使用hinge损失函数支持向量机(l1-svm)、偏最小二乘法和三层bp神经网络方法进行了对比,实验平台均为matlab2009(a)。表2:本发明方法与支持向量机、偏最小二乘法和三层bp神经网络的水蜜桃品质分级判别准确率(%)水蜜桃品质等级本发明方法支持向量机偏最小二乘法三层bp神经网络特级10096.6793.3393.33一级10093.3390.0093.33二级10090.0086.7693.33三级10090.0086.7690.00以上所述的实例只是用于说明本发明,而不构成对本发明的限制。本领域的技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种修改和变更,这些修改和变更仍然在本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1