转基因棉花品种识别方法_3

文档序号:9614880阅读:来源:国知局
[0092] 二、数据处理方法
[0093] 2. 1支持向量机
[0094] 支持向量机(SVM,SupportVectorMachine)实现的基本思想是在初始阶段选择 一个非线性变换方法,将输入向量由低维非线性样本空间映射到高维或无穷维,使样本空 间的非线性分类转化为线性分类,并基于结构风险最小化在特征空间中寻找最优超平面, 解决线性分类问题。
[0095]SVM被其描述为:
[0096]
[0097] 式中ω为惯性权重,ξ为松弛系数,γ为惩罚系数。
[0098] 2. 2粒子群优化算法
[0099] 粒子群优化算法是由Eberhart博士和Kennedy博士于1995年提出的一种进化计 算技术。源于对鸟群捕食行为的研究。其基本思想是通过群体中个体之间的信息传递及信 息共享来寻找最优解。其经典算法如下所示:
[0100] Vij(t+1) =ωV;j(t) +0^!j(t)(Pij(t) -X;j(t)) +c2r2j (t) (pgj (t) -x;s (t))
[0101] XijCt+l) =xij(t)+vij(t+l)
[0102] 式中i= 1,2, "·,Μ,M是该群体中粒子的总数,i表示第几个粒子;j表示微粒的 第j维,即算法所优化的第j个参数;ω为惯性权重因子,其值为负,值的大小影响整体寻 优能力;t表示此时优化的代数;Vu(t)表示t时刻粒子i在j维的空间速度;(^和c2为加 速因子,通常在0-2间取值;Γι]和r2]为[0,1]之间变化的两个相对独立的随机数;p^⑴ 为粒子i的历史最好解(个体最优)的j维值,即单个粒子i在所优化的第j个参数中的 历史最好解;pg.j(t) =min{ρυ(t)}为所有粒子在t时刻的历史最好解(群体最优)的j维 值,即所有粒子在所优化的第j个参数中的历史最优解;X, (t)为t时刻粒子i在j维空间 位置。
[0103] 2. 3动态自适应粒子群优化算法
[0104] 粒子群优化算法是通过粒子跟踪自身记忆的个体最优向种群记忆的全局最优靠 近以逐渐逼近更优位置。但在动态环境下,记忆的个体最优位置和全局最优位置对应的适 应度值是变化,粒子重新将再次对先前环境进行寻优,算法将可能陷入死循环。因此,普通 粒子群算法难以在实际环境下有效逼近最优位置。
[0105] 为了在动态环境下取得最优解,本发明对粒子群算法进行了改进:(1)加入感知 能力,使粒子群获得感知外部环境变化的能力;(2)引入更新机制,在感知到环境变化后, 采用某种响应方式对粒子群进行更新,以适应实际动态环境。其思想是利用粒子感知外部 环境是否发生变化,将可行域空间分为叫个均匀的子空间,在每个子空间内随机抽取η2个 粒子作为感知粒子进行初始化,在迭代过程中计算感知粒子的适应度^,并比较相邻2次迭 代的适应度差值△£,然后对所适应度差值求和F,公式如下:
[0106] Δfj=fi (k+1) -f; (k)
[0107]
[0108] 在上式中,如果F# 0,则表明外部环境已发生变化,此时应设定一个响应阈值FT, 当F>FT时触发响应,更新机制为按一定方式重新初始化感知粒子和粒子速度,描述如下:
[0109]
[0110] 其中,rand(M) 73M维N重;vu; =LVu,Vl2,…,Vin」,λα; = [Xn,Xl2,…,xin]表 示从粒子群中选出的重新进行初始化的第i个感知粒子,m表示维数;Vmax为感知粒子最大 速度,一般取¥_=父咖。
[0111] 三、结果与讨论
[0112] 3. 1转基因棉种子品种的太赫兹光谱识别
[0113] 研究表明大多数分子振动频率都在太赫兹频段内,主要表现在分子的低频集体振 动模式,其位置和强度与分子机构、所处的环境及分子间相互作用等因素有关。对于不同转 基因棉种子其内部分子结构不一样可以表现为太赫兹时域及频域响应的差异,如图1、2所 示。图3为3类转基因棉种子在太赫兹下的特征吸收峰,从图3中可以看出三中转基因棉种 子均呈现出独特的吸收峰,其中鲁研棉36号的吸收峰位于在0. 57THz、0. 80THz、0. 98THz; 鑫秋638号的吸收峰位于0. 57THz、0. 75THz、0. 94THz;新陆中6号的吸收峰位于0. 55THz。 由此,本发明可以根据不同转基因棉种子呈现出的不同吸收峰对转基因棉种子进行区分。
[0114] 3. 2DAPS0-SVM模型的优化
[0115] 动态自适应粒子(DAPS0)的算法思想如下:
[0116] (1)在可行域空间内,把粒子群分为叫均匀子空间,在每个子空间内随机选择η2个 感知粒子进行初始化,共产生叫Xη2个感知粒子。
[0117](2)初始化参数:惯性权重ω,松弛系数ξ,惩罚系数γ,学习因子Cl,c2,动态响 应触发阈值FT。
[0118] (3)根据适应度函数计算每个感知粒子的适应度,计算局部最优和全局最优。
[0119] (4)按式1和2迭代产生新感知粒子群,并计算适应度值。
[0120] (5)把新粒子群的适应度值同个体局部最优值,群体局部最优值比较,更新个体局 部最优值和群体局部最优值。
[0121] (6)计算并判断F,若F>FT,则按比例更新粒子群及粒子速度,转步骤(3),当满 足结束条件时,则结束算法。
[0122] 动态自适应粒子群优化的支持向量机(DAPS0-SVM)思想如下:
[0123] (1)获取的样品的太赫兹光谱数据,把所有样品的太赫兹光谱数据分成η份,将其 中k份用来作为训练数据。
[0124] (2)读取训练样本的太赫兹数据,随机产生一组{丫,〇}(即Xl](t)的空间坐标 值)作为粒子的初始位置,训练支持向量机。
[0125] (3)根据粒子的初始化位置,计算粒子的适应值,如果粒子适应值优于个体极值 P,⑴,则Pl]⑴被粒子的适应值仁(k)取代;如果粒子适应度优于全局极值pg] (t),pg]⑴ 被粒子的适应值t(k)取代。
[0126] (4)利用新的Plj(t)和pgj(t)更新粒子速度和位置。
[0127] (5)根据粒子适应值不同采取自适应动态调整策略,按照惯性权重公式调整惯性 权重,转向步骤(3)。
[0128] (6)判断算法是否满足终止条件(终止条件应根据实实际情况来定,例如可以选 择终止条件为当训练误差率小于1. 5%时终止算法),若满足转向步骤(8),否则执行步骤 (7)。
[0129] (7)根据粒子适应值不同采取不同的动态自适应调整策略调整惯性权重,转向步 骤⑵。
[0130] (8)若满足终止条件,寻优过程结束,输出最优{丫,〇}。
[0131] (9)根据输出的最优{γ,〇 },建立支持向量机识别模型。
[0132] 图 4 给出 了通过PSO-SVM(ParticleSwarmOptimizationandSupportVector Machine)和DAPSO-SVM(DynamicAdaptiveParticleSwarmOptimizationandSupport VectorMachine)优化支持向量机得到的粒子群迭代次数与适应度值关系曲线对比图。从 图可见,DAPSO模型在粒子群进化到50代后可达到其最优解,PSO-SVM模型要迭代100次才 达到最优解。其具体的参数值及分类正确率,见表1所示。
[0133] 表1 :PS〇-SVM与DAPS0各参数对比
[0134]
[0135] 3. 3判别分析
[0136] 将3类转基因棉种子的165个样本分成2组,第一组90个作为训练集,第二组75 个作为训练集,并保证每类转基因棉种子的30个样本在训练集中,25个样本在预测集中, 如表2所示。表3、表4给出了两种不同方法对转基因棉花的分类结果。从表中可以看出 PS0-SVM对转基因棉种子的综合识别率为89. 3%,DAPS0对转基因棉种子的综合识别率为 97.3% .由此可以证明该方法可有效地识别转基因类别。
[0137] 表2 :实验样品表
[0138]
[0139] 表3 :PS〇-SVM模型对样品训练集和测试集的识别情况
[0140]
[0141] 表4 :DAPS0模型对样品训练集和测试集的识别情况
[0142]
[0144] 为了更加直观的比较PS0-SVM和DAPS0-SVM模型的识别
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1