一种利用变形虫网络实现最小冗余度的波长选择方法

文档序号:9785293阅读:471来源:国知局
一种利用变形虫网络实现最小冗余度的波长选择方法
【技术领域】
[0001 ]本发明涉及光谱分析技术领域,尤其涉及一种光谱波长选择方法。
【背景技术】
[0002] 光谱分析是一种利用物质的反射率或吸收率来分析物质有效成分的方法。由于该 方法具有高效、准确、非侵入、适合在线分析等特点,被广泛的应用在食品、药品、农业、化 工、环境保护等各个领域。
[0003] 借助光谱仪,研究者可快速获取大量光谱数据。但原始光谱数据可能包含无关信 息、噪音、冗余信息。如果将这些原始数据都用于建模来实现样品分析,不但会造成计算量 大、模型复杂等问题,也会影响计算精度。因此,对光谱特征变量(波长)进行优选成为提高 建模质量的关键环节。
[0004] 现有的波长选择方法多采用寻优算法或映射的方式来实现波长选择。这些方法采 用全谱所有的波长作为输入。由于波长变量间的随机相关性(random correlation)的存 在,以这样方式选择的"最优"波长,仍然不可避免的存在冗余信息(波长变量之间相关系数 高)。对于选择全光谱中某一子波段所有波长的波长选择方法,同样存在着相邻波长变量间 相关系数高,有冗余信息的问题。冗余信息的出现意味着所选的波长的数目比实际最优的 波长组合的数目要多,这样不利于实现在线实时的光谱分析。
[0005] 多头绒泡菌是一种大型单细胞变形虫有机体。Tero等研究人员在文献"Mazesolving by an amoeboid organism(Nature, 2000,407:470)"中的"迷宫觅食"试验中发 现:被放置在迷宫中央的多头绒泡菌可以自适应地找到位于迷宫出口和入口处的食物源, 并且形成出口和入口间的最短路径。在文献"A mathematical model for adaptive transport network in path finding by true slime mold(Journal of Theoretical Biology,2007,244:553-564)"中的变形虫网络(PN)算法模拟多头绒泡菌迷宫觅食的机制, 将迷宫抽象成点和边,并结合哈根-泊肃叶定理将迷宫入口食物源抽象为流量的流入点,迷 宫出口食物源为流出点。采用变形虫网络算法可以将波长选择问题抽象成"迷宫觅食"问 题,从而实现最小冗余度的波长选择。

【发明内容】

[0006] 本发明提供一种利用变形虫网络实现最小冗余度的波长选择方法,使得最后优选 出的波长组合具有最小信息冗余度,有利于构建实时的光谱分析模型。
[0007] 为了实现上述目的,采用以下技术方案:
[0008] A.对光谱数据进行预处理,以降噪和去基线漂移。
[0009] B.将所有样本随机的分成校正集和验证集。
[0010] C.将整个光谱的全波段分成m个子波段,每个子波段中波长的个数大致相等。将每 个子将子波段抽象为迷宫节点。相邻子波段(节点)之间有多条边相连,每条边的两端分别 位于不同子波段中的波长。并设一个虚拟源节点(流量流入点)和一个虚拟终节点(流量流 出点),以组成网络。
[0011] D.给定每条边上的传导性的初始值,并设初始值均相同。
[0012] E.计算每条边的长度。
[0013] F.给定源节点流量和终节点压力值的初始值。
[0014] G.计算各个节点的压力值。
[0015] H.更新每条边上的流量 [0016] I.更新每条边上的传导性值。
[0017] J.若每条边上所有更新后的传导性值和原来的传导性值之间的差值小于某一阈 值,或迭代次数达到某一设定值时,转到步骤K,否则转到步骤G。
[0018] K.从源节点开始逐一选择传导性最小的边构成最短路径,取最短路径上的波长组 合作为待选波长。
[0019] L.将步骤K中的待选波长输入遗传-偏最小二乘(GA-PLS)算法,得出最优的波长组 合。
[0020] 本发明将子波段抽象为节点,波长间的相关性抽象为节点间的路径长度,采用变 形虫网络寻找网络间最短路径,最后选择出来的波长组合具有最小相关性(即最小信息冗 余),所以能够用最少的波长点预测物质的有效成分,有利于实现实时的光谱分析。
【附图说明】
[0021] 图1是本发明数据处理的流程图;
[0022] 图2是本发明中组建迷宫网络的示意图;
[0023]图3是变形虫网络(PN)算法从700个波长点中选出的70个波长点;
[0024]图4是GA-PLS从70个波长点中精选出的13个波长点。
【具体实施方式】
[0025] 以小麦(80个样本)的近红外光谱的700个波数点作为选则对象,以下结合附图和 实例对本发明做进一步说明。
[0026] -种利用变形虫网络实现最小冗余度的波长选择方法,包括下列步骤:
[0027] A.对光谱数据采用自动调整(auto scaling),降噪,去基线漂移。
[0028] B.将数据集按3:1的比例随机的分成校正集(60个)和验证集(20个),并保证校正 集和验证集具有相似的数值分布。
[0029] C.如图1所示,将整个波段分成M = 70个子波段,每个子波段中波长的个数P = 10。 将每个子波段抽象为迷宫节点,相邻子波段(节点)之间有多条边相连,如图2所示。
[0030] D.并设每条边上传导性Dij(i,j表示波长点的编号)的初始值设为0.001,虚拟节点 (源节点和终节点)与之相邻节点连接边的传导性为1。
[0031] E.计算出各波长之间的相关系数RU,同一子波段内的波长间不计算相关系数;
[0032]
用相关度代替波长间边的长度。
[0033] 式中N为样本个数;fik,fjk分别为第k个样本在波长点i和波长点j的光谱数据; &表不全体样本在波长点i和波长点j的平均光谱值。R i j为波长i和波长j的相关系 数,是指光谱间的关联程度,相关系数越大表示光谱波长之间的相关性越强,数据的冗余度 就越高,反之亦然。
[0034] F.设源节点流量为I 〇,此处I 〇 = 6,终节点压力值为0; =源节点编号
[0035] G.在公式= -W =终节点编号中,用b替换L1J;
[ 0 ,其他
[0036] Pi和Pj分别是节点i和节点j处的压力,Ιο是从源节点到终节点的流量Ιο = 6,?^是 连接节点i和节点j的连接边的传导性,其初始值全部设为0.00001。将j = N(终节点)代入该 公式,可得Pn-1 (节点N和节点N-1连),将j = N-1代入该式,可得出PN-2 (PN-!和?〃已知),以此类 推得出各节点的压力Pl。
[0037] Η.计算每条边上的流量岛=^^,其中Lu为是节点i和节点j所 在节点处的压力,对每条边上的流量进行更新。
[0038] I.根据公式巧/ + 1 - % = /(|%|) - i^1
[0039] 和公式f ( | Qu | ) = (l+α) | Qu | μ/(1+α | Qdμ),计算下一时刻的传导性巧;1,(&代 表当前时刻η的传导性),α为波段的个数,μ取值为2.5,汽|(^|)是关于|(^|的函数,更新每 条边上的传导性值。
[0040] J.若所有节点的均小于0.001,或已完成2000步迭代,则转至步骤Κ;若不 满足,则转至步骤G。
[0041] Κ.从源节点开始逐一选择传导性最小的边构成最短路径,取最短路径上的波长组 合作为待选波长。
[0042] L.将步骤Κ中的待选波长输入遗传-偏最小二乘(GA-PLS)算法,得出最优的波长组 合。GA以交叉检验均方根误差(RMSESV)为目标函数,交叉概率为50%,变异概率为1%,迭代 次数100。
[0043]图3给出了变形虫网络(ΡΝ)算法选出的具有最小信息冗余的70个波长点。图4给出 了通过PN-GA-PLS精选后的13个波长点。
[0044]本发明参照当前较佳实施方案就行了描述,本领域的技术人员能理解设计原则, 上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的 精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护 范围之内。
【主权项】
1. 一种利用变形虫网络实现最小冗余度的波长选择方法,其特征在于:所述方法包括 下列步骤: A、对光谱数据进行预处理,以降噪和去基线漂移; B.将所有样本随机的分成校正集和验证集; C. 将整个光谱的全波段分成m个子波段,相邻子波段之间有多条边相连,每条边的两 端分别位于不同子波段中的波长,并设一个虚拟源节点和一个虚拟终节点,以组成网络; D. 给定每条边上的传导性的初始值,并设初始值均相同; E. 计算每条边的长度; F. 给定源节点流量和终节点压力值的初始值; G. 计算各个节点的压力值; H. 更新每条边上的流量; I. 更新每条边上的传导性值; J. 若每条边上所有更新后的传导性值和原来的传导性值之间的差值小于某一阈值, 或迭代次数达到某一设定值时,转到步骤K,否则转到步骤G; K. 从源节点开始逐一选择传导性最小的边构成最短路径,取最短路径上的波长组合 作为待选波长; L. 将步骤K中的待选波长输入遗传-偏最小二乘算法,得出最优的波长组合。2.如权利要求1所述的利用变形虫网络实现最小冗余度的波长选择方法,其特征在于: 所述步骤C中每个子波段中波长的个数相等。
【专利摘要】本发明公开了一种利用变形虫网络实现最小冗余度的波长选择方法包括下列步骤:对光谱数据进行预处理,将所有样本随机的分成校正集和验证集;将整个光谱的全波段分成m个子波段,相邻子波段之间有多条边相连,每条边的两端分别位于不同子波段中的波长,并设一个虚拟源节点和一个虚拟终节点,以组成网络;本发明将子波段抽象为节点,波长间的相关性抽象为节点间的路径长度,采用变形虫网络寻找网络间最短路径,最后选择出来的波长组合具有最小相关性,所以能够用最少的波长点预测物质的有效成分,有利于实现实时的光谱分析。
【IPC分类】G01N21/359
【公开号】CN105548067
【申请号】CN201510941170
【发明人】刘光远, 陈通, 赵兴骢
【申请人】西南大学
【公开日】2016年5月4日
【申请日】2015年12月16日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1