一种基于稀疏表示的拉曼光谱特征提取方法与流程

文档序号:14653867发布日期:2018-06-08 22:37阅读:336来源:国知局
一种基于稀疏表示的拉曼光谱特征提取方法与流程

本发明涉及一种拉曼光谱特征提取方法,具体涉及一种基于稀疏表示的拉曼光谱特征提取方法。



背景技术:

拉曼光谱图是利用拉曼光谱对物质进行分析的根据,拉曼光谱图的质量会直接影响对物质的分析。然而,从光谱仪采集到的原始光谱信号存在一定的噪声。其中有杂散光引起的低频背景噪声,有探测器和放大系统自身的噪声,有因为激光光强所引起的漂移,样品放置位置与方向等多方面因素引起的噪声。这些噪声导致不能从拉曼光谱图中准确的提取有用的信息,对于后续的分析造成巨大的影响,导致准确度和精度下降。

现在的拉曼光谱去噪方法主要包括小波去噪、Savitzky-Golay滤波器、经验模态分解、有限冲击响应数字滤波器等方法,这些方法多数是针对特定的一个模拟数据或者实例来验证单一算法的有效性,应用到另一个实例可能并不会有太好的效果。同时,因为算法中各参数对性能的影响不宜,如今只是采用经验的手段获得较佳的性能指标。



技术实现要素:

针对上述现有技术存在的问题,本发明提供一种基于稀疏表示的拉曼光谱特征提取方法,解决了现有技术中噪声干扰特征提取的问题,提高光谱分析检出限。

为了实现上述目的,本发明采用的技术方案是:一种基于稀疏表示的拉曼光谱特征提取方法,包括以下步骤:

a.获取原始拉曼光谱信息;

b.根据峰的位置将步骤a中的原始拉曼光谱分为N块;

c.将步骤b中处理后的拉曼光谱进行变换域变换,得到光谱信息域图像;

d.获取步骤c中的光谱信息域图像的最相关分量;

e.将步骤d中的最相关分量进行反变换,恢复原光谱;

f.将步骤e中的原光谱进行合并,得到重构后的拉曼光谱。

进一步的,所述的步骤d中通过正交匹配追踪算法获取光谱信息域图像的最相关分量;

正交匹配追踪算法以贪婪迭代的方法选择字典原子,使得每次迭代的过程中原子与信号最大相关(内积最大),从信号向量减去相关部分得到残差,残差按照上述方法反复迭代,直到迭代次数达到稀疏度K或者残差小于误差阈值,停止迭代。

进一步的,所述的正交匹配追踪算法具体步骤为:

a.找出残差和字典内积最大的原子索引,即λt=argmaxj=1...N|<rt-1j>|,

式中,r-残差,λ-残差和字典原子的最大内积;

b.更新索引集Λt=Λt-1∪{λt},记录字典的重建原子集合Φt=[Φt-1λt],

式中,Λ-索引集,Φ-重建原子集合,φ-字典原子;

c.有最小二乘法得到

式中,的估计值,y-原始光谱;

d.更新残差t=t+1,式中,t-迭代次数;

e.判断是否满足t>K,若满足,则停止迭代;若不满足,则执行步骤a,式中,K-稀疏度。

与现有技术相比本发明采用了拉曼光谱在变换域是稀疏的特性,提取稀疏域中最相关的分量,减小了各种噪声对拉曼光谱信号的影响;同时,对原始光谱进行分段处理,提高了光谱重构的准确性,保证想要特征峰的信息能够从噪声中还原出来;其次,本发明采用正交追踪匹配算法,结合联合稀疏表示,能够更快的达到收敛,速度明显快于最小二乘法,加上约束项,密合出的数值与原始数据之间的误差很小,能更有效地去除背景噪声的对光谱分析的干扰;同时,本发明对于特征峰去噪的效果能够提高被测物的检出限,对于后续的光谱分析有着重要的意义。

附图说明

图1是本发明的处理流程图。

图2是正交匹配追踪算法的算法流程图。

图3是模拟纯净拉曼光谱图。

图4是模拟带噪拉曼光谱图。

图5是对于模拟光谱本发明提供方法与其他方法的对比图。

图6是对氯苯胺的实际高噪声拉曼光谱图。

图7是不同方法对于对氯苯胺的拉曼光谱图像的对比图。

图8是应用本发明提供的方法前后对于实际样品检出限的对比图。

具体实施方式

下面结合附图对本发明作进一步说明。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明包括以下步骤:

a.获取原始拉曼光谱信息;

b.根据峰的位置将步骤a中的原始拉曼光谱分为N块;

c.将步骤b中处理后的拉曼光谱进行变换域变换,得到光谱信息域图像;

d.获取步骤c中的光谱信息域图像的最相关分量;

e.将步骤d中的最相关分量进行反变换,恢复原光谱;

f.将步骤e中的原光谱进行合并,得到重构后的拉曼光谱。

进一步的,所述的步骤d中通过正交匹配追踪算法获取光谱信息域图像的最相关分量;

正交匹配追踪算法以贪婪迭代的方法选择字典原子,使得每次迭代的过程中原子与信号最大相关(内积最大),从信号向量减去相关部分得到残差,残差按照上述方法反复迭代,直到迭代次数达到稀疏度K或者残差小于误差阈值,停止迭代。

如图2所示,所述的正交匹配追踪算法具体步骤为:

a.找出残差和字典内积最大的原子索引,即λt=argmaxj=1...N|<rt-1j>|,

式中,r-残差,λ-残差和字典原子的最大内积;

b.更新索引集Λt=Λt-1∪{λt},记录字典的重建原子集合Φt=[Φt-1λt],

式中,Λ-索引集,Φ-重建原子集合,φ-字典原子;

c.有最小二乘法得到

式中,的估计值,y-原始光谱;

d.更新残差t=t+1,式中,t-迭代次数;

e.判断是否满足t>K,若满足,则停止迭代;若不满足,则执行步骤a,式中,K-稀疏度;本发明为了得到最相关的特征峰信息,将原始光谱根据想要还原的特征峰位置,以峰与峰之间距离的二分之一为划分尺度进行划分,稀疏值K选择1,字典为将原始光谱进行信息域变换而得到的过完备字典。

图3为模拟纯净拉曼光谱图,图4为模拟带噪拉曼光谱图,图5为对于模拟光谱本发明提供方法与其他方法的对比图,由图中的S-G平滑去燥法所得拉曼光谱图像,小波去噪法所得拉曼光谱图像和本发明所得拉曼光谱图像效果的对比可知,本发明能更好的获取拉曼光谱信号的有效特征,特征提取效果好于其他方法;图6为对氯苯胺的实际高噪声拉曼光谱图,对于图6的拉曼光谱图分别采用S-G平滑去燥法、小波去噪法和本发明提供的方法去燥所得拉曼光谱图像对比如图7所示,由图7可以明显看出,本发明能够更好的提取实际拉曼光谱信号的特征峰,便于进一步的分析;图8为应用本发明提供的方法前后对于实际样品检出限的对比图,可以计算出处理后的光谱检出限低于未处理的光谱检出限3倍,对于低浓度分析有重要意义。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

以上所述,仅为本发明的较佳实施例,并不用以限制本发明,凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同替换和改进,均应包含在本发明技术方案的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1