基于二维Gabor小波的三维荧光光谱特征提取方法与流程

文档序号:17131896发布日期:2019-03-16 01:22阅读:967来源:国知局
基于二维Gabor小波的三维荧光光谱特征提取方法与流程

本发明涉及一种三维荧光光谱的特征提取方法,具体涉及一种基于二维gabor小波的三维荧光光谱特征提取方法。



背景技术:

三维荧光光谱是荧光分析法获得荧光光谱中的一种。三维荧光光谱是以激发波长和发射波长为变量获得的三维谱图,能够获得激发波长与发射波长同时变化情况下的荧光强度。根据荧光的产生和发射原理,物质分子对不同波长的激发光的吸收效率不同,激发效率也不同,因此在基于三维荧光光谱的有机物检测中,不同有机物将产生不同波长范围不同强度的三维荧光光谱谱图。与普通荧光光谱相比,三维荧光光谱包含了更为丰富的信息,同时由于三维荧光光谱的维数较高,计算量庞大,且在某些区域光谱信息很弱,与样品的关联较弱,全谱分析的模型学习和计算方法不适宜用于三维荧光光谱。因此需要从三维图谱信息中提取出表征不同有机物的有效特征信息来表征待测溶液中的物质引起的光谱变化,从而进一步检测溶液中有机物的种类。

现在的三维荧光光谱特征提取方法主要包括平行因子法(parafac)、主成分分析法(pca)等。这些方法在特定的研究领域和应用场景中可以得到适用性验证,但是在管网水有机污染物识别领域中存在一定的局限性。其中,平行因子法需要在算法伊始指定因子数,对未知污染物场景可能不太适用;主成分分析法对三维荧光光谱进行特征提取的方法是将三维荧光光谱按行向量方向或者列向量方向拉直成二维矩阵,损失了大量光谱图像纹理信息,不能很好地适应污染物光谱特征接近时的有机物种类识别。



技术实现要素:

针对上述现有方法存在的问题,本发明提供了一种基于二维gabor小波的三维荧光光谱特征提取方法。

一种基于二维gabor小波的三维荧光光谱特征提取方法,包括以下步骤:

s1.获取原始三维荧光光谱数据;

s2.利用delaunay三角形内插值法去除原始光谱中的瑞利散射;

s3.利用扣除空白背景溶剂的方法去除原始光谱中的拉曼散射;

s4.利用多维s-g平滑进行光谱去噪;

s5.不同的尺度伸缩和旋转产生的二维gabor小波函数与经过步骤s1-s4的预处理后的三维荧光光谱进行卷积滤波,得到不同的gabor系数特征矩阵;

s6.利用分块统计量的方法,对s5得到的gabor系数特征矩阵进行特征降维;

s7.将经过步骤s6方法得到的降维后的不同特征矩阵进行重新组合,得到关于该三维荧光光谱的最终特征矩阵。

所述的s4步骤中,对去除瑞利散射和拉曼散射的三维荧光光谱进行savitzky-golay平滑处理。采用多项式进行拟合,由最小二乘法得到拟合系数,然后计算平滑窗口各点平滑值,得到平滑后的三维荧光光谱。

所述的s5步骤中,利用不同的尺度伸缩和旋转产生的二维gabor小波滤波器,和三维荧光光谱图像f(z)作卷积,将所有尺度、方向下的滤波结果连接形成一个列向量,得到不同的gabor系数特征矩阵。

所述的s6步骤中,将各gabor系数特征矩阵分成若干个子块矩阵,然后用子块矩阵内所有元素的均值和标准差对该块进行标记,代替原高维gabor特征。

所述的s7步骤中,将每一个gabor矩阵的分块特征描述量组成一个特征向量,作为该污染物三维荧光光谱的特征表示。

本发明的方法结合二维gabor小波算法和分块统计量二次特征描述方法,实现了基于二维gabor小波的三维荧光光谱特征提取方法。本发明提出的二维gabor小波对三维荧光光谱进行特征提取的方法对管网水有机污染物识别的准确率较高,达到了95%。本发明的方法对污染物三维荧光光谱谱图接近的有机污染物识别效果也较好,可以识别光谱特征峰重叠或接近的污染物,在城市管网水水质监测和污染物识别领域可以发挥较好的作用。

附图说明

图1为基于二维gabor小波的三维荧光光谱特征提取方法的流程图;

图2为苯酚、间苯二酚、对苯二酚、水杨酸、罗丹明b(10ug/l)的三维荧光图;

图3为罗丹明b饮用水溶液在不同gabor滤波器下的系数特征图;

图4为苯酚、间苯二酚、对苯二酚、水杨酸、罗丹明b(10ug/l)在尺度为4,方向为3滤波器下的gabor系数图;

图5为测试数据在pca(左)二维gabor小波(右)特征提取下的识别比较结果。

具体实施方案

下面结合附图对本发明进一步描述。

基于二维gabor小波的三维荧光光谱特征提取方法的基本步骤如图1所示,主要包含:三维荧光光谱数据预处理,二维gabor小波方法特征提取,分块统计量二次特征描述,输入分类器进行分类识别。

一种基于二维gabor小波的三维荧光光谱特征提取方法,包括以下步骤:

s1.获取原始三维荧光光谱数据;

s2.利用delaunay三角形内插值法去除原始光谱中的瑞利散射;

s3.利用扣除空白背景溶剂的方法去除原始光谱中的拉曼散射;

s4.利用多维s-g平滑进行光谱去噪;

s5.不同的尺度伸缩和旋转产生的二维gabor小波函数与经过步骤s1-s4的预处理后的三维荧光光谱进行卷积滤波,得到不同的gabor系数特征矩阵;

s6.利用分块统计量的方法,对s5得到的gabor系数特征矩阵进行特征降维;

s7.将经过步骤s6方法得到的降维后的不同特征矩阵进行重新组合,得到关于该三维荧光光谱的最终特征矩阵。

所述的s4步骤中,对去除瑞利散射和拉曼散射的三维荧光光谱进行savitzky-golay平滑处理。采用多项式进行拟合,由最小二乘法得到拟合系数,然后计算平滑窗口各点平滑值,得到平滑后的三维荧光光谱。

所述的s5步骤中,利用不同的尺度伸缩和旋转产生的二维gabor小波滤波器,和三维荧光光谱图像f(z)作卷积,将所有尺度、方向下的滤波结果连接形成一个列向量,得到不同的gabor系数特征矩阵。其中,μ和v分别代表gabor滤波器的方向和尺度,z=(x,y)为空间位置,kμ,v为平面波的波向量,表示为其中,kv=kmax/fν,中u=πμ/8,kmax=π/2为最大频率。

所述的s6步骤中,将各gabor系数特征矩阵分成若干个子块矩阵,然后用子块矩阵内所有元素的均值和标准差对该块进行标记,代替原高维gabor特征。

所述的s7步骤中,将每一个gabor矩阵的分块特征描述量组成一个特征向量,作为该污染物三维荧光光谱的特征表示。

实施例

以实验室配置不同有机污染物的管网水溶液为实验样本进行实验验证。选取苯酚、对苯二酚、间苯二酚、水杨酸、罗丹明b为实验有机物。将上述有机物配制成浓度梯度2μg/l、4μg/l、6μg/l、8μg/l、10μg/l、20μg/l、30μg/l、40μg/l的管网饮用水,并使用日立f-4600荧光光谱仪扫描上述样本,得到三维荧光光谱图。其中,所用的管网饮用水分别采自2018年5月1日至2018年5月4日的实验室自来水管道中。将前三天的数据作为模型训练数据,最后一天的数据作为模型测试数据。原始的光谱数据存在散射和噪声,采用delaunay三角形内插值法对光谱进行瑞利散射去除,采用扣除纯自来水光谱图的方法扣除拉曼散射,并且采用s-g平滑对光谱数据进行去噪处理。观察预处理后五种有机污染物的三维荧光光谱图(如图2),可以发现,对苯二酚和间苯二酚的三维荧光光谱图极为接近,两种污染物的光谱特征峰几乎重叠。

光谱预处理后,将光谱数据分别与包含5个尺度v={0,1,2,3,4}和8个方向μ={0,1,2,3,4,5,6,7}的gabor滤波器组进行卷积滤波,每一个样本得到了40个不同尺度、不同方向滤波器下的gabor特征子带输出mμ,ν,如图3。令rμ,ν(z)是在方向μ、尺度v下的滤波结果。如果将所有尺度、方向下的滤波结果连接形成一个列向量:将其作为三维荧光图像的特征向量,其中,mμ,v表示子带输出mμ,ν中的元素经过逐行(列)接连后形成的列向量。在进行二维gabor小波特征提取后,我们从对应的gabor特征系数图中可以发现,gabor系数特征光谱可以提取细微的光谱纹理信息。观察五种不同有机污染物在滤波器尺度为4,方向为3时的gabor系数图,如图4,都有较为明显的不同的纹理特征。对于对苯二酚和间苯二酚两种原始三维荧光光谱图十分接近的物质而言,在特征系数图中也表达了纹理走向的不同。

这样得到的特征矩阵维数过高,通过采用分块统计量的方法进行特征降维和二次描述。对于gabor变换后的某个子带图像令rμ,v(z),将其划分成k个彼此连接的、具有相同大小的子块,记第i个子块为用子块内元素的均值和标准差作为该子块区域的局部特征描述。再将所有子带mμ,v(z)(μ∈{0,...7},v∈{0,...4})中的分块统计量连接成一个列向量:

在本次实验过程中,我们采用k=16作为子块分割数量。通过分块统计量对特征进行二次提取之后,每种不同浓度的污染物的三维荧光光谱图的特征信息得到了充分的描述,将该批特征光谱数据记为特征1。为了体现本方法相比于传统无监督学习特征提取方法pca方法的优越性,将同一批测试数据进行pca特征提取,记为特征2,共同输入svm多分类器中,验证实验效果。采用不同的核函数进行svm模型训练,使用网格法搜索最优参数,得到svm多分类模型,并用测试集进行测试。结果发现当采用为线性核时,样本识别率最高。分别采用pca和二维gabor小波进行特征提取对有机污染物的识别对比结果如图5所示。

对于样本特征区分度比较大的罗丹明b、水杨酸,有较为明显的独立特征峰,直接采用pca对三维荧光数据进行降维特征提取和采用二维gabor小波进行特征提取两种方法,都可以取得较为理想的分类效果,从图中可以得到,两种特征提取方法下的识别正确率都达到了90%以上。但对于苯酚、对苯二酚、间苯二酚这类特征峰位置相近甚至重叠,且三维荧光光谱形状比较类似的污染物,采用二维gabor小波进行特征提取能够更加细致地表征荧光谱图中的纹理信息,并在提取得到的gabor特征系数中加以表现。而pca直接将三维数据向一个方向拉直成二维数据,并且降维提取特征,会损失三维谱图自身带有的细节信息。在本批次测试数据中,pca方法对于对苯二酚和间苯二酚在低浓度样本的区分能力相对较差,识别正确率为87.5%,而gabor方法则将所有对苯二酚和间苯二酚样本都识别正确。因此,对于污染物特征峰接近或重叠的物质,基于二维gabor小波的特征提取结合svm多分类器能够有较好的识别效果。

针对以上实验结果,可见本发明在管网水有机污染物的识别检测中有较好的实际应用价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1