本发明属于智能控制,具体涉及一种激光显微拉曼光谱仪的控制模型训练方法及装置、设备。
背景技术:
1、激光显微拉曼光谱仪(简称拉曼光谱仪)常用于获取样品的分子振动信息分析得到拉曼光谱数据,对于样品的物理化学性质分析有着决定性的作用。然而,获取到的拉曼光谱数据的质量通常受到拉曼光谱仪扫描参数设置的影响,包括激光功率、积分时间、步进距离等因素,在实际应用中,这些扫描参数的调整通常需要人工操作,非常依赖于操作者的经验和直觉,这不但耗时耗力,而且无法保证扫描结果的最优性。
2、现有的基于人工经验的扫描参数调整方法仍存在许多局限性,例如难以针对不同类型的样品提供最佳扫描效果、过于依赖经验规则的制定等。因此现有拉曼光谱仪通过手动调整扫描参数的方法,不确定性较高,无法自适应调整扫描参数,难以在各种不同环境条件和样品类型下都实现最佳的扫描效果。
技术实现思路
1、本发明的目的在于提供一种激光显微拉曼光谱仪的控制模型训练方法及装置、设备,可以自适应调整扫描参数,从而提高扫描控制准确性和操作效率,进而保证扫描结果的最优性。
2、本发明第一方面公开一种激光显微拉曼光谱仪的控制模型训练方法,包括:
3、基于深度q网络构建激光显微拉曼光谱仪的控制模型;
4、控制激光显微拉曼光谱仪针对样品扫描得到第一显微图像及对应的第一拉曼光谱;
5、将第一显微图像和第一拉曼光谱分别输入所述控制模型,以使所述控制模型预测得到每个候选扫描参数的预测动作价值;
6、将激光显微拉曼光谱仪的当前扫描参数调整为预测动作价值最高的候选扫描参数,控制激光显微拉曼光谱仪进行重新扫描,获得第二显微图像及对应的第二拉曼光谱;
7、根据第二显微图像和第二拉曼光谱计算目标动作价值;
8、以目标动作价值为标签,将所述第二显微图像和所述第二拉曼光谱输入所述控制模型进行迭代训练,以优化所述控制模型的网络参数。
9、在一些实施例中,根据第二显微图像和第二拉曼光谱计算目标动作价值,包括:
10、计算第二拉曼光谱的信噪比;
11、计算第二拉曼光谱的基线奖励;
12、计算第二显微图像的图像奖励;
13、根据第二拉曼光谱的信噪比和基线奖励、第二显微图像的图像奖励以及惩罚项,计算总奖励值作为目标动作价值。
14、在一些实施例中,计算第二拉曼光谱的信噪比,包括:
15、对第二拉曼光谱进行平滑处理得到平滑后的第三拉曼光谱;
16、根据第二拉曼光谱与第三拉曼光谱,计算获得拉曼光谱噪声;
17、根据第三拉曼光谱的均值、拉曼光谱噪声的标准差,计算得到第二拉曼光谱的信噪比。
18、在一些实施例中,计算第二拉曼光谱的基线奖励,包括:
19、对第二拉曼光谱进行基线校正,获得基线校正后的校正光谱;
20、求取第二拉曼光谱和校正光谱之间的光谱差值;
21、根据光谱差值计算得到第二拉曼光谱的基线奖励。
22、在一些实施例中,计算第二显微图像的图像奖励,包括:
23、分别根据第二显微图像,计算其对比度的第一度量值、图像信噪比的第二度量值、清晰度的第三度量值以及图像畸变的第四度量值;
24、根据第一度量值、第二度量值、第三度量值和第四度量值,计算得到第二显微图像的图像奖励。
25、本发明第二方面公开一种激光显微拉曼光谱仪的控制模型训练装置,包括:
26、构建单元,用于基于深度q网络构建激光显微拉曼光谱仪的控制模型;
27、第一扫描单元,用于控制激光显微拉曼光谱仪针对样品扫描得到第一显微图像及对应的第一拉曼光谱;
28、预测单元,用于将第一显微图像和第一拉曼光谱分别输入所述控制模型,以使所述控制模型预测得到每个候选扫描参数的预测动作价值;
29、调整单元,用于将激光显微拉曼光谱仪的当前扫描参数调整为预测动作价值最高的候选扫描参数;
30、第二扫描单元,用于控制激光显微拉曼光谱仪进行重新扫描,获得第二显微图像及对应的第二拉曼光谱;
31、目标计算单元,用于根据第二显微图像和第二拉曼光谱计算目标动作价值;
32、训练单元,用于以目标动作价值为标签,将所述第二显微图像和所述第二拉曼光谱输入所述控制模型进行迭代训练,以优化所述控制模型的网络参数。
33、在一些实施例中,所述目标计算单元包括:
34、第一计算子单元,用于计算第二拉曼光谱的信噪比;
35、第二计算子单元,用于计算第二拉曼光谱的基线奖励;
36、第三计算子单元,用于计算第二显微图像的图像奖励;
37、第四计算子单元,用于根据第二拉曼光谱的信噪比和基线奖励、第二显微图像的图像奖励以及惩罚项,计算总奖励值作为目标动作价值。
38、在一些实施例中,所述第一计算子单元,具体用于对第二拉曼光谱进行平滑处理得到平滑后的第三拉曼光谱;根据第二拉曼光谱与第三拉曼光谱,计算获得拉曼光谱噪声;根据第三拉曼光谱的均值、拉曼光谱噪声的标准差,计算得到第二拉曼光谱的信噪比。
39、在一些实施例中,所述第二计算子单元,具体用于对第二拉曼光谱进行基线校正,获得基线校正后的校正光谱;求取第二拉曼光谱和校正光谱之间的光谱差值;根据光谱差值计算得到第二拉曼光谱的基线奖励。
40、本发明第三方面公开一种电子设备,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行第一方面公开的激光显微拉曼光谱仪的控制模型训练方法。
41、本发明第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行第一方面公开的激光显微拉曼光谱仪的控制模型训练方法。
42、本发明的有益效果在于,通过基于深度q网络构建拉曼光谱仪的控制模型,首先控制拉曼光谱仪针对样品扫描得到显微图像及拉曼光谱,将显微图像和拉曼光谱输入控制模型,以预测得到每个候选扫描参数的预测动作价值,将拉曼光谱仪的当前扫描参数调整为预测动作价值最高的候选扫描参数,控制拉曼光谱仪重新扫描,获得新的显微图像及新的拉曼光谱,根据新的显微图像和拉曼光谱计算目标动作价值,最后以目标动作价值为标签,将新的显微图像和拉曼光谱输入控制模型进行迭代训练,以优化控制模型的网络参数,从而通过不断迭代训练,控制模型可以逐渐学习到最优的策略,以最小化预测的动作价值与目标动作价值之间的差异,基于准确预测候选扫描参数的动作价值,可以实现自适应调整扫描参数,从而提高扫描控制准确性和操作效率,保证扫描结果的最优性。
1.一种激光显微拉曼光谱仪的控制模型训练方法,其特征在于,包括:
2.如权利要求1所述的激光显微拉曼光谱仪的控制模型训练方法,其特征在于,根据第二显微图像和第二拉曼光谱计算目标动作价值,包括:
3.如权利要求2所述的激光显微拉曼光谱仪的控制模型训练方法,其特征在于,计算第二拉曼光谱的信噪比,包括:
4.如权利要求2所述的激光显微拉曼光谱仪的控制模型训练方法,其特征在于,计算第二拉曼光谱的基线奖励,包括:
5.如权利要求2所述的激光显微拉曼光谱仪的控制模型训练方法,其特征在于,计算第二显微图像的图像奖励,包括:
6.一种激光显微拉曼光谱仪的控制模型训练装置,其特征在于,包括:
7.如权利要求6所述的激光显微拉曼光谱仪的控制模型训练装置,其特征在于,所述目标计算单元包括:
8.如权利要求7所述的激光显微拉曼光谱仪的控制模型训练装置,其特征在于,所述第一计算子单元,具体用于对第二拉曼光谱进行平滑处理得到平滑后的第三拉曼光谱;根据第二拉曼光谱与第三拉曼光谱,计算获得拉曼光谱噪声;根据第三拉曼光谱的均值、拉曼光谱噪声的标准差,计算得到第二拉曼光谱的信噪比。
9.如权利要求7所述的激光显微拉曼光谱仪的控制模型训练装置,其特征在于,所述第二计算子单元,具体用于对第二拉曼光谱进行基线校正,获得基线校正后的校正光谱;求取第二拉曼光谱和校正光谱之间的光谱差值;根据光谱差值计算得到第二拉曼光谱的基线奖励。
10.一种电子设备,其特征在于,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至5任一项所述的激光显微拉曼光谱仪的控制模型训练方法。