基于Transformer模型的自由视场红外数字全息成像方法

文档序号:30522952发布日期:2022-06-25 05:39阅读:190来源:国知局
基于Transformer模型的自由视场红外数字全息成像方法
基于transformer模型的自由视场红外数字全息成像方法
技术领域
1.本发明涉及红外数字全息成像技术领域,特别涉及一种基于transformer模型纠差的自由视场红外数字全息成像方法。


背景技术:

2.红外波段处于可见光波段之外因其对于不同物质的穿透性不同,使之在成像领域有着很好的应用前景,而数字全息技术因其成像结构简单和灵活的数据处理方式,对特定目标样品的多个聚焦层面成像有着独特优势。transformer模型是谷歌在2017年底发表的论文attention is all you need中所提出seq2seq模型。而transformer这个seq2seq模型的特别之处是模型当中大量用到了自注意力层。transformer模型现如今在计算机视觉当中也表现出了非常令人满意的效果。在传统成像过程中,存在聚焦距离判定精准度低且最终合成的主视场振幅图像与主视场相位图像存在明显的折痕的问题,通过transformer模型实现红外数字全息成像的训练与识别,结合三者的优势,可以实现一种基于transformer模型纠差的自由视场红外数字全息成像技术。
3.现有的自由视场红外数字全息成像方法存在的不足为:聚焦距离判定精准度低,最终合成的主视场振幅图像与主视场相位图像存在明显的折痕,严重影响图像质量。


技术实现要素:

4.本发明针对现有技术的缺陷,提供了一种基于transformer模型的自由视场红外数字全息成像方法。解决聚焦距离判定精准度低且最终合成的主视场振幅图像与主视场相位图像存在明显的折痕的问题。
5.为了实现以上发明目的,本发明采取的技术方案如下:
6.一种基于transformer模型的自由视场红外数字全息成像方法,包括以下步骤:
7.步骤一、构建真实样品数据集收集系统;
8.所述收集系统包括:可调谐激光光源1、保护银膜反射式准直器2、二维电动平移台3、样品旋转平移台4、红外热释电探测器5和探测器二维平移台6。
9.可调谐激光光源1用于发射红外激光通过光纤连接至保护银膜反射式准直器2;保护银膜反射式准直器2用于使红外激光最大效率的耦合通过样品,二维电动平移台3和样品旋转平移台4相互配合能够让样品能够平移和旋转;二维电动平移台3和样品旋转平移台4位于保护银膜反射式准直器2的正下方。红外热释电探测器5用于接收红外激光热信号,位于二维电动平移台3的正下方。探测器二维平移台6位于红外热释电探测器5下方能够让红外热释电探测器5平移。
10.步骤二、transformer模型真实样品数据集收集过程,通过自由视场红外数字全息成像系统完成样品数据获取,覆有样品的载玻片放置于样品旋转平移台4上的二维电动平移台3上,设置二维电动平移台3水平扫描次数c次、纵向扫描次数z次、扫描路径和步进距离,设置样品旋转平移台4旋转次数x次、旋转方向顺时针和步进度数360/(x+1)
°
。样品自由
视场全息图采集过程采用遍历的方式,通过c次水平移动,红外热释电探测器5采集c+1个子视场全息图。之后二维电动平移台3完成纵向移动z次,每次纵向移动均平移至行初始位置,重复c次水平移动扫描。之后通过样品旋转平移台4完成旋转扫描x次,每次旋转位移均进行水平移动扫描和纵向移动扫描,共采集(x+1)*(z+1)*(c+1)张子视场全息图。
11.步骤三、训练集生成与transformer模型构建过程,通过计算机模拟全息图记录与重建过程获取对应的训练集,根据仿真样品模拟得到仿真子视场全息图进行预处理,预处理过程包括对仿真子视场全息图进行添加不同水平噪声,图像旋转,图像拉伸的操作。把子视场全息图预处理后的图像转换成数据集的形式,得到由仿真数据组成的用于子视场全息图重建的训练集,在transformer模型中设置自注意力层与多头注意力层并将其打包成一个矩阵q,键和值也被打包成矩阵k和v,矩阵计算公式如下:
[0012][0013]
multihead(q,k,v)=concat(head1,...,headn)wo[0014]
headi=attention(qw
iq
,kw
ik
,vw
iv
)
[0015]
其中softmax函数的功能为按照一定权重取矩阵内的值,concat函数功能为将内部所有矩阵相连,对进行预处理后的数据集进行训练获得分类后的结果,实现重建的子视场振幅图与子视场相位图的聚焦距离判定。最终把步骤一中的(x+1)*(z+1)*(c+1)张子视场全息图作为输入层,在输出层得到(x+1)*(z+1)*(c+1)张优化的子视场振幅图像与子视场相位图像。
[0016]
步骤四、基于transformer模型的背景噪声消除与图像融合拼接过程,通过基于transformer模型的原理训练平滑算法,平滑算法消除二维电动平移台3和样品旋转平移台4位移时的微小误差,校准不同位置子视场全息图的背景噪声至同一水平。平滑算法对子视场图像进行归一化处理。使用步骤二中(x+1)*(z+1)*(c+1)张处理后的子视场振幅图像和子视场相位图像进行图像分割,在分割过程中加入随机噪声干扰,并按照步骤二中的数据处理方法得到训练集,再按照步骤二中的方法设置transformer模型的自注意力层与多头注意力层,实现对训练集中的子视场图像进行拼接还原,求得最佳背景噪声数值,消除样品二维电动平移台和样品旋转平移台产生的位移误差,得到归一化后的结果。最后把步骤二中(x+1)*(z+1)*(c+1)张处理后的子视场振幅图像与子视场相位图像作为输入层,在输出层得到强度校准后平滑的主视场振幅图像与主视场相位图像。
[0017]
步骤五、对样品长时间轴的动态记录过程,通过步骤二实现样品图像的全过程、记录,标定时间信息,并通过步骤四中得到的主视场全息图按时间顺序的堆叠,实现长时间内物体变化全息信息的完整展现。
[0018]
作为优选,步骤五中在按照时间顺序堆叠的过程中,时间间隙可设置为每n1拍摄一张子视场振幅图与子视场相位图,并且记录n2小时,实现n2小时内长时间轴共计n3张主视场振幅图与主视场相位图。其中n1、n2和n3均为可设置的整数参数。
[0019]
与现有技术相比,本发明的优点在于:
[0020]
可以有效提高聚焦距离判定精准度,消除最终合成的主视场振幅图像与主视场相位图像存在的明显折痕,拍摄出在一段连续时间内高分辨率的无明显折痕的主视场振幅图像与主视场相位图像。
附图说明
[0021]
图1是本发明实施例自由视场红外数字全息成像方法流程图;
[0022]
图2是本发明实施例真实样品数据集收集系统结构示意图;
[0023]
图3是本发明实施例真实样品数据集收集系统收集图像示意图。
具体实施方式
[0024]
为使本发明的目的、技术方案及优点更加清楚明白,以下根据附图并列举实施例,对本发明做进一步详细说明。
[0025]
如图1所示,一种基于transformer模型的自由视场红外数字全息成像方法,包括以下步骤:
[0026]
步骤一、如图2所示,构建真实样品数据集收集系统,所述收集系统包括:1550nm可调谐激光光源1、保护银膜反射式准直器2、二维电动平移台3、样品旋转平移台4、红外热释电探测器5和探测器二维平移台6。
[0027]
可调谐激光光源1用于发射红外激光通过光纤连接至保护银膜反射式准直器2;保护银膜反射式准直器2用于使红外激光最大效率的耦合通过样品,二维电动平移台3和样品旋转平移台4相互配合能够让样品能够平移和旋转;二维电动平移台3和样品旋转平移台4位于保护银膜反射式准直器2的正下方。红外热释电探测器5用于接收红外激光热信号,位于二维电动平移台3的正下方。探测器二维平移台6位于红外热释电探测器5下方能够让红外热释电探测器5平移。
[0028]
步骤二、transformer模型真实样品数据集收集过程,通过自由视场红外数字全息成像系统完成样品数据获取,覆有样品的载玻片放置于样品旋转平移台4的二维电动平移台3上,设置二维电动平移台3水平扫描次数两次、纵向扫描次数两次、扫描路径和步进距离,设置样品旋转平移台4旋转次数三次、旋转方向顺时针和步进度数90
°
。样品自由视场全息图采集过程采用遍历的方式,通过两次水平移动,红外热释电探测器5采集三个子视场全息图。之后二维电动平移台3完成纵向移动两次,每次纵向移动均平移至行初始位置,重复两次水平移动扫描。之后通过样品旋转平移台4完成旋转扫描3次,每次旋转位移均进行水平移动扫描和纵向移动扫描,共采集4*3*3张子视场全息图。
[0029]
步骤三、训练集生成与transformer模型构建过程,通过计算机模拟全息图记录与重建过程获取对应的训练集,根据仿真样品模拟得到仿真子视场全息图进行预处理,预处理过程包括对仿真子视场全息图进行添加不同水平噪声,图像旋转,图像拉伸的操作。把子视场全息图预处理后的图像转换成数据集的形式,得到由仿真数据组成的用于子视场全息图重建的训练集,在transformer模型中设置自注意力层与多头注意力层并将其打包成一个矩阵q,键和值也被打包成矩阵k和v,矩阵计算公式如下:
[0030][0031]
multihead(q,k,v)=concat(head1,...,headn)wo[0032]
headi=attention(qw
iq
,kw
ik
,vw
iv
)
[0033]
其中softmax函数的功能为按照一定权重取矩阵内的值,concat函数功能为将内部所有矩阵相连,对进行预处理后的数据集进行训练获得分类后的结果,实现重建的子视
场振幅图与子视场相位图的聚焦距离判定。最终把步骤一中的4*3*3张子视场全息图作为输入层,在输出层得到4*3*3张优化的子视场振幅图像与子视场相位图像。
[0034]
步骤四、基于transformer模型的背景噪声消除与图像融合拼接过程,受限于红外探测器的低灵敏度和平移台的移动误差,不同位置采集图像的背景噪声存在一定的差异,导致图像质量非常低,无法清晰辨识待测目标。子视场全息图合成主视场全息图后,图像中各子视场全息图的交界处会存在明显的折痕。通过基于transformer模型的原理训练平滑算法,并且,由于二维电动平移台3和样品旋转平移台4位移的时候,不一定能转到准确位置,二维电动平移台3和样品旋转平移台4会产生微小误差,此算法可以消除该微小误差,校准不同位置子视场全息图的背景噪声至同一水平,达到消除图像割裂感的同时增强图像质量。因样品在不同位置会导致的子视场全息图强度不同,此算法可以对子视场图像进行归一化处理。使用步骤二中4*3*3张处理后的子视场振幅图像和子视场相位图像进行图像分割,在分割过程中加入随机噪声干扰,并按照步骤二中的数据处理方法得到训练集,再按照步骤二中的方法设置transformer模型的自注意力层与多头注意力层,实现对训练集中的子视场图像进行拼接还原,求得最佳背景噪声数值,消除样品二维电动平移台和样品旋转平移台产生的位移误差,得到归一化后的结果。最后把步骤二中4*3*3张处理后的子视场振幅图像与子视场相位图像作为输入层,在输出层得到强度校准后平滑的主视场振幅图像与主视场相位图像。
[0035]
步骤五、对样品长时间轴的动态记录过程,通过步骤二实现样品图像的全过程、记录,标定时间信息,并通过步骤四中得到的主视场全息图按时间顺序的堆叠,实现长时间内物体变化全息信息的完整展现,在按照时间顺序堆叠的过程中,时间间隙可设置为每5s拍摄一张子视场振幅图与子视场相位图,并且记录5小时,实现5小时内长时间轴共计100张主视场振幅图与主视场相位图。
[0036]
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的实施方法,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1