基于Swin-transformer的大容量光通信自适应补偿方法

文档序号:37035399发布日期:2024-02-20 20:27阅读:25来源:国知局
基于Swin-transformer的大容量光通信自适应补偿方法

本发明属于光学通信领域,涉及携带轨道角动量(orbital angular momentum,oam)的涡旋光束在大气湍流中的传输和基于深度学习的自适应补偿方法。


背景技术:

1、随着以云计算、大数据为代表的信息技术的快速发展,全球网络带宽需求呈爆炸式增长。通信能力和速度必须迅速增长,以支持新技术的应用,具有空间相位变化的轨道角动量(oam)成为了目前光学无线通信(optical wireless communication,owc)领域研究的热点。

2、与时间、波长、振幅、相位和偏振等物理维度相比,轨道角动量(oam)是涡旋光束的一种新的空间维度,源于其空间结构,形成了螺旋相位前沿。涡旋光束的相位随方位角变化,并可表示为其中l是代表拓扑电荷(topological charge,tc)的oam状态。不同的l值对应于波前的不同螺旋形状,而这些模式l是正交的。通过使用oam状态,可以在空间域中编码信息,实现在单一信道上同时传输多个数据流,从而提升频谱效率和信道容量。oam复用技术利用oam模式的正交性,将多路信号调制在不同的oam模式上,根据模式的不同区分不同的信道,理论上可以无限提高通信容量,多个oam模式分别携带不同的数据在空间环境下实现信息的复用传输,最终在接收端使用解复用器完成数据的接收。因此,发展oam技术可以解决现代通信高速率、大容量的需求,是大幅度提高信息传输容量的有效途径。

3、然而,当oam光束穿过大气湍流(atmospheric turbulence,at)时,它们会经历波前相位的扭曲,这种扭曲是由大气中温度和密度的不均匀性引起的,导致了大气的折射率的不均匀性分布,这种不均匀性会破坏不同状态的oam光束之间的正交性,导致oam模式之间的模式串扰,并导致oam的螺旋相位结构发生畸变,降低owc链路的性能。

4、为了克服大气湍流对oam光束的影响,通常需要采用自适应光学(adaptiveoptics,ao)技术。这些技术包括使用波前传感器来测量相位畸变,并使用可变形镜或其他补偿装置来实时纠正相位扭曲。通常采用gerchberg-saxton(gs)和随机并行梯度下降(spgd)算法来补偿相位畸变,但是上述两个算法仍会降低ao系统的校准效率。主要是由于这两种算法通常需要多次迭代才能达到满意的结果,尤其是在需要高精度的相位控制应用中,这可能导致较长的计算时间和较低的实时性能;易陷入局部最优解,这意味着它们可能无法找到全局最优的相位控制解决方案。

5、近年来深度学习在医学影像分析、自动驾驶、图像处理等领域表现出出色的性能,许多研究人员也在大气湍流信息提取和涡旋光束补偿方面做了大量的研究,结果表明深度学习技术可以很好的改善oam光束的传输性能,具备提升oam光学通信系统性能的潜力。这种基于深度学习技术的校正方法相较于传统的自适应光学(ao)系统,具备更为精准和更快的纠正能力。


技术实现思路

1、本发明的目的是提供一种oam光束在大气湍流下产生相位畸变的补偿方法,基于swin-transformer的网络模型从oam强度分布图像中提取大气湍流相位屏,通过对用于提取大气湍流相位屏的swin-transformer网络模型不断训练,以学习畸变oam光束和对应的大气湍流相位屏之间的非线性关系,将该相位屏的复共轭加载到待补偿oam光束,补偿oam光束在大气湍流下产生相位的畸变,缓解模间串扰,从而使传输光束的传输功率增高,提升传输模式的纯度。同时,本发明引入基于移位窗口的自注意力机制,能够捕捉输入序列中的长距离依赖性,将自注意力局限于局部窗口中并使用滑动窗口策略促进窗口之间的信息交流,在减少计算开销的同时保持transformer的全局特征提取能力。本发明适用于光通信等领域,显著提升光通信系统的可靠性。本发明解决技术问题所采用的技术方案如下:

2、本发明公开的基于swin-transformer的大容量光通信自适应补偿方法,包括如下步骤:

3、步骤一:建立oam光束在大气湍流信道中的传输模型,基于大气湍流信道中的传输模型采集受大气湍流影响后的oam光束光强分布图,获得的相位受影响的畸变光束作为步骤二swin-transformer神经网络的输入,对应的大气湍流相位屏作为步骤二swin-transformer神经网络的标签进行训练,制作包括不同大气湍流信息的受大气湍流影响的畸变oam光束光强分布图数据集。

4、步骤一所述oam光束在大气湍流信道中的传输模型建立方法为:

5、oam光束中光束围绕其中心轴向前传播,具有螺旋相位结构和携带轨道角动量的波矢量。拉盖尔-高斯光束是携带oam的涡旋光束,表示为:

6、

7、式中,p和l分别为lg光束的径向折射率和拓扑电荷,为空间点到传输轴的径向距离,k=2π/λ为波数,λ为波长,z为传播距离,为方位角,ω0为束腰半径。是传输到z的光束的半径。

8、大气湍流在时间和空间上是连续分布的。折射率的随机分布干扰涡旋光束的波前相位。大气湍流对oam传输的影响等效为oam在随机相位屏之间的自由传输。采用改进的vonkarman大气湍流模型,湍流折射率波动的空间功率谱表示为:

9、

10、式中κ为角空间频率,单位为rad/m;km=5.92/l0;k0=2π/l0;l0和l0分别表示湍流的外部尺度和内部尺度。是大气折射率的结构常数,表示湍流强度。

11、oam波束在大气中的传输等效为在固定间隔的多个随机相位屏之间的波束传输。将波束的传播距z分隔成n段,则连续相位屏之间的间隔δz=z/n。

12、涡旋光束在大气湍流中传输时,会产生波前畸变。大气湍流引起的相位等效为相位屏对光场的影响。当光场通过相位屏时,进行纯相位调制。只有相位改变,但振幅保持不变。然后以δz的距离传播到下一相屏的位置,直到oam光束最后通过第n个相位屏,完成oam光束在大气湍流整个距离的传播。

13、受湍流影响的光束的光场表达式为:

14、

15、通过相位屏输出的光束的复振幅为:

16、

17、式中,ψ0(x,y)andψ(x,y)分别表示光束通过相位屏前后的相位分布。

18、获得的相位受影响的畸变光束作为步骤二swin-transformer神经网络的输入,对应的大气湍流相位屏作为步骤二swin-transformer神经网络的标签进行训练。

19、步骤二:根据步骤一制作的包括不同大气湍流信息的受大气湍流影响的畸变oam光束光强分布图数据集,作为用于提取大气湍流信息的swin-transformer神经网络的输入,将对应的大气湍流相位屏作为标签,对用于提取大气湍流信息的swin-transformer神经网络进行训练,使其对不同输入图像的特征进行提取,以均方误差损失mse作为损失函数,不断训练来调整优化swin-transformer神经网络参数,使swin-transformer神经网络输出的大气湍流相位屏和大气湍流相位屏标签之间的差异越来越小,直至求解到swin-transformer神经网络的最佳参数,学习到满足预设要求的畸变oam图像和对应的大气湍流相位屏之间的非线性关系,输出满足较小损失范围内的大气湍流图像,相比传统gs、spgd等方法,实现更快速度、更高精度的预测大气湍流相位屏;通过引入自注意力机制,捕捉输入序列中的长距离依赖性,而cnn在这方面可能受到限制,实现全局特征的提取,进而提高通信系统的传输质量,提高通信系统的性能。保存损失最小时的网络模型参数,用于步骤三中对输入待补偿的畸变oam光束的预测。

20、步骤二中所述的swin-transformer神经网络包括一对连续的滑动窗口transformer块(swin transformer block,stb)、自注意力机制、块嵌入层、线性嵌入层、块合并层、特征压缩层、块扩张层;swin-transformer神经网络的结构由编码路径、高层级特征融合桥接路径、多阶段图像重建解码路径组成;所述一对连续的滑动窗口transformer块为移动窗口的transformer块和固定窗口的transformer块。

21、步骤2.1:将步骤一制作的含有大气湍流信息的畸变oam光束光强分布图像输入用于提取大气湍流信息的swin-transformer神经网络,编码路径对不同图像特征进行提取,将高维图像以低维特征表示,通过解码器将学习到的特征映射到标签生成对应的大气湍流相位屏,网络的输出则是畸变oam光束对应的大气湍流相位屏。

22、步骤2.2:步骤2.1所述的swin-transformer神经网络中的编码路径包含三层编码阶段,使用多个编码阶段的目的,是在较深的网络中提取图像中的湍流信息,用于解码路径中大气湍流相位屏的重建。输入图像被分割成3*3共9个图像块;阶段1由块嵌入层和stb×2组成,将输入序列中映射为连续向量空间中的嵌入向量,主要目的是将离散的输入符号转化为连续的实数向量,以便神经网络能够处理它们,用stb中的自注意力机制来将远距离上下文信息编码到图像块特征向量中,此为高分辨率阶段,低层级但是细粒度的图像特征例如空间细节在这个阶段被提取出来;阶段2由块融合层和stb×2组成,为了产生分层表示,随着网络变得更深,降低特征表示在空间上的分辨率以提取不同尺度的特征,通过块融合层来减少特征的数量,包含两个操作:首先每2×2个在空间上相邻的向量在特征维拼接,然后使用一个线性层对特征降维一半,最终块合并层输出的向量序列长度缩小为原来的四分之一,每个向量的特征维数增加为原来的两倍,之后应用stb×2进行特征转换,此为中分辨率阶段,用于中等大小地面实况的特征和较为抽象的上下文特征;阶段3和阶段2操作相同,仅将stb×2替换为stb×6,此为低分辨率阶段,大型地面实况的特征和抽象的高层级特征在此阶段被提取出来。以上为编码阶段的具体操作,可根据具体任务的需要重复阶段3的操作,加深网络的深度,提取更高层及的特征,这些阶段共同产生分层表示,具有与典型卷积网络相同的特征图分辨率。

23、步骤2.3:步骤二中所述的高层级特征融合桥接路径由stb×2组成,用于高级特征融合。

24、步骤2.4:步骤2.2中所述的图像重建解码路径也包含三个阶段来逐步融合多级特征表示以重建高分辨率大气湍流相位屏图像。在阶段4的开始,首先使用特征压缩层来削减冗余特征,特征压缩层先将输入序列层归一化,再通过线性层对每个块嵌入削减特征维度到原来的一半,用于去除冗余特征,对于输入图像来说,有用信息主要集中于图像中心;然后通过块扩张层,被设计为块融合层的逆操作来提升特征表示的分辨率,用于融合拼接特征。块扩张层由两个操作组成:先使用一个线性层对向量进行升维,通过可学习的线性变换将一个向量的特征细化为空间上相邻的4个向量的特征,然后每个升维了的向量被平均分割成4个空间上相邻的向量,块扩张后,嵌入序列的长度增加为原来的四倍,每个嵌入的特征维数减少为输入拼接特征的一半;在阶段的最后,使用一对连续stb来融合拼接特征。阶段5重复阶段4的操作。图像重构层将高分辨率融合特征表示映射回图像域。

25、步骤2.5:步骤2.4中所述的块扩张层操作在编码路径和解码路径中采用跳跃连接来共享上下文信息,将图像的最浅层原始特征直接通过跳跃连接注入到此层中进行最后的融合,以避免浅层特征和空间信息的丢失,使解码器在进行块扩张层操作时能够充分的利用特征信息,从而更精确的实现图像输出。

26、步骤2.6:步骤二所述的stb块通过将transformer模块中的标准多头自注意w-msa模块替换为基于移位窗口的模块来构建的sw-msa模块,其他层保持不变。swintransformer块由常规窗口的msa模块和基于移位窗口的msa模块组成;在每个msa模块和每个mlp之前应用layernorm(ln)层,并且在每个模块之后应用残差连接。因此,将自注意力局限于局部窗口中并使用滑动窗口策略促进窗口之间的信息交流,在减少计算开销的同时保持transformer的全局特征提取能力。

27、w-msa和sw-msa中自注意力的计算表达式为:

28、

29、式中,q、k和v都由ln后的向量序列经过线性变换得到。b为相对位置偏置矩阵。计算q与k的点积,将每个k除以应用softmax函数来获得值的权重与与v作矩阵乘法以得到根据上下文依赖性重新生成的向量序列。

30、步骤三:步骤二所述的swin-transformer神经网络模型训练完成后,获取待补偿的畸变oam光束的强度分布,将待校正的畸变光束的光强图像输入到训练完成的用于提取大气湍流信息的swin-transformer神经网络模型中,实现对应的大气湍流相位屏的预测,得到待补偿的畸变oam光束对应的大气湍流相位屏预测相位。

31、进一步的,获取待补偿畸变oam光束的强度分布,包括将光通信系统中接收端接收到的畸变oam光束通过偏振分束器分离,其中一束利用电荷耦合器件检测待补偿的畸变oam光束的光强分布,用于输入到计算机中,经过swin-transformer模型输出光束中的大气湍流相位,另一束用于在步骤四中做相位补偿。

32、步骤四:通过在空间光调制器上加载步骤三得到的大气湍流预测相位的共轭实现相位补偿,提升oam光束在光通信链路中传输模式的纯度,从而提升通信系统的传输能力。

33、进一步的,将步骤三中的预测得到的大气湍流相位屏的复共轭输入到波前矫正器,即步骤四中所述空间光调制器中,对待补偿oam光束进行波前矫正,净化oam光束的模式纯度,从而提升通信系统的传输能力。

34、有益效果:

35、1、本发明公开的基于swin-transformer的大容量光通信自适应补偿方法,采用swin-transformer神经网络学习畸变光束和大气湍流相位屏之间的映射关系,从而对待补偿的畸变光束直接预测对于的大气湍流相位屏,进而实现高精度地补偿空间光通信系统中的oam光束,其预测速度快且补偿精度高,相较于g-s等算法长时间的迭代,能够节省更多的时间和更快地对系统进行补偿,提高系统的补偿效率。

36、2、本发明公开的基于swin-transformer的大容量光通信自适应补偿方法,基于swin-transformer补偿大气湍流,相对于传统的ao光学技术的迭代算法,能够有效地解决其易陷入局部最优值的问题,高效校正畸变oam光束,降低自适应损伤补偿系统的复杂度。

37、3、本发明公开的基于swin-transformer神经网络学习来补偿相位畸变的方法,引入基于移动窗口的自注意力机制,能够捕捉输入序列中的长距离依赖性,将自注意力局限于局部窗口中并使用滑动窗口策略促进窗口之间的信息交流,在减少计算开销的同时保持transformer的全局特征提取能力,而cnn在这方面可能受到限制,实现全局特征的提取,进而提高通信系统的传输质量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1