图像处理方法、装置、电子设备及存储介质

文档序号:31545448发布日期:2022-09-17 01:02阅读:来源:国知局

技术特征:
1.一种图像处理方法,其特征在于,包括:获取待处理图像;将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。2.根据权利要求1所述的图像处理方法,其特征在于,所述特征提取模型包括级联的多个特征提取模块,所述多个特征提取模块包括正交特征提取模块,所述正交特征提取模块包括级联的所述正交自注意力模块和前向传播网络;所述将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征,包括:将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,所述上一令牌是所述当前的特征提取模块之前的特征提取模块输出的;将最尾的特征提取模块输出的令牌作为所述图像特征。3.根据权利要求2所述的图像处理方法,其特征在于,在所述当前的特征提取模块为正交特征提取模块的情况下,所述将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,包括:将所述上一令牌输入到当前的特征提取模块的正交自注意力模块,由所述正交自注意力模块将所述上一令牌进行正交化,得到正交令牌,再对所述正交令牌进行多头注意力计算,将计算所得的正交注意力特征进行逆正交化,并对逆正交化后的注意力特征与所述上一令牌进行融合,得到所述正交自注意力模块输出的当前自注意力特征;将所述当前自注意力特征输入到当前的特征提取模块的前向传播网络,得到所述前向传播网络输出的当前令牌。4.根据权利要求2所述的图像处理方法,其特征在于,所述多个特征提取模块还包括窗口特征提取模块,所述窗口特征提取模块包括级联的窗口自注意力模块和前向传播网络,所述窗口自注意力模块用于将所述待处理图像的令牌以滑动窗口的形式划分后进行自注意力转换。5.根据权利要求4所述的图像处理方法,其特征在于,在所述当前的特征提取模块为窗口特征提取模块的情况下,所述将所述待处理图像的上一令牌输入到当前的特征提取模块,得到所述当前的特征提取模块输出的当前令牌,包括:将所述上一令牌输入到当前的特征提取模块的窗口自注意力模块,由所述窗口自注意力模块将所述上一令牌进行窗口划分,得到窗口令牌,再对所述窗口令牌进行多头注意力计算,将计算所得的窗口注意力特征进行窗口合并,并对窗口合并后的注意力特征与所述上一令牌进行融合,得到所述窗口自注意力模块输出的当前自注意力特征;将所述当前自注意力特征输入到当前的特征提取模块的前向传播网络,得到所述前向传播网络输出的当前令牌。6.根据权利要求2至5中任一项所述的图像处理方法,其特征在于,所述前向传播网络包括第一卷积层,所述第一卷积层用于提取位置信息。
7.根据权利要求6所述的图像处理方法,其特征在于,所述前向传播网络包括第一分支和第二分支,所述第一分支和所述第二分支的输入相同,所述第一分支和所述第二分支的输出相加作为所述前向传播网络的输出;所述第一分支包括顺次连接的第一归一化层、第一全连接层、激活层、所述第一卷积层和第二全连接层;在所述第一卷积层的卷积核步长为1的情况下,所述第二分支的输入与输出相同;在所述第一卷积层的卷积核步长大于1的情况下,所述第二分支包括顺次连接的第二归一化层和第二卷积层,所述第二卷积层的卷积核步长与所述第一卷积层的卷积核步长相同。8.一种图像处理装置,其特征在于,包括:获取单元,用于获取待处理图像;特征提取单元,用于将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;图像处理单元,用于基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述图像处理方法。10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述图像处理方法。

技术总结
本发明涉及计算机视觉技术领域,提供一种图像处理方法、装置、电子设备及存储介质,其中方法包括:获取待处理图像;将所述待处理图像输入至特征提取模型,得到所述特征提取模型输出的图像特征;基于所述图像特征,对所述待处理图像进行图像处理;所述特征提取模型包括正交自注意力模块,所述正交自注意力模块用于将所述待处理图像的令牌投影到正交空间进行自注意力转换。本发明提供的方法、装置、电子设备及存储介质,特征提取模型中的正交自注意力模块,可以将待处理图像的令牌投影到正交空间进行自注意力转换,降低了自注意力转换的复杂度,提高了图像特征的提取质量,因此保证了图像处理的有效性。像处理的有效性。像处理的有效性。


技术研发人员:赫然 黄怀波 周晓强
受保护的技术使用者:中国科学院自动化研究所
技术研发日:2022.07.28
技术公布日:2022/9/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1