1.一种基于少样本条件下的招投标视觉语言模型的训练方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于少样本条件下的招投标视觉语言模型的训练方法,其特征在于,所述基于门控交叉注意力机制的密集连接文本处理模块包括以下具体操作:
3.根据权利要求1所述的基于少样本条件下的招投标视觉语言模型的训练方法,其特征在于,所述预训练的视觉编码器采用预训练的swintransformer模型,所述基于感知的重采样模块由带有注意力的通用感知器和detection transformer构成。
4.根据权利要求1所述的基于少样本条件下的招投标视觉语言模型的训练方法,其特征在于,在所述招投标视觉语言模型的训练过程中冻结所述预训练的视觉编码器和预训练的语言模型的参数,两个所述视觉单元中的基于感知的重采样模块参数共享。
5.一种基于少样本条件下的招投标视觉语言模型的训练装置,其特征在于,包括:
6.一种招投标视觉语言处理方法,其特征在于:采用权利要求1-4中任一项所述的基于少样本条件下的招投标视觉语言模型的训练方法训练得到的经训练的招投标视觉语言模型,包括以下步骤:
7.一种招投标视觉语言处理装置,其特征在于:采用权利要求1-4中任一项所述的基于少样本条件下的招投标视觉语言模型的训练方法训练得到的经训练的招投标视觉语言模型,包括:
8.一种电子设备,包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的方法。