1.一种基于语义信息感知的视频描述生成方法,其特征在于:包括
2.根据权利要求1所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤1包括:
3.根据权利要求1所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤2包括:
4.根据权利要求3所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤2.1包括:
5.根据权利要求3所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤2.2包括:
6.根据权利要求3所述的基于语义信息感知的视频描述生成方法,其特征在于:所述步骤2.1、2.2中,在得到实体特征及谓词特征后,通过一个全连接层将关键实体的特征向量o、谓词特征a分别投射到语言的语义空间得到实体词向量e、谓词词向量p。
7.根据权利要求1所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤3包括:
8.根据权利要求7所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤3.3中,解码部分采用一种双解码器的形式,分别解码步骤3.2得到的不同层面的信息并进行拼接得到最终的融合特征v:
9.根据权利要求1所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤4包括:
10.根据权利要求9所述的基于语义信息感知的视频描述生成方法,其特征在于:步骤4.1中,打分的具体计算公式为: