本发明涉及数据分析领域,尤其涉及一种图片标签的生成方法、装置、电子设备及存储介质。
背景技术:
1、标签思维是互联网时代的核心思维之一,也是一个视觉场景能被快速了解的渠道之一。但是如何生成图片的标签成了一个问题。目前通常使用的方法是构建一个训练数据集,该训练数据集包括图片集及与该图片集强相关的标签。通过该训练数据集对预训练模型进行训练得到优选模型,该优选模型能够为目标图片生成与其相关的标签。但是一些视觉场景下的训练数据集难以构建,进而会导致优选模型为目标图片生成的视觉场景标签与目标图片的实际视觉场景不符,因此,图片的生成方法仍需改善。
技术实现思路
1、本发明要解决的技术问题是为了克服现有技术中一些视觉场景下的训练数据集难以构建,进而会导致优选模型为目标图片生成的视觉场景标签与目标图片的实际视觉场景不符的缺陷,提供一种图片标签的生成方法、装置、电子设备及存储介质。
2、本发明是通过下述技术方案来解决上述技术问题:
3、第一方面,提供一种图片标签的生成方法,所述生成方法包括:
4、获取每一视觉场景的正向文本特征和负向文本特征;其中,所述正向文本特征中包含至少一个可命中特征;
5、提取目标图片的目标命中特征,筛选出包括至少一个所述目标命中特征的目标视觉场景;
6、根据所述目标命中特征以及所述目标视觉场景的所述正向文本特征和所述负向文本特征,确定所述目标图片与每一所述目标视觉场景的相似度;
7、根据所述相似度,生成所述目标图片的视觉场景标签。
8、可选地,所述确定所述目标图片与每一所述目标视觉场景的相似度,包括:
9、当所述目标图片只有一个所述目标命中特征时,对于每一所述目标视觉场景:
10、计算所述正向文本特征的正向特征均值和所述负向文本特征的负向特征均值;
11、计算所述正向特征均值与所述负向特征均值的特征均值差值;
12、根据所述特征均值差值与所述目标命中特征,确定所述相似度。
13、可选地,根据所述特征均值差值与所述目标命中特征,确定所述相似度,包括:
14、计算出所述特征均值差值与所述目标命中特征的点积最大值;
15、将所述点积最大值对应的正向文本特征记为第一相似文本特征;
16、计算所述第一相似文本特征与所述目标图片的第一相似度,以所述第一相似度作为所述目标图片与所述目标视觉场景的相似度。
17、可选地,所述确定所述目标图片与每一所述目标视觉场景的相似度,包括:
18、当所述目标图片至少两个所述目标命中特征时,对于每一所述目标视觉场景:
19、计算每一所述正向文本特征与所述目标命中特征的正向相似度和每一所述正向文本特征与所述目标命中特征的负向相似度;
20、根据所述正向相似度、所述负向相似度及所述目标命中特征,确定所述相似度。
21、可选地,所述根据所述正向相似度、所述负向相似度及所述目标命中特征,确定所述相似度,包括:
22、在所述正向相似度的正向最大值大于等于所述负向相似度的负向最大值时,将所述正向最大值对应的正向文本特征记为第二相似文本特征;
23、计算所述第二相似文本特征与所述目标图片的第二相似度,以所述第二相似度作为所述目标图片与所述目标视觉场景的相似度。
24、可选地,所述根据所述相似度,生成所述目标图片的视觉场景标签,包括:
25、在所述相似度大于等于阈值时,生成所述目标图片的视觉场景标签;
26、可选地,所述生成方法还包括:
27、使用注意力机制对所述可命中特征进行加权,提升所述可命中特征在每一所述目标视觉场景的所述正向文本特征中的权重,以在所述目标命中特征与加权后的所述可命中特征相匹配时调整所述目标图片与每一所述目标视觉场景的相似度。
28、第二方面,提供一种图片标签的生成装置,所述生成装置,包括:
29、获取模块,用于获取每一视觉场景的正向文本特征和负向文本特征;其中,所述正向文本特征中包含至少一个可命中特征;
30、提取模块,用于提取目标图片的目标命中特征,筛选出包括至少一个所述目标命中特征的目标视觉场景;
31、确定模块,用于根据所述目标命中特征以及所述目标视觉场景的所述正向文本特征和所述负向文本特征,确定所述目标图片与每一所述目标视觉场景的相似度;
32、生成模块,用于根据所述相似度,生成所述目标图片的视觉场景标签。
33、第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的图片标签的生成方法。
34、第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述的图片标签的生成方法。
35、本发明的积极进步效果在于:直接根据目标命中特征以及目标视觉场景的正向文本特征和负向文本特征,确定目标图片与每一目标视觉场景的相似度;进而根据相似度,生成目标图片的视觉场景标签。这样就可以在不需要构建训练数据集的情况下,生成目标图片的视觉场景标签,解决了一些视觉场景下训练数据集难以构建的问题。此外,由于是根据目标图片和与目标图片相关的目标视觉场景的相似度生成的视觉场景标签,因此,保证了目标图片与生成的视觉场景标签之间的相似性。
1.一种图片标签的生成方法,其特征在于,所述生成方法包括:
2.如权利要求1所述的图片标签的生成方法,其特征在于,所述确定所述目标图片与每一所述目标视觉场景的相似度,包括:
3.如权利要求2所述的图片标签的生成方法,其特征在于,根据所述特征均值差值与所述目标命中特征,确定所述相似度,包括:
4.如权利要求1所述的图片标签的生成方法,其特征在于,所述确定所述目标图片与每一所述目标视觉场景的相似度,包括:
5.如权利要求4所述的图片标签的生成方法,其特征在于,所述根据所述正向相似度、所述负向相似度及所述目标命中特征,确定所述相似度,包括:
6.如权利要求1所述的图片标签的生成方法,其特征在于,所述根据所述相似度,生成所述目标图片的视觉场景标签,包括:
7.如权利要求1所述的图片标签的生成方法,其特征在于,所述生成方法还包括:
8.一种图片标签的生成装置,其特征在于,所述生成装置,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的图片标签的生成方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的图片标签的生成方法。