本申请涉及人工智能,更具体地,涉及一种话题标签的分类方法、装置、电子设备及存储介质。
背景技术:
1、在内容分享平台中,用户可以为待发布的分享内容添加话题标签,便于在分享内容被发布后基于话题标签进行匹配搜索。但是,相关技术中,部分分享内容中的话题标签实际上与分享内容在内容上并不相关,这样,如果分享内容的搜索过程中容易出现搜索到的分享内容实际上并不是用户需要的分享内容,即分享内容的话题标签中存在噪声话题标签。因此,如何识别话题标签与分享内容之间的内容相关性是相关技术中亟待解决的技术问题。
技术实现思路
1、鉴于上述问题,本申请实施例提出了一种话题标签的分类方法、装置、电子设备及存储介质,以识别话题标签与分享内容之间的内容相关性。
2、根据本申请实施例的一个方面,提供了一种话题标签的分类方法,包括:根据目标分享内容中的分享文本、目标话题标签和所述目标分享内容中的图像,确定第一特征序列;所述目标话题标签是所述目标分享内容的一个话题标签;通过相关性预测模型中的特征提取网络对所述第一特征序列进行交互特征提取,获得交互特征序列;将所述交互特征序列与目标类目特征序列进行组合,得到组合特征序列;所述目标类目特征序列至少包括所述目标话题标签所属类目对应的类目特征;通过所述相关性预测模型中的分类层根据所述组合特征序列进行相关性分类,获得相关性分类结果;所述相关性分类结果用于指示所述目标话题标签与所述目标分享内容之间的内容相关性。
3、根据本申请实施例的一个方面,提供了一种话题标签的分类装置,包括:确定模块,用于根据目标分享内容中的分享文本、目标话题标签和所述目标分享内容中的图像,确定第一特征序列;所述目标话题标签是所述目标分享内容的一个话题标签;交互特征提取模块,用于通过相关性预测模型中的特征提取网络对所述第一特征序列进行交互特征提取,获得交互特征序列;组合模块,用于将所述交互特征序列与目标类目特征序列进行组合,得到组合特征序列;所述目标类目特征序列至少包括所述目标话题标签所属类目对应的类目特征;相关性分类结果,用于通过所述相关性预测模型中的分类层根据所述组合特征序列进行相关性分类,获得相关性分类结果;所述相关性分类结果用于指示所述目标话题标签与所述目标分享内容之间的内容相关性。
4、在一些实施例中,所述目标分享内容为分享内容集合中的一个;在本实施例中,话题标签的分类装置,还包括:分数计算模块,用于根据所述分享内容集合中各分享内容的话题标签与分享内容之间的相关性分类结果,和各类型的相关性分类结果对应的分数,计算所述分享内容集合中各分享内容对应的分数;排序模块,用于按照分数由高到低的顺序,对所述分享内容集合中的分享内容进行排序,得到内容排序;发送模块,用于按照所述内容排序向终端发送所述分享内容集合中的分享内容。
5、在一些实施例中,话题标签的分类装置,还包括:删除模块,用于若所述相关性分类结果指示所述目标话题标签与所述目标分享内容之间内容不相关,则从所述目标分享内容的话题标签中删除所述目标话题标签。
6、在一些实施例中,话题标签的分类装置,还包括:训练数据获取模块,用于获取训练数据;所述训练数据包括多个样本分享内容、所述样本分享内容的话题标签和所述样本分享内容的话题标签对应的标注信息,所述标注信息是将所述样本分享内容对应的话题标签与所述样本分享内容之间进行内容相关性标注得到的;训练模块,用于通过所述训练数据对所述相关性预测模型进行训练。
7、在一些实施例中,训练模块,包括:样本输入序列确定单元,用于根据所述样本分享内容中的样本分享文本对应的第一样本词向量序列、所述样本分享内容的话题标签对应的第二样本词向量序列、所述样本分享内容中样本图像对应的图像特征序列,确定样本输入序列;样本交互特征序列确定单元,用于通过所述相关性预测模型中的特征提取网络对所述样本输入序列进行交互特征提取,获得样本交互特征序列;组合单元,用于将所述样本交互特征序列与样本类目特征序列进行组合,得到样本组合特征序列;所述样本类目特征序列至少包括所述话题标签所属类目对应的类目特征;相关性分类单元,用于通过所述相关性预测模型中的分类层根据所述样本组合特征序列进行相关性分类,获得第一相关性分类结果;预测损失计算单元,用于根据所述第一相关性分类结果和所述样本分享内容的所述话题标签对应的标注信息,计算预测损失;参数调整单元,用于根据预测损失反向调整所述相关性预测模型的参数,直至达到训练结束条件。
8、在一些实施例中,话题标签的分类装置,还包括:第一获取模块,用于获取所述样本分享内容的话题标签对应的第一标注信息,和获取所述样本分享内容的话题标签对应的第二标注信息,其中,所述第一标注信息和所述第二标注信息是不同的标注人员对所述话题标签与所述样本分享内容进行内容相关性标注得到的;标注信息确定模块,用于若所述第一标注信息所指示所述话题标签与所述样本分享内容之间的内容相关性与所述第二标注信息所指示所述话题标签与所述样本分享内容之间的内容相关性相同,将第一标注信息或者所述第二标注信息作为所述样本分享内容的话题标签对应的标注信息。
9、根据本申请实施例的一个方面,提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上所述话题标签的分类方法。
10、根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如上所述话题标签的分类方法。
11、根据本申请实施例的一个方面,提供了一种计算机程序产品,其包括计算机指令,所述计算机指令被处理器执行时实现如上的话题标签的分类方法。
12、在本申请的方案中,通过相关性预测模型根据目标分享内容中的分享文本、目标分享内容中的图像、目标话题标签以及目标话题标签所属类目来将目标分享内容与目标话题标签进行内容相关性分类,输出用于指示目标话题标签与目标分享内容之间内容相关性的相关性分类结果,实现了有效识别话题标签与分享内容之间的内容相关性。而且,在本申请中,将目标分享内容中的分享文本和目标分享内容中的图像、目标话题标签、以及目标话题标签所属类目这多种模态的信息进行内容相关性分类,利用多模态的信息可以充分交互,不同模态的信息之间可以相互增强,从而保证内容相关性分类的准确性。
13、此外,在本申请中,将目标话题标签所属类目应用于相关性预测模型,可以有效辅助相关性预测模型充分学习目标话题标签的语义,可以减少因错误理解目标话题标签的语义导致内容相关性分类不准确的情况,提升相关性预测模型所进行内容相关性分类的准确性。
1.一种话题标签的分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标类目特征序列还包括所述目标分享内容所属类目对应的类目特征。
3.根据权利要求1所述的方法,其特征在于,所述目标分享内容为分享内容集合中的一个;
4.根据权利要求1所述的方法,其特征在于,所述通过所述相关性预测模型中的分类层根据所述组合特征序列进行相关性分类,获得相关性分类结果之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述通过相关性预测模型中的特征提取网络对所述第一特征序列进行交互特征提取,获得交互特征序列之前,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述通过所述训练数据对所述相关性预测模型进行训练,包括:
7.根据权利要求5所述的方法,其特征在于,所述获取训练数据之前,所述方法还包括:
8.一种话题标签的分类装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,当所述计算机可读指令被处理器执行时,实现如权利要求1至7中任一项所述的方法。