本发明涉及自然语言处理,特别涉及一种零样本立场检测模型的构建方法、系统及计算机设备。
背景技术:
1、对抗学习是一种机器学习技术,旨在通过提供欺骗性输入来欺骗模型,现有技术中的toad模型是一种通过对抗学习以及域转移结构将每个主题视为一个领域来学习不同主题之间的文本中能够表达立场的主题不变特征,toad模型侧重挖掘文本中表达立场与主题无关的特征,在分类时简单的将主题向量与立场特征拼接,并使用了大量与测试集相同主题的未标注数据来辅助训练话题鉴别器。具体来说该模型分为四个组件(documentencoder、transformation、stance classifier、topic discriminator)模型先通过document encoder将话题与文本处理生成话题向量与文本向量,再通过transformation将文本向量进行线性变换分别出入stance classifier与topic discriminator中,通过对抗学习提高stance classifier的立场分类性能,同时最大化topic discriminator对话题的鉴别能力。
2、在对抗学习的过程中,toad模型将得能够提取文本中的主题不变特征,在最后阶段通过将主题不变特征拼接document encoder输出的话题向量进行零样本的立场检测,同时toad模型在训练过程中需要提供待预测话题相关的未标注文本来辅助训练,否则会严重影响toad模型的性能。
3、然而,通过对抗学习从文本中提取主题不变性特征,而立场检测的特点是基于主题的,而受toad模型的结构影响导致其在训练的时候会弱化文本与主题之间的相关性,同时toad模型在训练过程中需要提供待预测话题相关的未标注文本来辅助训练,否则会严重影响模型的性能,而现实生活中话题与文本几乎是无穷的,导致难以收集到所有的数据。
技术实现思路
1、基于此,本发明的目的是提出一种零样本立场检测模型的构建方法、系统及计算机设备,以能够捕获话题与文本之间的融合特征的基础上再结合话题题不变特征,以提高模型在零样本立场检测任务中的性能,且克服传统的toad模型需要提供待预测话题相关的未标注文本来辅助训练的缺点。
2、根据本发明提出的一种零样本立场检测模型的构建方法,所述方法包括:
3、获取数据集样本,所述数据集样本包括若干示例,任一所述示例均包括主题名称和文本内容,以对所述主题名称和文本内容进行融合编码,得到融合向量、主题向量以及文本向量;
4、根据对抗学习的域转移结构从所述主题向量和文本向量中提取话题不变特征,并对所述话题不变特征进行线性变换,以得到线性变换特征;
5、将所述线性变换特征和所述融合向量进行拼接,得到拼接特征,以将拼接特征输入到立场分类器,所述线性变换特征输入到话题鉴别器进行零样本立场模型的训练;
6、采用控制调度的超参数调度零样本立场模型在训练阶段不同的模式,以使得零样本立场模型在不同模式的动态调整中训练。
7、进一步地,在对所述主题名称和文本内容进行融合编码的步骤中:
8、融合编码损失记为:
9、
10、其中,表示融合编码损失,crossentropy(·)表示交叉熵损失函数,表示零样本立场模型预测的立场标签,l表示真实的立场标签。
11、进一步地,所述根据对抗学习的域转移结构从所述主题向量和文本向量中提取话题不变特征,并对所述话题不变特征进行线性变换,以得到线性变换特征的步骤包括:
12、将融合编码输入的所述主题向量和所述文本向量采用双向条件编码进行编码;
13、所述将融合编码输入的所述主题向量和所述文本向量采用双向条件编码进行编码的步骤包括:
14、采用第一个bi-lstm将所述主题向量编码为主题特征,再使用以所述主题特征为条件的第二个bi-lstm对所述文本向量进行编码,同时在第二个bi-lstm的输出上以所述主题特征为查询使用缩放点积注意力,以生成所述文本向量对所述主题向量的立场特征,所述立场特征为所述话题不变特征。
15、进一步地,所述根据对抗学习的域转移结构从所述主题向量和文本向量中提取话题不变特征,并对所述话题不变特征进行线性变换,以得到线性变换特征的步骤包括:
16、根据以下公式对所述话题不变特征进行线性变换:
17、
18、其中,表示线性变换特征,vdt表示话题不变特征,wtr表示对话题不变特征进行线性变换的权重矩阵。
19、进一步地,所述将所述线性变换特征和所述融合向量进行拼接,得到拼接特征,以将拼接特征输入到立场分类器,所述线性变换特征输入到话题鉴别器进行零样本立场模型的训练的步骤包括:
20、对每个bi-lstm的隐藏状态使用非线性变换进行重构,并采用对抗学习通过组合单个组件的损失进行零样本立场模型的训练;
21、联合对抗模式的损失记为:
22、
23、
24、表示联合对抗模式下的中间损失和,λrec、λtr均表示固定的超参数,表示第一个bi-lstm的重构损失,表示第二个bi-lstm的重构损失,表示对话题不变特征线性变换的权重矩阵损失,表示立场分类器损失,表示联合对抗模式下的总损失,λ表示l2正则化系数,θ表示零样本立场模型的融合编码模块的可训练参数,ρ表示话题鉴别器损失的权重,表示话题鉴别器损失,||·||2表示l2正则化。
25、进一步地,单独对抗模式的损失记为:
26、
27、其中,所述单独对抗模式为所述联合对抗模式的一个特例,表示单独对抗模式的损失。
28、进一步地,所述采用控制调度的超参数调度零样本立场模型在训练阶段不同的模式,以使得零样本立场模型在不同模式的动态调整中训练的步骤包括:
29、输入超参数η和μ以对零样本立场模型中的λ和ρ进行调整,以使零样本立场模型在不同模式的动态调整中进行训练,得到最终零样本立场模型的损失:
30、
31、其中,表示最终零样本立场模型的损失,f1epoch表示模型在当前epoch结束时对训练集进行评估的f1分数,η和μ取值范围均为(0,1)。
32、本发明另一方面还提供一种零样本立场模型的构建系统,所述系统包括:
33、示例内容编码模块,用于获取数据集样本,所述数据集样本包括若干示例,任一所述示例均包括主题名称和文本内容,以对所述主题名称和文本内容进行融合编码,得到融合向量、主题向量以及文本向量;
34、立场特征提取模块,用于根据对抗学习的域转移结构从所述主题向量和文本向量中提取话题不变特征,并对所述话题不变特征进行线性变换,以得到线性变换特征;
35、训练执行模块,用于将所述线性变换特征和所述融合向量进行拼接,得到拼接特征,以将拼接特征输入到立场分类器,所述线性变换特征输入到话题鉴别器进行零样本立场模型的训练;
36、模式调度模块,用于采用控制调度的超参数调度零样本立场模型在训练阶段不同的模式,以使得零样本立场模型在不同模式的动态调整中训练。
37、本发明另一方面还提供一种存储介质,包括所述存储介质存储一个或多个程序,该程序被执行时实现如上述的零样本立场检测模型的构建方法。
38、本发明另一方面还提供一种计算机设备,所述计算机设备包括存储器和处理器,其中:
39、所述存储器用于存放计算机程序;
40、所述处理器用于执行所述存储器上所存放的计算机程序时,实现如上述的零样本立场检测模型的构建方法。
41、与现有技术相比,本发明具有以下优点:
42、(1)本发明提出了一种能够捕获文本与话题融合特征的同时结合立场不变特征的全新的零样本立场模型,并且不需要基于大量的未标注数据来辅助训练模型。
43、(2)通过设置动态调度参数使得模型能够在训练阶段动态调度模型的不同模式参与训练,使得能够学习到更好的特征,从而进一步提高模型的性能。
44、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。