论证关系挖掘方法、装置、介质及电子设备与流程

文档序号:36101635发布日期:2023-11-21 15:59阅读:85来源:国知局

本技术属于人工智能,具体涉及一种论证关系挖掘方法、论证关系挖掘装置、计算机可读介质、电子设备以及计算机程序产品。


背景技术:

1、论证关系指的是在不同的文本语句之间存在的逻辑论证结构,例如一个文本语句的内容观点可以对另一个文本语句的内容观点表示支持或者反对。通过挖掘文本中存在的论证关系,可以帮助理解文本内容的含义,提高计算机理解人类语言的能力。然而,由于文本中存在着大量的与逻辑论证结构无关的干扰信息,导致论证关系挖掘方案普遍存在准确性差的问题。


技术实现思路

1、本技术提供一种论证关系挖掘方法、论证关系挖掘装置、计算机可读介质、电子设备以及计算机程序产品,目的在于提高论证关系挖掘的准确性。

2、本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。

3、根据本技术实施例的一个方面,提供一种论证关系挖掘方法,该方法包括:获取需要挖掘论证关系的文本数据,所述文本数据包括连续分布的多个命题语句,所述论证关系包括两个命题语句之间存在的反对关系、支持关系或无关系;对所述命题语句进行特征提取,得到所述命题语句的第一语义特征;对连续分布的多个命题语句的第一语义特征进行融合处理,得到所述命题语句的第二语义特征;根据所述第一语义特征和所述第二语义特征,对两个命题语句进行分类处理,得到所述两个命题语句的论证关系。

4、根据本技术实施例的一个方面,提供一种论证关系挖掘装置,该装置包括:

5、获取模块,被配置为获取需要挖掘论证关系的文本数据,所述文本数据包括连续分布的多个命题语句,所述论证关系包括两个命题语句之间存在的反对关系、支持关系或无关系;

6、提取模块,被配置为对所述命题语句进行特征提取,得到所述命题语句的第一语义特征;

7、融合模块,被配置为对连续分布的多个命题语句的第一语义特征进行融合处理,得到所述命题语句的第二语义特征;

8、分类模块,被配置为根据所述第一语义特征和所述第二语义特征,对两个命题语句进行分类处理,得到所述两个命题语句的论证关系。

9、在本技术的一些实施例中,基于以上技术方案,所述分类模块进一步包括:

10、特征融合模块,被配置为将所述命题语句的所述第一语义特征和所述第二语义特征融合得到所述命题语句的第三语义特征;

11、特征映射模块,被配置为根据预设的激活函数对两个命题语句的第三语义特征进行映射处理,得到所述两个命题语句的分类概率,所述分类概率包括将所述两个命题语句的论证关系分类为反对关系、支持关系或无关系的概率;

12、关系确定模块,被配置为根据所述分类概率的最大值确定所述两个命题语句的论证关系。

13、在本技术的一些实施例中,基于以上技术方案,当所述两个命题语句的论证关系为无关系时,所述分类概率的最大值与所述两个命题语句的特征相似度呈正相关关系;当所述两个命题语句的论证关系为反对关系或者支持关系时,所述分类概率的最大值与所述两个命题语句的特征相似度呈负相关关系。

14、在本技术的一些实施例中,基于以上技术方案,当所述两个命题语句的论证关系为无关系时,所述两个命题语句的特征相似度对于所述分类概率的影响程度与所述两个命题语句的位置距离呈负相关关系;当所述两个命题语句的论证关系为反对关系或者支持关系时,所述两个命题语句的特征相似度对于所述分类概率的影响程度与所述两个命题语句的位置距离呈正相关关系。

15、在本技术的一些实施例中,基于以上技术方案,所述装置还包括:

16、模型获取模块,被配置为获取用于对文本数据挖掘论证关系的论证关系挖掘模型,所述论证关系挖掘模型包括用于对命题语句进行特征提取的编码器和用于对两个命题语句进行分类处理的分类器;

17、样本获取模块,被配置为获取用于训练所述论证关系挖掘模型的文本数据样本,所述文本数据样本包括连续分布的多个命题语句样本,以及用于表示两个命题语句样本之间的论证关系的样本标签;

18、第一误差确定模块,被配置为获取由所述编码器对所述命题语句样本进行特征提取得到的样本特征,并根据所述样本特征和所述样本标签确定两个命题语句样本的第一损失误差;

19、第二误差确定模块,被配置为获取由所述分类器根据所述样本特征对所述两个命题语句样本进行分类处理得到的样本分布概率,并根据所述样本分布概率和所述样本标签确定所述两个命题语句样本的第二损失误差;

20、参数更新模块,被配置为根据所述第一损失误差和所述第二损失误差更新所述论证关系挖掘模型的模型参数。

21、在本技术的一些实施例中,基于以上技术方案,所述装置还包括:

22、屏蔽模块,被配置为随机屏蔽所述文本数据样本中的词语或者语句。

23、在本技术的一些实施例中,基于以上技术方案,所述屏蔽模块进一步被配置为:从所述文本数据样本中识别与所述论证关系相关的标记词语;按照第一预设概率在所述文本数据样本中随机屏蔽所述标记词语;按照第二预设概率在所述文本数据样本中随机屏蔽所述命题语句样本。

24、在本技术的一些实施例中,基于以上技术方案,所述第一误差确定模块进一步被配置为:根据所述样本特征确定两个命题语句样本的特征相似度;根据所述特征相似度和所述样本标签确定所述两个命题语句样本的第一损失误差。

25、在本技术的一些实施例中,基于以上技术方案,当所述样本标签为无关系时,所述第一损失误差与所述两个命题语句样本的特征相似度呈正相关关系;当所述样本标签为反对关系或者支持关系时,所述第一损失误差与所述两个命题语句样本的特征相似度呈负相关关系。

26、在本技术的一些实施例中,基于以上技术方案,当所述样本标签为无关系时,所述两个命题语句样本的特征相似度对于所述第一损失误差的影响程度与所述两个命题语句样本的位置距离呈负相关关系;当所述样本标签为反对关系或者支持关系时,所述两个命题语句样本的特征相似度对于所述第一损失误差的影响程度与所述两个命题语句样本的位置距离呈正相关关系。

27、在本技术的一些实施例中,基于以上技术方案,所述分类器包括依次连接的输入层、隐藏层和输出层;所述第二误差确定模块进一步被配置为:获取由所述输入层对所述两个命题语句样本的样本特征进行嵌入编码得到的输入向量;获取由所述隐藏层对所述输入向量进行归一化处理得到的中间向量;获取由所述输出层对所述中间向量进行分类映射处理得到的样本分布概率。

28、在本技术的一些实施例中,基于以上技术方案,所述参数更新模块进一步被配置为:根据预设权重对所述第一损失误差和所述第二损失误差进行加权求和得到所述论证关系挖掘模型的误差值;在所述论证关系挖掘模型中对所述误差值进行反向传播得到各个模型参数的误差梯度;根据所述误差梯度更新所述模型参数。

29、根据本技术实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的论证关系挖掘方法。

30、根据本技术实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为执行所述可执行指令来实现如以上技术方案中的论证关系挖掘方法。

31、根据本技术实施例的一个方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如以上技术方案中的论证关系挖掘方法。

32、在本技术实施例提供的技术方案中,通过对文本数据中的命题语句进行特征提取得到第一语义特征,并将连续分布的多个命题语句的第一语义特征融合得到第二语义特征,从而可以根据第一语义特征和第二语义特征对两个命题语句进行分类处理,得到该两个命题语句的论证关系。本技术实施例实现了在论证关系的挖掘过程中融合命题语句的上下文关系,因而能够提高论证关系挖掘的准确性。

33、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!