事件时序关系识别方法、装置、设备及介质

文档序号:35474306发布日期:2023-09-16 17:11阅读:37来源:国知局
事件时序关系识别方法、装置、设备及介质

本公开涉及深度学习和人工智能,更具体地涉及一种事件时序关系识别方法、装置、设备、介质和程序产品。


背景技术:

1、事件序列关系的识别是关系抽取中的一个子任务。目的是及时确定两个目标事件发生的先后顺序,例如:在…前和在…后等。对事件时序关系的认识得到越来越多研究者的关注。这个任务有助于事件脉络的自动抽取和生成。因此,该技术可以有效应用在各个垂直领域解决特点场景问题。例如,在医疗领域,可以根据某些疾病在不同时期的状态和变化,更准确地选择治疗方案。总之,事件时序关系的识别可以促进许多其他自然语言处理任务,例如问答系统、文本摘要、文本含义和知识图谱构建。

2、传统的基于规则以及基于统计方法的事件时序抽取方法依赖于语言学专家依靠经验所编写的特定规则、人工精心设计的特征和复杂的自然语言处理工具。这些方法虽然经过实验证明是有效的,但是花费了大量人工精力、缺乏泛化能力,而且会有规则不完全、特征稀疏的问题。此外,传统的特征很难抓取词的语义信息以及句子的深层语义信息。


技术实现思路

1、鉴于上述问题,本公开提供了事件时序关系识别方法、装置、设备、介质和程序产品。

2、根据本公开的第一个方面,提供了一种事件时序关系识别方法,包括:

3、获取输入文本中的事件的全局语义信息,其中,输入文本至少包括两个事件,事件包括触发词和事件论元;

4、对输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组,其中,句法依存三元组包括:第一目标事件词、与第一目标事件词存在句法依赖的词以及句法依赖的关系;路径依存三元组包括:第一目标事件词、第二目标事件词、第一目标事件词与第二目标事件词之间的路径依存关系;

5、将句法依存三元组和路径依存三元组融合,得到输入文本中的事件的关键信息;

6、根据事件时序类型的先验概率,获取事件的先验知识的约束信息;

7、将事件的全局语义信息、事件的关键信息和事件的先验知识的约束信息融合,得到融合信息;以及

8、将融合信息输入事件时序关系分类模型,得到事件的时序关系。

9、根据本公开的实施例,根据事件时序类型的先验概率,获取事件的先验知识的约束信息包括:

10、利用百科类数据集计算事件时序类型出现的频数,以作为事件时序类型的先验概率;

11、在先验概率满足阈值的情况下,确定事件时序类型的概率;

12、将事件时序类型的概率映射为向量,得到事件的先验知识的约束信息。

13、根据本公开的实施例,获取输入文本中的事件的全局语义信息包括:

14、获取输入文本的词列表和词性列表;

15、利用预训练语言模型,将词列表表示为词嵌入向量,以及词性列表表示为词性嵌入向量;

16、将词嵌入向量以及词性嵌入向量融合,得到融合嵌入向量;

17、将融合嵌入向量输入神经网络模型,根据神经网络模型的隐藏层的输出确定输入文本中的事件的全局语义信息。

18、根据本公开的实施例,神经网络模型包括双向长短期记忆网络模型。

19、根据本公开的实施例,从输入文本中分别生成事件的句法依存三元组和事件间的路径依存三元组包括:

20、利用句法依存树,从输入文本中分别提取第一目标事件词、与第一目标事件词存在句法依赖的词以及句法依赖的关系,生成句法依存三元组;

21、利用句法依存树,从输入文本中提取第二目标事件词;

22、根据第一目标事件词到第二目标事件词的路径,确定第一目标事件词与第二目标事件词之间的路径依存关系;

23、根据第一目标事件词、第二目标事件词以及第一目标事件词与第二目标事件词之间的路径依存关系,生成事件间的路径依存三元组。

24、根据本公开的实施例,事件时序关系分类模型通过最小化交叉熵损失函数训练得到。

25、本公开的第二方面提供了一种事件时序关系识别装置,包括:

26、全局语义信息获取模块,用于获取输入文本中的事件的全局语义信息,其中,文本至少包括两个事件,事件包括触发词和事件论元;

27、三元组生成模块,用于对输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组,其中,句法依存三元组包括:第一目标事件词、与第一目标事件词存在句法依赖的词以及句法依赖的关系;路径依存三元组包括:第一目标事件词、第二目标事件词、第一目标事件词与第二目标事件词之间的路径依存关系;

28、第一融合模块,用于将句法依存三元组和路径依存三元组融合,得到输入文本中的事件的关键信息;

29、先验知识的约束信息获取模块,用于根据事件时序类型的先验概率,获取事件的先验知识的约束信息;

30、第二融合模块,用于将事件的全局语义信息、事件的关键信息和事件的先验知识的约束信息融合,得到融合信息;以及

31、分类模块,用于将融合信息输入事件时序关系分类模型,得到事件的时序关系。

32、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述事件时序关系识别方法。

33、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述事件时序关系识别方法。

34、本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述事件时序关系识别方法。

35、根据本公开的实施例,通过获取事件的全局语义信息;利用句法依存和路径依赖分析获取复杂句中事件的关键信息;通过加入先验知识,获取事件的先验知识的约束信息;将各信息融合并进行事件时序关系的分类。全局语义信息的获取保留了全局的信息;关键信息的获取,减少了冗余信息对事件时序关系判断的影响;事件的先验知识的约束信息的获取避免了事件时序的常识性错误,在分类过程中提升了模型性能;融合了关键信息、全局语义信息和先验知识的约束信息,保证了模型时序抽取的鲁棒性。实现了对事件时序关系的精准识别,进而实现了复杂句中事件时序关系抽取的任务,至少部分解决了现有方法过多依赖外部信息、通用性不强以及在长句中表现差的问题。



技术特征:

1.一种事件时序关系识别方法,包括:

2.根据权利要求1中所述的方法,其中,所述根据事件时序类型的先验概率,获取事件的先验知识的约束信息包括:

3.根据权利要求1中所述的方法,其中,所述获取输入文本中的事件的全局语义信息包括:

4.根据权利要求3中所述的方法,其中,所述神经网络模型包括双向长短期记忆网络模型。

5.根据权利要求1中所述的方法,其中,所述从所述输入文本中分别生成事件的句法依存三元组和事件间的路径依存三元组包括:

6.根据权利要求1中所述的方法,其中,所述事件时序关系分类模型通过最小化交叉熵损失函数训练得到。

7.一种事件时序关系识别装置,包括:

8.一种电子设备,包括:

9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的方法。

10.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~6中任一项所述的方法。


技术总结
本公开提供了一种事件时序关系识别方法,包括:获取输入文本中的事件的全局语义信息,其中,输入文本至少包括两个事件,事件包括触发词和事件论元;对输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组;将句法依存三元组和路径依存三元组融合,得到输入文本中的事件的关键信息;根据事件时序类型的先验概率,获取事件的先验知识的约束信息;将事件的全局语义信息、事件的关键信息和事件的先验知识的约束信息融合,得到融合信息;以及将融合信息输入事件时序关系分类模型,得到事件的时序关系。本公开还提供了一种事件时序关系识别装置、设备、存储介质和程序产品。

技术研发人员:李晓宇,张泽群,金力,孙显,马豪伟,李树超,靳盼盼
受保护的技术使用者:中国科学院空天信息创新研究院
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1