事件检测方法、装置、计算机设备和存储介质

文档序号:30970814发布日期:2022-08-02 21:25阅读:67来源:国知局
事件检测方法、装置、计算机设备和存储介质

1.本技术涉及事件抽取技术领域,特别是涉及一种事件检测方法、装置、计算机设备和存储介质。


背景技术:

2.事件检测是自然语言处理的重要课题之一。现有的事件检测方法需要在训练数据中添加带注释的触发器和事件类型。然而,触发器对于事件检测来说并不重要,注释者从给定的句子中,尤其是从一个长句中,挑出“最清晰”的单词是很费时的。


技术实现要素:

3.基于此,有必要针对上述技术问题,提供一种事件检测方法、装置、计算机设备和存储介质。
4.一种事件检测方法,所述方法包括:
5.获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
6.构建类型感知注意力网络;所述感知注意力网络包括:lstm层以及注意力层;所述lstm网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
7.根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
8.根据所述事件样本集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属类型。
9.在其中一个实施例中,还包括:根据所述编码嵌入矩阵和所述类型嵌入矩阵,得到注意力分数矩阵为:
[0010][0011]
其中,αk表示第k个分词的注意力得分,表示第k个分词在所述编码嵌入矩阵的编码表示,表示类型t在所述类型嵌入矩阵的嵌入表示。
[0012]
在其中一个实施例中,还包括:根据所述注意力得分矩阵和所述编码嵌入矩阵,得到文本语料的表示形式为:
[0013]
[0014]
其中,h表示编码嵌入矩阵。
[0015]
在其中一个实施例中,还包括:根据所述编码嵌入矩阵和所述类型嵌入矩阵,构建图神经网络为:
[0016]vl+1
=f(v
l
,a)=δ(av
lwl
)
[0017]
其中,v∈r
n*m
表示节点,a∈r
n*n
表示邻接矩阵,δ(.)表示激活函数,l表示网络的层数,w表示网络参数。
[0018]
在其中一个实施例中,还包括:获取所述待检测文本的类型嵌入向量;将所述类型嵌入向量输入图神经网络。
[0019]
在其中一个实施例中,还包括:利用训练好的所述类型感知注意力网络对待检测文本进行编码嵌入,得到待检测编码嵌入矩阵;根据所述待检测编码嵌入矩阵中每个单词的编码嵌入向量和所述第一类型嵌入向量,得到注意力得分矩阵;根据所述注意力得分矩阵和所述待检测编码嵌入矩阵,得到待检测文本的第一表达形式。
[0020]
在其中一个实施例中,还包括:利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理,得到待检测文本的表达形式、待检测编码嵌入矩阵和第二类型嵌入矩阵;
[0021]
根据待检测编码嵌入矩阵和第二类型嵌入矩阵,得到待检测文本的第二表达形式;
[0022]
将所述第一表达形式和所述第二表达形式融合后输入多分类器,得到待检测文本的所属事件分类。
[0023]
一种事件检测装置,所述装置包括:
[0024]
数据获取模块,用于所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0025]
类型感知模块,用于构建类型感知注意力网络;所述感知注意力网络包括:lstm层以及注意力层;所述lstm网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0026]
图神经网络模块,用于根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0027]
分类模块,用于根据所述事件样本集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0028]
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0029]
获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0030]
构建类型感知注意力网络;所述感知注意力网络包括:lstm层以及注意力层;所述
lstm网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0031]
根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0032]
根据所述事件样本数据集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0033]
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0034]
获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0035]
构建类型感知注意力网络;所述感知注意力网络包括:lstm层以及注意力层;所述lstm网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0036]
根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0037]
根据所述事件样本数据集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0038]
上述事件检测方法、装置、计算机设备和存储介质,采用类型感知注意力和图卷积神经网络模型对事件类型进行性质预测,这里的类型感知注意力神经网络层可以明确的识别与给定事件类型最相关的特征,例如,死亡事件通常与“死亡”、“去世”、“消失”等特征最相关,可以将更多的注意力放在这些特征上面,从而能够避免对触发词的依赖,解决了目前事件检测任务依赖触发词来识别和分类事件、触发词的标注费时费力的问题;同时,相比传统的事件检测方法,本发明还引入了图卷积神经网络,能结合事件之间的相关性,进一步提高事件检测任务的准确性和可靠性。
附图说明
[0039]
图1为一个实施例中事件检测方法的流程示意图;
[0040]
图2为一个实施例中事件检测装置的结构框图;
[0041]
图3为一个实施例中计算机设备的内部结构图。
具体实施方式
[0042]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
[0043]
在一个实施例中,如图1所示,提供了一种事件检测方法,包括以下步骤:
[0044]
步骤102,获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵。
[0045]
事件样本数据集中的事件样本包括文本语料和标注。具体,事件样本数据集具体为文本数据的数据集,并且带有事件属性,以新闻资讯为例,从数据源获取新闻资讯的文本,将新闻资讯文本中的句子提取之后,作为文本语料,然后进行标注就可以得到事件样本数据,从而建立事件样本数据集。
[0046]
类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,第二类型嵌入矩阵是根据事件样本中所有单词编码得到的。
[0047]
隐藏触发词指的是事件样本中单词的同义词,例如:死亡的同义词包含去世、消失等,也就是说,进行隐藏触发词的嵌入可以学习到事件样本的局部隐藏特征,对于事件而言,死亡事件中往往采用去世、消失等词进行表达。第二类型嵌入矩阵可以理解是对全文所有单词进行嵌入,可以更好的表达事件样本的真实含义,从而可以进一步结合事件之间的相关性。
[0048]
步骤104,构建类型感知注意力网络。
[0049]
感知注意力网络包括:lstm层以及注意力层;lstm网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;注意力层根据编码嵌入矩阵和第一类型嵌入矩阵,得到注意力分数矩阵。
[0050]
值得说明的是,lstm网络是将文本语料转化为编码嵌入矩阵,而注意力层可以将文本中单词与事件类型进行关联,从而可以避免对触发词的依赖,解决了目前事件检测任务依赖触发词来识别和分类事件、触发词的标注费时费力的问题。
[0051]
步骤106,根据编码嵌入矩阵和第二类型嵌入矩阵,构建图神经网络。
[0052]
图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性。因此,随着训练样本数量的增加,图神经网络可以更加准确的描述事件之间的关联。
[0053]
步骤108,根据事件样本集对类型感知注意力网络和图神经网络进行训练,利用训练好的类型感知注意力网络和图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0054]
上述事件检测方法中,采用类型感知注意力和图卷积神经网络模型对事件类型进行性质预测,这里的类型感知注意力神经网络层可以明确的识别与给定事件类型最相关的特征,例如,死亡事件通常与“死亡”、“去世”、“消失”等特征最相关,可以将更多的注意力放在这些特征上面,从而能够避免对触发词的依赖,解决了目前事件检测任务依赖触发词来识别和分类事件、触发词的标注费时费力的问题;同时,相比传统的事件检测方法,本发明还引入了图卷积神经网络,能结合事件之间的相关性,进一步提高事件检测任务的准确性和可靠性。
[0055]
在其中一个实施例中,可以从自动上下文提取(ace)事件评价项目获得训练集、验证集和测试集,其中,所述ace数据由语料和注释组成,注释包括事件属性、事件参数和事件提及的信息。
[0056]
具体的,事件属性是指事件类型,子类型,模态,极性,通用性和时态;事件参数由唯一编号和角色标识;事件提及是提及事件的句子或短语,事件提及的范围被定义为提及
事件的整个句子。
[0057]
在其中一个实施例中,lstm网络对输入句子的单词编码为
[0058][0059]
因此,给定一个句子s={s1,s2,

,sn}作为一个标记序列,双向长短时记忆网络编码层负责将每个标记映射到连续的嵌入表示为
[0060]
在其中一个实施例中,根据编码嵌入矩阵和第一类型嵌入矩阵,得到注意力分数矩阵为:
[0061][0062]
其中,αk表示第k个分词的注意力得分,表示第k个分词在编码嵌入矩阵的编码表示,表示类型t在第一类型嵌入矩阵的嵌入表示。
[0063]
在其中一个实施例中,根据注意力得分矩阵和编码嵌入矩阵,得到文本语料的表示形式为:
[0064][0065]
其中,h表示编码嵌入矩阵。
[0066]
在其中一个实施例中,根据编码嵌入矩阵和第二类型嵌入矩阵,构建图神经网络为:
[0067]vl+1
=f(v
l
,a)=δ(av
lwl
)
[0068]
其中,v∈r
n*m
表示节点,a∈r
n*n
表示邻接矩阵,δ(.)表示激活函数,l表示网络的层数,w表示网络参数。
[0069]
在其中一个实施例中,获取待检测文本的类型嵌入向量;将类型嵌入向量输入图神经网络。值得说明的是,和训练过程相同,类型嵌入向量也包括第一类型嵌入向量和第二类型嵌入向量;第一类型嵌入向量用于捕捉局部信息;第二类型嵌入向量用于捕捉全局信息。
[0070]
在其中一个实施例中,利用训练好的类型感知注意力网络对待检测文本进行编码嵌入,得到待检测编码嵌入矩阵;根据待检测编码嵌入矩阵中每个单词的编码嵌入向量和第一类型嵌入向量,得到注意力得分矩阵;根据注意力得分矩阵和待检测编码嵌入矩阵,得到待检测文本的第一表达形式。
[0071]
在其中一个实施例中,利用训练好的类型感知注意力网络和图神经网络对待检测文本进行处理,得到待检测文本的表达形式、待检测编码嵌入矩阵和第二类型嵌入矩阵;根据待检测编码嵌入矩阵和第二类型嵌入矩阵,得到待检测文本的第二表达形式;将第一表达形式和第二表达形式融合后输入多分类器,得到待检测文本的所属分类。
[0072]
应该理解的是,虽然图1流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步
骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0073]
在一个实施例中,如图2所示,提供了一种事件检测装置,包括:数据获取模块202、类型感知模块204、图神经网络模块206和分类模块208,其中:
[0074]
数据获取模块202,用于获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0075]
类型感知模块204,用于构建类型感知注意力网络;所述感知注意力网络包括:lstm层以及注意力层;所述lstm网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0076]
图神经网络模块206,用于根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0077]
分类模块208,用于根据所述事件样本集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0078]
关于事件检测装置的具体限定可以参见上文中对于事件检测方法的限定,在此不再赘述。上述事件检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0079]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种事件检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0080]
本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0081]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述实施例中方法的步骤。
[0082]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中方法的步骤。
[0083]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以
通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0084]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0085]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1