本发明涉及文本信息抽取,尤其涉及一种文本信息的论元抽取方法、装置、设备及存储介质。
背景技术:
1、主流的事件检测方法,通常分为触发词识别和论元抽取两个部分。其中,论元抽取相较于触发词识别,其结果及内容成分更加复杂多样,通常需要抽取蕴含语义的实体或短语而非单个词汇,因此抽取精度往往较低且更受研究者关注。
2、为了提高论元的抽取精度,目前的研究将句法图作为一项十分重要的上下文信息,作为图卷积神经网络(graph convolutional network,gcn)模型的输入,以利用gcn对句法图中的特征进行提取,得到特征向量,再将特征向量输入至另一个神经网络模型中,得到该神经网络模型输出的论元抽取结果。
3、但是,上述神经网络模型可以理解为是一个黑盒模型,缺少论元抽取过程,模型的可解释性差。
技术实现思路
1、本发明提供一种文本信息的论元抽取方法、装置、设备及存储介质,用以解决现有技术中论元抽取方法中模型的可解释性差的问题。
2、本发明提供一种文本信息的论元抽取方法,包括:
3、分析待处理的文本信息,得到所述文本信息对应的句法图;其中,所述句法图包括以下至少一项:词向量、实体类型向量和句法成分向量;
4、将所述句法图输入至预先设置的语义图生成模型中,得到所述语义图生成模型输出的所述文本信息对应的语义图;其中,所述语义图生成模型用于基于所述句法图中的向量特征构建所述语义图,所述语义图中包括至少两个词对应的节点和至少一条节点间的游走路径;
5、将所述语义图和在所述文本信息中预先设置的触发词输入至预先设置的游走模型中,得到所述游走模型输出的目标路径和所述目标路径对应的论元抽取结果;其中,所述游走模型用于:以所述触发词对应的节点为起点,基于所述游走路径确定目标路径,并确定通过所述目标路径抽取的目标论元及其对应的类型,作为所述论元抽取结果。
6、根据本发明提供的一种文本信息的论元抽取方法,所述游走模型包括环境模型和无模型的强化学习模型;
7、所述将所述语义图和在所述文本信息中预先设置的触发词输入至预先设置的游走模型中,得到所述游走模型输出的目标路径和所述目标路径对应的论元抽取结果,包括:
8、将所述语义图和所述触发词输入至所述环境模型中,得到所述环境模型输出的第一路径;其中,所述环境模型用于以所述触发词对应的节点为起点,基于所述游走路径确定所述第一路径;
9、将所述语义图、所述触发词和所述第一路径输入至所述无模型的强化学习模型中,得到所述无模型的强化学习模型输出的所述目标路径和所述论元抽取结果;其中,所述无模型的强化学习模型用于:以所述触发词对应的节点为起点,基于所述第一路径和所述游走路径确定所述目标路径,并确定所述目标论元及其对应的类型,作为所述论元抽取结果。
10、根据本发明提供的一种文本信息的论元抽取方法,所述环境模型具体用于:基于概率分布mθ(s′|s,a),以所述触发词对应的节点为起点,基于所述游走路径确定所述第一路径;
11、其中,s表征当前的游走状态,s′表征所述当前的游走状态的下一个状态,a表征各所述游走路径,θ表征待优化的环境模型参数。
12、根据本发明提供的一种文本信息的论元抽取方法,在所述将所述语义图和所述触发词输入至所述环境模型中,得到所述环境模型输出的第一路径之前,所述方法还包括:
13、通过最小化预先设置的候选模型的损失函数,训练所述候选模型,得到所述环境模型;其中,所述损失函数如公式(1):
14、
15、其中,表征环境模型训练的损失函数,m*表征真实的环境模型,πd表征收集数据的策略,表征基于m*和πd得到的状态动作分布;m*(·|s,a)表征环境模型,μθ(s,a)表征高斯分布的均值向量,σθ(s,a)表征高斯分布的方差矩阵。
16、根据本发明提供的一种文本信息的论元抽取方法,所述无模型的强化学习模型采用近端策略优化算法ppo2。
17、根据本发明提供的一种文本信息的论元抽取方法,所述语义图生成模型采用基于注意力机制的图卷积神经网络gcn。
18、本发明还提供一种文本信息的论元抽取装置,包括:
19、分析模块,用于分析待处理的文本信息,得到所述文本信息对应的句法图;其中,所述句法图包括以下至少一项:词向量、实体类型向量和句法成分向量;
20、构建模块,用于将所述句法图输入至预先设置的语义图生成模型中,得到所述语义图生成模型输出的所述文本信息对应的语义图;其中,所述语义图生成模型用于基于所述句法图中的向量特征构建所述语义图;其中,所述语义图中包括至少两个词对应的节点和至少一条节点间的游走路径;
21、抽取模块,用于将所述语义图和在所述文本信息中预先设置的触发词输入至预先设置的游走模型中,得到所述游走模型输出的目标路径和所述目标路径对应的论元抽取结果;其中,所述游走模型用于:以所述触发词对应的节点为起点,基于所述游走路径确定目标路径,并确定通过所述目标路径抽取的目标论元及其对应的类型,作为所述论元抽取结果。
22、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文本信息的论元抽取方法。
23、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文本信息的论元抽取方法。
24、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述文本信息的论元抽取方法。
25、本发明提供的文本信息的论元抽取方法、装置、设备及存储介质,先分析待处理的文本信息,得到文本信息对应的句法图,再通过语义图生成模型,基于句法图中的向量特征构建文本信息对应的语义图,以由游走模型以触发词对应的节点为起点,通过拟人游走的方式基于语义图中的游走路径确定目标路径,并确定通过目标路径抽取的目标论元及其对应的类型,作为论元抽取结果,最终由游走模型输出目标路径以及对应的论元抽取结果,相较于相关技术的论元抽取方法中神经网络模型为一个黑盒模型,导致缺少论元抽取过程,模型的可解释性差的问题,本发明实施例中的游走模型可以输出用于表征论元抽取过程的目标路径,有效提高了模型的可解释性;另外,相较于相关技术中仅在提取向量特征时利用了句法图,本发明实施例还利用游走模型,采用语义图拟人游走的方式确定目标路径并抽取论元,语义图本质上包含了句法结构,使得论元抽取过程中句法结构的利用率更高,进而可以提高论元抽取的准确率。
1.一种文本信息的论元抽取方法,其特征在于,包括:
2.根据权利要求1所述的文本信息的论元抽取方法,其特征在于,所述游走模型包括环境模型和无模型的强化学习模型;
3.根据权利要求2所述的文本信息的论元抽取方法,其特征在于,所述环境模型具体用于:基于概率分布mθ(s′|s,a),以所述触发词对应的节点为起点,基于所述游走路径确定所述第一路径;
4.根据权利要求3所述的文本信息的论元抽取方法,其特征在于,在所述将所述语义图和所述触发词输入至所述环境模型中,得到所述环境模型输出的第一路径之前,所述方法还包括:
5.根据权利要求2至4任一项所述的文本信息的论元抽取方法,其特征在于,所述无模型的强化学习模型采用近端策略优化算法ppo2。
6.根据权利要求1所述的文本信息的论元抽取方法,其特征在于,所述语义图生成模型采用基于注意力机制的图卷积神经网络gcn。
7.一种文本信息的论元抽取装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述文本信息的论元抽取方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述文本信息的论元抽取方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述文本信息的论元抽取方法。