事件抽取方法、装置、电子设备及存储介质与流程

文档序号:30581398发布日期:2022-06-29 12:26阅读:来源:国知局

技术特征:
1.一种事件抽取方法,其特征在于,所述方法包括:获取待处理文本,并对所述待处理文本进行句子级切割,得到多个句子文本;对于得到多个句子文本中的任一目标句子文本,基于所述目标句子文本在所述待处理文本中的前后文,生成标签识别文本;将所述标签识别文本输入到预先训练的文本分类算法中,获取所述文本分类算法输出的各预设的事件标签对应的分类概率,并将满足预设条件的分类概率对应的事件标签确定为所述目标句子文本的目标事件标签;基于所述目标事件标签对应的元素架构,从所述目标句子文本中抽取事件元素,以实现对所述目标句子文本的事件抽取。2.根据权利要求1所述的方法,其特征在于,所述获取待处理文本,包括:获取新闻数据,所述新闻数据中包括多个新闻文本;对各所述新闻文本进行主题分类,得到每个所述新闻文本各自对应的文本主题;获取事件抽取所需的目标主题类型,筛选出所述目标主题类型对应的目标新闻文本,并将每个所述目标新闻文本确定为一个待处理文本。3.根据权利要求1所述的方法,其特征在于,所述对于得到多个句子文本中的任一目标句子文本,基于所述目标句子文本在所述待处理文本中的前后文,生成标签识别文本,包括:对于得到多个句子文本中的任一目标句子文本,获取所述目标句子文本在所述待处理文本中所在位置的前n个句子文本和后m个句子文本,其中n为第一预设正整数,m为第二预设正整数;将所述前n个句子文本和后m个句子文本确定为所述目标句子文本在所述待处理文本中的前后文;将所述前后文和所述目标句子文本进行组合,得到标签识别文本。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:以各事件标签下的标签识别文本样本,对文本分类算法进行训练,得到训练好的初始文本分类算法;利用蒸馏模型对初始文本分类算法进行简化压缩,得到最终的文本分类算法。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标事件标签对应的元素架构,从所述目标句子文本中抽取事件元素,包括:将所述目标事件标签和所述目标句子文本输入到预先训练的元素抽取算法中;利用所述元素抽取算法,确定所述目标事件标签对应的元素架构,所述元素架构包括至少一个目标事件元素类型;利用所述元素抽取算法,从所述目标句子文本中抽取各所述目标事件元素类型对应的事件元素。6.根据权利要求1所述的方法,其特征在于,在所述获取待处理文本之后,且在所述对所述待处理文本进行句子级切割,得到多个句子文本之前,所述方法还包括:识别所述待处理文本中出现的实体名称;所述基于所述目标事件标签对应的元素架构,从所述目标句子文本中抽取事件元素,还包括:
在抽取到事件元素后,将所述数据元素和所述实体名称输入到预先训练的主题相关度模型和指代模型,对包含实体的所述事件元素进行修正。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用预设的知识库对抽取的事件元素进行标准化映射。8.一种事件抽取装置,其特征在于,所述装置包括:分割模块,用于获取待处理文本,并对所述待处理文本进行句子级切割,得到多个句子文本;文本生成模块,用于对于得到多个句子文本中的任一目标句子文本,基于所述目标句子文本在所述待处理文本中的前后文,生成标签识别文本;标签分类模块,用于将所述标签识别文本输入到预先训练的文本分类算法中,获取所述文本分类算法输出的各预设的事件标签对应的分类概率,并将满足预设条件的分类概率对应的事件标签确定为所述目标句子文本的目标事件标签;元素抽取模块,用于基于所述目标事件标签对应的元素架构,从所述目标句子文本中抽取事件元素,以实现对所述目标句子文本的事件抽取。9.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的事件抽取方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的事件抽取方法。

技术总结
本申请实施例公开了一种事件抽取方法、装置、电子设备及存储介质。该方法包括:在获取到待处理文本后,对待处理文本进行句子级切割,得到多个句子文本,然后生成每个句子文本各自对应的标签识别文本,先通过文本分类算法对标签识别文本进行标签分类,从而得到句子文本的事件标签,得到事件标签后,基于该事件标签对应的元素架构,有针对性地从句子文本中提取事件元素。基于此,根据该事件标签对应的元素架构,从句子文本中有针对性的提取事件元素,减少了对句子文本中多余信息的处理,处理过程精简后,事件提取的效率也得到了提升。事件提取的效率也得到了提升。事件提取的效率也得到了提升。


技术研发人员:严晨 张慧 于海军 陈家树 史光华
受保护的技术使用者:上海安硕企业征信服务有限公司
技术研发日:2022.03.07
技术公布日:2022/6/28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1