语义角色标注方法、装置、计算机设备和存储介质与流程

文档序号:26050652发布日期:2021-07-27 15:25阅读:来源:国知局

技术特征:

1.一种语义角色标注方法,其特征在于,包括以下步骤:

获取待标注语句,并对所述待标注语句进行分词处理和词性标注;

根据所述词性标注的结果确定所述待标注语句中的动词;

获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;

将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;

在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。

2.根据权利要求1所述的语义角色标注方法,其特征在于,所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签时的起始位置的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤之前,包括:

计算各个所述输入样本中存在所述角色标签所对应的字段的第三概率和不存在所述角色标签所对应的字段的第四概率;

将所述第三概率与所述第四概率进行比较;

若所述第四概率大于所述第三概率,则不进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤;

若所述第四概率小于等于所述第三概率,则进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤。

3.根据权利要求1所述的语义角色标注方法,其特征在于,所述根据所述第一概率和所述第二概率进行角色标注的步骤,包括:

确定各个所述输入样本中最大的第一概率所对应的字的位置作为所述角色标签的起始位置,确定各个所述输入样本中最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

4.根据权利要求1所述的语义角色标注方法,其特征在于,所述根据所述第一概率和所述第二概率进行角色标注的步骤,包括:

将所述输入样本中最大的所述第一概率与预设第一概率进行比较,若最大的所述第一概率大于所述预设第一概率,则将最大的第一概率所对应的字的位置作为所述角色标签的起始位置;

将所述输入样本中最大的所述第二概率与预设第二概率进行比较,若最大的所述第二概率大于所述预设第二概率,则将最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

5.根据权利要求1所述的语义角色标注方法,其特征在于,所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置的时第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤,包括:

将各个动词所对应的所有输入样本经过batch计算的方式计算各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

6.根据权利要求1所述的语义角色标注方法,其特征在于,所述语义角色标注模型包括第一全连接层和第二全连接层,所述第一全连接层和所述第二全连接层均包括softmax函数;所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤,包括:

通过所述第一全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率;

通过所述第二全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

7.一种语义角色标注装置,其特征在于,包括:

获取单元,用于获取待标注语句,并对所述待标注语句进行分词处理和词性标注;

第一确定单元,用于根据所述词性标注的结果确定所述待标注语句中的动词;

第二确定单元,用于获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;

输入单元,用于将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;

计算单元,用于在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。

8.根据权利要求7所述的语义角色标注装置,所述计算单元,包括:

第一计算子单元,用于计算各个所述输入样本中存在所述角色标签所对应的字段的第三概率和不存在所述角色标签所对应的字段的第四概率;

比较子单元,用于将所述第三概率与所述第四概率进行比较;

不进入子单元,用于若所述第四概率大于所述第三概率,则不进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤;

进入子单元,用于若所述第四概率小于等于所述第三概率,则进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤。

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的语义角色标注方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的语义角色标注方法的步骤。


技术总结
本申请涉及人工智能技术领域,提供了一种语义角色标注方法、装置、计算机设备和存储介质,所述方法包括:获取待标注语句,并对待标注语句进行分词处理和词性标注;根据词性标注的结果确定待标注语句中的动词;获取各个动词预设的角色标签,根据角色标签和分词处理的结果构建各个角色标签所对应的输入样本;将各个输入样本输入至语义角色标注模型;在语义角色标注模型中,计算输入样本中的各个字作为输入样本所对应的角色标签的起始位置时的第一概率和结束位置时的第二概率,根据第一概率和第二概率进行角色标注。通过本申请提供的语义角色标注方法、装置、计算机设备和存储介质,提供语义角色标注的准确性。

技术研发人员:马跃
受保护的技术使用者:中国平安人寿保险股份有限公司
技术研发日:2021.05.27
技术公布日:2021.07.27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1