语义角色标注方法、装置、计算机设备和存储介质与流程

文档序号:26050652发布日期:2021-07-27 15:25阅读:143来源:国知局
语义角色标注方法、装置、计算机设备和存储介质与流程

本申请涉及人工智能的技术领域,特别涉及一种语义角色标注方法、装置、计算机设备和存储介质。



背景技术:

语义角色标注是自然语言处理领域中,语义解析的重要一环。通常我们的表达是以动词(也有叫谓词)为核心的,例如“我明天晚上去北京”中的“去”,就是整个句子表达意思的核心。而语义角色标注,就是针对句子中的动词进行其要素识别的技术,在前面例子中“我”一般标注为“arg1”,作为主语;“明天晚上”一般标注为“tmp”,表示时间;“北京”一般标注为“loc”,表示地点。角色标记的符号并不重要,我们完全可以根据需要定义属于自己的一套角色标签体系,但是角色背后的含义是重要的,一般包括了“主谓宾、时间、地点、方式”等内容的识别,通俗一点表达,就是“谁(或什么东西)对谁(或什么东西)做了什么,在什么时间和地点,和用什么方式等”。可以看到,利用语义角色标注,可以从浅层获得整个句子表达的意思,有助于后续语言理解。

传统的语义角色标注采用了bio(begin,inside,outside)序列标注的方法,整个方法对输入的动词,进行一次性的标注,如“我明天晚上去北京”会被标注为“b_arg0,b_tmp,i_tmp,i_tmp,i_tmp,o,b_loc,i_loc”。这样的标注方法,一次性针对“去”这个动词,标记出它所支配的所有语义角色,使得准确率较低。



技术实现要素:

本申请的主要目的为提供一种语义角色标注方法、装置、计算机设备和存储介质,旨在解决语义角色标注的准确率较低的技术问题。

为实现上述目的,本申请提供了一种语义角色标注方法,包括以下步骤:

获取待标注语句,并对所述待标注语句进行分词处理和词性标注;

根据所述词性标注的结果确定所述待标注语句中的动词;

获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;

将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;

在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。

进一步地,所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤之前,包括:

计算各个所述输入样本中存在所述角色标签所对应的字段的第三概率和不存在所述角色标签所对应的字段的第四概率;

将所述第三概率与所述第四概率进行比较;

若所述第四概率大于所述第三概率,则不进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤;

若所述第四概率小于等于所述第三概率,则进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤。

进一步地,所述根据所述第一概率和所述第二概率进行角色标注的步骤,包括:

确定各个所述输入样本中最大的第一概率所对应的字的位置作为所述角色标签的起始位置,确定各个所述输入样本中最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

进一步地,所述根据所述第一概率和所述第二概率进行角色标注的步骤,包括:

将所述输入样本中最大的所述第一概率与预设第一概率进行比较,若最大的所述第一概率大于所述预设第一概率,则将最大的第一概率所对应的字的位置作为所述角色标签的起始位置;

将所述输入样本中最大的所述第二概率与预设第二概率进行比较,若最大的所述第二概率大于所述预设第二概率,则将最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

进一步地,所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤,包括:

将各个动词所对应的所有输入样本经过batch计算的方式计算各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

进一步地,所述语义角色标注模型包括第一全连接层和第二全连接层,所述第一全连接层和所述第二全连接层均包括softmax函数;所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤,包括:

通过所述第一全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率;

通过所述第二全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

本申请还提供一种语义角色标注装置,包括:

获取单元,用于获取待标注语句,并对所述待标注语句进行分词处理和词性标注;

第一确定单元,用于根据所述词性标注的结果确定所述待标注语句中的动词;

第二确定单元,用于获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;

输入单元,用于将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;

计算单元,用于在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。

进一步地,所述计算单元,包括:

第一计算子单元,用于计算各个所述输入样本中存在所述角色标签所对应的字段的第三概率和不存在所述角色标签所对应的字段的第四概率;

比较子单元,用于将所述第三概率与所述第四概率进行比较;

不进入子单元,用于若所述第四概率大于所述第三概率,则不进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤;

进入子单元,用于若所述第四概率小于等于所述第三概率,则进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤。

本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的语义角色标注方法的步骤。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的语义角色标注方法的步骤。

本申请提供的语义角色标注方法、装置、计算机设备和存储介质,通过构建每个角色标签的输入样本,将输入样本输入至语义角色标注模型中,计算每个输入样本中的每个字作为对应的角色标签的起始位置时的第一概率和输入样本中的各个字作为输入样本所对应的角色标签的结束位置时的第二概率,再根据第一概率和第二概率进行角色标注,无需将每个字都进行标注,只需要标注起始位置和结束位置,减少语义角色标注模型需要决策的路径数目,降低语义角色标注的搜索空间,同时每次只预测一个角色标签,通过缩小每次决策的搜索空间,提升语义角色标注的性能,提高语义角色标注的准确性。

附图说明

图1是本申请一实施例中语义角色标注方法步骤示意图;

图2是本申请一实施例中语义角色标注装置结构框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

参照图1,本申请一实施例提供了一种语义角色标注方法,包括以下步骤:

步骤s1,获取待标注语句,并对所述待标注语句进行分词处理和词性标注;

步骤s2,根据所述词性标注的结果确定所述待标注语句中的动词;

步骤s3,获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;

步骤s4,将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;

步骤s5,在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。

本实施例中,如上述步骤s1-s2所述,待标注语句即想要进行语义角色标注的语句,所述待标注语句可以是终端从接收到的语音信息或文字内容信息中获取得到的。对待标注语句进行分词处理和词性标注,具体的,可通过斯坦福nlp工具、jieba分词等工具进行分词处理和词性标注,如待标注语句为“特朗普昨天访问了中国,并表示会加大中美合作交流。”。分词处理的结果为“特朗普/昨天/访问/了/中国/,/并/表示/会/加大/中美/合作/交流/。”。根据词性标注的结果,其中“访问”、“表示”“加大”为动词(动词词性标签一般为v),得到标注语句中的动词为“访问”、“表示”和“加大”。

如上述步骤s3所述,角色标签可由用户自行确定使用哪些,如arg0/arg1/arg2/arg3/arg4/argm-adv/argm-tmp/argm-dis/argm-loc/argm-mnr/argm-prp/argm-tpc/argm-dir/argm-ext/argm-bnf/argm-dgr/argm-frq/c-arg0/c-arg1在内的19种标签中,用户可以仅仅标注arg0和arg1两种角色标签,不标注全部的角色标签,不同的动词也可标注不同的角色标签,如“访问”这个动词可标注arg0和arg1两个角色标签,“加大”这个动词可标注arg2和arg3两个角色标签。

根据分词处理的结果及角色标签确定对应的输入样本,如对于“访问”这个动词而言,其想要标注的是arg0和arg1两种角色标签,构建得到的输入样本分别是“cls/特/朗/普/昨/天/<s>/访/问/</s>/了/中/国/,/并/表/示/会/加/大/中/美/合/作/交/流/。/sep/arg0/sep”和“cls/特/朗/普/昨/天/<s>/访/问/</s>/了/中/国/,/并/表/示/会/加/大/中/美/合/作/交/流/。/sep/arg1/sep”;对于“加大”这个动词想要标注arg2和arg3两个角色标签,构建得到的输入样本分别是“cls/特/朗/普/昨/天/访/问/了/中/国/,/并/表/示/会/<s>/加/大/</s>/中/美/合/作/交/流/。/sep/arg2/sep”和“cls/特/朗/普/昨/天/访/问/了/中/国/,/并/表/示/会/<s>/加/大/</s>/中/美/合/作/交/流/。/sep/arg3/sep”。每个输入样本中,通过两个<s>确定该输入样本所关注的动词,通过两个sep确定该输入样本所关注的角色标签,对于输入样本“cls/特/朗/普/昨/天/<s>/访/问/</s>/了/中/国/,/并/表/示/会/加/大/中/美/合/作/交/流/。/sep/arg0/sep”,可以理解为该输入样本想要标注的是动词“访问”的arg0(主语)这个角色标签,每个动词的每个角色标签对应有一个输入样本。

如上述步骤s4-s5所述,语义角色标注模型可基于bert(bidirectionalencoderrepresentationsfromtransformers,双向注意力神经网络模型)模型、bilstm(bi-directionallongshort-termmemory)、roberta、xlnet模型中任意一个模型训练得到。

以bert模型为例,bert模型将一整个输入样本中所有的“字”进行one-hot编码后得到各自的向量表示[r1,r2,…,rn]。每个输入样本均表示了想要进行角色标注对应的角色标签,计算输入样本的每个字作为该角色标签的起始位置的第一概率和结束位置的第二概率,通过计算得到第一概率和第二概率确定对应的起始位置和结束位置,从而得到角色标签所对应的字段。

具体的,以bert模型训练得到的语义角色标注模型可表示为:

r=bert(input)

vstart=wstart·[r1,r2,…,rn]

vend=wend·[r1,r2,…,rn]

yhasans=whasans·rcls

xstart=argmax(vstart)

xend=argmax(vend)

其中,r=[rcls,r1,r2,…,rn],表示是r矩阵的行表示,包括了输入的每个位置的表示,和输入是一一对应的,一般也可称为上下文表示,也就是经过bert、xlnet等编码器的输出。vstart表示每个输入样本计算得到的第一概率,经过argmax(取最大得分位置)得到起始位置xstart。vend是每个输入样本计算得到的第一概率,经过argmax(取最大得分位置)得到结束位置xend,w指参数矩阵。

例如,在上述例子中,通过计算得到各个字作为起始位置和结束位置的概率,如第一个字作为起始位置的概率最大,第四个字作为结束位置的概率最大,从而确定,动词“访问”的arg0这个角色标签所对应字段为“特朗普”,则在“特朗普”处标注arg0这个角色标签。当同一个动词的各个输入样本中的角色标签均确定了相应的字段,则可在待标注语句中进行统一标注。

本实施中,无需将每个字都进行标注,只需要标注起始位置和结束位置,减少语义角色标注模型需要决策的路径数目,降低语义角色标注的搜索空间,同时每次只预测一个角色标签,通过缩小每次决策的搜索空间,提升语义角色标注的性能,提高语义角色标注的准确性。语义角色的评估一般使用p、r、f1来评价,发布为精准率,召回率和f1值,其中在公开的测评任务conll-2005和conll-2012两个数据集上,本申请提供的技术方案相较于现有的技术方案,p值绝对提升2个百分点,r值略降1个百分点,综合f1值比现有的技术方案高0.8-1个百分点。将本申请提供的技术方案应用在实际业务中时,如应用在客服系统、电销系统等,提高语义角色标注的效果,能够直接提升客服系统,电销系统中的语义理解的准确性,使得系统能从用户说出或者输入的自然语言中,获取到准确的主谓宾、时间、地点的相关的语义角色,从而帮助客服、企业提高对用户的刻画和理解能力,从而提高客户满意度。

在一实施例中,所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤s5之前,包括:

步骤s5a,计算各个所述输入样本中存在所述角色标签所对应的字段的第三概率和不存在所述角色标签所对应的字段的第四概率;

步骤s5b,将所述第三概率与所述第四概率进行比较;

步骤s5c,若所述第四概率大于所述第三概率,则不进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤;

步骤s5d,若所述第四概率小于等于所述第三概率,则进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤。

本实施例中,语义角色标注模型中设置有一个全连接层,将输入样本输入到该全连接层中,该全连接层可计算得到一个二分类结果,即每个输入样本的第三概率和第四概率,当第四概率大于所述第三概率时,表明该输入样本中不存在对应的角色标签所对应的字段,无需后续进行计算第一概率和第二概率,减少计算量,同时避免在不存在角色标签所对应的字段时,仍旧根据第三概率和第四概率确定了一个字段,此时这个字段对应该角色标签而言是错误的,因此,当第四概率小于第三概率时,再计算具体的第一概率和第二概率去进行语义角色标注,提高语义角色标注的准确度。

在一实施例中,所述根据所述第一概率和所述第二概率进行角色标注的步骤s5,包括:

步骤s51,确定各个所述输入样本中最大的第一概率所对应的字的位置作为所述角色标签的起始位置,确定各个所述输入样本中最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

步骤s52,提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

本实施例中,每个输入样本中的每个字均计算了第一概率和第二概率,第一概率表明该字作为该输入样本中的角色标签的初始位置的概率,第一概率越大,表明该字越有可能是初始位置,选择最大的第一概率所对应的字的位置作为初始位置,准确性较高,选择最大的第二概率所对应的字的位置作为结束位置也是同样的道理。通过选择最大的第一概率和第二概率对应的字作为起始位置和结束位置,能够更加准确的进行语义角色标注。

在一实施例中,所述根据所述第一概率和所述第二概率进行角色标注的步骤s5,包括:

步骤s5a,将所述输入样本中最大的所述第一概率与预设第一概率进行比较,若最大的所述第一概率大于所述预设第一概率,则将最大的第一概率所对应的字的位置作为所述角色标签的起始位置;

步骤s5b,将所述输入样本中最大的所述第二概率与预设第二概率进行比较,若最大的所述第二概率大于所述预设第二概率,则将最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

步骤s5c,提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

本实施例中,预设第一概率和预设第二概率可相等,每个输入样本中,计算出每个字的第一概率和第二概率后,最大的第一概率需大于预设第一概率时,最大的第二概率需大于预设第二概率时,所对应的字的位置才能作为该角色标签的起始位置和结束位置,避免即使是最大的第一概率,该第一概率的值其实是比较小的情况,这种情况下,得到的结果是不准确的,只有当最大的第一概率需大于预设第一概率时,最大的第二概率需大于预设第二概率时,才确定对应的初始位置和结束位置,通过本实施提供的技术方案,提高语义角色标注的准确性。

在一实施例中,在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤,包括:

将各个动词所对应的所有输入样本经过batch计算的方式计算各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的时结束位置的第二概率。

本实施例中,batch是一个超参数,用于定义语义角色标注要处理的样本数。通过batch计算的方式计算第一概率和第二概率,能够更快的对输入样本进行处理,从而进行语义角色标注,同一个动词可输出一个语义角色标注结果。在其他实施例中,不同的动词可输出一个语义角色标注结果。在另一实施例中,在进行模型训练时,设置batch的数值,将批处理视为循环迭代一个或多个样本并进行预测。在批处理结束时,将预测与预期输出变量进行比较,并计算误差。从该错误中,更新算法用于改进语义角色标注模型。

在一实施例中,所述语义角色标注模型包括第一全连接层和第二全连接层,所述第一全连接层和所述第二全连接层均包括softmax函数;所述计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤,包括:

通过所述第一全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率;

通过所述第二全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

本实施例中,具体的,语义角色模型中包括有两个全连接层,分别为第一全连接层和第二全连接层,每个全连接层中包含有一个softmax函数,分别可通过softmax进行计算第一概率和第二概率,softmax可将一个k维的任意实数向量映射成另一个k维的实数向量,其中向量中的每个元素取值都介于(0,1)之间,softmax的函数表达式为:通过计算各个字作为起始位置和结束位置的第一概率和第二概率,分别取其中最大一个概率值所对应的字的位置作为该角色标签的起始位置和结束位置。

本申请提供的语义角色标注方法可运用在区块链领域中,将训练完成的语义角色标注模型存储在区块链网络中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。

区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。

参见图2,本申请一实施例还提供了一种语义角色标注装置,包括:

获取单元10,用于获取待标注语句,并对所述待标注语句进行分词处理和词性标注;

第一确定单元20,用于根据所述词性标注的结果确定所述待标注语句中的动词;

第二确定单元30,用于获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;

输入单元40,用于将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;

计算单元50,用于在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。

在一实施例中,所述计算单元50,包括:

第一计算子单元,用于计算各个所述输入样本中存在所述角色标签所对应的字段的第三概率和不存在所述角色标签所对应的字段的第四概率;

第一比较子单元,用于将所述第三概率与所述第四概率进行比较;

不进入子单元,用于若所述第四概率大于所述第三概率,则不进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤;

进入子单元,用于若所述第四概率小于等于所述第三概率,则进入计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率的步骤。

在一实施例中,所述计算单元50,包括:

确定子单元,用于确定各个所述输入样本中最大的第一概率所对应的字的位置作为所述角色标签的起始位置,确定各个所述输入样本中最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

第一提取子单元,用于提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

在一实施例中,所述计算单元50,包括:

第二比较子单元,用于将所述输入样本中最大的所述第一概率与预设第一概率进行比较,若最大的所述第一概率大于所述预设第一概率,则将最大的第一概率所对应的字的位置作为所述角色标签的起始位置;

第二比较子单元,用于将所述输入样本中最大的所述第二概率与预设第二概率进行比较,若最大的所述第二概率大于所述预设第二概率,则将最大的第二概率所对应的字的位置作为所述角色标签的结束位置;

第二提取子单元,用于提取所述起始位置和结束位置间的字段,在所述字段处标注所述角色标签。

在一实施例中,所述计算单元50,包括:

第二计算子单元,用于将各个动词所对应的所有输入样本经过batch计算的方式计算各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

在一实施例中,所述语义角色标注模型包括第一全连接层和第二全连接层,所述第一全连接层和所述第二全连接层均包括softmax函数;所述计算单元50,包括:

第三计算子单元,用于通过所述第一全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率;

第四计算子单元,用于通过所述第二全连接层的softmax函数计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率。

在本实施例中,上述各个单元、子单元的具体实现请参照上述方法实施例中所述,在此不再进行赘述。

参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待标注语句、角色标签等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语义角色标注方法。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种语义角色标注方法。

综上所述,为本申请实施例中提供的语义角色标注方法、装置、计算机设备和存储介质,所述方法包括:获取待标注语句,并对所述待标注语句进行分词处理和词性标注;根据所述词性标注的结果确定所述待标注语句中的动词;获取各个所述动词预设的角色标签,根据所述角色标签和所述分词处理的结果构建各个所述角色标签所对应的输入样本;将各个所述输入样本输入至语义角色标注模型;其中,所述语义角色标注模型基于bert、bilstm、robert或xlne模型训练得到的;在所述语义角色标注模型中,计算所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的起始位置时的第一概率和所述输入样本中的各个字作为所述输入样本所对应的所述角色标签的结束位置时的第二概率,根据所述第一概率和所述第二概率进行角色标注。通过本申请提供的语义角色标注方法、装置、计算机设备和存储介质,无需将每个字都进行标注,只需要标注起始位置和结束位置,减少语义角色标注模型需要决策的路径数目,降低语义角色标注的搜索空间,同时每次只预测一个角色标签,通过缩小每次决策的搜索空间,提升语义角色标注的性能,提高语义角色标注的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram通过多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1