一种基于二维时序网络的端到端文本实体关系识别方法与流程

文档序号:23222163发布日期:2020-12-08 15:04阅读:来源:国知局

技术特征:

1.一种基于二维时序网络的端到端文本实体关系识别方法,其特征在于:所述方法包括:

s1、获取文本语句,对文本语句进行处理后嵌入embedding层,并对嵌入结果进行编码处理,得到语句的向量表示;

s2、对步骤s1中得到的向量表示进行处理,得到头实体张量和尾实体张量;

s3、对步骤s1中得到的向量表示进行识别处理,得到文本语句提及的关系类别;

s4、用步骤s3中得到的关系类别对步骤s2中得到的头实体张量和尾实体张量进行缩放处理;

s5、从步骤s4中经缩放的头实体张量中识别涉及到的实体类别,得到头实体类别;从步骤s4中经缩放的尾实体张量中识别涉及到的实体类别,得到尾实体类别;

s6、对步骤s4中经缩放的头实体张量和尾实体张量分别进行加权处理;

s7、用步骤s5中得到的头实体类别对步骤s6中经加权的头实体张量进行缩放处理,用步骤s5中得到的尾实体类别对步骤s6中经加权的尾实体张量进行缩放处理;

s8、对步骤s7中经缩放的头实体张量和尾实体张量进行处理,得到最终的关系张量。

2.根据权利要求1所述的一种基于二维时序网络的端到端文本实体关系识别方法,其特征在于:所述步骤s1中对文本语句的处理,包括序列编码处理和cls字符嵌入处理,所述cls字符用来代表整个文本语句。

3.根据权利要求1所述的一种基于二维时序网络的端到端文本实体关系识别方法,其特征在于:所述步骤s5中得到的头实体类别和尾实体类别均采用bio标注方法。

4.根据权利要求1所述的一种基于二维时序网络的端到端文本实体关系识别方法,其特征在于:所述步骤s6中,利用点积缩放自注意力机制对步骤s4中经缩放的头实体张量和尾实体张量分别进行加权处理。

5.根据权利要求1所述的一种基于二维时序网络的端到端文本实体关系识别方法,其特征在于:所述步骤s8中,利用s3步骤中得到的关系类别对所述关系张量进行缩放处理。

6.根据权利要求1所述的一种基于二维时序网络的端到端文本实体关系识别方法,其特征在于:所述步骤s4中得到的头实体类别和尾实体类别,以及s8步骤中得到的关系张量均含有关系类别纬度。


技术总结
本发明提供了一种基于二维时序网络的端到端文本实体关系识别方法,属于自然语言处理技术领域。所述方法包括:对文本语句进行处理后嵌入embedding层,得到语句的向量表示;对向量表示编码处理后得到头实体张量和尾实体张量;从向量表示中识别出关系类别;用关系类别对头实体张量和尾实体张量进行缩放;从经缩放的头实体张量中识别出头实体类别和尾实体类别;对经缩放的头实体张量和尾实体张量进行加权处理;对头实体张量和尾实体张量进行缩放;对上一步经缩放的头实体张量和尾实体张量进行处理,得到最终的关系张量。本发明采用联合建模方式的端到端关系识别模型,相较于管道式的方法可以消除误差累加;本发明可以有效处理交织实体和交织关系的识别问题。

技术研发人员:付勇;井友鼎;杜创胜;王旭峰;甘志芳;王顺智
受保护的技术使用者:河南合众伟奇云智科技有限公司
技术研发日:2020.09.11
技术公布日:2020.12.08
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1