一种实体关系提取的方法和装置与流程

文档序号:37289564发布日期:2024-03-13 20:38阅读:来源:国知局

技术特征:

1.一种实体关系提取的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据预设的实体集和所述语句模板生成扩充数据集,包括:

3.根据权利要求1所述的方法,其特征在于,对所述合并数据集中的每条数据进行实体关系标注,包括:

4.根据权利要求3所述的方法,其特征在于,结合实体在数据中的位置对所述合并数据集中的每条数据的实体关系进行标注,包括:

5.根据权利要求4所述的方法,其特征在于,结合所述数据的实体关系标注结果生成所述增强数据的实体关系标注结果,包括:

6.根据权利要求1所述的方法,其特征在于,提取每条数据对应的子句、实体和非实体词语,包括:

7.根据权利要求1所述的方法,其特征在于,对所述合并数据集中的每条数据,将所述数据对应的子句、实体和非实体词语分别进行数据增强处理,包括:

8.根据权利要求1、6或7所述的方法,其特征在于,在提取每条数据对应的子句、实体和非实体词语之后,还包括:

9.根据权利要求8所述的方法,其特征在于,在生成所述数据对应的树状解析结果之后,还包括:

10.一种实体关系提取的装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。


技术总结
本发明公开了一种实体关系提取的方法和装置,涉及自然语言处理技术领域。该方法的一具体实施方式包括:根据原始数据集的文本表述方式生成语句模板,并根据预设的实体集和语句模板生成扩充数据集;将原始数据集和扩充数据集进行合并生成合并数据集,进行实体关系标注,并提取每条数据对应的子句、实体和非实体词语;将数据对应的子句、实体和非实体词语分别进行数据增强处理,以得到数据对应的增强数据,并生成实体关系标注结果;基于汇总数据集中每条数据对应的增强数据和对应的实体关系标注结果进行实体关系提取模型训练,并使用实体关系提取模型进行实体关系提取。该实施方式提高了模型的泛化能力和鲁棒性,提高实体关系提取效率和准确性。

技术研发人员:张雷,邱小霞,赵新宇,卢腾
受保护的技术使用者:中国人民银行数字货币研究所
技术研发日:
技术公布日:2024/3/12
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1