基于合同纠纷判决书的信息抽取方法及装置与流程

文档序号:22931315发布日期:2020-11-13 16:30阅读:来源:国知局

技术特征:

1.一种基于合同纠纷判决书的信息抽取方法,其特征在于,包括:

获取目标文本,其中,所述目标文本为合同纠纷判决书中本院查明目录对应的文本信息;

利用合同基本信息抽取模型从所述目标文本中抽取获得至少一个合同基本信息,从所述合同基本信息中抽取获得合同名称和签订时间;

根据每一所述合同基本信息对所述目标文本进行划分,获得对应的合同信息块;

利用合同条款抽取模型分别对每一合同信息块进行信息抽取,获得对应的合同条款内容。

2.根据权利要求1所述的方法,其特征在于,所述获取目标文本,包括:

获取合同纠纷判决书;

利用目录抽取模型对所述合同纠纷判决书进行信息抽取,获得多个目录对应的起始位置信息;其中,多个目录包括本院查明目录;

根据所述本院查明目录对应的起始位置信息和本院查明目录的下一个目录对应的起始位置信息从所述合同纠纷判决书中获得所述目标文本。

3.根据权利要求1所述的方法,其特征在于,当所述至少一个合同基本信息为多个合同基本信息时,所述根据每一所述合同基本信息对所述目标文本进行划分,包括:

采用包含取短原则对所述多个合同基本信息进行内容去重,获得去重后合同基本信息;其中,所述包含取短原则是指,若两个合同基本信息中,第一个合同基本信息包含第二个合同基本信息,则将第一个合同基本信息剔除;

获取每个去重后合同基本信息的位置索引信息,根据所述位置索引信息对所述去重后合同基本信息进行排序;

利用排序后的合同基本信息对所述目标文本进行划分。

4.根据权利要求1所述的方法,其特征在于,在获得对应的合同名称和签订时间之后,所述方法还包括:

若一个合同基本信息中包括多个合同名称,利用包含取短原则对多个合同名称进行去重处理,并根据去重后的合同名称对应的位置索引信息进行排序,将排序后的第一个合同名称作为目标合同名称;

对所述签订时间进行归一化处理,并将归一化后的排在合同信息块的第一个的签订时间作为目标签订时间。

5.根据权利要求1所述的方法,其特征在于,所述利用合同条款抽取规则分别对每一合同信息块进行信息抽取,获得合同条款内容,包括:

利用合同条款内容模型对对应的合同信息块进行抽取,获得多个抽取结果;

根据位置最靠前的一个抽取结果的起始位置索引信息和位置最靠后的一个抽取结果的结束位置索引信息从对应的合同信息块中截取所述合同条款内容。

6.根据权利要求1-5任一项所述的方法,其特征在于,在获得合同条款内容之后,所述方法还包括:

根据预设规则对所述合同条款内容进行结构化,获得对应的合同条款明细;其中,所述预设规则包括:

利用预先设置的序列特征规则对所述合同条款内容进行匹配,获得独立条款项的位置索引信息表;

若所述独立条款项的位置索引信息表不为空,则利用独立条款项的起始位置索引信息表中的位置索引信息对所述合同条款内容进行切分,获得合同条款明细;

若所述独立条款项的位置索引信息表为空,则利用整句符号对所述合同条款内容进行分割,获得所述合同条款明细。

7.根据权利要求6所述的方法,其特征在于,在获得所述合同条款明细后,所述方法还包括:

利用不同的条款类别规则对各合同条款明细进行匹配,获得各合同条款明细对应的条款类别。

8.一种基于合同纠纷判决书的信息抽取装置,其特征在于,包括:

文本获取模块,用于获取目标文本,其中,所述目标文本为合同纠纷判决书中本院查明目录对应的文本信息;

基本信息抽取模块,用于利用合同基本信息抽取模型从所述目标文本中抽取获得至少一个合同基本信息,从所述合同基本信息中抽取获得合同名称和签订时间;

文本划分模块,用于根据每一所述合同基本信息对所述目标文本进行划分,获得对应的合同信息块;

条款抽取模块,用于利用合同条款抽取模型分别对每一合同信息块进行信息抽取,获得对应的合同条款内容。

9.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,

所述处理器和所述存储器通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-7任一项所述的方法。

10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被计算机运行时,使所述计算机执行如权利要求1-7任一项所述的方法。


技术总结
本申请提供一种基于合同纠纷判决书的信息抽取方法及装置。该方法包括:获取目标文本,目标文本为合同纠纷判决书中本院查明目录对应的文本信息;利用合同基本信息抽取规则从目标文本中抽取获得至少一个合同基本信息,从合同基本信息中抽取获得合同名称和签订时间;根据至少一个合同基本信息对所述目标文本进行划分获得至少一个合同信息块;利用合同条款抽取规则分别对每一合同信息块进行信息抽取,获得对应的合同条款内容。本申请实施例通过先从合同基本信息中抽取获得合同名称和签订时间,然后利用合同条款抽取规则对每一个合同信息块进行信息抽取获得合同条款内容,便于后续通过合同名称将合同条款内容和条款的效力进行关联分析。

技术研发人员:李德彦;晋耀红;刘大双;张志一
受保护的技术使用者:鼎富智能科技有限公司
技术研发日:2020.08.10
技术公布日:2020.11.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1