自动提取裁判文书涉案标的和裁判结果的方法及装置与流程

文档序号:20775982发布日期:2020-05-19 20:46阅读:275来源:国知局
自动提取裁判文书涉案标的和裁判结果的方法及装置与流程

本发明涉及一种自动提取裁判文书涉案标的和裁判结果的方法及装置。



背景技术:

在信息时代,特别在大数据风控的背景下,企业需要各个维度的信息帮助企业的经营投资等决策。司法涉诉一般作为评估目标主体信用风险的一个重要的维度,其中,裁判文书包含案件当事人、案由、裁判结果、涉案金额等内容,已被视为当事人信用及经营风险评估的重要数据来源,案件的裁判结果和涉案金额,更是成为主体风控模型中的重要维度。由于裁判文书内容是非结构化的文本,参与建模前还需要通过自然语言处理技术将文本结构化。

但在目前的普遍应用中,对案件的裁判结果和涉案金额的解析并未结合当事人因素,笼统地将整个案件的涉案金额、裁判结果归到所有当事人身上,可能并不符合实际裁判情况,尤其是同一角色涉及多个当事人时,偏差尤为明显。



技术实现要素:

针对上述现有技术的不足,本发明所要解决的技术问题是:提供一种在评估目标主体信用风险时,能够将裁判文书中所含的当事人、案由、裁判结果、涉案金额等内容提取出来以作为评估参考的自动提取裁判文书涉案标的和裁判结果的方法及装置。

为解决上述技术问题,本发明采用的一个技术方案是:提供一种自动提取裁判文书涉案标的和裁判结果的方法,包括以下步骤:

s101、根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;

s102、根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;

s103、将s101步骤提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将s102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;

s104、将s103步骤中每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;

s105、将s103步骤中每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。

进一步的,在s101步骤中,根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。

进一步的,在s102步骤中,

根据“裁定如下”、“判决如下”或其变体作为第二标识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。

进一步的,在s103步骤中,根据以下分类和规则识别带入参数:

优先识别裁判结果是否提及具体当事人及其当事人法律地位,若有结果,则将具体当事人及其对应的法律地位带入到当事人项及对应的法律地位项中,若无结果,则识别是否裁判结果是否提及具体当事人,若有结果,则将具体当事人带入到当事人项中,若无结果,则识别裁判结果是否提及当事人法律地位,若有结果,则将具体当事人法律地位带入到法律地位项,若以上皆无结果,则当事人及法律地位项输入参数均为空。

为解决上述技术问题,本发明采用的另一个技术方案是:提供一种自动提取裁判文书涉案标的和裁判结果的装置,包括:

当事人及当事人法律地位提取模块,用于根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;

裁判结果提取处理模块,用于根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;

关联模块,用于将所述当事人及当事人法律地位提取模块提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将s102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;

裁判结果处理模块,用于将所述关联模块关联到的每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;以及

涉案标的处理模块,用于将所述关联模块关联到每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。

进一步的,所述当事人及当事人法律地位提取模块还用于根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。

进一步的,识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。

进一步的,所述关联模块还用于根据以下分类和规则识别带入参数:

优先识别裁判结果是否提及具体当事人及其当事人法律地位,若有结果,则将具体当事人及其对应的法律地位带入到当事人项及对应的法律地位项中,若无结果,则识别是否裁判结果是否提及具体当事人,若有结果,则将具体当事人带入到当事人项中,若无结果,则识别裁判结果是否提及当事人法律地位,若有结果,则将具体当事人法律地位带入到法律地位项,若以上皆无结果,则当事人及法律地位项输入参数均为空。

通过本自动提取裁判文书涉案标的和裁判结果的方法及装置,在对海量裁判文书文本分析时,自动化和精确提取裁判结果中针对该当事人的裁判结果和法院支持涉案标的,解决人工提取判决结果效率低成本高等问题,节省人力,提高准确性,在金融科技、信用科技应用领域为目标主体信用风险的评估和控制的业务场景提供决策支持,并不限于上述领域风控场景。本发明的自动提取裁判文书涉案标的和裁判结果的方法及装置能够精确提取裁判文书中具体当事人的权利和义务、判决结果、法院支持标的。准确识别裁判结果段落中每个裁判事件与各当事人的相关性,把裁判结果按照当事人分类,精确提取裁判结果文本中各当事人的权利和义务、判决结果、法院支持标的;构建裁判文书体库和当事人裁判结果提取规则从裁判文书判决结果提取关键字,清洗、过滤后加入裁判文书体关键词库,将需要解析的裁判文书的当事人、当事人法律地位标识带入文书体关键词库构建裁判结果提取规则,基于这个提取规则文本解析可精确提取到各涉案当事人在该案中裁判结果和涉案标的。

附图说明

图1是本发明自动提取裁判文书涉案标的和裁判结果的方法一实施例的流程图。

图2是本发明自动提取裁判文书涉案标的和裁判结果的方法一实施例中裁判文书体判词词库和提取规则构建图。

图3是本发明自动提取裁判文书涉案标的和裁判结果的方法具体实例中涉案当事人及法律地位提取内容示意图。

图4是本发明自动提取裁判文书涉案标的和裁判结果的方法具体实例中判决结果提取内容示意图。

图5是提取结果关联图。

图6是本发明自动提取裁判文书涉案标的和裁判结果的装置一实施例的方框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参见图1至图5,本发明自动提取裁判文书涉案标的和裁判结果的方法,包括以下步骤:

s101、根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;

本步骤中,根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。

s102、根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;

所述停止标识可以是停止词、停止符号(例如句号)、回车等段落结束符号等。

本步骤中,根据“裁定如下”、“判决如下”或其变体作为第二标识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。然后将裁判结果段进行分句,逐句检索并保留不包含停止词的句子再清洗,这个过程是为了降噪,尽量去除和裁判结果不相干的句子,避免对判决结果提取造成干扰。

s103、将s101步骤提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将s102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;具体地:

将s101步骤提取的当事人和当事人法律地位作为参数带入文书体关键词库构建得到裁判结果提取规则:根据裁判结果中是否提及具体当事人、当事人法律地位等情形,将根据以下分类和规则识别带入参数:(一)、优先识别裁判结果是否提及具体当事人及其当事人法律地位,(二)、若(一)无结果,则识别是否裁判结果是否提及具体当事人,(三)、若(一)和(二)都无结果,则识别裁判结果是否提及当事人法律地位,(四)、若以上皆无结果,则输入参数均为空,利用优先级灵活地控制参数输入将影响模型,提高提取结果的准确性,降低系统开销,将步骤2中所得的文本内容分句后,由提取规则对每一个分句分别关联出该分句中提及到的当事人对应的裁判结果和该句中所有提及金额。所述提取规则可以是根据句型主谓宾结构进行提取,首先明确主语所涉及的当事人法律地位(比如被告),将其写入至关联库或表中对应的当事人和法律地位项中,再确定谓语,根据谓语确定判决结果,例如主语当事人支付……,通过此可以确定主语当事人败诉等。宾语例如可以是另一当事人(比如原告)及金额,比如支付原告xx元。通过这样的规则即可将该句中的各当事人对应的判决结果和金额写入至关联库或表中。当然,在不同的实施例中,提取规则还可以有不同的方式,此处不再一一描述。

s104、将s103步骤中每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;

本步骤中,将s103步骤中每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果,例如:某案中当事人a在该案中关联出的判决结果为:(1)xxx(被告)赔偿当事人a、(2)确认xx物归当事人a所有、(3)驳回当事人a其他诉讼请求,现将上述判决结果关联映射后得:(1)当事人a胜诉(2)当事人a胜诉(3)驳回当事人a其他请求,合并上述结果并去重后结果为:(1)当事人a部分胜诉(2)驳回当事人a部分请求。

s105、将s103步骤中每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。

本步骤中,将s103每个当事人关联得到的所有金额分别进行清洗、转换,根据规则去重。例如100万、壹亿伍仟万零叁佰、1,500,100等含有中文、汉字大写金额、中文字符等各种可能的金额清洗、转化成阿拉伯数字标准格式,计算加总后得到该当事人在该案中法院所支持的涉案标的。

本发明实施方式,在对海量裁判文书文本分析时,自动化和精确提取裁判结果中针对该当事人的裁判结果和法院支持涉案标的,解决人工提取判决结果效率低成本高等问题,节省人力,提高准确性,在金融科技、信用科技应用领域为目标主体信用风险的评估和控制的业务场景提供决策支持,并不限于上述领域风控场景。

请参见图6,本发明自动提取裁判文书涉案标的和裁判结果的装置,包括:

当事人及当事人法律地位提取模块,用于根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;进一步的,所述当事人及当事人法律地位提取模块还用于根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。

裁判结果提取处理模块,用于根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;进一步的,还用于根据“裁定如下”、“判决如下”或其变体作为第二标识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。

关联模块,用于将当事人及当事人法律地位提取模块提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将裁判结果提取处理模块所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;进一步的,优先识别裁判结果是否提及具体当事人及其当事人法律地位,若有结果,则将具体当事人及其对应的法律地位带入到当事人项及对应的法律地位项中,若无结果,则识别是否裁判结果是否提及具体当事人,若有结果,则将具体当事人带入到当事人项中,若无结果,则识别裁判结果是否提及当事人法律地位,若有结果,则将具体当事人法律地位带入到法律地位项,若以上皆无结果,则当事人及法律地位项输入参数均为空。

裁判结果处理模块,用于将关联模块关联得到的每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;以及

涉案标的处理模块,用于关联模块关联到的每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。

以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1