法条上下位关系判断方法及处理终端与流程

文档序号:21993502发布日期:2020-08-25 19:34阅读:679来源:国知局
法条上下位关系判断方法及处理终端与流程

本申请属于自然语言处理技术领域,具体涉及法条上下位关系判断方法及处理终端。



背景技术:

法律是由国家制定的规范体系,规定了公民在社会生活中可进行及不可进行的事物,是维护国家稳定的有力武器。在立法审查过程中,需要找到对应的上位法或下位法,确保在上下位法中的法条不发生相抵触或矛盾的情况。

然而,不同领域的法律数量众多,对应的法条数据数以万计,如果仅仅依靠人力审查,将会耗费大量的人力物力资源,且精度不高。相关技术中,采用无监督文本相似度计算方法判断上下位法条,比如,采用余弦相似度方法,其利用将法条数据映射到向量空间,通过计算向量间的余弦相似度来计算法条数据之间的相似程度,从而判断法条间的上下位关系,但是余弦相似度计算方法存在无法表示语义的缺陷,而且法条数据有一定的规则性,余弦相似度计算得到的精度并不高,难以很好的满足上下位法条判断需求。



技术实现要素:

为至少在一定程度上克服相关技术中存在的问题,本申请提供法条上下位关系判断方法及处理终端,有助于提升上下位法条关系判断的准确率。

为实现以上目的,本申请采用如下技术方案:

第一方面,

本申请提供法条上下位关系判断方法,所述方法包括:

获取法条数据;

将所述法条数据输入训练好的文本关联度计算模型,所述文本关联度计算模型包括:编码模块、局部推理模块、推理合成模块和预测结果模块,经所述编码模块、局部推理模块、推理合成模块和预测结果模块的依次处理,得到法条间的上下位关系。

进一步地,所述方法还包括:

根据所述法条数据得到法条对;

对所述法条对进行标注,得到所述法条对之间的上下位关系标签,然后对经标注的所述法条对进行文本处理,得到上下位法条数据集;

将所述上下位法条数据集按预设比例划分成训练集和测试集;

利用训练集和测试集,对所述文本关联度计算模型进行训练,得到训练好的所述文本关联度计算模型。

进一步地,所述编码模块用于:

获取法条对,通过词嵌入处理将法条对由文本分别转换成词向量序列,然后使用bi-lstm模型学习表示单词及其上下文关系,对词向量做编码后保存隐藏层的结果作为输出。

进一步地,所述局部推理模块用于:

获取所述编码模块的输出;

根据法条对词向量序列构造相似度矩阵,通过计算词向量的内积,得到法条对间的相似度;

对相似度结果计算加权权重,对编码值和加权权重值做差异值计算,在差异值计算后将编码值和加权权重值做拼接,以作为所述局部推理模块的输入。

进一步地,所述局部推理模块中,所述对相似度结果计算加权权重,包括:

基于attention机制,对相似度结果做软对齐;

利用预设加权计算公式计算加权权重,所述预设加权计算公式为:

其中,a和b表示法条,i和j表示的是不同时刻,eij表示法条对词向量的关联程度,表示法条词向量编码值。

进一步地,所述局部推理模块中,所述对编码值和加权权重值做差异值计算,包括:

对编码值和加权权重值做对位相减差异计算或是对位相乘差异计算。

进一步地,所述推理合成模块用于:

获取所述局部推理模块的输出,再次送入所述bi-lstm模型中捕获局部推理信息并进行推理组合,将经推理组合得到的结果做池化操作,将池化后的值做拼接,拼接后的结果作为预测模块的输入。

进一步地,所述推理合成模块中,所述将经推理组合得到的结果做池化操作,包括:

将经推理组合得到的结果分别做最大池化和平均池化。

进一步地,所述预测结果模块,用于将局部推理模块输出的结果送入全连接层,并选用softmax层得到最终结果,即法条间上下位关系标签。

第二方面,

本申请提供一种处理终端,包括:

一个或者多个存储器,其上存储有可执行程序;

一个或者多个处理器,用于执行所述存储器中的所述可执行程序,以实现上述任一项所述方法的步骤。

本申请采用以上技术方案,至少具备以下有益效果:

本申请通过调用经训练好的文本关联度计算模型对法条对进行相似度计算,根据相似度计算结果得到上下位关系标签,从而判断法条间的上下位关系,有助于在立法审查过程中实现上下位法条搜索,解决无监督文本相似度计算方法精度不高的问题,提升上下位法条关系判断准确率。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的法条上下位关系判断方法的流程图;

图2是根据一示例性实施例示出的文本关联度计算模型的处理过程示意图;

图3是根据一示例性实施例示出的处理终端的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将对本申请的技术方案进行详细的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本申请所保护的范围。

名称解释:

bi-lstm(bidirectionallongshort-termmemory),双向长短期记忆神经网络。

attention机制,即注意力机制,模仿了生物观察行为的内部过程,即一种将内部经验和外部感觉对齐从而增加部分区域的观察精细度的机制。

本申请的第一方面,请参考图1,图1是根据一示例性实施例示出的法条上下位关系判断方法的流程图,如图1所示,该法条上下位关系判断方法包括如下步骤:

步骤s101、获取法条数据;

步骤s102、将所述法条数据输入训练好的文本关联度计算模型,所述文本关联度计算模型包括:编码模块、局部推理模块、推理合成模块和预测结果模块,经所述编码模块、局部推理模块、推理合成模块和预测结果模块的依次处理,得到法条间的上下位关系。

本申请通过调用经训练好的文本关联度计算模型对法条对进行相似度计算,根据相似度计算结果得到上下位关系标签,从而判断法条间的上下位关系,有助于在立法审查过程中实现上下位法条搜索,通过文本关联度来解决无监督文本相似度计算方法精度不高的问题,提升上下位法条关系判断准确率,从而有助于满足较准确地查找上下位法条的需求。

在一个实施例中,所述方法还包括:

根据法条数据得到法条对;

对法条对进行标注,得到所述法条对之间的上下位关系标签,然后对经标注的所述法条对进行文本处理,得到上下位法条数据集;

将所述上下位法条数据集按预设比例划分成训练集和测试集;

利用训练集和测试集,对所述文本关联度计算模型进行训练,得到训练好的所述文本关联度计算模型。

具体的,从数据库中获取具有上下位关系的法律,比如:《深圳经济特区实施《中华人民共和国消费者权益保护法》办法》和《中华人民共和国消费者权益保护法》,前者为深圳经济特区地方性法规,是后者的下位法,根据其上位法,即《中华人民共和国消费者权益保护法》制订,二者为上下位法关系。获取上述法律分别对应的法条数据,例如在前述下位法中有如下法条:“政府鼓励、支持一切组织和个人对损害消费者合法权益的行为进行社会监督。大众传播媒介应当做好维护消费者合法权益的宣传,对损害消费者合法权益的行为进行揭露、批评”,在其上位法中有如下法条:“保护消费者的合法权益是全社会的共同责任。国家鼓励、支持一切组织和个人对损害消费者合法权益的行为进行社会监督。大众传播媒介应当做好维护消费者合法权益的宣传,对损害消费者合法权益的行为进行舆论监督。”能够比较明显的看出,上述两个法条相似度高,属于上下位法条关系。另外,也存在分别属于上下位法律,但是不属于上下位法条关系的情况,例如在前述下位法中有如下法条:“深圳市及其辖区消费者委员会依法开展对商品和服务的社会监督”,在其上位法中有如下法条:“消费者组织不得从事商品经营和营利性服务,不得以牟利为目的向社会推荐商品和服务”,能够明显的看出,二者不属于上下位法条关系。将上述法条以对的形式存储,构成上下位法条数据集,每一组法条对都有对应标签,标签表示的法条间是否存在上下位关系,在数据集中标签可以以二值法表示是否存在上下位关系。

法条数据中存在一些影响计算的词,如“第十七条县级以上人民政府可以根据实际情况,在不同的农业区域建立农业机械化示范基地,并鼓励农业机械生产者、经营者等建立农业机械示范点,引导农民和农业生产经营组织使用先进适用的农业机械。”中所存在的“第十七条”实际上并非法条正文内容,但是在计算过程中如果没有删去,将会对计算结果产生比较大的影响,因此需要进行文本预处理,包括:去停用词等数据清理工作。

将上下位法条数据集按预设比例划分成训练集和测试集,利用训练集和测试集,对文本关联度计算模型进行训练,在具体应用中,可以经多轮训练,得到训练好的文本关联度计算模型,对于文本关联度计算模型是否训练好可以用精确率和召回率评估。

请参考图2,图2是根据一示例性实施例示出的文本关联度计算模型的处理过程示意图,文本关联度计算模型实现原理是,给定一个前提和假设,判断假设是否能由前提推理得出,即假设是否能由前提表示,其损失函数的目标是判断假设和前提是否有关联,将文本关联度计算模型用于相似度计算中实际上只是将损失函数的目标改为判断两个文本序列是否是同义句,通过上述四个模块进行实现,具体如下:

进一步地,所述编码模块用于:

获取法条对,通过词嵌入处理将法条对由文本分别转换成词向量序列,然后使用bi-lstm模型学习表示单词及其上下文关系,对词向量做编码后保存隐藏层的结果作为输出。

该层的输入是法条对,如“经营者与消费者进行交易,应当遵循自愿、平等、公平、诚实信用的原则”,“经营者应当标明其真实名称和标记。租赁他人柜台或者场地的经营者,应当标明其真实名称和标记”等法条对,法条对是文本数据,为了方便计算,首先要将法条数据转换为词向量序列,首先将法条数据通过嵌入层转换成向量,接着使用bi-lstm模型学习表示单词及其上下文关系,对向量做编码后保存隐藏层的结果作为下一层的输入,隐藏层结果表示如下:

其中a和b分别表示输入的两则法条数据,而i和j表示的是不同时刻。

进一步地,所述局部推理模块用于:

获取所述编码模块的输出;

根据法条对词向量序列构造相似度矩阵,通过计算词向量的内积,得到法条对间的相似度;

对相似度结果计算加权权重,对编码值和加权权重值做差异值计算,在差异值计算后将编码值和加权权重值做拼接,以作为所述局部推理模块的输入。

进一步地,所述局部推理模块中,所述对相似度结果计算加权权重,包括:

基于attention机制,对相似度结果做软对齐;

利用预设加权计算公式计算加权权重,所述预设加权计算公式为:

其中,a和b表示法条,i和j表示的是不同时刻,eij表示法条对词向量的关联程度,表示法条词向量编码值。

进一步地,所述局部推理模块中,所述对编码值和加权权重值做差异值计算,包括:

对编码值和加权权重值做对位相减差异计算或是对位相乘差异计算。

具体的,局部推理模块,该层的输入是编码阶段的输出,也就是bi-lstm中隐藏层的结果,上述公式中的a和b在该模块中首先需要构造两个序列的相似度矩阵,通过计算词向量的内积表示两个文本的关联程度,内积计算公式如下:

在该模块中用两个文本序列间是否能够相互表示来计算两个文本相似度,并将该结果基于attention机制做软对齐,计算加权权重,其计算公式如下:

接着对编码值和加权权重值做差异值计算,差异值计算方法可以是对位相减或是对位相乘,再差异值计算后将两个状态的值做拼接,以实现对局部推理进行增强,其计算公式如下:

进一步地,所述推理合成模块用于:

获取所述局部推理模块的输出,再次送入所述bi-lstm模型中捕获局部推理信息并进行推理组合,将经推理组合得到的结果做池化操作,将池化后的值做拼接,拼接后的结果作为预测模块的输入。

进一步地,所述推理合成模块中,所述将经推理组合得到的结果做池化操作,包括:

将经推理组合得到的结果分别做最大池化和平均池化。

具体的,推理合成模块,该层的输入是局部推理模块中拼接后的值,再次送入bi-lstm模型中捕获局部推理信息并进行推理组合,再将得到的结果做池化操作,该阶段进行的池化操作分别为最大池化和平均池化,将池化后的值做拼接,拼接后的结果作为预测结果模块的输入,其计算公式如下:

v=[va,ave;va,max;vb,ave;vb,max]

进一步地,所述预测结果模块,用于将局部推理模块输出的结果送入全连接层,并选用softmax层得到最终结果,即法条间上下位关系标签。

本申请的第二方面,请参阅图3,图3是根据一示例性实施例示出的处理终端的结构示意图,如图3所示,该处理终端3包括:

一个或者多个存储器301,其上存储有可执行程序;

一个或者多个处理器302,用于执行所述存储器301中的所述可执行程序,以实现上述任一项所述方法的步骤。

关于上述实施例中的处理终端3,在具体应用中,其处理器302执行存储器301的程序的具体方式已经在上述有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”、“多”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为:表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器301中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器301,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1