基于深度学习的文书判决结果倾向性的方法及装置与流程

文档序号：17862172发布日期：2019-06-11 22:56阅读：296来源：国知局

本发明涉及基于深度学习的文本倾向性分析方法技术领域，特别是涉及裁判文书的判决结果倾向性。

背景技术：

目前，解决短文本倾向性分析的常用手段为基于字典规则的方法和基于机器学习的方法是。基于字典规则的方法通常需要先构建情感词典，再根据测试文本中的情感词在词典中的先验情感进行整条文本的情感计算，不同类型或主题的语料上难以移植和泛化，同时过度依赖于专家的领域知识。基于机器学习的方法是将情感分析转化成模式分类的问题，建立分类模型，对情感极性作出预测。在建立模型时，需要事先标注好数据，依赖于大量的人工标注。

同时，文书的判决结果倾向性与一般文本倾向性有所不同，判决结果本身是被包含在裁判文书这样半结构的文本中，无法直接获得，同时由于判决结果的对象实体对倾向性结果有决定性作用，而判决结果中往往使用的是人名等称谓，而非统一的法律实体，因此需要准确地识别出判决的多重实体并进行清洗。

中国专利申请cn201510866865.0，一种自动判定裁判文书判决结果的方法及装置，涉及自然语言处理领域，为解决人工提取判决结果效率低的问题而发明。本发明的方法包括：在裁判文书中遍历预设的标识一和标识二，所述标识一为判决如下、裁定如下或其变体，所述标识二为受理费或其变体；截取标识一与标识二中间的判决段落，所述判决段落包括判决结果；在所述判决段落中，在所述标识一之后的预设字符范围内查找败诉关键词，所述败诉关键词包括驳回、不准或其变体；若查找到所述败诉关键词，则确定所述判决结果为败诉。该发明主要应用于对中文裁判文书的判决结果进行自动判定的过程中。

但是使用该方法和装置判定的裁判文书准确性还存在一定的偏差。

技术实现要素：

为了克服上述方法存在的难以移植、依赖于专家、大量人工标注的问题，提出一种基于深度学习的文本倾向性分析方法，该方法只需少量人工标注，且一经训练成模型，之后可直接使用。

本发明所采用的技术方案是：基于深度学习的文书判决结果倾向性的方法，包括通过对裁判文书依次进行数据抽取、数据清洗、数据标注、分词、生成词向量、词向量替换、深度神经网络训练和生成模型，从而获取裁判文书的倾向性结果标签的步骤；其中：

数据抽取，是从裁判文书中抽取出原告、被告、判决结果的关键特征；

数据清洗，利用模糊匹配的方式，识别判决结果中的人名、公司名称谓，并使用相对应的法律用语代替；设定w是所有原告与被告名称的集合，sk是第k个名称wk与判决结果的最长公共子字符串，rk是第k个最长公共子串sk与第k个名称wk的长度比，则

w＝{w1，w2，…，wn}

选择集合{rk}中的最大值所对应的身份，“原告”或者“被告”，替换判决结果中的最长公共子串；

数据标注，将数据清洗得到的判决结果进行人工标注，分别为“支持原告”和“不支持原告”；

分词：将数据标注的判决结果进行分词，作为深度神经网络训练的输入；

生成词向量及词向量替换：使用word2vector进行词向量生成；

深度神经网络训练和生成模型，将词向量表示的分词结果作为lstm网络模型的输入，然后通过多层lstm的深度神经网络进行倾向性判断，最后生成裁判文书的倾向性结果标签。

进一步地，生成词向量和词向量替换完成之后，在深度神经网络训练时，倾向性结果标签输出前的输出节点之前增加一层隐藏层对向量进行特征选择，最终输出的倾向性结果标签使用sigmoid激活函数获得。

进一步地，数据标注步骤中，设定如下判定规则：如果单条判决结果中，部分支持原告，则标注支持原告；

如果撤诉判定为支持原告，则标注其支持原告；

如果驳回被告的反诉请求判定为支持原告，同理，驳回原告的反诉请求为支持被告，则标注支持原告。

进一步地，数据标注由至少三个人进行标注。

基于深度学习的文书判决结果倾向性的装置，包括裁判文书的抽取装置、数据清洗装置、数据标注装置、分词模块、生成词向量模块、词向量替换模块、深度神经网络训练模块和裁判文书判决结果倾向性生成标签模块；其中：

数据清洗装置，利用模糊匹配的方式，识别判决结果中的人名、公司名称谓，并使用相对应的法律用语代替；设定w是所有原告与被告名称的集合，sk是第k个名称wk与判决结果的最长公共子字符串，rk是第k个最长公共子串sk与第k个名称wk的长度比，则

w＝{w1，w2，…，wn}

选择集合{rk}中的最大值所对应的身份，“原告”或者“被告”，替换判决结果中的最长公共子串；

数据标注装置，用于将数据清洗得到的判决结果进行人工标注，分别为“支持原告”和“不支持原告”；

分词模块：将数据标注的判决结果进行分词，作为深度神经网络训练的输入；深度神经网络训练模块，将词向量表示的分词结果作为lstm网络模型的输入，然后通过多层lstm的深度神经网络进行倾向性判断，最后生成裁判文书的倾向性结果标签；

裁判文书判决结果倾向性生成标签模块，通过显示装置显示出来。

进一步地，数据标注模块中，设定如下判定规则，如下判决案例一旦出现，按照判定规则执行倾向性结构标签进行标识：

规则一，如果单条判决结果中，部分支持原告，则标注支持原告；

规则二，如果撤诉判定为支持原告，则标注其支持原告；

规则三，如果驳回被告的反诉请求判定为支持原告，同理，驳回原告的反诉请求为支持被告，则标注支持原告。

进一步地，深度神经网络训练模块与裁判文书判决结果倾向性生成标签模块之间增加一层隐藏层对词向量进行特征选择，并且最终输出的倾向性结果标签使用sigmoid激活函数获得。

进一步地，使用该文书判决结果倾向性的装置在进行数据标注时，至少三人对其进行标注。

与现有技术相比，本发明的有益效果是：基于深度学习的文本倾向性分析方法能够从非结构化的文本中提取关键特征，利用模糊匹配方法解决判决结果中的多实体识别的问题，通过基于多层lstm的深度神经网络进行倾向性判断，将整个过程构建成一个针对判决结果的倾向性分析模型。将该模型在不同案由的裁判文书数据集上都达到很高的准确率。通过该方法，只需输入裁判文书，即可得到判决结果倾向性标签，中间步骤无需人工参与，省时省力。

通过该方法，只需输入裁判文书，即可得到判决结果倾向性标签，中间步骤无需人工参与，省时省力。同时对于今后的裁判文书规范化、推荐诉讼律师等工作具有重要的意义。

附图说明

图1为基于深度学习的文书判决结果倾向性的方法的判断流程图；

图2为本发明裁判文书的倾向性结果标签的深度神经网络模型；

图3为本发明裁判文书的在使用深度神经网络训练模块在进行神经网络训练的训练算法。

具体实施方式

为了加深对本发明的理解，下面结合附图和实施例对本发明进一步说明，该实施例仅用于解释本发明，并不对本发明的保护范围构成限定。

实施例1

如图1所示，基于深度学习的文书判决结果倾向性的方法，包括通过对裁判文书依次进行数据抽取s1、数据清洗s2、数据标注s3、分词s4、生成词向量s5、词向量替换s6、深度神经网络训练s7和深度神经网络模型s8，从而获取裁判文书的倾向性结果标签的步骤；其中：

数据抽取，是从裁判文书中抽取出原告、被告、判决结果的关键特征；由于裁判文书半结构化的特点，抽取出关键特征所在的段落比较容易，从段落中抽取出准确的特征则需要根据特征上下文设计不同的正则匹配条件。

w＝{w1，w2，…，wn}

选择集合{rk}中的最大值所对应的身份，“原告”或者“被告”，替换判决结果中的最长公共子串；在这个步骤中，有一些判决结果中的公司名与原告、被告中的名称不完全一致，比如抽取出的原告名称为“北京**工程技术有限公司”，而在判决结果中使用“**工程技术有限公司”的称谓，这些称谓通常是全称的子串，因此在最终实验的数据清洗过程中使用的是最长公共子串算法进行模糊匹配。

数据标注，将数据清洗得到的判决结果进行人工标注，分别为“支持原告”和“不支持原告”；标注时，由3人进行人工标注，每条判决结果的标注由3人标注的结果综合判定，从而降低人工出错的可能性。

分词：将数据标注的判决结果进行分词，作为深度神经网络训练的输入；

生成词向量及词向量替换：使用word2vector进行词向量生成；

深度神经网络训练和生成模型，如图2所示，将词向量表示的分词结果作为lstm网络模型的输入，然后通过多层lstm的深度神经网络进行倾向性判断，最后生成裁判文书的倾向性结果标签。也就是说深度神经网络模型包括对词向量表示的分词结果的训练以及倾向性结果的计算，随后在输出节点82处通过裁判文书的倾向性结果标签将判决结果标识并且输出。图2是本发明设计的深度神经网络模型，将词向量表示的分词结果作为lstm网络的输入。由于倾向性分析的最终输出是分类标签，因此只需要考虑lstm最后一个单元的输出结果。又因为输出结果是一个向量，所以额外增加了一层隐藏层对向量进行特征选择，最终输出的标签使用sigmoid激活函数获得。整个深度神经网络的训练完成后，会得到最终的模型。

在上述实施例中，生成词向量和词向量替换完成之后，在深度神经网络训练时，倾向性结果标签输出前的输出节点之前增加一层隐藏层81对向量进行特征选择，最终输出的倾向性结果标签使用sigmoid激活函数获得。

在上述实施例中，数据标注步骤中，设定如下判定规则：如果单条判决结果中，部分支持原告，则标注支持原告；

如果撤诉判定为支持原告，则标注其支持原告；

如果驳回被告的反诉请求判定为支持原告，同理，驳回原告的反诉请求为支持被告，则标注支持原告。

具体如表1特殊情况标注规则所示：

表1特殊情况标注规则

在上述实施例中，数据标注由至少三个人进行标注。

实施例2

w＝{w1，w2，…，wn}

选择集合{rk}中的最大值所对应的身份，“原告”或者“被告”，替换判决结果中的最长公共子串；数据标注装置，用于将数据清洗得到的判决结果进行人工标注，分别为“支持原告”和“不支持原告”；

裁判文书判决结果倾向性生成标签模块，通过显示装置显示出来。

数据标注模块中，设定如下判定规则，如下判决案例一旦出现，按照判定规则执行倾向性结构标签进行标识：

规则一，如果单条判决结果中，部分支持原告，则标注支持原告；

规则二，如果撤诉判定为支持原告，则标注其支持原告；

规则三，如果驳回被告的反诉请求判定为支持原告，同理，驳回原告的反诉请求为支持被告，则标注支持原告。深度神经网络训练模块与裁判文书判决结果倾向性生成标签模块之间增加一层隐藏层对词向量进行特征选择，并且最终输出的倾向性结果标签使用sigmoid激活函数获得。使用该文书判决结果倾向性的装置在进行数据标注时，至少三人对其进行标注。

深度神经网络训练模块在进行神经网络训练时，以lstm模型作为核心，lstm在rnn的基础上新增了细胞状态和门两个概念。细胞状态会在整个lstm隐藏层中传输，存储在其中的信息不会丢失，但可以通过不同的门对其中的信息进行增删。门结构是用来选择信息的结构，lstm中包含了3种门，分别是遗忘门、输入门、输出门。如图3所示，lstm节点的内部结构。xt，ht，ct是第t时刻的输入，输出，候选细胞状态和细胞状态，ft，it，ot是第t时刻的遗忘门、输入门、输出门的结果。它们的计算公式如下：

遗忘门：ft＝σ(wfxt+ufht-1+bf)

输入门：it＝σ(wixt+uiht-1+bi)

输出门：ot＝σ(woxt+uoht-1+bo)

状态候选值：

细胞状态更新：

ht＝ot*tanh(ct)

其中wf，wi，wc，wo，uf，ui，uc，uo是权重矩阵，bf，bi，bc，bo是偏移向量，σ是sigmoid函数。

遗忘门用来控制从细胞状态中丢弃的内容，诸如判决结果中赔偿金额、赔偿时间，这些信息对标签的最终判定是没有影响的，因此在训练的过程中，类似信息会被遗忘。输入门用来决定哪些新信息需要增加到细胞状态中，例如“驳回【空格】被告【空格】反诉【空格】请求”，训练时，“被告”一词是“驳回”的对象，对最终的标签是有决定性影响的，因此会被更新到细胞状态中。输出门根据当前时刻的输入和细胞状态控制当前时刻的输出内容。

综上所述，本发明的方法和装置，克服了上述方法存在的难以移植、依赖于专家、大量人工标注的问题，提出一种基于深度学习的文本倾向性分析方法，该方法只需少量人工标注，且一经训练成模型，之后可直接使用。准确度如下表2所示，p、n表示“支持原告”、“不支持原告”这两种分类标签。

表2本发明的方法与现有方法得到的裁判文书倾向性结果正确率对比

本发明的实施例公布的是较佳的实施例，但并不局限于此，本领域的普通技术人员，极易根据上述实施例，领会本发明的精神，并做出不同的引申和变化，但只要不脱离本发明的精神，都在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵志宏;宋梦姣;陈松宇;王业沛
技术所有人：南京大学
我是此专利的发明人

上一篇：一种工业炉门楣预制件模具结构的制作方法
上一篇：排水抗滑桩及其制作方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。