案件判别结果的预测方法及装置与流程

文档序号:18257962发布日期:2019-07-24 10:26阅读:303来源:国知局
案件判别结果的预测方法及装置与流程

本发明涉及大数据处理技术领域,具体而言,涉及一种案件判别结果的预测方法及装置。



背景技术:

随着社会经济不断发展,法院对经济类型的案件的审判也越来越多。但是,在对每个案件的审判结果进行预测的过程中,通常是法官或律师根据自身的经验,对案件的审判结果进行预测。但是,法官或律师受到自身的局限性,无法准确预测得到相应的结果。

因此,亟需一种预测案件判别结果的方法,以提高现有人工进行预测的准确性。



技术实现要素:

本发明的目的在于,针对上述现有技术中的不足,提供一种案件判别结果的预测方法及装置,以解决现有判别方式准确率较低的问题。

为实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供了一种案件判别结果的预测方法,所述方法包括:

获取待检测案件的案件数据,所述案件数据包括公平数据、公正数据和社会效应数据;

将所述案件数据分别输入强分类器模型和线性回归模型,分别得到所述输入强分类器模型输出的第一结果和所述线性回归模型输出的第二结果,所述第一结果和所述第二结果均为预测得到的所述待检测案件的判定结果;

根据所述第一结果和所述第二结果进行分析,得到预测结果。

可选的,在所述获取待检测案件的案件数据之前,所述方法还包括:

获取多个样本案件归一化后的样本数据,所述样本数据包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果;

根据所述样本数据对预先设置的初始强分类器模型进行训练,得到分类器;

根据所述分类器输出的多个所述样本案件的样本预测结果,以及多个所述样本案件对应的实际判别结果,对所述分类器进行修正,得到所述强分类器模型。

可选的,所述根据所述分类器输出的多个所述样本案件的样本预测结果,以及多个所述样本案件对应的实际判别结果,对所述分类器进行修正,得到所述强分类器模型,包括:

对多个所述样本预测结果和相对应的实际判别结果进行比较,得到比较结果;

根据所述比较结果,计算所述分类器的损失函数;

根据所述损失函数对所述分类器进行修正,得到所述强分类器模型。

可选的,在所述获取待检测案件的案件数据之前,所述方法还包括:

获取多个样本案件归一化后的样本数据,所述样本数据包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果;

根据所述样本数据确定多个初始载荷因子;

通过所述样本数据对多个所述初始载荷因子进行训练,得到所述线性回归模型。

可选的,所述根据所述第一结果和所述第二结果进行分析,得到预测结果,包括:

根据所述第一结果对应的第一权重和所述第二结果对应的第二权重,结合所述第一结果和所述第二结果进行计算,得到所述预测结果。

第二方面,本发明实施例还提供了一种案件判别结果的预测装置,所述装置包括:

第一获取模块,用于获取待检测案件的案件数据,所述案件数据包括公平数据、公正数据和社会效应数据;

输入模块,用于将所述案件数据分别输入强分类器模型和线性回归模型,分别得到所述输入强分类器模型输出的第一结果和所述线性回归模型输出的第二结果,所述第一结果和所述第二结果均为预测得到的所述待检测案件的判定结果;

确定模块,用于根据所述第一结果和所述第二结果进行分析,得到预测结果。

可选的,所述装置还包括:

第二获取模块,用于获取多个样本案件归一化后的样本数据,所述样本数据包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果;

第一训练模块,用于根据所述样本数据对预先设置的初始强分类器模型进行训练,得到分类器;

修正模块,用于根据所述分类器输出的多个所述样本案件的样本预测结果,以及多个所述样本案件对应的实际判别结果,对所述分类器进行修正,得到所述强分类器模型。

可选的,所述修正模块,具体用于对多个所述样本预测结果和相对应的实际判别结果进行比较,得到比较结果;根据所述比较结果,计算所述分类器的损失函数;根据所述损失函数对所述分类器进行修正,得到所述强分类器模型。

可选的,所述装置还包括:

第三获取模块,用于获取多个样本案件归一化后的样本数据,所述样本数据包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果;

模型建立模块,用于根据所述样本数据确定多个初始载荷因子;

第二训练模块,用于通过所述样本数据对多个所述初始载荷因子进行训练,得到所述线性回归模型。

可选的,所述确定模块,具体用于根据所述第一结果对应的第一权重和所述第二结果对应的第二权重,结合所述第一结果和所述第二结果进行计算,得到所述预测结果。

本发明的有益效果是:

本发明提供的案件判别结果的预测方法及装置,通过获取待检测案件包括公平数据、公正数据和社会效应数据的案件数据,将案件数据分别输入强分类器模型和线性回归模型,分别得到输入强分类器模型输出的第一结果和线性回归模型输出的第二结果,最后根据第一结果和第二结果进行分析,得到预测结果。通过数据模型对待检测案件的案件数据进行分析,并对多个模型输出的结果进行综合分析,得到综合多个结果的预测结果,避免了通过人工进行预测的预测结果准确性较低的问题,提高了预测案件判别结果的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明一实施例提供的案件判别结果的预测方法的流程示意图;

图2为本发明另一实施例提供的案件判别结果的预测方法的流程示意图;

图3为本发明一实施例提供的案件判别结果的预测装置的示意图;

图4为本发明另一实施例提供的案件判别结果的预测装置的示意图;

图5为本发明又一实施例提供的案件判别结果的预测装置的示意图;

图6为本发明一实施例提供的案件判别结果的预测装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。

图1为本发明一实施例提供的案件判别结果的预测方法的流程示意图,如图1所示,该方法包括:

步骤101、获取待检测案件的案件数据。

其中,该案件数据可以包括公平数据、公正数据和社会效应数据,该公平数据用于表示案件判决的公平程度,该公正数据用于表示案件判决的公正程度,而该社会效应数据用于表示案件所引起的正面社会效应或负面社会效应。

为了提高预测案件判别结果的准确性,可以通过预先训练的模型对案件进行预测。由于模型是通过案件的案件数据进行预测的,因此,可以先获取待检测案件的案件数据,以便在后续步骤中,可以根据获取的案件数据对待检测案件进行预测。

由于在审判案件的过程中,涉及公平指标、公正指标和社会效应指标,因此,可以将待检测案件的案件数据量化为公平数据、公正数据和社会效应数据。

例如,公平数据、公正数据和社会效应数据的取值范围均为0至100,若取值为0,则表示案件审判极不符合公平公正等原则,但是若取值为100,则说明案件审判完全符合公平公正等原则。

需要说明的是,待检测案件的案件数据可以是相关领域的技术专家评价得到,也可以通过其他方式获取,本发明实施例对此不做限定。

步骤102、将案件数据分别输入强分类器模型和线性回归模型,分别得到该输入强分类器模型输出的第一结果和该线性回归模型输出的第二结果。

其中,该第一结果和该第二结果均为预测得到的待检测案件的判定结果。

为了提高预测结果的准确性,可以将案件数据输入不同的模型,则可以得到不同模型输出的结果,以便在后续步骤中,可以根据各个结果进行综合分析,得到最后的结果。

具体地,可以将案件数据分别输入强分类器模型和线性回归模型,强分类器模型则可以根据包括的各个弱分类器所对应的权重,对案件数据进行分析计算,结合各个弱分类器的结果得到第一结果。

而线性回归模型则可以根据预先设置的计算公式,并结合不同案件数据对应的训练得到的载荷因子进行计算,从而得到计算结果,最后根据分类方式确定计算结果所对应的类别,从而得到第二结果。

需要说明的是,在实际应用中,还可以将案件数据输入其他训练得到的模型,本发明实施例对用于预测案件结果的模型不做限定。

步骤103、根据第一结果和第二结果进行分析,得到预测结果。

在得到第一结果和第二结果后,均可以根据第一结果和第二结果预测待检测案件的判别结果。但是,为了提高预测判别结果的准确性,可以对第一结果和第二结果再次进行分析计算,从而得到综合各个模型输出结果的预测结果。

例如,可以根据第一结果和第二结果分别对应的权重,对第一结果和第二结果分别对应的参数值进行计算,得到计算后的参数值,再根据计算得到的参数值确定待检测案件的预测结果。

综上所述,本发明提供的案件判别结果的预测方法,通过获取待检测案件包括公平数据、公正数据和社会效应数据的案件数据,将案件数据分别输入强分类器模型和线性回归模型,分别得到输入强分类器模型输出的第一结果和线性回归模型输出的第二结果,最后根据第一结果和第二结果进行分析,得到预测结果。通过数据模型对待检测案件的案件数据进行分析,并对多个模型输出的结果进行综合分析,得到综合多个结果的预测结果,避免了通过人工进行预测的预测结果准确性较低的问题,提高了预测案件判别结果的准确性。

图2为本发明另一实施例提供的案件判别结果的预测方法的流程示意图,如图2所示,该方法包括:

步骤201、根据样本数据进行训练,得到强分类器模型和线性回归模型。

为了提前对尚未判决的案件进行准确地预测,可以对样本数据进行训练,得到多个类型的分类模型,以便在后续步骤中,可以根据训练得到的各个结果。

由于可以采用不同的训练方式训练得到不同的分类模型。因此,本步骤201可以包括步骤201a和步骤201b,分别训练得到强分类器模型和线性回归模型。

步骤201a、获取多个样本案件归一化后的样本数据,并根据样本数据对预先设置的初始强分类器模型进行训练,得到分类器,再根据分类器输出的多个样本案件的样本预测结果,以及多个样本案件对应的实际判别结果,对该分类器进行修正,得到强分类器模型。

其中,样本数据可以包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果。

而且,各个样本案件对应的案件数据可以是相关领域的技术专家评价得到的,也可以通过其他方式获取,本发明实施例对此不做限定。

例如,样本公平数据、样本公正数据和样本社会效应数据的取值范围均为0至100,若取值为0,则表示案件审判极不符合公平公正等原则,但是若取值为100,则说明案件审判完全符合公平公正等原则。

具体地,可以先对获取的各个样本数据中的不同类型数据进行分类,再将同一类型的各个数据进行归一化,得到归一化后的样本数据,再对各个样本案件对应的案件数据设置初始权重,之后可以训练得到第一个弱分类器对应的权重,从而根据第一个弱分类器对应的权重对各个样本案件对应的案件数据的初始权重进行更新,从而得到第一弱分类器。

若需要训练三个弱分类器,则可以按照上述方式再次训练得到两个弱分类器:第二弱分类器和第三弱分类器,从而将第一弱分类器、第二弱分类器和第三弱分类器进行组合,从而得到分类器。

进一步地,为了提高分类器的准确性,可以对组合得到的分类器进行修正,从而得到强分类器模型。

因此,在对分类器进行修正的过程中,可以对多个样本预测结果和相对应的实际判别结果进行比较,得到比较结果,再根据该比较结果,计算分类器的损失函数,最后根据该损失函数对分类器进行修正,得到强分类器模型。

具体地,分类器可以对各个样本案例进行预测,得到多个样本案例对应的样本预测结果,再将样本预测结果与属于同一样本案例的实际判别结果进行比较,得到比较结果。

相应的,可以根据比较结果计算分类器的损失函数,从而确定分类器输出结果的准确性,可以再根据损失函数计算相对应的梯度变化,最后根据得到的梯度变化调整分类器中各个弱分类器的权重,得到强分类器模型。

步骤201b、获取多个样本案件归一化后的样本数据,并根据该样本数据确定多个初始载荷因子,再通过样本数据对多个初始载荷因子进行训练,得到线性回归模型。

其中,样本数据可以包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果。

本步骤201b中的样本数据与步骤201a中的样本数据类似,在此不再赘述。

在对各个类型的样本数据进行归一化后,可以根据样本数据的类型,确定线性回归模型中主成分的数目,并根据样本数据设置每个主成分对应的初始载荷因子,再根据初始载荷因子对样本数据进行计算,得到样本预测结果,并根据样本预测结果与实际判别结果进行比较,得到比较结果,从而根据比较结果对各个初始载荷因子进行调整。

当线性回归模型的准确度达到一定标准或迭代调整初始载荷因子的次数达到预设阈值时,可以根据当前各个载荷因子对应的参数生成线性回归模型。

例如,根据样本数据确定的主成分可以包括:公平数据X1,公正数据X2,以及社会效应数据X3,则与各个主成分对应的初始载荷因子可以为c1、c2和c3,其中c1与X1对应,c2与X2对应,c3与X3对应,则可以得到初始的线性回归模型y=c1*X1+c2*X2+c3*X3,y即为根据样本数据进行预测分类的分类结果。若根据各个样本数据训练得到各个初始载荷因子对应的参数为:c1=1.2,c2=0.5,c3=0.8,则训练得到的线性回归模型为y=1.2X1+0.5X2+0.8X3。

需要说明的是,在步骤201a和步骤201b中,可以通过预先设置的归一化公式对各个案件对应的初始数据进行归一化,从而得到归一化后的样本数据。其中,该归一化公式可以为:其中,i为正整数,xi为归一化后第i种类型的样本数据,xi0为归一化前第i种类型的初始数据,ximin为第i种类型的初始数据中参数值最小的初始数据,ximax为第i种类型的初始数据中参数值最小的初始数据。

步骤202、获取待检测案件的案件数据。

其中,该案件数据可以包括公平数据、公正数据和社会效应数据。

步骤203、将案件数据分别输入强分类器模型和线性回归模型,分别得到输入强分类器模型输出的第一结果和线性回归模型输出的第二结果。

其中,该第一结果和该第二结果均为预测得到的待检测案件的判定结果。

步骤204、根据第一结果对应的第一权重和第二结果对应的第二权重,结合第一结果和第二结果进行计算,得到预测结果。

在得到第一结果和第二结果之后,可以再对第一结果和第二结果进行计算,根据计算后的结果确定预测结果。

例如,案件的原告胜诉用参数“1”表示,原告败诉用参数“2”表示,而第一结果对应的权重为0.7,第二结果对应的权重为0.3,因此,若第一结果为1,第二结果为2,则综合计算后的计算结果为1*0.7+2*0.3=1.3,则可以将1.3作为最后得到的预测结果。

综上所述,本发明提供的案件判别结果的预测方法,通过获取待检测案件包括公平数据、公正数据和社会效应数据的案件数据,将案件数据分别输入强分类器模型和线性回归模型,分别得到输入强分类器模型输出的第一结果和线性回归模型输出的第二结果,最后根据第一结果和第二结果进行分析,得到预测结果。通过数据模型对待检测案件的案件数据进行分析,并对多个模型输出的结果进行综合分析,得到综合多个结果的预测结果,避免了通过人工进行预测的预测结果准确性较低的问题,提高了预测案件判别结果的准确性。

图3为本发明一实施例提供的案件判别结果的预测装置的示意图,如图3所示,该装置具体包括:

第一获取模块301,用于获取待检测案件的案件数据,该案件数据包括公平数据、公正数据和社会效应数据;

输入模块302,用于将该案件数据分别输入强分类器模型和线性回归模型,分别得到该输入强分类器模型输出的第一结果和该线性回归模型输出的第二结果,该第一结果和该第二结果均为预测得到的该待检测案件的判定结果;

确定模块303,用于根据该第一结果和该第二结果进行分析,得到预测结果。

可选的,参见图4,该装置还包括:

第二获取模块304,用于获取多个样本案件归一化后的样本数据,该样本数据包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果;

第一训练模块305,用于根据该样本数据对预先设置的初始强分类器模型进行训练,得到分类器;

修正模块306,用于根据该分类器输出的多个该样本案件的样本预测结果,以及多个该样本案件对应的实际判别结果,对该分类器进行修正,得到该强分类器模型。

可选的,该修正模块306,具体用于对多个该样本预测结果和相对应的实际判别结果进行比较,得到比较结果;根据该比较结果,计算该分类器的损失函数;根据该损失函数对该分类器进行修正,得到该强分类器模型。

可选的,参见图5,该装置还包括:

第三获取模块307,用于获取多个样本案件归一化后的样本数据,该样本数据包括:样本公平数据、样本公正数据、样本社会效应数据和实际判别结果;

模型建立模块308,用于根据该样本数据确定多个初始载荷因子;

第二训练模块309,用于通过该样本数据对多个该初始载荷因子进行训练,得到该线性回归模型。

可选的,该确定模块303,具体用于根据该第一结果对应的第一权重和该第二结果对应的第二权重,结合该第一结果和该第二结果进行计算,得到该预测结果。

综上所述,本发明提供的案件判别结果的预测装置,通过获取待检测案件包括公平数据、公正数据和社会效应数据的案件数据,将案件数据分别输入强分类器模型和线性回归模型,分别得到输入强分类器模型输出的第一结果和线性回归模型输出的第二结果,最后根据第一结果和第二结果进行分析,得到预测结果。通过数据模型对待检测案件的案件数据进行分析,并对多个模型输出的结果进行综合分析,得到综合多个结果的预测结果,避免了通过人工进行预测的预测结果准确性较低的问题,提高了预测案件判别结果的准确性。

上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。

图6为本发明一实施例提供的案件判别结果的预测装置的示意图,该装置可以集成于终端设备或者终端设备的芯片,该终端可以是具备案件判别结果的预测功能的计算设备。

该装置包括:存储器601、处理器602。

存储器601用于存储程序,处理器602调用存储器601存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。

可选地,本发明还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1