案件胜率确定方法、装置、设备及计算机可读存储介质与流程

文档序号:20010299发布日期:2020-02-22 04:02阅读:176来源:国知局
案件胜率确定方法、装置、设备及计算机可读存储介质与流程

本申请涉及数据分析的技术领域,尤其涉及一种案件胜率确定方法、装置、设备及计算机可读存储介质。



背景技术:

随着社会经济的发展与法治体系的日趋完善,人民群众的司法需求日益增长,人民群众请求法院对案件进行审判时,需要提供诉请状和证据,证据尤其重要,影响着案件的判案结果,而法院审理案件的周期较长,需要经过很长的时间才能知晓法院的审判结果,无法提前知晓案件的胜诉概率。为此,人民群众可以向有经验的律师进行咨询,由律师基于以往的已判案件和当前案件的资料预测胜诉概率。然而,需要律师主观的结合己经审判过的类似案件的审判结果预测待判案件的胜诉概率,也需要花费较长的时间,无法保证预测出的胜诉概率的准确性。因此,如何快速准确的预测案件的胜诉概率是目前亟待解决的问题。



技术实现要素:

本申请的主要目的在于提供一种案件胜率确定方法、装置、设备及计算机可读存储介质,旨在快速准确的预测案件的胜诉概率。

第一方面,本申请提供一种案件胜率确定方法,所述案件胜率确定方法包括以下步骤:

获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件;

根据所述第一知识图谱和每个所述第二知识图谱,计算所述目标案件与每个所述已判案件之间的相似度;

根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件;

根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

第二方面,本申请还提供一种案件胜率确定装置,所述案件胜率确定装置包括:

获取模块,用于获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件;

计算模块,用于根据所述第一知识图谱和每个所述第二知识图谱,计算所述目标案件与每个所述已判案件之间的相似度;

确定模块,用于根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件;

所述确定模块,还用于根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的案件胜率确定方法的步骤。

第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的案件胜率确定方法的步骤。

本申请提供一种案件胜率确定方法、装置、设备及计算机可读存储介质,本申请通过待预测胜诉概率的案件的知识图谱与已判案件的知识图谱,计算待预测胜诉概率的案件与每个已判案件之间的相似度,并基于待预测胜诉概率的案件与每个已判案件之间的相似度,确定与该案件相似的已判案件,再基于与该案件相似的已判案件,确定该案件的胜诉概率,可以快速且较为准确的确定案件的胜诉概率。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种案件胜率确定方法的流程示意图;

图2为本申请实施例中知识图谱的一示意图;

图3为本申请实施例提供的另一种案件胜率确定方法的流程示意图;

图4为本申请实施例提供的一种案件胜率确定装置的示意性框图;

图5为本申请实施例提供的另一种案件胜率确定装置的示意性框图;

图6为本申请一实施例涉及的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本申请实施例提供一种案件胜率确定方法、装置、计算机设备及计算机可读存储介质。其中,该案件胜率确定方法可应用于服务器,该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参照图1,图1为本申请的实施例提供的一种案件胜率确定方法的流程示意图。

如图1所示,该案件胜率确定方法包括步骤s101至步骤s104。

步骤s101、获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件。

服务器可以实时或定时的获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,目标案件为待预测胜诉概率的案件。具体地,当接收到终端设备发送的案件胜率预测请求时,服务器从该案件胜率预测请求中获取案件编号,并获取该案件编号对应的第一知识图谱和多个已判案件的第二知识图谱。

其中,服务器存储有待预测胜诉概率的案件,即目标案件的知识图谱,记为第一知识图谱,还存储有已判案件的知识图谱,记为第二知识图谱,案件的知识图谱中存储有案件知识信息和法条知识信息,该案件知识信息包括基础案件知识、争议焦点知识、事实要素知识和证据知识,基础案件知识包括但不限于诉讼人物、诉讼公司、诉讼参与人关系、原告、被告、诉请观点和辩称观点,争议焦点知识包括争议焦点,证据知识包括证据项、证据类别和证据属性。证据属性是指证据的特征属性,比如欠条这一项证据有没有借款人签名。每一个原告诉请中都有至少一个事实如“a请求b还钱”的事实是“a借给b钱且b不还”。

以下以一个已判案件为例,解释说明已判案件的知识图谱的构建方式。具体地,获取已判案件的裁决文书,并对该裁决文书进行案件知识提取,得到已判案件的结构化的案件知识信息和法条知识信息,然后根据该案件知识信息和法条知识信息,构建已判案件的知识图谱。其中,裁决文书包括人物关系部分、案件由来部分、审理经过部分、事实部分以及判决理由和依据部分。人物关系部分包括当事人的基本情况、委托诉讼代理人的基本情况和当事人的诉讼地位;案件由来部分包括诉请信息和辩称信息,审理经过部分为庭审记录,事实部分包括原告起诉的诉讼请求、事实和理由,被告答辩的事实和理由以及法院认定的事实和据以定案的证据,判决理由和依据部分包括证据与争议焦点之间的关系以及裁判依据与法律条文之间的关系。

在一实施例中,案件知识提取的方式具体为:通过基础案件知识提取模型从该裁决文书中提取基础案件知识;通过争议焦点提取模型从该裁决文书中提取争议焦点知识,并通过证据项提取模型从该裁决文书中提取证据知识;通过法条知识提取模型从该裁决文书提取法条知识。

其中,该基础案件知识提取模型包括文本分段层和信息提取层,该文本分段层设置有用于分段的正则表达式集合,该信息提取层设置有用于提取原告和诉请观点的正则表达式集合、用于提取被告和辩称观点的正则表达式集合以及用于提取诉讼人物、诉讼公司和诉讼参与人关系的正则表达式集合,基础案件知识的抽取方式具体为:通过该文本分段层中的正则表达式集合,从该裁决文书中提取出诉请段落、辩称段落和诉讼参与人段落,并通过信息提取层中的各个正则表达式集合从诉请段落中提取原告和诉请观点,从辩称段落中提取被告和辩称观点,从诉讼参与人段落中提取诉讼人物、诉讼公司和诉讼参与人关系。

其中,该证据项提取模型包括证据段落提取层、证据项提取层、证据分类层和证据属性确定层,该证据段落提取层设置有用于提取证据段落的正则表达式集合,该潜在证据项提取层设置有潜在证据项提取模型,该证据分类层设置有证据分类表,该证据属性确定层设置有相似度计算模型和证据属性与证据关键字的映射关系表。

在一实施例中,证据知识的抽取方式具体为:服务器从该裁决文书中提取证据段落,并对该证据段落进行分句,得到若干证据语句;通过证据项提取层中的潜在证据项提取模型提取每个证据语句中的潜在证据项;通过证据分类层中的证据分类表,确定每个潜在证据项的证据类别,即查询证据分类表,获取潜在证据项的证据大类,并计算潜在证据项与该证据大类下的每个小类对应的证据关键字之间的相似度,然后将相似度最大的小类,确定为该潜在证据项的证据类别;

通过证据属性确定层,确定每一类证据的证据属性,即对于证据段落中的每一类证据,对该证据段落进行遍历,获取首次出现的证据语句和最后一次出现的证据语句,并将这两个证据语句以及两个证据语句之间的段落文本确定为该类证据的上下文信息;查询证据属性与证据关键字的映射关系表,并从每一类证据的上下文信息中获取包含有证据关键字的目标证据语句,以及获取该目标证据语句对应的证据属性组,然后将该目标证据语句和证据属性组进行拼接之后,输入相似度计算模型,计算证据属性组中每个证据属性与目标证据语句之间的相似度,并将该相似度最高的证据属性作为该目标证据语句的目标证据属性,从而抽取到所有证据、证据类别及证据属性等证据知识。

需要说明的是,上述关键词集合、证据属性与证据关键字的映射关系表和各个正则表达式集合基于实际情况进行设置,本申请对此不作具体限定。上述证据项提取模型是通过autoner模型基于人工标注的样本数据训练得到的,autoner模型通过针对裁决文书训练的词向量作为嵌入,由于自动远程标注数据准确率太低,故放弃此模块转而用人工标注的数据进行训练,用人工标注的样本数据的准确性较高,此外,为了防止过拟合,在训练时采用数据增强的方法,即随机替换证据语句中不超过3个的词和/或调换证据语句中词语的顺序。上述相似度模型是基于法律语料对bert模型的预训练模型进行重新训练得到的,并将bert模型的encoder模块(编码模块)减到3层,且调整句子长度,从而实现时间上的优化,此外,针对训练任务,获取干扰样本数据,并基于干扰样本数据训练模型,且将分类层接到encoder层的位置。autoner模型为一个无需人工标注就可以自动标记数据并训练命名实体识别的模型,bert模型是第一个深度、双向和无监督的语言表示模型。可选地,用于获取诉请段落正则表达式为:r*^(?p<appeal>.*?)\n[^\n]*?(辩[称|解]|[答抗]辩|述称|未[出到]庭|承认)。

其中,知识图谱的构建方式具体为:将法条知识中的法条以及案件知识信息中的原告、被告、诉请观点、辩称观点、争议焦点、事实要素和证据作为知识图谱的实体节点,并从法条知识和案件知识信息中获取每个实体节点之间的关系和属性(原告、被告、诉请观点、辩称观点、争议焦点、事实要素、证据和法条的具体值),然后基于实体节点、实体节点之间的关系和实体节点的属性,构建目标案件的案件知识图谱。请参阅图2,图2为本申请实施例中知识图谱的一示意图,如图2所示,该知识图谱的实体节点为原告、被告、诉请观点、辩称观点、争议焦点、事实要素、证据和法条,且事实要素包括小要素1、小要素2和小要素3。

步骤s102、根据所述第一知识图谱和每个所述第二知识图谱,计算所述目标案件与每个所述已判案件之间的相似度。

服务器根据第一知识图谱和每个已判案件的第二知识图谱,计算目标案件与每个已判案件之间的相似度。具体地,计算第一知识图谱与每个第二知识图谱之间的相似度;将第一知识图谱与每个第二知识图谱之间的相似度作为目标案件与每个已判案件之间的相似度。知识图谱包含案件的完整信息,通过计算知识图谱之间的相似度,即可确定案件之间的相似度,且可以提高计算得到的相似度的可信度和准确度。

在一实施例中,服务器计算第一知识图谱中的各第一实体节点与每个第二知识图谱中的对应第二实体节点之间的目标相似度;根据每个第一实体节点各自对应的预设系数和每个目标相似度,计算第一知识图谱与每个所述第二知识图谱之间的相似度,即以一个第二知识图谱为单位,将属于一个第二知识图谱的每个目标相似度乘以各自对应的预设系数之后进行累加,得到目标案件与对应已判案件之间的相似度。其中,第一知识图谱中的各第一实体节点与第二知识图谱中的各第二实体节点一一对应。需要说明的是,上述预设系数可基于实际情况进行设置,本申请对此不作具体限定。

在一实施例中,目标相似度的计算方式具体为:根据第一知识图谱中的节点属性信息和/或节点关系信息以及每个第二知识图谱中的节点属性信息/或节点关系信息,计算每个第一实体节点与每个第二知识图谱中的对应第二实体节点之间的目标相似度。其中,该节点属性信息为知识图谱中的实体节点的属性,如争议焦点、事实要素和证据等实体节点的具体参数,该节点关系信息为知识图谱中各实体节点间的关系信息,如争议焦点与事实要素之间的关系。

在一实施例中,目标相似度的计算方式具体为:根据第一知识图谱中的节点属性信息和每个第二知识图谱中的节点属性信息,计算每个第一实体节点与每个第二知识图谱中的对应第二实体节点之间的第一相似度;和/或根据第一知识图谱中的节点关系信息和每个第二知识图谱中的节点关系信息,计算每个第一实体节点与每个所述第二知识图谱中的对应第二实体节点之间的第二相似度;将每个第一实体节点与每个第二知识图谱中的对应第二实体节点之间的第一相似度和/或第二相似度作为目标相似度。通过节点属性信息,可以得到案件之间在语义上的相似度,而通过节点关系信息可以得到案件之间在逻辑上的相似度。可以提高相似度的可信度和准确度。

在一实施例中,当目标相似度为第一相似度和第二相似度时,第一知识图谱与第二知识图谱之间的相似度的计算方式具体为:将每个第一相似度乘以各自对应的第一权重系数之后进行累加,得到第一知识图谱与第二知识图谱之间的第一目标相似度;将每个第二相似度乘以各自对应的第二权重系数之后进行累加,得到第一知识图谱与第二知识图谱之间的第二目标相似度;将计算第一目标相似度与第二目标相似度的和,并将第一目标相似度与第二目标相似度的和作为第一知识图谱与第二知识图谱之间的相似度。通过节点属性信息和节点关系信息可以综合考虑案件之间在语义和逻辑上的相似度,进一步地提高相似度的可信度和准确度。

需要说明的是,上述第一权重系数和第二权重系数可基于实际情况进行设置,每个实体节点的第一权重系数可以相同,也可以不同,且每个实体节点的第二权重系数可以相同,也可以不同,本申请不作具体限定。

步骤s103、根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件。

服务器根据目标案件与每个已判案件之间的相似度,确定与目标案件相似的已判案件,即将相似度大于预设的相似度阈值的已判案件作为与目标案件相似的已判案件。需要说明的是,上述相似度阈值可基于实际情况进行设置,本申请对此不作具体限定。

步骤s104、根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

服务器根据与目标案件相似的已判案件,确定目标案件的胜诉概率,即统计与目标案件相似的已判案件中被告胜诉的第一案件数量、原告胜诉的第二案件数量以及总案件数量,并计算第一案件数量占总案件数量的百分比,以及计算第二案件数量占总案件数量的百分比,然后将第一案件数量占总案件数量的百分比和/或第二案件数量占总案件数量的百分比作为目标案件的胜诉概率。

在一实施例中,统计与目标案件相似的已判案件的总案件数量,并确定总案件数量是否大于或等于预设的数量阈值;若总案件数量大于或等于预设的数量阈值,则统计与目标案件相似的已判案件中被告胜诉的第一案件数量和原告胜诉的第二案件数量;计算第一案件数量占总案件数量的百分比,并根据第一案件数量占总案件数量的百分比,确定目标案件的被告胜诉概率;计算第二案件数量占总案件数量的百分比,并根据第一案件数量占总案件数量的百分比,确定目标案件的原告胜诉概率;将目标案件的被告胜诉概率和/或原告胜诉概率作为目标案件的胜诉概率。如果总案件数量小于预设的数量阈值,则向终端设备发送提醒信息。

其中,被告胜诉概率或原告胜诉概率的确定方式具体可以为:将第一案件数量占总案件数量的百分比作为目标案件的被告胜诉概率,或者将第二案件数量占总案件数量的百分比。被告胜诉概率或原告胜诉概率的确定方式具体还可以为:获取预存的第一案件数量或第二案件数量与权重系数之间的映射关系表,并查询该映射关系表,获取第一案件数量或第二案件数量对应的权重系数,然后计算该权重系数与第一案件数量或第二案件数量占总案件数量的百分比的乘积,并将该乘积作为目标案件的被告胜诉概率或原告胜诉概率。需要说明的是,上述预存的第一案件数量或第二案件数量与权重系数之间的映射关系表可基于实际情况进行设置,本申请对此不作具体限定。

在一实施例中,根据与目标案件相似的已判案件对应的第二知识图谱,确定证据类型,并将确定的证据类型作为待推荐的目标证据类型,即获取相似度最大的已判案件对应的第二知识图谱,并从该第二知识图谱中获取证据知识信息,然后确定证据知识信息所属的证据类型,并将确定的证据类型作为待推荐的目标证据类型。当接收到终端设备发送的案件胜率查询请求时,服务器根据该案件胜率查询请求获取对应案件的胜诉概率和目标证据类型,并将胜诉概率和目标证据类型发送至终端设备。

上述实施例提供的案件胜率确定方法,通过待预测胜诉概率的案件的知识图谱与已判案件的知识图谱,计算待预测胜诉概率的案件与每个已判案件之间的相似度,并基于待预测胜诉概率的案件与每个已判案件之间的相似度,确定与该案件相似的已判案件,再基于与该案件相似的已判案件,确定该案件的胜诉概率,可以快速且较为准确的确定案件的胜诉概率。

请参照图3,图3为本申请实施例提供的另一种案件胜率确定方法的流程示意图。

如图3所示,该案件胜率确定方法包括步骤s201至205。

步骤s201、获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件。

服务器可以实时或定时的获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,目标案件为待预测胜诉概率的案件。具体地,当接收到终端设备发送的案件胜率预测请求时,服务器从该案件胜率预测请求中获取案件编号,并获取该案件编号对应的第一知识图谱和多个已判案件的第二知识图谱。

步骤s202、根据所述第一知识图谱,对每个所述第二知识图谱进行校验,并根据每个所述第二知识图谱的校验结果,对每个所述第二知识图谱进行筛选。

具体地,从第一知识图谱中获取目标案件的第一争议焦点,并从每个第二知识图谱中获取每个已判案件的第二争议焦点;将第一争议焦点的类别与每个第二争议焦点的类别是否相同,如果第一争议焦点的类别与第二争议焦点的类别相同,则确定对应的第二知识图谱通过校验,而如果第一争议焦点的类别与第二争议焦点的类别不同,则确定对应的第二知识图谱未通过校验;剔除未通过校验的第二知识图谱,保留通过校验的第二知识图谱,得到通过筛选后的每个第二知识图谱。

步骤s203、根据所述第一知识图谱和通过筛选后的每个所述第二知识图谱,计算所述目标案件与对应的每个所述已判案件之间的相似度。

服务器根据第一知识图谱和通过筛选后的每个已判案件的第二知识图谱,计算目标案件与通过筛选后的每个已判案件之间的相似度。具体地,计算第一知识图谱与通过筛选后的每个第二知识图谱之间的相似度;将第一知识图谱与通过筛选后的每个第二知识图谱之间的相似度作为目标案件与通过筛选后的每个已判案件之间的相似度。

步骤s204、根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件。

服务器根据目标案件与每个已判案件之间的相似度,确定与目标案件相似的已判案件,即将相似度大于预设的相似度阈值的已判案件作为与目标案件相似的已判案件。需要说明的是,上述相似度阈值可基于实际情况进行设置,本申请对此不作具体限定。

步骤s205、根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

服务器根据与目标案件相似的已判案件,确定目标案件的胜诉概率,即统计与目标案件相似的已判案件中被告胜诉的第一案件数量、原告胜诉的第二案件数量以及总案件数量,并计算第一案件数量占总案件数量的百分比,以及计算第二案件数量占总案件数量的百分比,然后将第一案件数量占总案件数量的百分比和/或第二案件数量占总案件数量的百分比作为目标案件的胜诉概率。

上述实施例提供的案件胜率确定方法,通过待预测胜诉概率的案件的知识图谱与通过筛选后的已判案件的知识图谱,计算待预测胜诉概率的案件与每个已判案件之间的相似度,并基于待预测胜诉概率的案件与每个已判案件之间的相似度,确定与该案件相似的已判案件,再基于与该案件相似的已判案件,确定该案件的胜诉概率,由于对已判案件的知识图谱进行了筛选,减少了参与相似度计算的知识图谱,可以提高相似度的计算速度,从而进一步的提高案件的胜诉概率的确定速度。

请参照图4,图4为本申请实施例提供的一种案件胜率确定装置的示意性框图。

如图4所示,该案件胜率确定装置400,包括:获取模块301、计算模块302和确定模块303。

获取模块301,用于获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件;

计算模块302,用于根据所述第一知识图谱和每个所述第二知识图谱,计算所述目标案件与每个所述已判案件之间的相似度;

确定模块303,用于根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件;

所述确定模块303,还用于根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

在一个实施例中,所述计算模块302,还用于计算所述第一知识图谱与每个所述第二知识图谱之间的相似度;将所述第一知识图谱与每个所述第二知识图谱之间的相似度作为所述目标案件与每个所述已判案件之间的相似度。

在一个实施例中,所述计算模块302,还用于计算所述第一知识图谱中的各第一实体节点与每个所述第二知识图谱中的对应第二实体节点之间的目标相似度;根据每个所述第一实体节点各自对应的预设系数和每个所述目标相似度,计算所述第一知识图谱与每个所述第二知识图谱之间的相似度。

在一个实施例中,所述计算模块302,还用于根据所述第一知识图谱中的节点属性信息和/或节点关系信息以及每个所述第二知识图谱中的节点属性信息/或节点关系信息,计算每个所述第一实体节点与每个所述第二知识图谱中的对应第二实体节点之间的目标相似度。

在一个实施例中,所述确定模块303,还用于统计与所述目标案件相似的已判案件的总案件数量,并确定所述总案件数量是否大于或等于预设的数量阈值;若所述总案件数量大于或等于预设的数量阈值,则统计与所述目标案件相似的已判案件中被告胜诉的第一案件数量和原告胜诉的第二案件数量;计算所述第一案件数量占所述总案件数量的百分比,并根据所述第一案件数量占所述总案件数量的百分比,确定所述目标案件的被告胜诉概率;计算所述第二案件数量占所述总案件数量的百分比,并根据所述第一案件数量占所述总案件数量的百分比,确定所述目标案件的原告胜诉概率;将所述目标案件的被告胜诉概率和/或原告胜诉概率作为所述目标案件的胜诉概率。

在一个实施例中,所述确定模块303,还用于根据与所述目标案件相似的已判案件对应的所述第二知识图谱,确定证据类型,并将确定的证据类型作为待推荐的目标证据类型。

请参照图5,图5为本申请实施例提供的另一种案件胜率确定装置的示意性框图。

如图5所示,该案件胜率确定装置400,包括:获取模块401、校验筛选模块402、计算模块403和确定模块404。

获取模块401,用于获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件;

校验筛选模块402,用于根据所述第一知识图谱,对每个所述第二知识图谱进行校验,并根据每个所述第二知识图谱的校验结果,对每个所述第二知识图谱进行筛选;

计算模块403,用于根据所述第一知识图谱和通过筛选后的每个所述第二知识图谱,计算所述目标案件与对应的每个所述已判案件之间的相似度;

确定模块404,用于根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件;

所述确定模块404,用于根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述案件胜率确定方法实施例中的对应过程,在此不再赘述。

上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。

请参阅图6,图6为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器。

如图6所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种案件胜率确定方法。

处理器用于提供计算和控制能力,支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种案件胜率确定方法。

该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:

获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件;

根据所述第一知识图谱和每个所述第二知识图谱,计算所述目标案件与每个所述已判案件之间的相似度;

根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件;

根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

在一个实施例中,所述处理器在实现根据所述第一知识图谱和每个所述第二知识图谱,计算所述目标案件与每个所述已判案件之间的相似度时,用于实现:

计算所述第一知识图谱与每个所述第二知识图谱之间的相似度;

将所述第一知识图谱与每个所述第二知识图谱之间的相似度作为所述目标案件与每个所述已判案件之间的相似度。

在一个实施例中,所述第一知识图谱中的各第一实体节点与所述第二知识图谱中的各第二实体节点一一对应,所述处理器在实现计算所述第一知识图谱与每个所述第二知识图谱之间的相似度时,用于实现:

计算所述第一知识图谱中的各第一实体节点与每个所述第二知识图谱中的对应第二实体节点之间的目标相似度;

根据每个所述第一实体节点各自对应的预设系数和每个所述目标相似度,计算所述第一知识图谱与每个所述第二知识图谱之间的相似度。

在一个实施例中,所述处理器在实现计算所述第一知识图谱中的各第一实体节点与每个所述第二知识图谱中的对应第二实体节点之间的目标相似度时,用于实现:

根据所述第一知识图谱中的节点属性信息和/或节点关系信息以及每个所述第二知识图谱中的节点属性信息/或节点关系信息,计算每个所述第一实体节点与每个所述第二知识图谱中的对应第二实体节点之间的目标相似度。

在一个实施例中,所述处理器在实现根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率时,用于实现:

统计与所述目标案件相似的已判案件的总案件数量,并确定所述总案件数量是否大于或等于预设的数量阈值;

若所述总案件数量大于或等于预设的数量阈值,则统计与所述目标案件相似的已判案件中被告胜诉的第一案件数量和原告胜诉的第二案件数量;

计算所述第一案件数量占所述总案件数量的百分比,并根据所述第一案件数量占所述总案件数量的百分比,确定所述目标案件的被告胜诉概率;

计算所述第二案件数量占所述总案件数量的百分比,并根据所述第一案件数量占所述总案件数量的百分比,确定所述目标案件的原告胜诉概率;

将所述目标案件的被告胜诉概率和/或原告胜诉概率作为所述目标案件的胜诉概率。

在一个实施例中,所述处理器在实现根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率之后,还用于实现:

根据与所述目标案件相似的已判案件对应的所述第二知识图谱,确定证据类型,并将确定的证据类型作为待推荐的目标证据类型。

其中,在另一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:

获取目标案件的第一知识图谱和多个已判案件的第二知识图谱,其中,所述目标案件为待预测胜诉概率的案件;

根据所述第一知识图谱,对每个所述第二知识图谱进行校验,并根据每个所述第二知识图谱的校验结果,对每个所述第二知识图谱进行筛选;

根据所述第一知识图谱和通过筛选后的每个所述第二知识图谱,计算所述目标案件与对应的每个所述已判案件之间的相似度;

根据所述目标案件与每个所述已判案件之间的相似度,确定与所述目标案件相似的已判案件;

根据与所述目标案件相似的已判案件,确定所述目标案件的胜诉概率。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的计算机设备的具体工作过程,可以参考前述案件胜率确定方法实施例中的对应过程,在此不再赘述。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请案件胜率确定方法的各个实施例。

其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。

应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1