大数据司法案件分析处理系统

文档序号:26139682发布日期:2021-08-03 14:23阅读:203来源:国知局
大数据司法案件分析处理系统

本发明属于大数据分析技术领域,尤其涉及一种大数据司法案件分析处理系统。



背景技术:

近年来,我国为促进司法体制改革,相继提出了裁判文书公开、庭审信息公开、执行公开等制度,大量的司法数据储备为大数据的建设提供了强有力的数据支撑,“智能法院”和“智能检务”的建设以及ai技术的发展为司法大数据的发展创造了良好的外部环境据的发展创造了良好的外部环境。当前世界各国都在积极进行法院智能化改革,深入探索“互联网+大数据”的审判模式,诸如美国的“cybercourt”、英国的onlinecourt实现可自动对案件进行分类。还有新加坡的“justiceonline”、澳大利亚的“e-courtsystem”等。

2010年,最高人民法院出台了《关于案例指导工作的规定》,标志着我国案例指导制度的建立;从2014年起,根据《最高人民法院关于人民法院在互联网公布裁判文书的规定》,最高人民法院设立裁判文书网,统一公布各级人民法院的生效裁判文书。相对于司法解释而言,指导性案例的适用情况更具有针对性,可以填补法律漏洞,创制更为具体的规则应用于具体的个案中去。

申请号为cn202010273409.6的中国发明专利申请提出一种基于大数据的行政处罚自由裁量权合理性评估方法及装置,包括获取基础数据;对所述基础数据进行特征抽取,根据抽取的特征信息确定案件的案由,并根据所述案由确定处罚金额范围,判断案件的处罚金额是否在所述处罚金额范围内,在判断案件的处罚金额在所述处罚金额范围内后,构建处罚金额合理性评估模型并根据所述处罚金额合理性评估模型判断所述案件的处罚金额的合理性。该发明建立了对自由裁量权的合理性评估方法及装置,能够辅助执法人员准确行使行政处罚自由裁量权,科学执法科学决策,为规范行政处罚自由裁量权的运用以及解决行政执法中滥用自由裁量权的问题,提供了一种科学高效的解决方案。

然而,当前的大数据运用于司法案件分析时,目的在于实现“同案同判”,因此,现有技术大多关注在于案情检索、相似度比对等方面。但是,发明人在实际运用中发现(例如通过裁判文书网检索),由于法律是随着社会发展不断变化的,而判决则需要基于当前的案情和当前的有效法律作出。如果仅仅是基于案情的相似度检索而不考虑法律随着时间的演化,得出的推荐结果或者相似案例则完全不适用。例如,2016年4月我国根据实际的经济发展水平,将2000年前“两高”公布的有关受贿罪定罪量刑标准从单一的“数额”修改为“数额+情节”,并相应提高了数额大小。将刑法第三百八十六条规定的“数额较大”的情形由原来“五千元至五万元”的规定修改为“三万至二十万元”。“数额巨大”的情形由原来“五万元至十万元”的规定修改为“二十万元至三百万元”;“数额特别巨大”的情形则由原来“十万元以上”的规定修改为“三百万元以上”。所以,2016年5月前受贿罪的量刑数据可能已“失效”,不能作为大数据系统决策参考依据。

针对上述技术问题,现有技术尚未提出有效的技术方案。



技术实现要素:

为解决上述技术问题,本发明提出一种大数据司法案件分析处理系统,包括数据录入子系统、数据索引子系统、数据分类子系统、数据查询子系统、数据比对子系统、数据推荐子系统以及数据输出子系统;数据录入子系统录入司法案件数据;数据索引子系统对司法案件数据执行索引分析;数据分类子系统将司法案件数据与多个分类索引数据库建立映射关系;数据查询子系统接收用户输入的查询数据;数据比对子系统通过映射关系比对出分类索引数据库;数据推荐子系统基于查询数据与比对出的分类索引数据库推荐出目标司法案件数据;数据输出子系统通过人机交互界面输出目标司法案件数据。

在具体实现上,本发明的技术方案的各个子系统的具体功能如下:

所述数据录入子系统用于录入司法案件数据,所述司法案件数据包括判决文书;

所述数据索引子系统用于对所述司法案件数据执行索引分析,生成多个案件索引;

所述数据分类子系统基于所述多个案件索引,将所述司法案件数据与多个分类索引数据库建立映射关系;

所述数据查询子系统用于接收用户输入的查询数据,所述查询数据包括多个关键词,所述多个关键词与所述案件索引关联;

所述数据比对子系统基于所述查询数据关联的案件索引,通过所述映射关系比对出至少一个分类索引数据库;

所述数据推荐子系统基于所述查询数据与所述比对出的至少一个分类索引数据库,推荐出至少一个目标司法案件数据;

所述数据输出子系统通过人机交互界面输出所述至少一个目标司法案件数据。

更具体的,所述多个案件索引包括时间索引、罪名索引、法条索引。

所述数据分类子系统包括多个分类索引数据库和案件归集数据库;

每个所述分类索引数据库保存有不同的案件索引以及案件索引对应的归集案件在所述案件归集数据库中的存储位置。

所述数据查询子系统用于接收用户输入的查询数据,所述查询数据包括时间关键词与如下关键词之一的组合:罪名关键词、法条关键词。

所述数据比对子系统基于所述查询数据关联的案件索引,通过所述映射关系比对出多个分类索引数据库;

所述数据推荐子系统基于所述查询数据对所述比对出的多个分类索引数据库执行数据交集运算,推荐出至少一个目标司法案件数据。

值得指出的是,在本发明中,所述数据录入子系统直接录入所述司法案件数据,不执行文档结构分析或者拆分操作。

本发明的技术方案利用司法大数据实现了有效的案件分析,避免了法条失效的情况。

具体而言,本发明的技术方案在录入案件数据时,通过案件索引包含的时间索引标识司法案件数据的时效性,并在时效性的基础上进行罪名和法条索引的分类存储;而在查询案件时,首先考虑的也是时间要素关键词,然后基于其他关键词执行数据交集运算,确保输出的推荐结果案例是与当前查询案例匹配并且法条有效的案例,从而避免了法条失效的情形;同时,在本发明的技术方案中,不同于现有技术需要执行文档结构分析的做法,本发明在录入所述司法案件数据是直接录入并且直接遍历,不执行文档结构分析或者拆分操作,也不需要要素分析。

本发明的进一步优点将结合说明书附图在具体实施例部分进一步详细体现。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的一种大数据司法案件分析处理系统的结构图

图2是图1所述系统录入数据与查询数据的数据控制流示意图

图3是图1所述系统录入裁判文书的处理过程示意图

图4是图1所述系统接收用户查询输入的处理流程示意图

具体实施方式

下面,结合附图以及具体实施方式,对发明做出进一步的描述。

参照图1,是本发明一个实施例的一种大数据司法案件分析处理系统的子系统结构图。

在图1中,所述大数据司法案件分析处理系统由数据录入子系统、数据索引子系统、数据分类子系统、数据查询子系统、数据比对子系统、数据推荐子系统以及数据输出子系统组成。

下面,结合图2,具体介绍各个不同的子系统的功能实现。

所述数据录入子系统用于录入司法案件数据,所述司法案件数据包括判决文书。

作为优选,在该实施例中,所述数据录入子系统录入的所述司法案件数据包括同一个司法案件的多个不同判决文书,所述多个不同判决文书包括生效的判决文书和未生效的判决文书。

值得注意的是,在现有技术中,已有的大数据司法数据库并不完备,并且数据存在缺失准确性、重复出现等问题。

以已有的裁判文书网机制为例,其已公开的文书除在二审中驳回上诉并维持原判的案子会对一审判决书进行公开以外,其余二审改判的案子,一审判决书并不会公开,未能真正的做到裁判完全公开。此外,已经公开的文书也存在重复上传、错误传送等问题,尤其是错误却影响较大的文字,如“权力”和“权利”,“法制”和“法治”。数据基础在完整度、精确性和唯一性上都存在问题。

为解决上述问题,在本实施例中,若针对同一个司法案件录入了生效的判决文书,则删除先前录入的未生效的判决文书中与生效的判决文书内容相同的部分。

作为进一步的改进,在数据获取的过程中阶段要尽可能的降低人为因素对数据收集的干扰,确保数据收集真实性,避免在初始阶段就出现误差。

接下来,参见图3,所述数据索引子系统对所述司法案件数据执行索引分析,具体包括:

按照预设索引词遍历所述判决文书,得出所述判决文书的多个案件索引,所述多个案件索引包括时间索引、罪名索引、法条索引。

不同于现有技术,本实施例在录入司法案例数据时,是直接录入并直接执行遍历,而不需要额外的结构分析或者文档要素拆分等过程。这是因为,本发明后续是直接归集司法案例数据本身,记录其实际映射关系和保存映射位置。

具体的,在图1中,所述数据分类子系统包括多个分类索引数据库和案件归集数据库;

每个所述分类索引数据库保存有不同的案件索引以及案件索引对应的归集案件在所述案件归集数据库中的存储位置。

其中,所述数据分类子系统基于所述多个案件索引,将所述司法案件数据与多个分类索引数据库建立映射关系之后,将所述司法案件数据存储至所述案件归集数据库中的指定位置,所述指定位置由所述映射关系确定。

接下来参见图4,所述数据查询子系统用于接收用户输入的查询数据,所述查询数据包括时间关键词与如下关键词之一的组合:罪名关键词、法条关键词。

所述数据比对子系统基于所述查询数据关联的案件索引,通过所述映射关系比对出多个分类索引数据库;

所述比对出的多个分类索引数据库包括时间分类索引数据库与如下分类索引数据库的组合:罪名分类索引数据库、法条分类索引数据库。

所述数据比对子系统基于所述查询数据关联的案件索引,通过所述映射关系比对出多个分类索引数据库;

所述数据推荐子系统基于所述查询数据对所述比对出的多个分类索引数据库执行数据交集运算,推荐出至少一个目标司法案件数据。

作为一个优选,所述基于所述查询数据对所述比对出的多个分类索引数据库执行数据交集运算,可以是如下表现形式:

其中,

其中:

n为比对出的多个分类索引数据库的数量;di为第i个分类索引数据库,∪为并集运算符号,∩为交集运算符号,j为所述数据交集运算结果,||为集合包含的元素个数,λi为元素比例控制权重。

c为所述比对出的多个分类索引数据库中与所述查询数据的匹配度大于预定阈值的分类索引数据库。

值得指出的是,在上述各个实施例中,所述数据输出子系统在所述人机交互界面上显示所述目标司法案件数据,并且高亮显示所述目标司法案件数据中与所述查询数据关联的部分。

显然,本发明的技术方案从两个方面入手对现有技术进行了改进。

在数据录入方面,采用直接录入和直接遍历分析的方式,避免文档本身的结构性分析或者要素分析,并且直接录入和保存文档本身,保持了数据的完整性;同时,基于时间要素为基准执行对应的映射分析,确保了数据在后续使用时的法条时效性;

在数据查询方面,首先考虑的也是时间要素关键词,然后基于其他关键词执行数据交集运算,确保输出的推荐结果案例是与当前查询案例匹配并且法条有效的案例,从而避免了法条失效的情形。

实践证明,本发明的技术方案,通过信息化资源共享,为不同法院审理同类案件提供大致统一的裁判尺度,避免同案不同判和法律适用不统一的问题。在具体实践中,在本发明的基础上,还可利用大数据建立案件权重系数和评价指标体系,确定法官工作量,并进行科学的员额分配、案件分流。在刑事侦查方面利用司法大数据可以深化数据化侦查线索的挖掘,实现类案刑事侦查的早预警和初查,利用人工智能行使侦查职能,通过智能化的手段挖掘数据的价值。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1