一种基于要素提取的相似判决书检索方法与流程

文档序号:26050646发布日期:2021-07-27 15:25阅读:135来源:国知局
一种基于要素提取的相似判决书检索方法与流程
本发明属于人工智能领域,涉及一种基于要素提取的相似判决书检索方法。
背景技术
:在法院案例检索中,“类案不同判”现象近年来受到社会关注,其背后是法律适用标准不统一。为推进“类案同判”,构筑司法公平正义,找到与当前案例相似的判决书,规范判决过程,提高判决依据。现有的案例检索系统以及现有的判决书数据库,采用的方法主要是,使用案件的关键词和关键词之间的叠加、求交集等,在法律文本中进行检索,或者根据案件中的关键词进行相似度对比,找到相似度最高的一篇案件。当没有准确的输入关键词时,无法得到需要的数据。在多人案件中,无法准确的检索出某一个被告人的犯罪情况。通过相似度对比时,无法指定某一要素查找,也无法根据要素范围查看判决书。技术实现要素:有鉴于此,本发明的目的在于提供一种基于要素提取的相似判决书检索方法。本方法对于用户输入需要的判决书类型以及判决书的关键词,或者一些犯罪量刑关键词,在裁判文书库中进行检索,将检索到的类似的案例以列表的形式展示给用户,并且支持多维度的排序操作,例如日期排序、判决时长排序、酒精浓度排序等,根据需要的要素范围对判决书进行搜索。为达到上述目的,本发明提供如下技术方案:一种基于要素提取的相似判决书检索方法,该方法包括以下步骤:s1:获取判决文书,按照罪名进行分类存储,形成基础案例库;s2:法律专家进行评估每种罪名的判决书可能涉及到的案件要素,按照不同罪名需要提取的不同要素确定通用规则,通过正则表达式进行提取,正则表达式为用来检索和替换符合某个模式和规则的文本;s3:基于不同的案件要素,得到不同的关键词列表,并且按照关键词出现频率排序,供用户选择;s4:构建筛选模块,包括判决法院所属省份名、市名、区县名、判决书中的判决时间范围和被告人的判刑时长范围;s5:根据用户输入的要素信息进行检索并输出判决书要素列表展示给用户;s6:用户根据自身需要,对检索出的判决书列表进行排序;s7:用户点击需要的判决书要素行,将完整的判决书信息展示出来,供用户在线查看和下载。可选的,所述s2中,对每种案件的要素提取不断进行优化,针对不同地区法院的判决书格式进行调整和丰富判决书作案手段、作案类型和缓刑方式的词库,得到要素列表,将要素列表中可以数字化的均数字化处理,将所有要素分类存储至数据库,得到判决书要素库。可选的,所述判决书中的判决时间范围包括判决最早时间和判决最晚时间,被告人的判刑时长范围包括少刑期和最多刑期。可选的,所述s6中,对检索出的判决书列表进行排序包括对日期进行排序、对判决时长进行排序、对酒精浓度进行排序。可选的,所述判决文书是基于危险驾驶罪判决书库建立的:通过中国裁判文书网或其他司法网获取危险驾驶罪的判决书,并按省市分类存储。可选的,所述案件要素中:针对危险驾驶罪的判决书,从判决书中提取省份、城市、地区、法院名、酒精浓度、减刑情况、判刑类型、判刑时长、缓刑情况、罚金、审判长、判决时间和文件名。可选的,所述判决书要素列表中,需要去除其中的空格,根据正排策略得到以下信息,其中,正排策略是按照文章段落正常的排列顺序的规则:第一个含有“人民法院”的段落视为法院名;第一个含有“市”、“县”、“区”的段落视为判决地点,并且按照市、自治区/县的前后顺序,找到市级区域名和县级区域名;根据判决书最后的“向某某市中级人民法院提起上诉”确定上一条提取的市是否为真正的市级市;第一个含有酒精浓度的数字串视为该判决书犯罪人的法律酒精浓度,包括以下情况:'mg/100ml'、'mg/l00ml'、'毫克/100毫升'、'mg/100ml'、'mg/100ml'、'mg/100ml'、'mg/100ml'、'mg/100ml'、'mg/100ml'、'mg/100ml'和'毫克/100毫升';根据倒排策略得到以下信息,其中,倒排策略是按照文章段落从后往前的排列顺序的规则:含有“审判长”字符的视为审判长所在段落,然后提取审判长,如果没有,则通过段落是否含有“审判员”来判断;第一个含有“本院认为”或“判决如下”的段落视为法院判决段落,对法院判决段落按照句号分割,然后根据“从轻处罚”、“从宽处罚”、“减轻处罚”和“悔罪表现”的字符判断是否包含以下关键词的缓刑情况;根据“犯某某罪,判处”字符定位到判刑情况,是否包含关键词判刑类型,并且分别提取关键词相关联的其他信息。可选的,所述用户能够选择省份、城市、县区、罪名、判决时间范围、审判长、判刑类型、刑期范围和酒精浓度范围,其中省份为必选,其他为非必选,根据用户填写的内容去数据库查询对应的判决书,以判决书要素列表的形式展示给用户,用户还能够对查询出来的判决书要素列表进行排序,包括酒精浓度排序、刑期排序和判决时间排序。本发明的有益效果在于:提高法律工作者对判决书的检索效率,为法官提供判决依据,为律师提供判决书依据以便对案情的走向有个大致的预判,推进“类案同判”,构筑司法公平正义。本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。附图说明为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:图1为本发明流程图。具体实施方式以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。如图1所示,一种基于要素提取的相似判决书检索方法,包括以下步骤:建立判决书库;建立判决书要素库;制定搜索关键词;检索并输出检索结果。下面针对具体危险驾驶罪的实施例对本方法进行进一步的说明。建立危险驾驶罪判决书库:通过中国裁判文书网或其他司法网获取危险驾驶罪的判决书,按省市分类存储。建立判决书要素库:针对危险驾驶罪的判决书,按照特定的算法逻辑从判决书中提取省份、城市、地区、法院名、酒精浓度、减刑情况、判刑类型、判刑时长、缓刑情况、罚金、审判长、判决时间、文件名。不断调优,使提取的要素尽量准确,然后将要素存入数据库。整篇文章按段落分割得到一个大列表,并且去除其中的空格,根据正排策略:第一个含有“人民法院”的段落视为法院名;第一个含有“市”、“县”、“区”的段落视为判决地点,并且按照市、自治区>县、区的前后顺序,找到市级区域名和县级区域名;其次根据判决书最后的“向某某市中级人民法院提起上诉”确定上一条提取的市是否为真正的市级市;第一个含有酒精浓度的数字串视为该判决书犯罪人的法律酒精浓度,主要有以下几种情况:'mg/100ml','mg/l00ml','毫克/100毫升','mg/100ml','mg/100ml','mg/100ml','mg/100ml','mg/100ml','mg/100ml','mg/100ml','毫克/100毫升';根据倒排策略得到以下信息:含有“审判长”相关字符的视为审判长所在段落,然后提取审判长,如果没有,则通过段落是否含有“审判员”来判断;第一个含有“本院认为”或“判决如下”的段落视为法院判决段落,对法院判决段落按照句号分割,然后根据“从轻处罚”、“从宽处罚”、“减轻处罚”、“悔罪表现”等字符判断是否包含以下关键词的缓刑情况;根据“犯某某罪,判处”字符定位到判刑情况,是否包含如表1所示的关键词判刑类型,并且分别提取关键词相关联的其他信息。表1判刑类型关键词缓刑情况判刑类型认罪拘役悔罪有期赔偿无期自首死刑坦白管制如实供述无罪精神分裂症从犯立功初犯偶犯用户可选择省份、城市、县区、罪名、判决时间范围、审判长、判刑类型、刑期范围、酒精浓度范围,其中省份为必选,其他为非必选,系统根据用户填写的内容去数据库查询对应的判决书,以判决书要素列表的形式展示给用户,用户还可以对查询出来的判决书要素列表进行排序,包括酒精浓度排序、刑期排序、判决时间排序。最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1