一种基于刑事案件的犯罪行为链构建方法与流程

文档序号:19155641发布日期:2019-11-16 00:43阅读:770来源:国知局
一种基于刑事案件的犯罪行为链构建方法与流程

本发明涉及一种刑事案件,尤其涉及一种基于刑事案件的犯罪行为链构建方法,属于自然语言处理技术领域。



背景技术:

在司法信息化建设过程中的研究发现,裁判文书中的案情描述对法条推荐结果、案件审判结果有着显著影响,关系到审判工作的严谨性和合理性,如何利用裁判文书中的案情描述和事实部分,分析推荐案件涉及的相关法条、罪名、类案等信息,有效服务于司法辅助审判工作,是当前司法实践中需要解决的关键技术问题,有着重要的研究与应用价值。传统的审判辅助工作主要依托独立的案情特征进行法条、量刑、案由的确立,进而辅助法官判案。然而,在这种情况下,案情特征的顺序容易被忽略,尤其是涉及到具体的案件审判时,“顺序问题”可能直接影响最终的审判结果,如相同特征的案件,因为案情要素序列的不同也可能导致审判结果的不同。例如,在“强奸杀人”、“杀人辱尸”以及“强奸致死”的案件中,对罪犯的量刑和引用条例是不同的,因此,案情特征描述的先后顺序对量刑和适用法条的选择有着重要的影响。



技术实现要素:

本发明要解决的技术问题是:提供一种基于刑事案件的犯罪行为链构建方法。通过抽取刑事案件中具有时序关系的各种案件关键特征要素(如犯罪行为、犯罪主体、犯罪客体和犯罪工具等)来构建犯罪“行为链”,进而基于犯罪“行为链”实现对裁判文书中案情语义的深层分析,可以为案件的相似性检测、法条推荐、类案判别等提供理论和技术支撑,为法官判案、案件量刑提供辅助,提升司法辅助工作的智能化水平,继而推进案件审判工作的公平性和严谨性。

在该发明中涉及到犯罪行为识别、犯罪要素识别、关系识别、犯罪行为链的构建。在本发明中,犯罪行为是指犯罪主体在实施犯罪的过程中所关联的行为,用集合m={m1,m2,...,mn}表示一个具体案件中的所有的犯罪行为。与犯罪行为相关的其它犯罪要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点等,用集合c={c1,c2,...,cn}表示。案件中所涉及到的犯罪行为具有时序关系和因果关系,犯罪行为与犯罪主体之间也可以定义多种关系,如主动关系、被动关系等。把按犯罪行为按时序特征或因果特征串联起来的犯罪行为过程称为犯罪行为链。犯罪行为链用集合l={(mi,mj)|mi∈m,mj∈m}表示,犯罪行为链l可以表示为犯罪行为m上的一个偏序关系,而偏序关系可以用来分析犯罪行为之间的因果关系,如:(砍杀,逃跑)∈l,(逃跑,拘捕)∈l,则有(砍杀,拘捕)∈l。为了进一步融合犯罪案件中的信息,提升犯罪行为链的表达能力,把与犯罪行为相关的犯罪要素c也融合进犯罪行为链l中,这样的话,我们最终可以将犯罪行为链看作一个图(用g={v,r|v=c∪m,vi∈v,vj∈v,r=(vi,vj)}表示,其中,v表示图g的顶点集合,r表示顶点之间边的集合)。v有两类节点:犯罪行为节点和犯罪要素节点,r表示犯罪行为之间的时序(因果)关系,或者犯罪行为和犯罪要素之间的关系(如:主动关系、被动关系等)。

本发明的技术方案为:一种基于刑事案件的犯罪行为链构建方法,所述方法包括如下步骤:一、犯罪行为识别:从案件文档的句子中判断某个犯罪行为是否出现;二、犯罪要素识别:犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体、犯罪客体、犯罪工具、犯罪时间和犯罪地点等;三、犯罪关系识别:犯罪关系包含:犯罪行为之间的时序(因果)关系或者犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等);四、犯罪行为链的构建:将犯罪行为链看作一个图,把上述三步中的识别结果整合在一起,形成一条完整的犯罪行为链。

所述步骤一中,犯罪行为识别首先是识别出整个刑事案件中的所有行为,然后利用其是否与犯罪主体关联,判断某一行为是否属于犯罪行为,再用集合m={m1,m2,...,mn}表示一个具体案件中的所有犯罪行为。

所述步骤二中,把与犯罪行为相关的要素称为犯罪要素,如犯罪主体、犯罪客体、犯罪工具、犯罪时间、犯罪地点等,用集合c={c1,c2,...,cn}表示一个具体案件中的所有犯罪要素。

所述步骤三中,关系识别分为两种:犯罪行为之间的时序(因果)关系,犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等),用集合r表示。

所述步骤四中,犯罪行为链的构建,以犯罪行为词为中心,将其他要素融入一个犯罪行为链中,将所有信息整合后的犯罪行为链看作一个图,用g={v,r|v=c∪m,vi∈v,vj∈v,r=(vi,vj)}表示,其中,v表示图g的顶点集合,r表示顶点之间边的集合。

本发明的有益效果是:传统针对裁判文书的分析主要基于文档进行分析,没有考虑裁判文书中的案件特征要素信息,而裁判文书中犯罪行为的时序和和因果关系会影响法官的审判。针对裁判文书时序性和逻辑性强等特点,本项目通过提出犯罪“行为链”的概念,研究以“行为”为核心的案情要素序列抽取以及语义分析方法。通过构建犯罪“行为链”,建立以“犯罪行为”为中心的案情要素间的内在关联和知识体系。在此基础上,利用犯罪“行为链”探索案件相似性的计算方法,重点研究法条推荐、类案推送等辅助审判的模型和方法,为解决“同案同判”、“量刑一致性”等问题提供技术支撑。通过本发明的实施与应用,可以实现对裁判文书中的案情语义的深层分析,有效提高审判工作的效率、公正性和严谨性。

附图说明

图1为本发明的犯罪行为链构建的模型。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将参照本说明书附图对本发明作进一步的详细描述。

实施例1:如附图1所示,一种基于刑事案件的犯罪行为链构建方法,所述方法包括如下步骤:一、犯罪行为识别,主要目的是从案件文档的句子中判断某个犯罪行为是否出现;二、犯罪要素识别,犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点、犯罪时间、犯罪地点等;三、犯罪关系识别,犯罪关系包含:犯罪行为之间的时序(因果)关系或者犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等);四、犯罪行为链的构建,将犯罪行为链看作一个图,把上述三步中的识别结果整合在一起。

下面将结合附图和实施例对本发明做进一步描述。

第一步,犯罪行为识别的主要目的是从案件文档的句子中判断某个犯罪行为是否出现,犯罪行为和一般行为的区别在于其关联到具体的犯罪主体或犯罪案件。在本发明中,利用哈工大的nlp系统识别出案件文档中识别出所有的行为词,用集合m={m1,m2,...,mn}表示,作为犯罪行为词的候选集,行为词与犯罪行为词之间存在区别,在后续步骤中,根据行为词与犯罪主体之间的关系,判断该行为词是否属于犯罪行为词。

第二步,犯罪要素识别,犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点等。在本发明中,利用哈工大的nlp系统识别出案件文档中的所有犯罪要素,c={c1,c2,...,cn}表示。系统识别的结果还需要经过筛选,删除一些冗余数据。在本发明中,采用textrnn深度神经网络对哈工大nlp的识别结果进行数据后处理。

第三步,犯罪关系识别,犯罪关系包含:犯罪行为之间的时序(因果)关系或者犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等)。本发明中,将案件文档的数据以句子为单位输入深度神经网络模型中,原始句子经过embedding层向量化表示后,进入textcnn-bilstm-crf模型中,从文本中识别出犯罪行为与犯罪主体之间的关系。

第四步,犯罪行为链的构建,以犯罪行为词为中心,将其他要素融入一个犯罪行为链中,将所有信息整合后的犯罪行为链看作一个图,我们用g={v,r|v=c∪m,vi∈v,vj∈v,r=(vi,vj)}表示,其中,v表示图g的顶点集合,r表示顶点之间边的集合)。在模型中,将前三步的输入作一个拼接,然后再经过一个softmax函数将信息整合,形成一条完整的犯罪行为链。

本发明未详述之处,均为本技术领域技术人员的公知技术。最后说明的是,以上实施例所采用的哈工大nlp系统、textrnn和text-bilstm-crf模型仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1