本发明涉及一种案情智能识别方法及系统。
背景技术:
为群众提供经济案件民事与刑事的自主识别已经成为一种越来越广泛的需求,这既便于群众及时解决问题,也方便公安机关提升工作效率。同时也能够引导群众从法律视角看问题,降低经济活动产生财产损失的风险。通过互联线上使用,让群众零门槛享受法律的福利,做到经济类案件“一站式服务”,满足百姓对于经济类案件的咨询了解,也能够为公安机关更好地与群众交流合作,提供便利通道。
技术实现要素:
本发明的目的是提供一种案情智能识别方法及系统,能够对案件的情形及罪名进行智能识别。
为实现上述目的,本发明提供了如下方案:
一种案情智能识别方法,包括:
获取待识别案情;
提取所述待识别案情的主谓宾以及关键信息,得到简化后的案情,所述关键信息包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
采用word2wec技术将简化后的案情转化为向量;
将所述向量与标准向量进行匹配,将与所述向量相匹配的标准向量记为匹配向量,所述标准向量为预先设定的、对应有设定罪名以及情形的向量;
根据所述匹配向量确定所述待识别案情的情形结论;
采用句法依存分析法提取所述待识别案情中包含犯罪特征的短句;
根据所述短句确定犯罪要素,所述犯罪要素包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
根据所述犯罪要素确定涉案金额;
根据所述情形结论和涉案金额,确定待识别案情所涉及的罪名。
可选的,在所述提取所述待识别案情的主谓宾以及关键信息,得到简化后的案情之后,在所述采用word2wec技术将简化后的案情转化为向量之前,还包括:
将简化后的案情中的词语与法律专业词语进行同义词替换,得到标准化案情。
可选的,在所述将所述向量与标准向量进行匹配之前,还包括:
根据法律语料库建立人名库、地点库和情形库;
根据人名库、地点库和情形库确定标准向量;
对所述标准向量中的核心词进行同义词维护,实现对所述标准向量的发散。
可选的,所述根据所述匹配向量确定所述待识别案情的情形结论,具体包括:
将所述匹配向量对应的案件情形确定为所述待识别案情的情形结论。
可选的,所述根据所述犯罪要素确定涉案金额,具体包括:
获取所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语;
根据所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语,确定涉案金额。
本发明还提供了一种案情智能识别系统,包括:
待识别案情获取模块,用于获取待识别案情;
案情简化模块,用于提取所述待识别案情的主谓宾以及关键信息,得到简化后的案情,所述关键信息包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
案情向量转化模块,用于采用word2wec技术将简化后的案情转化为向量;
匹配模块,用于将所述向量与标准向量进行匹配,将与所述向量相匹配的标准向量记为匹配向量,所述标准向量为预先设定的、对应有设定罪名以及情形的向量;
情形确定模块,用于根据所述匹配向量确定所述待识别案情的情形结论;
短句提取模块,用于采用句法依存分析法提取所述待识别案情中包含犯罪特征的短句;
犯罪要素确定模块,用于根据所述短句确定犯罪要素,所述犯罪要素包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
涉案金额确定模块,用于根据所述犯罪要素确定涉案金额;
罪名分析模块,用于根据所述情形结论和涉案金额,确定待识别案情所涉及的罪名。
可选的,所述系统还包括:
案情标准化模块,用于将简化后的案情中的词语与法律专业词语进行同义词替换,得到标准化案情。
可选的,所述系统还包括:
材料库建立模块,用于根据法律语料库建立人名库、地点库和情形库;
标准向量确定模块,用于根据人名库、地点库和情形库确定标准向量;
标准向量发散模块,用于对所述标准向量中的核心词进行同义词维护,实现对所述标准向量的发散。
可选的,所述情形确定模块,具体包括:
情形确定单元,用于将所述匹配向量对应的案件情形确定为所述待识别案情的情形结论。
可选的,所述涉案金额确定模块,具体包括:
金额要素获取单元,用于获取所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语;
涉案金额确定单元,具体根据所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语,确定涉案金额。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的案情智能识别方法及系统,通过提取待识别案情的主谓宾以及关键信息,得到简化后的案情,采用word2wec技术将简化后的案情转化为向量,将所述向量与标准向量进行匹配,根据匹配向量确定所述待识别案情的情形结论;并采用句法依存分析法提取所述待识别案情中包含犯罪特征的短句,根据所述短句确定犯罪要素,根据所述犯罪要素确定涉案金额,根据所述情形结论和涉案金额,结合法律中的四要件判断规则,确定待识别案情所涉及的罪名,实现了对待识别案情的情形识别和罪名识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例案情智能识别方法流程图;
图2为本发明实施例案情智能识别系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种案情智能识别方法及系统,能够对案件的情形及罪名进行智能识别。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的案情智能识别方法包括以下步骤:
步骤101:获取待识别案情;
步骤102:提取所述待识别案情的主谓宾以及关键信息,得到简化后的案情,所述关键信息包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
步骤103:采用word2wec技术将简化后的案情转化为向量;
步骤104:将所述向量与标准向量进行匹配,将与所述向量相匹配的标准向量记为匹配向量,所述标准向量为预先设定的、对应有设定罪名以及情形的向量;
步骤105:根据所述匹配向量确定所述待识别案情的情形结论;
步骤106:采用句法依存分析法提取所述待识别案情中包含犯罪特征的短句;
步骤107:根据所述短句确定犯罪要素,所述犯罪要素包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
步骤108:根据所述犯罪要素确定涉案金额;
步骤109:根据所述情形结论和涉案金额,确定待识别案情所涉及的罪名。通过判断是否满足四大构成要件来定性,通过规则判断涉案金额是否满足对应罪的立案标准,通过案例标准向量相似度匹配是否满足对应罪的客观方面,通过基于句法依存分析及同义词来实现对犯罪主体的提取、通过关键词来判断主观方面。
作为本发明的一个实施例,在上述实施例的步骤102和步骤103之间,还包括:
将简化后的案情中的词语与法律专业词语进行同义词替换,得到标准化案情。
作为本发明的一个实施例,上述实施例的步骤104之前,还包括:
根据法律语料库建立人名库、地点库和情形库;
根据人名库、地点库和情形库确定标准向量;
对所述标准向量中的核心词进行同义词维护,实现对所述标准向量的发散。
作为本发明的一个实施例,上述实施例的步骤105具体包括:
将所述匹配向量对应的案件情形确定为所述待识别案情的情形结论。
作为本发明的一个实施例,上述实施例的步骤108具体包括:
获取所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语;
根据所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语,确定涉案金额。
本发明还提供了一种案情智能识别系统,如图2所示,该系统包括:
待识别案情获取模块201,用于获取待识别案情;
案情简化模块202,用于提取所述待识别案情的主谓宾以及关键信息,得到简化后的案情,所述关键信息包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
案情向量转化模块203,用于采用word2wec技术将简化后的案情转化为向量;
匹配模块204,用于将所述向量与标准向量进行匹配,将与所述向量相匹配的标准向量记为匹配向量,所述标准向量为预先设定的、对应有设定罪名以及情形的向量;
情形确定模块205,用于根据所述匹配向量确定所述待识别案情的情形结论;
短句提取模块206,用于采用句法依存分析法提取所述待识别案情中包含犯罪特征的短句;
犯罪要素确定模块207,用于根据所述短句确定犯罪要素,所述犯罪要素包括实施者、承受者、实施地点、涉及金额、金额符号和事件时间;
涉案金额确定模块208,用于根据所述犯罪要素确定涉案金额;
罪名分析模块209,用于根据所述情形结论和涉案金额,确定待识别案情所涉及的罪名。
作为本发明的一个实施例,本发明提供的系统还包括:
案情标准化模块,用于将简化后的案情中的词语与法律专业词语进行同义词替换,得到标准化案情。
作为本发明的一个实施例,在上述实施例的基础上,本发明提供的系统还包括:
材料库建立模块,用于根据法律语料库建立人名库、地点库和情形库;
标准向量确定模块,用于根据人名库、地点库和情形库确定标准向量;
标准向量发散模块,用于对所述标准向量中的核心词进行同义词维护,实现对所述标准向量的发散。
作为本发明的一个实施例,在上述实施例的基础上,所述情形确定模块205,具体包括:
情形确定单元,用于将所述匹配向量对应的案件情形确定为所述待识别案情的情形结论。
作为本发明的一个实施例,在上述实施例的基础上,所述涉案金额确定模块208,具体包括:
金额要素获取单元,用于获取所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语;
涉案金额确定单元,具体根据所述犯罪要素中涉及的金额、金额的单位以及表示“加”金额的词语、表示“减”金额的词语,确定涉案金额
本发明提供的案情智能识别方法及系统,通过提取待识别案情的主谓宾以及关键信息,得到简化后的案情,采用word2wec技术将简化后的案情转化为向量,将所述向量与标准向量进行匹配,根据匹配向量确定所述待识别案情的情形结论;并采用句法依存分析法提取所述待识别案情中包含犯罪特征的短句,根据所述短句确定犯罪要素,根据所述犯罪要素确定涉案金额,根据所述情形结论和涉案金额,结合法律中的四要件判断规则,确定待识别案情所涉及的罪名,实现了对待识别案情的情形识别和罪名识别。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。